飞桨百度架构师手把手带你零基础实践深度学习——手写数字识别资源配置飞桨深度学习笔记

使用GPU训练使用GPU进行训练

CPU：fluid.CPUPlace()
GPU: fluid.CUDAPlace(0)，四个GPU卡的编号0,1,2,3

#仅前3行代码有所变化，在使用GPU时，可以将use_gpu变量设置成True use_gpu = False place = fluid.CUDAPlace(0) if use_gpu else fluid.CPUPlace()with fluid.dygraph.guard(place):#用place作为资源进行训练 model = MNIST() model.train() #调用加载数据的函数 train_loader = load_data('train')

分布式训练（多卡）两种并行计算

模式并行：节省内存，应用较为受限（模型非常大，内存放不下）
数据并行：飞桨框架采用（训练节点上运行供养的程序，以不同的数据训练，不同节点得到的梯度要聚合。数据进行多机多卡拆分）

实现“多GPU卡”的分布式训练程序修改

启动训练前
获取环境变量定义额GPU序列号，对原模型进行预处理，定义多GPU训练的reader，不同ID的GPU
加载不同的数据集

##修改1-从环境变量获取使用GPU的序号 place = fluid.CUDAPlace(fluid.dygraph.parallel.Env().dev_id)with fluid.dygraph.guard(place):##修改2-对原模型做并行化预处理 strategy = fluid.dygraph.parallel.prepare_context() model = MNIST() model = fluid.dygraph.parallel.DataParallel(model, strategy)model.train()#调用加载数据的函数 train_loader = load_data('train') ##修改3-多GPU数据读取，必须确保每个进程读取的数据是不同的 train_loader = fluid.contrib.reader.distributed_batch_reader(train_loader)