目录
导入库
数据准备
定义生成器
定义判别器
初始化模型,优化器及损失计算函数
绘图函数
GAN的训练
运行结果
?编辑
导入库
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim #优化
import numpy as np
import matplotlib.pyplot as plt #绘图
import torchvision #加载图片
from torchvision import transforms #图片变换
数据准备
#对数据做归一化(-1,1)
transform=transforms.Compose([
#将shanpe为(H,W,C)的数组或img转为shape为(C,H,W)的tensor
transforms.ToTensor(), #转为张量并归一化到【0,1】;数据只是范围变了,并没有改变分布
transforms.Normalize(0.5,0.5)#数据归一化处理,将数据整理到[-1,1]之间;可让数据呈正态分布
])
transforms.Compose(): 将多个预处理依次累加在一起, 每次执行transform都会依次执行其中包含的多个预处理程序
transforms.ToTensor():在做数据归一化之前必须要把PIL Image转成Tensor
transforms.Normalize([0.5], [0.5]):归一化,这里的两个0.5分别表示对张量进行归一化的 全局平均值和方差,因为图像是灰色的只有一个通道,所以分别指定一了一个值,如果有多个通道,需要有多个数字,如3个通道,就应该是Normalize([m1, m2, m3], [n1, n2, n3])
#下载数据到指定的文件夹
train_ds = torchvision.datasets.MNIST('data',
train=True,
transform=transform,
download=True)
root :需要下载至地址的根目录位置
train:如果是True, 下载训练集 trainin.pt; 如果是False,下载测试集 test.pt; 默认是True?
transform:一系列作用在PIL图片上的转换操作,返回一个转换后的版本
download:是否下载到 root指定的位置,如果指定的root位置已经存在该数据集,则不再下载
datalodar=torch.utils.data.DataLoader(train_ds,batch_size=64,shuffle=True)
PyTorch中数据读取的一个重要接口是 torch.utils.data.DataLoader。定义生成器
该接口主要用来将自定义的数据读取接口的输出或者PyTorch已有的数据读取接口的输入按照batch_size封装成Tensor,后续只需要再包装成Variable即可作为模型的输入。
torch.utils.data.DataLoader(onject)的可用参数如下:
dataset(Dataset): 数据读取接口,该输出是torch.utils.data.Dataset类的对象(或者继承自该类的自定义类的对象)。
batch_size (int, optional): 批训练数据量的大小,根据具体情况设置即可。一般为2的N次方(默认:1)
shuffle (bool, optional):是否打乱数据,一般在训练数据中会采用。(默认:False
输出是长度为100的噪声(正态分布随机数)
输出为(1,28,28)的图片
linear 1:100---256
linear 2: 256--512
linear 3:512--784(28*28)
reshape: 784---(1,28,28)
class Generator(nn.Module):
def __init__(self):
super(Generator,self).__init__()
self.main=nn.Sequential(
nn.Linear(100,256),
nn.ReLU(),
nn.Linear(256,512),
nn.ReLU(),
nn.Linear(512,784),
nn.Tanh()#对于生成器,最后一个激活函数是tanh,值域:-1到1
)
#定义前向传播
def forward(self,x):#x表示长度为100的noise输入
img = self.main(x)
img=img.view(-1,28,28)#转换成图片的形式
return img
定义判别器
输入为为(1,28,28)的图片,输出为二分类的概率值,输出使用sigmoid的激活0-1
BCEloss计算交叉熵损失
在判别器中一般推荐使用nn.LeakyReLU
class Discriminator(nn.Module):
def __init__(self):
super(Discriminator,self).__init__()
self.main = nn.Sequential(
nn.Linear(784,512),
nn.LeakyReLU(),
nn.Linear(512,256),
nn.LeakyReLU(),
nn.Linear(256,1),
nn.Sigmoid()
)
def forward(self,x):
x =x.view(-1,784) #展平
x =self.main(x)
return x
初始化模型,优化器及损失计算函数
#设备的配置
device='cuda' if torch.cuda.is_available() else 'cpu'
#初始化生成器和判别器把他们放到相应的设备上
gen = Generator().to(device)
dis = Discriminator().to(device)
#训练器的优化器
d_optim = torch.optim.Adam(dis.parameters(),lr=0.0001)
#训练生成器的优化器
g_optim = torch.optim.Adam(dis.parameters(),lr=0.0001)
#交叉熵损失函数
loss_fn = torch.nn.BCELoss()
绘图函数
def gen_img_plot(model,test_input):
prediction = np.squeeze(model(test_input).detach().cpu().numpy())
fig = plt.figure(figsize=(4,4))
for i in range(16):
plt.subplot(4,4,i+1)
plt.imshow((prediction[i]+1)/2)
plt.axis('off')
plt.show()
test_input = torch.randn(16,100 ,device=device) #16个长度为100的随机数
GAN的训练
D_loss = []
G_loss = []
#训练循环
for epoch in range(20):
#初始化损失值
d_epoch_loss = 0
g_epoch_loss = 0
count = len(dataloader) #返回批次数
#对数据集进行迭代
for step,(img,_) in enumerate(dataloader):
img =img.to(device) #把数据放到设备上
size = img.size(0) #img的第一位是size,获取批次的大小
random_noise = torch.randn(size,100,device=device)#判别器训练(真实图片的损失和生成图片的损失),损失的构建和优化
d_optim.zero_grad()#梯度归零
#判别器对于真实图片产生的损失
real_output = dis(img) #判别器输入真实的图片,real_output对真实图片的预测结果
d_real_loss = loss_fn(real_output,
torch.ones_like(real_output)
)
d_real_loss.backward()#计算梯度#在生成器上去计算生成器的损失,优化目标是判别器上的参数
gen_img = gen(random_noise) #得到生成的图片
#因为优化目标是判别器,所以对生成器上的优化目标进行截断
fake_output = dis(gen_img.detach()) #判别器输入生成的图片,fake_output对生成图片的预测;
detach会截断梯度,梯度就不会再传递到gen模型中了
#判别器在生成图像上产生的损失
d_fake_loss = loss_fn(fake_output,
torch.zeros_like(fake_output)
)
d_fake_loss.backward()
#判别器损失
d_loss = d_real_loss + d_fake_loss
#判别器优化
d_optim.step()#生成器上损失的构建和优化
g_optim.zero_grad() #先将生成器上的梯度置零
fake_output = dis(gen_img)
g_loss = loss_fn(fake_output,
torch.ones_like(fake_output)
)#生成器损失
g_loss.backward()
g_optim.step()
#累计每一个批次的loss
with torch.no_grad():
d_epoch_loss +=d_loss
g_epoch_loss +=g_loss
#求平均损失
with torch.no_grad():
d_epoch_loss /=count
g_epoch_loss /=count
D_loss.append(d_epoch_loss)
G_loss.append(g_epoch_loss)
print('Epoch:',epoch)
gen_img_plot(gen,test_input)
运行结果一共有20张,因篇幅有限,这里先展示前六张和最后一张
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
【深度学习|基础GAN实例(pytorch代码实现)】
推荐阅读
- 机器学习|基于双任务一致性的半监督医学图像分割
- Python|Python标准库
- 深度学习|多模态语义检索 | 基于 MetaSpore 快速部署 HuggingFace 预训练模型
- 目标检测|【yolov6系列一】深度解析网络架构
- 目标检测|评价目标检测的方法map 新方法 TIDE
- 目标检测|项目实战工具|目标检测评价map精细化系列工具
- 目标检测|yolov5 提速多GPU训练显存低的问题
- 深度学习|人工智能深度学习交流群
- python|【python开发】1. __init__.py与导包