PyTorch实现卷积LSTM核(ConvLSTMCell) PyTorch实现卷积LSTM核(ConvLSTMCe

文章图片
简单RNN与LSTM对比
文章图片
LSTM计算示意
文章图片
LSTM计算示意

import torch from torch import nn import torch.nn.functional as f from torch.autograd import Variable# Define some constants KERNEL_SIZE = 3 PADDING = KERNEL_SIZE // 2class ConvLSTMCell(nn.Module): """ Generate a convolutional LSTM cell """def __init__(self, input_size, hidden_size): super(ConvLSTMCell, self).__init__() self.input_size = input_size self.hidden_size = hidden_size self.Gates = nn.Conv2d(input_size + hidden_size, 4 * hidden_size, KERNEL_SIZE, padding=PADDING)def forward(self, input_, prev_state):# get batch and spatial sizes batch_size = input_.data.size()[0] spatial_size = input_.data.size()[2:]# generate empty prev_state, if None is provided if prev_state is None: state_size = [batch_size, self.hidden_size] + list(spatial_size) prev_state = ( Variable(torch.zeros(state_size)), Variable(torch.zeros(state_size)) )prev_hidden, prev_cell = prev_state# data size is [batch, channel, height, width] stacked_inputs = torch.cat((input_, prev_hidden), 1) gates = self.Gates(stacked_inputs)# chunk across channel dimension in_gate, remember_gate, out_gate, cell_gate = gates.chunk(4, 1)# apply sigmoid non linearity in_gate = f.sigmoid(in_gate) remember_gate = f.sigmoid(remember_gate) out_gate = f.sigmoid(out_gate)# apply tanh non linearity cell_gate = f.tanh(cell_gate)# compute current cell and hidden state cell = (remember_gate * prev_cell) + (in_gate * cell_gate) hidden = out_gate * f.tanh(cell)return hidden, celldef _main(): """ Run some basic tests on the API """# define batch_size, channels, height, width b, c, h, w = 1, 3, 4, 8 d = 5# hidden state size lr = 1e-1# learning rate T = 6# sequence length max_epoch = 20# number of epochs# set manual seed torch.manual_seed(0)print('Instantiate model') model = ConvLSTMCell(c, d) print(repr(model))print('Create input and target Variables') x = Variable(torch.rand(T, b, c, h, w)) y = Variable(torch.randn(T, b, d, h, w))print('Create a MSE criterion') loss_fn = nn.MSELoss()print('Run for', max_epoch, 'iterations') for epoch in range(0, max_epoch): state = None loss = 0 for t in range(0, T): state = model(x[t], state) loss += loss_fn(state[0], y[t])print(' > Epoch {:2d} loss: {:.3f}'.format((epoch+1), loss.data[0]))# zero grad parameters model.zero_grad()# compute new grad parameters through time! loss.backward()# learning_rate step against the gradient for p in model.parameters(): p.data.sub_(p.grad.data * lr)print('Input size:', list(x.data.size())) print('Target size:', list(y.data.size())) print('Last hidden state size:', list(state[0].size()))if __name__ == '__main__': _main()

PyTorch实现卷积LSTM核(ConvLSTMCell)

推荐阅读

顺丰速递单号查询查快递信息官网顺丰速递单号查询查快递信息

不急不躁就是最好的状态

小朋友过生日送什么礼物好

诗姐诗妹接龙

投稿|淘系女装脱去“黄金甲”

广仁医院是不是私立医院杭州广仁医院怎么样

新手如何开自动挡汽车呢图片新手如何开自动挡汽车呢

可以带上飞机的行李箱尺寸图片可以带上飞机的行李箱尺寸

如何正确晒太阳补钙

subverse阿根廷怎么买 subverse阿根廷区买法一览

三菱电机空调显示UL处理方法,是因为这些原因

捷达vs5的发动机和大众哪款一样捷达vs5发动机和大众哪个一样

苦瓜怎么做不苦苦瓜怎么吃不苦

专家教你节后怎样清理肠胃

火车的英语怎么写火车翻译成英文

go语言与java Go语言与环境

柞树叶

华为mate40价格多少？华为mate40pro内屏坏了多少钱

尼康fm2镜头怎么装尼康fm2相机修理

iphone12|华为手机销量跌42%，苹果暴涨22%，中国市场不喜欢华为了？