手把手写深度学习|手把手写深度学习(10)（用Pix2Pix GANs实现sketch-to-image跨模态任务(理论基础)） sketch|人工智能|深度学习

***前言：***2017年GANs正如火如荼地发展，有CGANs、DCGANs等前辈珠玉在前，Pix2Pix GANs横空出世，在多种多模态任务上有着亮眼的表现，并且首次把U-net结构带到了深层次生成模型当中，非常有意义。本文用Pix2Pix GANs实现sketch-image这一跨模态任务。

文章图片

encoder-decoder：多模态基础 【手把手写深度学习|手把手写深度学习(10)（用Pix2Pix GANs实现sketch-to-image跨模态任务(理论基础)）】现在很多多模态的任务，都是基于encoder-decoder的结构，或者attention机制。作为多模态生成任务的鼻祖，pix2pix gan的生成器使用了encoder-decoder的机制，并在此基础上，使用跳接层，改进成了一个Unet的结构，这应该是unet首次出现在生成任务中。
为什么要加入跳接层？输入和输出图像的外表面(surface appearance)应该不同而潜在的结构(underlying structure)应该相似，对于image translation的任务来说，输入和输出应该共享一些底层的信息，因此使用Unet这种跳层连接(skip connection)的方法。
从此unet变成了一种很优秀的具有生成能力的神经网络，为后面diffusion models大规

手把手写深度学习|手把手写深度学习(10)（用Pix2Pix GANs实现sketch-to-image跨模态任务(理论基础)）

推荐阅读

王者荣耀:亚瑟成为T0级边路,专治花里胡哨,三秒沉默太恶心,有克制亚瑟的英雄吗？

骨质疏松|骨质疏松会累及心脏！预防骨质疏松，要从儿童做起！

OPPOK1可以人脸解锁吗 OPPOK1人脸解锁设置方法

个人商标注册流程日本商标去哪里注册，商标在哪注册

《星露谷物语 / 像素谷》稀有种子用法及林雕像用途详解

佳能5d延时拍摄怎么设置佳能5d设置延时拍摄

荣耀20pro怎么设置熄屏时钟（荣耀20pro设置熄屏时钟的方法）

想读书,不会知道读什么,麻烦推荐几本？

部落冲突怎么强化兵种

清凉补有什么材料正宗清补凉有哪些材料

mongodb支持海量数据存储 mongodb 持久化码

面试电商运营要准备什么问题和答案面试电商运营要准备什么问题，面试电商运营要准备什么问题呢

mysql设置外键约束语句，mysql外键约束作用

住房公积金质押贷款是什么意思

空调开一晚上多少度电

台式电脑如何打开光驱光驱在哪里

内蒙羊吃的草是什么草山羊和绵羊吃草的区别

mac 日志分析工具

在雨水节气降雨好不好呢雨水落雨三大碗是夏天的俗语吗

中国女子4×100米接力田径亚锦赛夺冠女子4×400米接力亚洲纪录