深度学习（DL）|U-Net学习总结（附DeepLab v3）

2022-08-11 深度学习（DL）

文章目录

- 简介
- U-Net
- References

简介本论文主要亮点：
（1）改进了FCN，把扩展路径完善了很多，多通道卷积与类似FPN（特征金字塔网络）的结构相结合。
（2）利用少量数据集进行训练测试，为医学图像分割做出很大贡献。
这是比较早的论文了，这篇论文比较简单，但是却非常的经典。而且U-Net和之前的FCN很像。总之，U-Net在医学图像分割领域简直是baba一般的存在。
U-Net U-Net是原作者参加ISBI Challenge提出的一种分割网络，能够适应很小的训练集（大约30张图）。U-Net与FCN都是很小的分割网络，既没有使用空洞卷积，也没有后接CRF，结构简单。

深度学习（DL）|U-Net学习总结（附DeepLab v3）

文章图片

整个U-Net网络结构如上图所示，类似于一个大大的U字母：首先进行Conv+Pooling下采样；然后Deconv反卷积进行上采样，crop之前的低层feature map，进行融合；然后再次上采样。重复这个过程，直到获得输出388x388x2的feature map，最后经过softmax获得output segment map。总体来说与FCN思路非常类似。
为何要提起U-Net？是因为U-Net采用了与FCN完全不同的特征融合方式：拼接！

深度学习（DL）|U-Net学习总结（附DeepLab v3）

文章图片

与FCN逐点相加不同，U-Net采用将特征在channel维度拼接在一起，形成更“厚”的特征。所以，语义分割网络在特征融合时也有2种办法：

FCN式的逐点相加，对应caffe的EltwiseLayer层，对应tensorflow的tf.add()；
U-Net式的channel维度拼接融合，对应caffe的ConcatLayer层，对应tensorflow的tf.concat()；

额。。。。。。以上基本就是U-Net的创新点了，就不多废话了。（现在看来，够简单吧，这可是当年医学图像分割的顶会论文）
总结一下，CNN图像语义分割也就基本上是这个套路：

下采样+上采样：Convlution + Deconvlution／Resize；
多尺度特征融合：特征逐点相加／特征channel维度拼接；
获得像素级别的segement map：对每一个像素点进行判断类别；

看，即使是更复杂的DeepLab v3+依然也是这个基本套路（至于DeepLab以后再说）。

深度学习（DL）|U-Net学习总结（附DeepLab v3）

文章图片

所以作为一篇入门文章，读完后如果可以理解这3个方面，也就可以了；当然CNN图像语义分割也算入门了。
【深度学习（DL）|U-Net学习总结（附DeepLab v3）】done~
References

https://mp.csdn.net/postedit/98783226
https://mp.csdn.net/postedit/98884558
https://zhuanlan.zhihu.com/p/31428783
https://baijiahao.baidu.com/s?id=1607561081907343294&wfr=spider&for=pc

推荐阅读

上一篇：人工智能学习笔记|cs224w（图机器学习）2021冬季课程学习笔记16 Community Detection in Networks

下一篇：Python学习笔记|21天Python进阶学习挑战赛打卡------第4天(字典)