总述 作者受到了Inpainting开山之作《Context Encoders: Feature Learning by Inpainting》(2016 CVPR)的启发,沿用了它的编码器-解码器结构,创新地提出了鉴别器,作者使用全局鉴别器和局部鉴别器,顾名思义,全局鉴别器可以保证整个图片的全局效果,而局部鉴别器包括被抠除的区域及其周围较小的区域。此外,为了保证补全效果的连贯性,作者还对后处理过程进行了阐述以及fine-tune的建议。(作者还指出GAN最主要的问题之一就是不稳定性,作者的网络可以改善)
注:批斗一下CE方法:2016 CVPR的开山之作CE ,(1)并没有完全描述如何处理任意修复掩码,也没有完全描述如何将该方法应用于高分辨率图像。(2)只能处理固定大小的图像,而作者的方法能处理任意尺寸的图像,而且在语义和纹理上都取得了比它更好的效果。(3)(续1)那个开山之作不能处理高分辨率的图像,我们通过使用完全卷积网络扩展他们的工作以处理任意分辨率,并通过同时使用全局和局部鉴别器显着提高视觉质量。
文章图片
一、方法详述
1. 网络结构 【人工智能论文精度|论文精度 —— 2017 ACM《Globally and Locally Consistent Image Completion》】
文章图片
如上图所示,
推荐阅读
- 个人笔记|机器学习算法----聚类 (K-Means、LVQ、GMM、DBSCAN、AGNES) (学习笔记)
- 人工智能论文精度|论文精度 —— 2016 CVPR 《Context Encoders: Feature Learning by Inpainting》
- 深度学习|吴恩达深度学习之一《神经网络和深度学习》学习笔记
- 深度学习自学笔记|Pytorch常见报错、踩坑点总结(持续更新)
- xhtml|CSS学习笔记
- 机器学习|机器学习之卷积神经网络(一)
- #|模型压缩 | TIP 2022 - 蒸馏位置自适应(Spot-adaptive Knowledge Distillation)
- 深度学习|ACmix 自注意力和卷积集成 On the Integration of Self-Attention and Convolution+
- 计算机视觉|ECCV2022|何恺明团队开源ViTDet(只用普通ViT,不做分层设计也能搞定目标检测...)