第五讲_图像识别之图像检测Image|第五讲_图像识别之图像检测Image Detection

第五讲_图像识别之图像检测Image Detection

  • 目录

  • 物体检测

  • ILSVRC竞赛200类(每个图片多个标签):输出类别+Bounding Box(x,y,w,h)
  • PASCAL VOC 2012只有20类
  • 【第五讲_图像识别之图像检测Image|第五讲_图像识别之图像检测Image Detection】模型进化

区域卷积神经网络R-CNN-2014
  • 模型结构
  • selective search+CNN特征+svm+Bounding box regression
  • Regiom proposals
  • 训练流程


  • 测试阶段
  • RCNN性能大幅提升
SPPNet网络-2014
  • R-CNN速度慢的重要原因:卷积特征重复计算量太大
  • spp技术实现了共享计算,适应不同输入尺寸
  • SPP层具体实现
  • sppNet问题
Fast-R-CNN-2015
  • 改进;更高mAP(类似AUC曲线下的面积)
  • 网络结构



  • 训练阶段
Faster-R-CNN-2015
  • 概况,引导CNN关注区域
  • Region Proposal Network
  • 训练过程
区域全卷积神经网络R-FCN
  • 回顾
  • F-RCN的设计过程
  • 分类问题对尺寸,方向等变换不敏感,网络越深,分类效果很好;但是检测对变换敏感

  • 结构图:三部分
  • 理解K2(C+1)个通道,映射到每类K2个score map

人脸检测/行人检测
  • 主流数据库
  • WIDER FACE
  • IJB-A
  • Caltech

    推荐阅读