TextBoxes++

TextBoxes++是基于SSD和TextBoxes的。论文:https://arxiv.org/pdf/1801.02765.pdf
前言 文本检测和其他物体检测的区别:
(1) 文本检测有比较大的长宽比;
(2) 一半的convolutional filter无法全部检测到;
可能的解决方案:
(1) 长的卷积核;
(2) inception convolutional kernels;
(3) part detection and grouping.
textboxes 与SSD区别:
(1) 把SSD的defaultbox的比例改成(1,2,3,5,7,10)的长矩形。
(2) 如下图所示,把原来的作为分类的卷积核3*3改成了1*5,更适合文本检测。
TextBoxes++
文章图片


(3) 从多尺度变换成单尺度(textboxes系列算法对尺度的严重依赖性,对于不同尺度的图片,要调整不同的尺度效果才好)。
TextBoxes++
文章图片


textboxes网络结构

TextBoxes++
文章图片


SSD网络结构
TextBoxes++ 代码:https://github.com/MhLiao/TextBoxes_plusplus




【TextBoxes++】

参考:
[1] https://zhuanlan.zhihu.com/p/34131821

    推荐阅读