TextBoxes++
TextBoxes++是基于SSD和TextBoxes的。论文:https://arxiv.org/pdf/1801.02765.pdf
前言 文本检测和其他物体检测的区别:
(1) 文本检测有比较大的长宽比;
(2) 一半的convolutional filter无法全部检测到;
可能的解决方案:
(1) 长的卷积核;
(2) inception convolutional kernels;
(3) part detection and grouping.
textboxes 与SSD区别:
(1) 把SSD的defaultbox的比例改成(1,2,3,5,7,10)的长矩形。
(2) 如下图所示,把原来的作为分类的卷积核3*3改成了1*5,更适合文本检测。
文章图片
(3) 从多尺度变换成单尺度(textboxes系列算法对尺度的严重依赖性,对于不同尺度的图片,要调整不同的尺度效果才好)。
文章图片
textboxes网络结构
文章图片
SSD网络结构
TextBoxes++ 代码:https://github.com/MhLiao/TextBoxes_plusplus
【TextBoxes++】
参考:
[1] https://zhuanlan.zhihu.com/p/34131821
推荐阅读
- 热闹中的孤独
- 我要做大厨
- 《真与假的困惑》???|《真与假的困惑》??? ——致良知是一种伟大的力量
- 爱就是希望你好好活着
- 太平之莲
- 知识
- 叙述作文
- 时间老了
- 清明,是追思、是传承、是感恩。
- 我错了,余生不再打扰