更多内容关注公众号“张大刀” 大家好,我是张大刀
文章图片
前两天写完目标检测的评价标准map后,有人在后台私信我如果map只能对目标检测大概评价,那具体到具体项目,真的要每次自己去将检测结果过一遍,人为去发现漏检和误检的数据特征吗?
额,作为人工智能当然不允许这样的事情发生。想起来之前在公众号中写到的TIDE
模块,开始以为是某one的实用模块,后来才发现原来大佬是发了ECCV2020,孤陋寡闻了。。立马拜读下。这一拜读后,竟然发现很多惊喜。
文章图片
对于目标检测,常见使用map做为评价指标,详情可以看《【小白入坑篇】目标检测的评价指标map》,map能大概评估目标检测模型的性能,在实际的检测过程中,还要对map庖丁解牛。然后在读TIDE模块时,意外发现几个其他几个优秀的工具,对于白嫖党的我,只想说:
文章图片
COCO Analysis Toolkit COCO官网上不仅公布了计算map的python和matlab代码,在最后面加入了对误报和漏检的分析。以下是 Derek Hoiem等人对Resnet检测器的结果分析:
文章图片
- C75:PR at IoU=.75(AP at strict IoU),曲线下面积对应于 AP IoU=.75。
- C50:PR at IoU=.50(AP at PASCAL IoU),曲线下面积对应于 AP IoU=.50。
- Loc:IoU=.10 的 PR(忽略定位错误,但不重复检测)。所有剩余的设置都使用 IoU=.1。
- Sim : 删除超类别误报 (fps) 后的 PR。具体来说,与具有不同类标签但属于同一超类别的对象的任何匹配都不算作 fp(或 tp)。通过将同一超类别中的所有对象设置为具有与所讨论的类别相同的类别标签并将其忽略标志设置为 1 来计算 Sim。请注意,人是单例超类别,因此其 Sim 结果与 Loc 相同。
- Oth:在消除所有类混淆之后的 PR。与 Sim 类似,但现在如果检测与任何其他对象匹配,则它不再是 fp(或 tp)。Oth 是通过将所有其他对象设置为与所讨论的类具有相同的类标签并将它们的忽略标志设置为 1 来计算的。
- BG : PR 在所有背景(和类混淆) fps 被删除后。对于单个类别,BG 是一个阶梯函数,在达到最大召回率之前为 1,然后下降到 0(跨类别平均后曲线更平滑)。
- FN:移除所有剩余错误后的 PR(通常 AP=1)。
Derek Hoiem有分析一堆的pdf结果,感兴趣可以上【1】白嫖。
FiftyOne FiftyOne,提供对象检测评估分析的可视化工具,不仅可以计算 AP,还可以轻松地 可视化单个样本和对象级别的结果, 查看精确召回曲线,并绘制交互式混淆矩阵等,一开始以为FiftyOne只用于目标检测中,看完官网后发现强大的不行,分类、目标检测、语义分割、关键点检测等预测结果均可以可视化,是一个优化模型的强大工具【2】。
UAP 19年的一篇文章,本来作者大佬是在主流检测框架 mmdetection,detectron2上,基于多个数据集探讨多个检测器所能达到的性能上限,人为的消除定位问题,看分类达到的性能效果,再基于分类达到的性能极限去评估AP的上界。
评估完的结果可以参见原文,这里放一张图:
文章图片
定义四种错误类型:
文章图片
对于每种错误,人为地消除后观察其提升,没有了分类方面的错误后,性能提升最明显:
文章图片
最后公布了他的分析工具UAP[5],在众佬都在刷map的时候,作者愿意分析统计各个算法的性能等,冲这个也要点赞一波。
TIDE ECCV2020的一篇文章,这里相对于Uap,将错误类型从4类增加到6类:
文章图片
- 分类错误:IoU??? ≥ t? 对于错误类别的box(即,定位正确但分类错误)。
- 定位误差:t? ≤ IoU??? ≤ t? 对于正确类别的box(即,分类正确但定位不正确)。
- Cls 和 Loc 错误:t? ≤ IoU??? ≤ t? 对于错误类别的box(即,分类错误和定位错误)。
- 重复检测错误:IoU??? ≥ t? 用于正确类别的box,但另一个更高得分的检测已经与该 GT 匹配(即,如果不是更高得分的检测,将是正确的)。
- 背景误差:IoU??? ≤ t? for all box(即,检测到的背景为前景)。
- Missed GT Error:分类或定位错误尚未涵盖的所有未检测到的ground truth(假阴性)。
文章图片
作者又从另外一个维度分析:
【目标检测|项目实战工具|目标检测评价map精细化系列工具】
文章图片
作者还从数据集和模型各个维度都有分析,感兴趣查看原论文。
TIDE提供了目标检测的分析工具通过:
pip install tidecv
导入安装,输入正确结果和预测结果:
from tidecv import TIDE, datasetstide = TIDE()
tide.evaluate(datasets.COCO(), datasets.COCOResult('path/to/your/results/file'), mode=TIDE.BOX) # Use TIDE.MASK for masks
tide.summarize()# Summarize the results as tables in the console
tide.plot()# Show a summary figure. Specify a folder and it'll output a png to that folder.
运行显示如下:
-- mask_rcnn_bbox --bbox AP @ 50: 61.80Main Errors
=============================================================
TypeClsLocBothDupeBkgMiss
-------------------------------------------------------------
dAP3.406.651.180.193.967.53
=============================================================Special Error
=============================
TypeFalsePosFalseNeg
-----------------------------
dAP16.2815.57
============================
可视化结果:
文章图片
以上是在阅读论文时发现的几个关于目标检测模型评价精细化的工具,可以作为在目标检测模型优化时的思路,昨天试了下TIDE效果,对于自己项目中十几万的数据集,有种抽丝剥茧的清爽感扑面而来。。希望对大家也有用。
文章图片
参考:
[1] https://cocodataset.org/#detection-eval
[2] https://voxel51.com/docs/fiftyone/index.html
[3] https://zhuanlan.zhihu.com/p/94990078
[4]https://arxiv.org/abs/1911.12451
[5]https://github.com/aliborji/DetectionUpperbound
[6] https://arxiv.org/pdf/2008.08115.pdf
[7] https://dbolya.github.io/tide/
推荐阅读
- 目标检测|评价目标检测的方法map 新方法 TIDE
- 目标检测|yolov5 提速多GPU训练显存低的问题
- 深度学习|人工智能深度学习交流群
- python|【python开发】1. __init__.py与导包
- 目标检测|【yolov5 6.0 源码解析】---utils /augmentations.py
- 机器学习|西瓜书《机器学习》第三章重点总结(下,二分类线性判别分析)
- 机器学习|西瓜书《机器学习》第三章重点总结(上,一元线性回归)
- 人工智能|西瓜书《机器学习》第三章重点总结(中2,对数几率回归)
- 机器学习|西瓜书《机器学习》第三章重点总结(中,多元线性回归)