A VERSATILE MULTI-VIEW FRAMEWORK FOR LIDAR-BASED 3D OBJECT DETECTION WITH GUIDANCE FROM PANOPTIC SEGMENTATION
- Contribution:
- Keyknowledge:
-
- Cascade RV Feature Fusion Module:融合多级Range View特征
- Attention-based RV-BEV Feature Weighting Module:对RV-BEV两个特征图加权突出重要的特征值。
- Class-wise Foreground Attention Module:将前景语义信息嵌入到特征中
- Center Density Heatmap Module:计算中心点密度
- Experiments
文章图片
灰色表示CPSeg模块,蓝色表示CenterPoint模块
Contribution:
- 提出了一个多任务框架(全景分割+目标检测),全景分割改进目标检测。
- 框架可用于任何基于BEV的目标检测方法
- 大量实验与消融实验
- Multi-View Backbone Augmentation
RV:特征表示密集,容易检测小物体。但是存在大小变化(近大远小)和遮挡。
BEV:不存在近大远小和遮挡的问题,容易检测密集的目标与确定边界。但稀疏性不利于检测小目标。
文章图片
将全景分割提供的三个不同分辨率特征图从r1(最小分辨率)开始,先通过Convolutional Block Attention Module(CBAM)模块逐层对特征图进行注意力加权特征再经过反卷积上采样连接到更高分辨率的特征图直到最高分辨率的r3特征图。然后投影到BEV平面,经过Space2Depth + Conv 1x1降采样块压缩分辨率适应2D BackBone检测头。
Attention-based RV-BEV Feature Weighting Module:对RV-BEV两个特征图加权突出重要的特征值。
文章图片
使用了修改的CBAM模块对RV、BEV两个特征图分别计算通道注意力特征图和空间注意力特征图,将两个特征图广播后相加再激活生成注意力图。用注意力图加权输入的RV-BEV特征,突出对检测任务有帮助的特征值。最后与输入特征相加得到注意力加权多视角的特征图。
基于注意力的特征加权图可视化:红色和蓝色的区域分别表示BEV和RV特征被认为具有更高权重的位置。
文章图片
基于注意力的RV-BEV加权模块为代表附近和较小物体的RV特征分配了更高的权重,而对于被遮挡和远处的物体,更倾向于支持BEV特征。
Class-wise Foreground Attention Module:将前景语义信息嵌入到特征中 由于论文缺少模块图,且尚未开源
文章图片
根据文字叙述按自己的理解画了模块图:
文章图片
将全景分割提供的每个点的每个前景类概率(不考虑背景点)进行maxpooling下采样到与RV-BEV加权特征图相同分辨率。之后按类进行加权:每个类按概率按元素乘对特征图进行每一类的加权后1×1卷积压缩通道维度得到Class-wise Foreground Attention Map,最后再将每一类的加权图连接通过1×1卷积改变特征图形状与输入RV-BEV特征图相同,再将二者相加得到最终的加权特征图。
Center Density Heatmap Module:计算中心点密度 通过CPSeg估计的每个点的3D BBox中心偏移量绘制 Center Density Heatmap:
先利用前景掩码过去背景点,剩余点根据偏移预测进行偏移并投影到BEV平面上,再根据Heatmap函数创建Heatmap:
文章图片
C(x,y)表示投影到该点的数量。
一个点被预测为中心点的次数越多值越大,颜色越深(绿色):
文章图片
Experiments Sota:
文章图片
消融实验:
文章图片
多任务框架的有效性:
文章图片
多任务的有效性(单任务预先训练CPSeg):
文章图片
推荐阅读
- pytorch学习|深度学习pytorch代码: transforms结构及用法 常见的transforms
- 人工智能|Pytorch(colab端)——基于VGG模型迁移学习的猫狗大战
- 神经网络|完整的动手指南,可在Google Colab GPU上训练你的神经网络模型
- 百度飞桨|百度飞桨((情人节特辑)想做就做,让爱豆对你说情话,过凡尔赛式情人节~)
- 百度飞桨|百度飞桨(春节写春联:你写上联,AI写下联)
- 百度飞桨|基于卷积神经网络VGG实现水果分类识别
- 人工智能|掌握神经网络的法宝(二)
- windows|一步步教你查看cuda和cudnn版本
- 人工智能|全连接层的算力计算方式