在研究步态识别初,我一直很好奇,为什么CASIA-B数据集是有轮廓版本,为什么不是原图,与mnist,COCO这种数据集完全不同,后来明白了,该问题的关键是:什么是步态识别?什么是行人再识别?行人再识别就是根据行人的衣服穿戴特征进行识别,属于静态特征,比如行人的衣服颜色,帽子,裤子长短这些都是静态特征,事实上,当一个人换了衣服颜色甚至是故意将两个人混淆穿戴,行人再识别就是弟弟了,而步态识别就是爸爸,因为步态识别不关注你穿什么,而关注你的关节、躯干的静态信息、身体行走变化的动态信息。这就是为什么步态数据集要用到轮廓图。由此可以得到一个结论,如果以目前基于深度学习的方法进行步态识别,那么该算法所采用的步态数据集不应该关注与行人的衣服,穿戴。事实上,卷积神经网络确实没法不关注。只要给一张”带色“的图片,网络就会被该特征吸引,那么最好的方法就是将行人轮廓图分割出来。
想象这么一个场景,国家级机密基地,比如说核试验基地,一个工作人员通过身份识别通道,今天他穿了一件黄色短袖,而第二天他穿了一件白色长衣,将立马被认证为外人入侵,行人再识别无法实现长期的身份检测。而步态识别可以做到,只要没有意外或者疾病干扰你走路的状态,这种身份识别系统将长期有效。
步态识别的难度在于忽略衣服和协变量的特征干扰,而只关注与步态特征本身,包括关节身高头型行走的姿态等,所以CASIA-B数据集直接公开了轮廓数据集,虽然没有原图看起来有特征鲜明,但是这就是步态识别,类似于蒙上眼睛听”色子“,只能从一段轮廓图序列中找特征。
【CASIA-B数据集的一些粗糙理解2】CASIA-B轮廓图不仅分辨率低,而且分割情况也没有特别完美。目前做步态识别的除了写论文,如果要商业化,基本竞争不过水滴。