Compressed Video Action Recognition(CVPR 2018) ML

最近在研究Action recognition 方面的算法，Compressed Video Action Recognition 提出了一个比较新颖的算法
也是 CVPR2018 action recognition方面比较有代表性的文章。
代码可详见github.
首先看一下，作者于文中列出的第一张图

文章图片

图中作者简要的对比了传统的RGB作为输入和提出的使用I-frame、motion vectors、residual
作为输入方法；
作者在文中详细阐述了提出的输入和网络结构：
1、输入
I-frame 了解视频编码的都清楚;
motion vectors 包含于P-frame中，作者拜托其依赖性对其进行了改进

文章图片

【Compressed Video Action Recognition(CVPR 2018)】上面列出了原文公式，主要思路是根据motion vectors 逐帧向前追溯图片中每个像素点，
但，代码实现时是以I-frame为起始点逐帧向后追溯的。
residual: 通过I-frame和P-frame解码后的帧和实际帧之间的差值，
2、网络结构
作者提出的网络结构

文章图片

将I-frame输入至ResNet-152中，由于motion-vector和residual相对于I-frame包含的信息较少
故将其输入至ResNet-18中；并且都是在ImageNet上进行的预训练。
对于最后的输出分类评分，作者使用了简单的求和平均。
最后看一下性能

文章图片

在UCF-101上获得了90.4%的增益，在HMDB-51上获得了59.1的增益，效果还是比较不错的。

Compressed Video Action Recognition(CVPR 2018)

推荐阅读

信贷逾期能去银行开户吗知乎信贷逾期能去银行开户吗？

英语演讲拍摄什么，英语演讲需要准备什么

sql 组内加序号 mysql组内加序号

plc按输出类型分为哪三类，写出plc常用的三种输出类型

李白、苏东坡两人,他们的共同点、不同点是什么？

硬核科技OPPO|硬核科技OPPO Reno系列4月1日正式开启预约

糖尿病|糖尿病主食怎么吃？听听3名糖尿病患者怎么说！吃饱吃好不升糖

冰箱的功能和作用：了解冰箱的各种特性及其在日常生活中的重要作用

盈余公积主要用途包括哪些盈余公积的形成

黄桃和水蜜桃味道有什么不一样

如何制作数据图表视频教学如何制作数据图表视频，如何制作数据图表视频教程

晚上吃水煮秋葵可以减肥吗

游戏版|红米K40游戏手机未售先崩！谁也没想到，“打脸”竟来得如此之快！

核酸结果检测中要多久可以出来

白醋洗白衣服的正确方法白醋洗白衣服的正确步骤

可以带一小瓶花椒油上飞机吗

鼠简笔画鼠简笔画报

redis客户端工具有哪些 redis支持客户端

甲状腺弥漫性肿大怎样治疗甲状腺弥漫性肿大

最新版苹果ipad是哪款，哪一款ipad是最新出来的叫什么名字