ARTnet: caffe实现:代码 1 Motivation:How to model appearance and relation (motion) 主要工作是在3D卷积的基础上,提升了action recognition的准确率,没有使用光流信息,因为光流的提取速度特别慢&#…
《Appearance-and-Relation Networks for Video Classification》
链接: https://arxiv.org/abs/1711.09125. 这篇文章中,作者认为在分类视频工作时最主要要抓住两点,1是每一帧的静态外观,2、是跨多帧之间的时序关系。
帧的静态外观很好提取,处理视频最重要的难点就在于…