v1v2v3v4 (latest)

Video Classification with Channel-Separated Convolutional Networks

4 April 2019

Heng Wang

Papers citing "Video Classification with Channel-Separated Convolutional Networks"

50 / 327 papers shown

Title
A Baseline Framework for Part-level Action Parsing and Action Recognition Xiaodong Chen Xinchen Liu Kun Liu Wu Liu Tao Mei 85 3 0 07 Oct 2021
CrossCLR: Cross-modal Contrastive Learning For Multi-modal Video Representations Mohammadreza Zolfaghari Yi Zhu Peter V. Gehler Thomas Brox 191 130 0 30 Sep 2021
TSM: Temporal Shift Module for Efficient and Scalable Video Understanding on Edge Device Ji Lin Chuang Gan Kuan-Chieh Wang Song Han 100 65 0 27 Sep 2021
LRWR: Large-Scale Benchmark for Lip Reading in Russian language E. Egorov Vasily Kostyumov M. Konyk Sergey Kolesnikov 51 10 0 14 Sep 2021
Negative Sample Matters: A Renaissance of Metric Learning for Temporal Grounding Zhenzhi Wang Limin Wang Tao Wu Tianhao Li Gangshan Wu AI4TS 110 122 0 10 Sep 2021
Efficient Action Recognition Using Confidence Distillation Shervin Manzuri Shalmani Fei Chiang Ronghuo Zheng 100 6 0 05 Sep 2021
Revisiting 3D ResNets for Video Recognition Xianzhi Du Yeqing Li Huayu Chen Rui Qian Jing Li Irwan Bello 160 17 0 03 Sep 2021
Searching for Two-Stream Models in Multivariate Space for Video Recognition Xinyu Gong Heng Wang Zheng Shou Matt Feiszli Zhangyang Wang Zhicheng Yan 85 9 0 30 Aug 2021
Shifted Chunk Transformer for Spatio-Temporal Representational Learning Xuefan Zha Wentao Zhu Tingxun Lv Sen Yang Ji Liu AI4TS ViT 86 27 0 26 Aug 2021
Dynamic Network Quantization for Efficient Video Inference Ximeng Sun Yikang Shen Chun-Fu Chen A. Oliva Rogerio Feris Kate Saenko 89 46 0 23 Aug 2021
MM-ViT: Multi-Modal Video Transformer for Compressed Video Action Recognition Jiawei Chen C. Ho ViT 98 78 0 20 Aug 2021
UNIK: A Unified Framework for Real-world Skeleton-based Action Recognition Di Yang Yaohui Wang A. Dantcheva Lorenzo Garattoni Gianpiero Francesca Francois Bremond 83 49 0 19 Jul 2021
Delta Sampling R-BERT for limited data and low-light action recognition Sanchit Hira Ritwik Das Abhinav Modi D. Pakhomov 101 17 0 12 Jul 2021
Universal 3-Dimensional Perturbations for Black-Box Attacks on Video Recognition Systems Shangyu Xie Han Wang Yu Kong Yuan Hong AAML 56 27 0 09 Jul 2021
iMiGUE: An Identity-free Video Dataset for Micro-Gesture Understanding and Emotion Analysis Xin Liu Henglin Shi Haoyu Chen Zitong Yu Xiaobai Li Guoying Zhao 82 83 0 01 Jul 2021
Generic Event Boundary Detection Challenge at CVPR 2021 Technical Report: Cascaded Temporal Attention Network (CASTANET) Dexiang Hong Congcong Li Longyin Wen Xinyao Wang Libo Zhang 55 13 0 01 Jul 2021
When Video Classification Meets Incremental Classes Hanbin Zhao Xin Qin Shihao Su Yongjian Fu Zibo Lin Xi Li CLL 73 28 0 30 Jun 2021
Feature Combination Meets Attention: Baidu Soccer Embeddings and Transformer based Temporal Detection Xin Zhou Le Kang Zhiyu Cheng Bo He Jingyu Xin 85 34 0 28 Jun 2021
Can An Image Classifier Suffice For Action Recognition? Quanfu Fan Chun-Fu Chen Chen Yikang Shen ViT 95 34 0 26 Jun 2021
Video Swin Transformer Ze Liu Jia Ning Yue Cao Yixuan Wei Zheng Zhang Stephen Lin Han Hu ViT 123 1,495 0 24 Jun 2021
Exploring Stronger Feature for Temporal Action Localization Zhiwu Qing Xiang Wang Ziyuan Huang Yutong Feng Shiwei Zhang Jianwen Jiang Mingqian Tang Changxin Gao Nong Sang 59 4 0 24 Jun 2021
Towards Long-Form Video Understanding Chaoxia Wu Philipp Krahenbuhl VLM ViT 117 170 0 21 Jun 2021
Weakly-Supervised Temporal Action Localization Through Local-Global Background Modeling Xiang Wang Zhiwu Qing Ziyuan Huang Yutong Feng Shiwei Zhang Jianwen Jiang Mingqian Tang Yuanjie Shao Nong Sang 132 4 0 20 Jun 2021
Proposal Relation Network for Temporal Action Detection Xiang Wang Zhiwu Qing Ziyuan Huang Yutong Feng Shiwei Zhang Jianwen Jiang Mingqian Tang Changxin Gao Nong Sang ViT 45 25 0 20 Jun 2021
Long-Short Temporal Contrastive Learning of Video Transformers Jue Wang Gedas Bertasius Du Tran Lorenzo Torresani VLM ViT 140 50 0 17 Jun 2021
Relation Modeling in Spatio-Temporal Action Localization Yutong Feng Jianwen Jiang Ziyuan Huang Zhiwu Qing Xiang Wang Shiwei Zhang Mingqian Tang Yue Gao 61 11 0 15 Jun 2021
A Stronger Baseline for Ego-Centric Action Detection Zhiwu Qing Ziyuan Huang Xiang Wang Yutong Feng Shiwei Zhang Jianwen Jiang Mingqian Tang Changxin Gao M. Ang Nong Sang EgoV 61 3 0 13 Jun 2021
Space-time Mixing Attention for Video Transformer Adrian Bulat Juan-Manuel Perez-Rua Swathikiran Sudhakaran Brais Martínez Georgios Tzimiropoulos ViT 93 127 0 10 Jun 2021
Keeping Your Eye on the Ball: Trajectory Attention in Video Transformers Mandela Patrick Dylan Campbell Yuki M. Asano Ishan Misra Ishan Misra Florian Metze Christoph Feichtenhofer Andrea Vedaldi João F. Henriques 105 282 0 09 Jun 2021
Towards Training Stronger Video Vision Transformers for EPIC-KITCHENS-100 Action Recognition Ziyuan Huang Zhiwu Qing Xiang Wang Yutong Feng Shiwei Zhang Jianwen Jiang Zhurong Xia Mingqian Tang Nong Sang M. Ang ViT 64 11 0 09 Jun 2021
Anticipative Video Transformer Rohit Girdhar Kristen Grauman ViT 71 211 0 03 Jun 2021
CT-Net: Channel Tensorization Network for Video Classification Kunchang Li Xianhang Li Yali Wang Jun Wang Yu Qiao ViT 72 55 0 03 Jun 2021
TSI: Temporal Saliency Integration for Video Action Recognition Haisheng Su Kunchang Li Jinyuan Feng Dongliang Wang Weihao Gan Wei Wu Yu Qiao 46 4 0 02 Jun 2021
SSAN: Separable Self-Attention Network for Video Representation Learning Xudong Guo Xun Guo Yan Lu ViT AI4TS 55 26 0 27 May 2021
DSANet: Dynamic Segment Aggregation Network for Video-Level Representation Learning Wenhao Wu Yuxiang Zhao Yanwu Xu Xiao Tan Dongliang He ... Jinxing Ye Yingying Li Mingde Yao Zichao Dong Yifeng Shi AI4TS 91 29 0 25 May 2021
Temporal Action Proposal Generation with Transformers Lining Wang Haosen Yang Wenhao Wu Huanjin Yao Hujie Huang ViT 85 28 0 25 May 2021
VPN++: Rethinking Video-Pose embeddings for understanding Activities of Daily Living Srijan Das Rui Dai Di Yang Francois Bremond ViT 104 70 0 17 May 2021
MutualNet: Adaptive ConvNet via Mutual Learning from Different Model Configurations Taojiannan Yang Sijie Zhu Matías Mendieta Pu Wang Ravikumar Balakrishnan Minwoo Lee T. Han M. Shah Chong Chen 3DH OOD 100 23 0 14 May 2021
AdaMML: Adaptive Multi-Modal Learning for Efficient Video Recognition Yikang Shen Chun-Fu Chen Quanfu Fan Ximeng Sun Kate Saenko A. Oliva Rogerio Feris 90 50 0 11 May 2021
Adaptive Focus for Efficient Video Recognition Yulin Wang Zhaoxi Chen Haojun Jiang Shiji Song Yizeng Han Gao Huang 95 100 0 07 May 2021
Revisiting Skeleton-based Action Recognition Haodong Duan Yue Zhao Kai-xiang Chen Dahua Lin Bo Dai 3DH 102 502 0 28 Apr 2021
FrameExit: Conditional Early Exiting for Efficient Video Recognition Amir Ghodrati B. Bejnordi A. Habibian 142 81 0 27 Apr 2021
VidTr: Video Transformer Without Convolutions Yanyi Zhang Xinyu Li Chunhui Liu Bing Shuai Yi Zhu Biagio Brattoli Hao Chen I. Marsic Joseph Tighe ViT 256 198 0 23 Apr 2021
Multiscale Vision Transformers Haoqi Fan Bo Xiong K. Mangalam Yanghao Li Zhicheng Yan Jitendra Malik Christoph Feichtenhofer ViT 135 1,271 0 22 Apr 2021
VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text Hassan Akbari Liangzhe Yuan Rui Qian Wei-Hong Chuang Shih-Fu Chang Huayu Chen Boqing Gong ViT 339 593 0 22 Apr 2021
Skimming and Scanning for Untrimmed Video Action Recognition Yunyan Hong Ailing Zeng Min Li Cewu Lu Li Jiang Qiang Xu 96 0 0 21 Apr 2021
Writing in The Air: Unconstrained Text Recognition from Finger Movement Using Spatio-Temporal Convolution Ue-Hwan Kim Yewon Hwang Sun-Kyung Lee Jong-Hwan Kim 59 20 0 19 Apr 2021
Higher Order Recurrent Space-Time Transformer for Video Action Prediction Tsung-Ming Tai G. Fiameni Cheng-Kuang Lee Oswald Lanz 57 9 0 17 Apr 2021
ADNet: Temporal Anomaly Detection in Surveillance Videos H. Öztürk Ahmet Burak Can 125 15 0 14 Apr 2021
Object Priors for Classifying and Localizing Unseen Actions Pascal Mettes William Thong Cees G. M. Snoek 74 20 0 10 Apr 2021