ECO: Efficient Convolutional Network for Online Video Understanding

24 April 2018

Thomas Brox

Papers citing "ECO: Efficient Convolutional Network for Online Video Understanding"

50 / 199 papers shown

Title
Dual-Stage Approach Toward Hyperspectral Image Super-Resolution Qiang Li Yuan. Yuan Wenxuan Wang Qi. Wang SupR 17 79 0 09 Apr 2022
Long Movie Clip Classification with State-Space Video Models Md. Mohaiminul Islam Gedas Bertasius VLM 43 102 0 04 Apr 2022
Gate-Shift-Fuse for Video Action Recognition Swathikiran Sudhakaran Sergio Escalera Oswald Lanz 22 22 0 16 Mar 2022
Motion-driven Visual Tempo Learning for Video-based Action Recognition Yuanzhong Liu Junsong Yuan Zhigang Tu 21 58 0 24 Feb 2022
Shift-Memory Network for Temporal Scene Segmentation Guo Cheng J. Zheng 28 0 0 17 Feb 2022
MeMViT: Memory-Augmented Multiscale Vision Transformer for Efficient Long-Term Video Recognition Chao-Yuan Wu Yanghao Li K. Mangalam Haoqi Fan Bo Xiong Jitendra Malik Christoph Feichtenhofer ViT 48 198 0 20 Jan 2022
Action Keypoint Network for Efficient Video Recognition Xu Chen Yahong Han Xiaohan Wang Yifang Sun Yi Yang 3DPC 27 6 0 17 Jan 2022
OCSampler: Compressing Videos to One Clip with Single-step Sampling Jintao Lin Haodong Duan Kai-xiang Chen Dahua Lin Limin Wang 37 24 0 12 Jan 2022
Representing Videos as Discriminative Sub-graphs for Action Recognition Dong Li Zhaofan Qiu Yingwei Pan Ting Yao Houqiang Li Tao Mei 42 25 0 11 Jan 2022
Glance and Focus Networks for Dynamic Visual Recognition Gao Huang Yulin Wang Kangchen Lv Haojun Jiang Wenhui Huang Pengfei Qi S. Song 3DH 79 49 0 09 Jan 2022
AdaFocus V2: End-to-End Training of Spatial Dynamic Networks for Video Recognition Yulin Wang Yang Yue Yuanze Lin Haojun Jiang Zihang Lai V. Kulikov Nikita Orlov Humphrey Shi Gao Huang 16 50 0 28 Dec 2021
ACGNet: Action Complement Graph Network for Weakly-supervised Temporal Action Localization Zichen Yang Jie Qin Di Huang 25 56 0 21 Dec 2021
Temporal Transformer Networks with Self-Supervision for Action Recognition Yongkang Zhang Jun Li Guoming Wu Hanjie Zhang Zhiping Shi Zhaoxun Liu Zizhang Wu ViT 27 4 0 14 Dec 2021
STSM: Spatio-Temporal Shift Module for Efficient Action Recognition Zhaoqilin Yang Gaoyun An 28 5 0 05 Dec 2021
BEVT: BERT Pretraining of Video Transformers Rui Wang Dongdong Chen Zuxuan Wu Yinpeng Chen Xiyang Dai Mengchen Liu Yu-Gang Jiang Luowei Zhou Lu Yuan ViT 36 203 0 02 Dec 2021
Self-Regulated Learning for Egocentric Video Activity Anticipation Zhaobo Qi Shuhui Wang Chi Su Li Su Qingming Huang Q. Tian EgoV 41 52 0 23 Nov 2021
Efficient Video Transformers with Spatial-Temporal Token Selection Junke Wang Xitong Yang Hengduo Li Li Liu Zuxuan Wu Yu-Gang Jiang ViT 21 63 0 23 Nov 2021
ST-ABN: Visual Explanation Taking into Account Spatio-temporal Information for Video Recognition Masahiro Mitsuhara Tsubasa Hirakawa Takayoshi Yamashita H. Fujiyoshi 27 1 0 29 Oct 2021
Temporal-attentive Covariance Pooling Networks for Video Recognition Zilin Gao Qilong Wang Bingbing Zhang Q. Hu P. Li 21 24 0 27 Oct 2021
Rethinking Generalization Performance of Surgical Phase Recognition with Expert-Generated Annotations Seungbum Hong Jiwon Lee Bokyung Park Ahmed A. Alwusaibie Anwar H. Alfadhel Sunghyun Park W. Hyung Min-Kook Choi 13 2 0 22 Oct 2021
GTM: Gray Temporal Model for Video Recognition Yanping Zhang Yongxin Yu 25 0 0 20 Oct 2021
Video Is Graph: Structured Graph Module for Video Action Recognition Rongjie Li Xiaojun Wu Tianyang Xu 43 12 0 12 Oct 2021
TSM: Temporal Shift Module for Efficient and Scalable Video Understanding on Edge Device Ji Lin Chuang Gan Kuan-Chieh Jackson Wang Song Han 40 64 0 27 Sep 2021
Temporal Shift Reinforcement Learning Deep Thomas Tichakorn Wongpiromsarn Ali Jannesari OffRL 15 0 0 05 Sep 2021
Efficient Action Recognition Using Confidence Distillation Shervin Manzuri Shalmani Fei Chiang Ronghuo Zheng 19 6 0 05 Sep 2021
Efficient Visual Recognition with Deep Neural Networks: A Survey on Recent Advances and New Directions Yang Wu Dingheng Wang Xiaotong Lu Fan Yang Guoqi Li W. Dong Jianbo Shi 29 18 0 30 Aug 2021
Cross-Modal Graph with Meta Concepts for Video Captioning Hao Wang Guosheng Lin S. Hoi C. Miao 22 6 0 14 Aug 2021
AutoVideo: An Automated Video Action Recognition System Daochen Zha Zaid Pervaiz Bhat Yi-Wei Chen Yicheng Wang Sirui Ding ... Mohammad Bhat AnmollKumar Jain Alfredo Costilla Reyes Na Zou Xia Hu 23 11 0 09 Aug 2021
Adaptive Recursive Circle Framework for Fine-grained Action Recognition Hanxi Lin Xinxiao Wu Jiebo Luo 25 1 0 25 Jul 2021
EAN: Event Adaptive Network for Enhanced Action Recognition Yuan Tian Yichao Yan Guangtao Zhai G. Guo Zhiyong Gao 35 41 0 22 Jul 2021
When Video Classification Meets Incremental Classes Hanbin Zhao Xin Qin Shihao Su Yongjian Fu Zibo Lin Xi Li CLL 19 28 0 30 Jun 2021
Long-Short Temporal Modeling for Efficient Action Recognition Liyu Wu Yuexian Zou Can Zhang 21 1 0 30 Jun 2021
Towards Long-Form Video Understanding Chaoxia Wu Philipp Krahenbuhl VLM ViT 49 165 0 21 Jun 2021
TokenLearner: What Can 8 Learned Tokens Do for Images and Videos? Michael S. Ryoo A. Piergiovanni Anurag Arnab Mostafa Dehghani A. Angelova ViT 37 127 0 21 Jun 2021
TNT: Text-Conditioned Network with Transductive Inference for Few-Shot Video Classification Andrés Villa Juan-Manuel Perez-Rua Victor Escorcia Vladimir Araujo Juan Carlos Niebles Alvaro Soto 27 0 0 21 Jun 2021
CT-Net: Channel Tensorization Network for Video Classification Kunchang Li Xianhang Li Yali Wang Jun Wang Yu Qiao ViT 22 55 0 03 Jun 2021
TSI: Temporal Saliency Integration for Video Action Recognition Haisheng Su Kunchang Li Jinyuan Feng Dongliang Wang Weihao Gan Wei Wu Yu Qiao 27 4 0 02 Jun 2021
DSANet: Dynamic Segment Aggregation Network for Video-Level Representation Learning Wenhao Wu Yuxiang Zhao Yanwu Xu Xiao Tan Dongliang He ... Jinxing Ye Yingying Li Mingde Yao Zichao Dong Yifeng Shi AI4TS 24 27 0 25 May 2021
A multimodal deep learning framework for scalable content based visual media retrieval Ambareesh Ravi Amith Nandakumar 19 3 0 18 May 2021
Adaptive Focus for Efficient Video Recognition Yulin Wang Zhaoxi Chen Haojun Jiang Shiji Song Yizeng Han Gao Huang 39 98 0 07 May 2021
FrameExit: Conditional Early Exiting for Efficient Video Recognition Amir Ghodrati B. Bejnordi A. Habibian 37 81 0 27 Apr 2021
Three-stream network for enriched Action Recognition Ivaxi Sheth 11 4 0 27 Apr 2021
Temp-Frustum Net: 3D Object Detection with Temporal Fusion Emecc Erccelik Ekim Yurtsever Alois C. Knoll 3DPC 30 5 0 25 Apr 2021
Skimming and Scanning for Untrimmed Video Action Recognition Yunyan Hong Ailing Zeng Min Li Cewu Lu Li Jiang Qiang Xu 19 0 0 21 Apr 2021
MGSampler: An Explainable Sampling Strategy for Video Action Recognition Yuan Zhi Zhan Tong Limin Wang Gangshan Wu TTA 19 72 0 20 Apr 2021
Beyond Short Clips: End-to-End Video-Level Learning with Collaborative Memories Xitong Yang Haoqi Fan Lorenzo Torresani L. Davis Heng Wang VLM 19 20 0 02 Apr 2021
Adaptive Configuration of In Situ Lossy Compression for Cosmology Simulations via Fine-Grained Rate-Quality Modeling Sian Jin Jesus Pulido Pascal Grosset Jiannan Tian Dingwen Tao J. Ahrens 13 22 0 01 Apr 2021
No frame left behind: Full Video Action Recognition X. Liu S. Pintea F. Karimi Nejadasl O. Booij J. C. V. Gemert 19 40 0 29 Mar 2021
A Comprehensive Review of the Video-to-Text Problem Jesus Perez-Martin B. Bustos S. Guimarães I. Sipiran Jorge A. Pérez Grethel Coello Said 13 17 0 27 Mar 2021
An Image is Worth 16x16 Words, What is a Video Worth? Gilad Sharir Asaf Noy Lihi Zelnik-Manor ViT 19 120 0 25 Mar 2021