TDN: Temporal Difference Networks for Efficient Action Recognition

18 December 2020

Gangshan Wu

Papers citing "TDN: Temporal Difference Networks for Efficient Action Recognition"

50 / 161 papers shown

Title
CoGenAV: Versatile Audio-Visual Representation Learning via Contrastive-Generative Synchronization Detao Bai Zhiheng Ma Xihan Wei Liefeng Bo 144 0 0 06 May 2025
Taming Consistency Distillation for Accelerated Human Image Animation Xinyu Wang Shiwei Zhang Hangjie Yuan Yujie Wei Yang Zhang Changxin Gao Yuehuan Wang Nong Sang VGen 35 0 0 15 Apr 2025
Audio-visual Event Localization on Portrait Mode Short Videos Wuyang Liu Yi Chai Yongpeng Yan Yanzhen Ren 32 0 0 09 Apr 2025
Is Temporal Prompting All We Need For Limited Labeled Action Recognition? Shreyank N. Gowda Boyan Gao Xiao Gu Xiaobo Jin VLM 41 0 0 02 Apr 2025
Ultrasound Image-to-Video Synthesis via Latent Dynamic Diffusion Models Tingxiu Chen Yilei Shi Zixuan Zheng Bingcong Yan Jingliang Hu Xiao Xiang Zhu Lichao Mou VGen MedIm 57 3 0 19 Mar 2025
YOLOMG: Vision-based Drone-to-Drone Detection with Appearance and Pixel-Level Motion Fusion Hanqing Guo Xiuxiu Lin Shiyu Zhao 144 0 0 10 Mar 2025
Uni-AdaFocus: Spatial-temporal Dynamic Computation for Video Recognition Yulin Wang Haoji Zhang Yang Yue Shiji Song Chao Deng Junlan Feng Gao Huang 79 3 0 15 Dec 2024
EdgeOAR: Real-time Online Action Recognition On Edge Devices Wei Luo Deyu Zhang Ying Tang Fan Wu Yaoxue Zhang 72 0 0 02 Dec 2024
Towards Student Actions in Classroom Scenes: New Dataset and Baseline Zhuolin Tan Chenqiang Gao Anyong Qin Ruixin Chen Tiecheng Song Feng Yang Deyu Meng 29 0 0 02 Sep 2024
CathAction: A Benchmark for Endovascular Intervention Understanding Baoru Huang Tuan Vo Chayun Kongtongvattana G. Dagnino Dennis Kundrat ... Francisco Vasconcelos Danail Stoyanov Daniel Elson Ferdinando Rodriguez y Baena Anh Nguyen 44 2 0 23 Aug 2024
TDS-CLIP: Temporal Difference Side Network for Image-to-Video Transfer Learning Bin Wang Wenqian Wang VLM 37 1 0 20 Aug 2024
Flatten: Video Action Recognition is an Image Classification task Junlin Chen Chengcheng Xu Yangfan Xu Jian Yang Jun Yu Li Zhiping Shi 39 1 0 17 Aug 2024
Dynamic and Compressive Adaptation of Transformers From Images to Videos Guozhen Zhang Jingyu Liu Shengming Cao Xiaotong Zhao Kevin Zhao Kai Ma Limin Wang ViT 29 1 0 13 Aug 2024
Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts Peng Wu Xuerong Zhou Guansong Pang Zhiwei Yang Qingsen Yan Peng Wang Yanning Zhang 28 9 0 12 Aug 2024
Hyper-parameter tuning for text guided image editing Shiwen Zhang DiffM 45 0 0 31 Jul 2024
A Comprehensive Review of Few-shot Action Recognition Yuyang Wanyan Xiaoshan Yang Weiming Dong Changsheng Xu VLM 77 3 0 20 Jul 2024
AU-vMAE: Knowledge-Guide Action Units Detection via Video Masked Autoencoder Qiaoqiao Jin Rui Shi Yishun Dou Bingbing Ni CVBM 53 0 0 16 Jul 2024
C2C: Component-to-Composition Learning for Zero-Shot Compositional Action Recognition Rongchang Li Zhenhua Feng Tianyang Xu Linze Li Xiao-Jun Wu Muhammad Awais Sara Atito Josef Kittler CoGe 60 5 0 08 Jul 2024
PosMLP-Video: Spatial and Temporal Relative Position Encoding for Efficient Video Recognition Y. Hao Diansong Zhou Zhicai Wang Chong-Wah Ngo Meng Wang ViT 40 4 0 03 Jul 2024
TransferAttn: Transferable-guided Attention Is All You Need for Video Domain Adaptation Andre Sacilotti Samuel Felipe dos Santos N. Sebe Jurandy Almeida ViT 47 0 0 01 Jul 2024
Triple-domain Feature Learning with Frequency-aware Memory Enhancement for Moving Infrared Small Target Detection Weiwei Duan Luping Ji Shengjia Chen Sicheng Zhu Mao Ye 76 4 0 11 Jun 2024
RNNs, CNNs and Transformers in Human Action Recognition: A Survey and a Hybrid Model Khaled Alomar Halil Ibrahim Aysel Xiaohao Cai MedIm ViT 43 7 0 02 Jun 2024
ARVideo: Autoregressive Pretraining for Self-Supervised Video Representation Learning Sucheng Ren Hongru Zhu Chen Wei Yijiang Li Alan L. Yuille Cihang Xie AI4TS VGen SSL 59 1 0 24 May 2024
No Time to Waste: Squeeze Time into Channel for Mobile Video Understanding Yingjie Zhai Wenshuo Li Yehui Tang Xinghao Chen Yunhe Wang ViT 30 0 0 14 May 2024
Deep video representation learning: a survey Elham Ravanbakhsh Yongqing Liang J. Ramanujam Xin Li 49 3 0 10 May 2024
Mamba-360: Survey of State Space Models as Transformer Alternative for Long Sequence Modelling: Methods, Applications, and Challenges Badri N. Patro Vijay Srinivas Agneeswaran Mamba 46 38 0 24 Apr 2024
SportsHHI: A Dataset for Human-Human Interaction Detection in Sports Videos Tao Wu Runyu He Gangshan Wu Limin Wang 3DH 54 3 0 06 Apr 2024
Learning Correlation Structures for Vision Transformers Manjin Kim Paul Hongsuck Seo Cordelia Schmid Minsu Cho ViT 40 7 0 05 Apr 2024
Enhancing Video Transformers for Action Understanding with VLM-aided Training Hui Lu Hu Jian Ronald Poppe A. A. Salah 42 1 0 24 Mar 2024
Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding Guo Chen Yifei Huang Jilan Xu Baoqi Pei Zhe Chen Zhiqi Li Jiahao Wang Kunchang Li Tong Lu Limin Wang Mamba 64 73 0 14 Mar 2024
VideoMamba: State Space Model for Efficient Video Understanding Kunchang Li Xinhao Li Yi Wang Yinan He Yali Wang Limin Wang Yu Qiao Mamba 37 182 0 11 Mar 2024
Advancing Human Action Recognition with Foundation Models trained on Unlabeled Public Videos Yang Qian Yinan Sun A. Kargarandehkordi Parnian Azizian O. Mutlu Saimourya Surabhi Pingyi Chen Zain Jabbar Dennis Paul Wall Peter Washington OffRL 29 1 0 14 Feb 2024
Taylor Videos for Action Recognition Lei Wang Xiuyuan Yuan Tom Gedeon Liang Zheng 26 6 0 05 Feb 2024
ContactGen: Contact-Guided Interactive 3D Human Generation for Partners Dongjun Gu Jaehyeok Shim Jaehoon Jang Changwoo Kang Kyungdon Joo DiffM 26 2 0 30 Jan 2024
Computer Vision for Primate Behavior Analysis in the Wild Richard Vogg Timo Lüddecke Jonathan Henrich Sharmita Dey Matthias Nuske ... Alexander Gail Stefan Treue H. Scherberger F. Worgotter Alexander S. Ecker 35 3 0 29 Jan 2024
Adversarial Augmentation Training Makes Action Recognition Models More Robust to Realistic Video Distribution Shifts Kiyoon Kim Shreyank N. Gowda Panagiotis Eustratiadis Antreas Antoniou Robert B Fisher 45 2 0 21 Jan 2024
A Recipe for Scaling up Text-to-Video Generation with Text-free Videos Xiang Wang Shiwei Zhang Hangjie Yuan Zhiwu Qing Biao Gong Yingya Zhang Yujun Shen Changxin Gao Nong Sang DiffM VGen 33 26 0 25 Dec 2023
Video Recognition in Portrait Mode Mingfei Han Linjie Yang Xiaojie Jin Jiashi Feng Xiaojun Chang Heng Wang 30 3 0 21 Dec 2023
ConFormer: A Novel Collection of Deep Learning Models to Assist Cardiologists in the Assessment of Cardiac Function Ethan Thomas Salman Aslam MedIm 31 0 0 13 Dec 2023
Asymmetric Masked Distillation for Pre-Training Small Foundation Models Zhiyu Zhao Bingkun Huang Sen Xing Gangshan Wu Yu Qiao Limin Wang 42 5 0 06 Nov 2023
ConViViT -- A Deep Neural Network Combining Convolutions and Factorized Self-Attention for Human Activity Recognition Rachid Reda Dokkar F. Chaieb Hassen Drira Arezki Aberkane ViT 30 2 0 22 Oct 2023
ZeroI2V: Zero-Cost Adaptation of Pre-trained Transformers from Image to Video Xinhao Li Yuhan Zhu Limin Wang VLM 35 8 0 02 Oct 2023
Training a Large Video Model on a Single Machine in a Day Yue Zhao Philipp Krahenbuhl VLM 34 15 0 28 Sep 2023
Disentangling Spatial and Temporal Learning for Efficient Image-to-Video Transfer Learning Zhiwu Qing Shiwei Zhang Ziyuan Huang Yingya Zhang Changxin Gao Deli Zhao Nong Sang 27 18 0 14 Sep 2023
TransNet: A Transfer Learning-Based Network for Human Action Recognition Khaled Alomar Xiaohao Cai 34 1 0 13 Sep 2023
SCD-Net: Spatiotemporal Clues Disentanglement Network for Self-supervised Skeleton-based Action Recognition Cong Wu Xiaojun Wu Josef Kittler Tianyang Xu Sara Atito Muhammad Awais Zhenhua Feng 24 3 0 11 Sep 2023
LAC: Latent Action Composition for Skeleton-based Action Segmentation Di Yang Yaohui Wang A. Dantcheva Quan Kong Lorenzo Garattoni Gianpiero Francesca F. Brémond 42 9 0 28 Aug 2023
Computation-efficient Deep Learning for Computer Vision: A Survey Yulin Wang Yizeng Han Chaofei Wang Shiji Song Qi Tian Gao Huang VLM 34 20 0 27 Aug 2023
MOFO: MOtion FOcused Self-Supervision for Video Understanding Mona Ahmadian Frank Guerin Andrew Gilbert 38 2 0 23 Aug 2023
MGMAE: Motion Guided Masking for Video Masked Autoencoding Bingkun Huang Zhiyu Zhao Guozhen Zhang Yu Qiao Limin Wang 39 30 0 21 Aug 2023