The THUMOS Challenge on Action Recognition for Videos "in the Wild"

21 April 2016

Papers citing "The THUMOS Challenge on Action Recognition for Videos "in the Wild""

50 / 95 papers shown

Title
DiGIT: Multi-Dilated Gated Encoder and Central-Adjacent Region Integrated Decoder for Temporal Action Detection Transformer Ho-Joong Kim Y. E. Lee Jung-Ho Hong Seong-Whan Lee 47 0 0 09 May 2025
Action Spotting and Precise Event Detection in Sports: Datasets, Methods, and Challenges Hao Xu Arbind Agrahari Baniya Sam Well Mohamed Reda Bouadjenek Richard Dazeley S. Aryal AI4TS 29 0 0 06 May 2025
F $^3$ Set: Towards Analyzing Fast, Frequent, and Fine-grained Events from Videos Zhaoyu Liu Kan Jiang Murong Ma Zhé Hóu Yun Lin Jin Song Dong 37 0 0 11 Apr 2025
Jointly Understand Your Command and Intention:Reciprocal Co-Evolution between Scene-Aware 3D Human Motion Synthesis and Analysis Xuehao Gao Yang Yang Shaoyi Du Guo-Jun Qi Junwei Han 41 1 0 01 Mar 2025
WiFi CSI Based Temporal Activity Detection via Dual Pyramid Network Zhendong Liu Le Zhang Bing Li Yingjie Zhou Zhaoyu Chen Ce Zhu 82 1 0 28 Jan 2025
SEAL: Semantic Attention Learning for Long Video Representation Lan Wang Yujia Chen Wen-Sheng Chu Vishnu Boddeti Du Tran VLM 75 0 0 02 Dec 2024
Introducing Gating and Context into Temporal Action Detection Aglind Reka Diana Laura Borza Dominick Reilly Michal Balazia Francois Bremond 30 0 0 06 Sep 2024
Open-Vocabulary Temporal Action Localization using Multimodal Guidance Akshita Gupta Aditya Arora Sanath Narayan Salman Khan Fahad Shahbaz Khan Graham W. Taylor 41 3 0 21 Jun 2024
MALT: Multi-scale Action Learning Transformer for Online Action Detection Zhipeng Yang Ruoyu Wang Yang Tan Liping Xie OffRL 43 1 0 31 May 2024
One-Stage Open-Vocabulary Temporal Action Detection Leveraging Temporal Multi-scale and Action Label Features Trung Thanh Nguyen Yasutomo Kawanishi Takahiro Komamizu Ichiro Ide VLM 33 3 0 30 Apr 2024
RTAB-Map as an Open-Source Lidar and Visual SLAM Library for Large-Scale and Long-Term Online Operation Mathieu Labbé François Michaud 59 727 0 10 Mar 2024
SADA: Semantic adversarial unsupervised domain adaptation for Temporal Action Localization David Pujol-Perich Albert Clapés Sergio Escalera 37 0 0 20 Dec 2023
Enhancing Single-Frame Supervision for Better Temporal Action Localization Changjian Chen Jiashu Chen Weikai Yang Haoze Wang Johannes Knittel Xibin Zhao Steffen Koch Thomas Ertl Shixia Liu 33 3 0 08 Dec 2023
Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition Jiaming Zhou Hanjun Li Kun-Yu Lin Junwei Liang 29 1 0 28 Nov 2023
Boundary Discretization and Reliable Classification Network for Temporal Action Detection Zhenying Fang Jun Yu Richang Hong 26 0 0 10 Oct 2023
SkeleTR: Towrads Skeleton-based Action Recognition in the Wild Haodong Duan Mingze Xu Bing Shuai Davide Modolo Zhuowen Tu Joseph Tighe Alessandro Bergamo ViT 35 1 0 20 Sep 2023
UnLoc: A Unified Framework for Video Localization Tasks Shengjia Yan Xuehan Xiong Arsha Nagrani Anurag Arnab Zhonghao Wang Weina Ge David A. Ross Cordelia Schmid 33 53 0 21 Aug 2023
A Survey on Deep Learning-based Spatio-temporal Action Detection Peng Wang Fanwei Zeng Yu Qian 34 5 0 03 Aug 2023
Coincidental Generation Jordan W. Suchow Necdet Gurkan 33 0 0 03 Apr 2023
What, when, and where? -- Self-Supervised Spatio-Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions Brian Chen Nina Shvetsova Andrew Rouditchenko D. Kondermann Samuel Thomas Shih-Fu Chang Rogerio Feris James R. Glass Hilde Kuehne 40 7 0 29 Mar 2023
Unmasked Teacher: Towards Training-Efficient Video Foundation Models Kunchang Li Yali Wang Yizhuo Li Yi Wang Yinan He Limin Wang Yu Qiao VGen 57 156 0 28 Mar 2023
DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion Sauradip Nag Xiatian Zhu Jiankang Deng Yi-Zhe Song Tao Xiang DiffM VGen 43 21 0 27 Mar 2023
TemporalMaxer: Maximize Temporal Context with only Max Pooling for Temporal Action Localization Tuan N. Tang Kwonyoung Kim Kwanghoon Sohn 29 29 0 16 Mar 2023
Ego-Only: Egocentric Action Detection without Exocentric Transferring Huiyu Wang Mitesh Singh Lorenzo Torresani EgoV 72 24 0 03 Jan 2023
InternVideo: General Video Foundation Models via Generative and Discriminative Learning Yi Wang Kunchang Li Yizhuo Li Yinan He Bingkun Huang ... Junting Pan Jiashuo Yu Yali Wang Limin Wang Yu Qiao VLM VGen 57 311 0 06 Dec 2022
Slow Motion Matters: A Slow Motion Enhanced Network for Weakly Supervised Temporal Action Localization Weiqi Sun Rui Su Qian Yu Dong Xu 31 20 0 21 Nov 2022
Soft-Landing Strategy for Alleviating the Task Discrepancy Problem in Temporal Action Localization Tasks Hyolim Kang Hanjung Kim Joungbin An Minsu Cho Seon Joo Kim 38 5 0 11 Nov 2022
Prior-enhanced Temporal Action Localization using Subject-aware Spatial Attention Yifan Liu Youbao Tang Ning Zhang Ruei-Sung Lin Haoqian Wang 46 0 0 10 Nov 2022
VideoPipe 2022 Challenge: Real-World Video Understanding for Urban Pipe Inspection Yi Liu Xuan Zhang Ying Li Guixin Liang Yabing Jiang ... Fei Xie Wei Yao Yifang Dai Yu Qiao Yali Wang 20 10 0 20 Oct 2022
A Circular Window-based Cascade Transformer for Online Action Detection Shuyuan Cao Weihua Luo Bairui Wang Wei Emma Zhang Lin Ma 47 6 0 30 Aug 2022
Actor-identified Spatiotemporal Action Detection -- Detecting Who Is Doing What in Videos Fan Yang Norimichi Ukita S. Sakti Satoshi Nakamura 19 0 0 27 Aug 2022
Video-based Human Action Recognition using Deep Learning: A Review Hieu H. Pham L. Khoudour Alain Crouzil Pablo Zegers S. Velastín 35 34 0 07 Aug 2022
HTNet: Anchor-free Temporal Action Localization with Hierarchical Transformers Tae-Kyung Kang Gun-Hee Lee Seong-Whan Lee 31 10 0 20 Jul 2022
Zero-Shot Temporal Action Detection via Vision-Language Prompting Sauradip Nag Xiatian Zhu Yi-Zhe Song Tao Xiang VLM 33 65 0 17 Jul 2022
Forcing the Whole Video as Background: An Adversarial Learning Strategy for Weakly Temporal Action Localization Ziqiang Li Yongxin Ge Jiaruo Yu Zhongming Chen 21 18 0 14 Jul 2022
MVP: Robust Multi-View Practice for Driving Action Localization Jingjie Shang Kunchang Li Kaibin Tian Haisheng Su Yangguang Li 37 3 0 05 Jul 2022
Programmatic Concept Learning for Human Motion Description and Synthesis Sumith Kulal Jiayuan Mao A. Aiken Jiajun Wu 33 7 0 27 Jun 2022
GateHUB: Gated History Unit with Background Suppression for Online Action Detection Junwen Chen Gaurav Mittal Ye Yu Yu Kong Mei Chen 49 33 0 09 Jun 2022
A Survey on Video Action Recognition in Sports: Datasets, Methods and Applications Fei Wu Qingzhong Wang Jian Bian Haoyi Xiong Ning Ding Feixiang Lu Junqing Cheng Dejing Dou AI4TS 28 52 0 02 Jun 2022
Weakly-Supervised Action Detection Guided by Audio Narration Keren Ye Adriana Kovashka 38 0 0 12 May 2022
Do You Really Mean That? Content Driven Audio-Visual Deepfake Dataset and Multimodal Method for Temporal Forgery Localization Zhixi Cai Kalin Stefanov Abhinav Dhall Munawar Hayat 20 3 0 13 Apr 2022
Frequency Selective Augmentation for Video Representation Learning Jinhyung Kim Taeoh Kim Minho Shim Dongyoon Han Dongyoon Wee Junmo Kim AI4TS 49 3 0 08 Apr 2022
TALLFormer: Temporal Action Localization with a Long-memory Transformer Feng Cheng Gedas Bertasius ViT 35 91 0 04 Apr 2022
Fine-grained Temporal Contrastive Learning for Weakly-supervised Temporal Action Localization Junyu Gao Mengyuan Chen Changsheng Xu 16 66 0 31 Mar 2022
ASM-Loc: Action-aware Segment Modeling for Weakly-Supervised Temporal Action Localization Bo He Xitong Yang Le Kang Zhiyu Cheng Xingfa Zhou Abhinav Shrivastava 33 77 0 29 Mar 2022
Assembly101: A Large-Scale Multi-View Video Dataset for Understanding Procedural Activities Fadime Sener Dibyadip Chatterjee Daniel Shelepov Kun He Dipika Singhania Robert Y. Wang Angela Yao VGen 33 205 0 28 Mar 2022
Surgical Workflow Recognition: from Analysis of Challenges to Architectural Study Tobias Czempiel Aidean Sharghi Magdalini Paschali Nassir Navab Omid Mohareri 19 8 0 17 Mar 2022
End-to-End Semantic Video Transformer for Zero-Shot Action Recognition Keval Doshi Yasin Yılmaz ViT 32 2 0 10 Mar 2022
ActionFormer: Localizing Moments of Actions with Transformers Chen-Da Liu-Zhang Jianxin Wu Yin Li ViT 31 330 0 16 Feb 2022
Continual Transformers: Redundancy-Free Attention for Online Inference Lukas Hedegaard Arian Bakhtiarnia Alexandros Iosifidis CLL 27 11 0 17 Jan 2022