A Closer Look at Spatiotemporal Convolutions for Action Recognition

30 November 2017

Heng Wang

Papers citing "A Closer Look at Spatiotemporal Convolutions for Action Recognition"

50 / 477 papers shown

Title
Dancing with Still Images: Video Distillation via Static-Dynamic Disentanglement Ziyu Wang Yue Xu Cewu Lu Yong-Lu Li DD 41 8 0 01 Dec 2023
Modality Mixer Exploiting Complementary Information for Multi-modal Action Recognition Sumin Lee Sangmin Woo Muhammad Adi Nugroho Changick Kim 30 0 0 21 Nov 2023
Boundary Discretization and Reliable Classification Network for Temporal Action Detection Zhenying Fang Jun Yu Richang Hong 26 0 0 10 Oct 2023
Semantic-aware Temporal Channel-wise Attention for Cardiac Function Assessment Guanqi Chen Guanbin Li 11 0 0 09 Oct 2023
TransNet: A Transfer Learning-Based Network for Human Action Recognition Khaled Alomar Xiaohao Cai 38 1 0 13 Sep 2023
STUPD: A Synthetic Dataset for Spatial and Temporal Relation Reasoning Palaash Agrawal Haidi Azaman Cheston Tan 51 3 0 13 Sep 2023
EgoPCA: A New Framework for Egocentric Hand-Object Interaction Understanding Yue Xu Yong-Lu Li Zhemin Huang Michael Xu Liu Cewu Lu Yu-Wing Tai Chi-Keung Tang EgoV 25 9 0 05 Sep 2023
UnLoc: A Unified Framework for Video Localization Tasks Shengjia Yan Xuehan Xiong Arsha Nagrani Anurag Arnab Zhonghao Wang Weina Ge David A. Ross Cordelia Schmid 33 53 0 21 Aug 2023
Learnt Contrastive Concept Embeddings for Sign Recognition Ryan Wong Necati Cihan Camgöz Richard Bowden 29 5 0 18 Aug 2023
View while Moving: Efficient Video Recognition in Long-untrimmed Videos Ye Tian Meng Yang Lanshan Zhang Zhizhen Zhang Yang Liu Xiao-Zhu Xie Xirong Que Wendong Wang 24 7 0 09 Aug 2023
Weakly Supervised AI for Efficient Analysis of 3D Pathology Samples Andrew H. Song Mane Williams Drew F. K. Williamson Guillaume Jaume Andrew Zhang ... R. Serafin Jonathan T. C. Liu Alexander S. Baras Anil V. Parwani Faisal Mahmood 17 4 0 27 Jul 2023
Sample Less, Learn More: Efficient Action Recognition via Frame Feature Restoration Harry Cheng Yangyang Guo Liqiang Nie Zhiyong Cheng Mohan S. Kankanhalli 37 7 0 27 Jul 2023
Spatial-Frequency U-Net for Denoising Diffusion Probabilistic Models Xin Yuan Linjie Li Jianfeng Wang Zhengyuan Yang Kevin Qinghong Lin Zicheng Liu Lijuan Wang DiffM 65 6 0 27 Jul 2023
ProtoASNet: Dynamic Prototypes for Inherently Interpretable and Uncertainty-Aware Aortic Stenosis Classification in Echocardiography H. Vaseli A. Gu Ahmadi Amiri Michael Y. Tsang A. Fung Nima Kondori Armin Saadat Purang Abolmaesumi T. Tsang 36 12 0 26 Jul 2023
In Defense of Clip-based Video Relation Detection Meng Wei Long Chen Wei Ji Xiaoyu Yue Roger Zimmermann 44 5 0 18 Jul 2023
What Can Simple Arithmetic Operations Do for Temporal Modeling? Wenhao Wu Yuxin Song Zhun Sun Jingdong Wang Chang Xu Wanli Ouyang 40 8 0 18 Jul 2023
Video-FocalNets: Spatio-Temporal Focal Modulation for Video Action Recognition Syed Talal Wasim Muhammad Uzair Khattak Muzammal Naseer Salman Khan M. Shah Fahad Shahbaz Khan ViT 54 19 0 13 Jul 2023
Atrial Septal Defect Detection in Children Based on Ultrasound Video Using Multiple Instances Learning Yiman Liu Qingming Huang Xiaoxiang Han Tongtong Liang Zhi-fang Zhang ... Angelos Stefanidis Jionglong Su Jiangang Chen Qingli Li Yuqi Zhang 23 7 0 06 Jun 2023
VIPriors 3: Visual Inductive Priors for Data-Efficient Deep Learning Challenges Robert-Jan Bruintjes A. Lengyel Marcos Baptista-Rios O. Kayhan Davide Zambrano Nergis Tomen Jan van Gemert 25 9 0 31 May 2023
Multimodal Group Activity Dataset for Classroom Engagement Level Prediction Alpay Sabuncuoglu T. Metin Sezgin 11 3 0 18 Apr 2023
SViTT: Temporal Learning of Sparse Video-Text Transformers Yi Li Kyle Min Subarna Tripathi Nuno Vasconcelos 31 12 0 18 Apr 2023
Recursive Joint Attention for Audio-Visual Fusion in Regression based Emotion Recognition R Gnana Praveen Eric Granger P. Cardinal 27 10 0 17 Apr 2023
Robust Cross-Modal Knowledge Distillation for Unconstrained Videos Wenke Xia Xingjian Li Andong Deng Haoyi Xiong Dejing Dou Di Hu 19 5 0 16 Apr 2023
Skeleton-based action analysis for ADHD diagnosis Yichun Li Yi Li R. Nair S. M. Naqvi 20 2 0 14 Apr 2023
Zoom-VQA: Patches, Frames and Clips Integration for Video Quality Assessment Kai Zhao Kun Yuan Ming-Ting Sun Xingsen Wen 21 20 0 13 Apr 2023
RECLIP: Resource-efficient CLIP by Training with Small Images Runze Li Dahun Kim B. Bhanu Weicheng Kuo VLM CLIP 36 13 0 12 Apr 2023
Vita-CLIP: Video and text adaptive CLIP via Multimodal Prompting Syed Talal Wasim Muzammal Naseer Salman Khan Fahad Shahbaz Khan M. Shah VLM VPVLM 39 74 0 06 Apr 2023
VicTR: Video-conditioned Text Representations for Activity Recognition Kumara Kahatapitiya Anurag Arnab Arsha Nagrani Michael S. Ryoo 39 20 0 05 Apr 2023
Black Box Few-Shot Adaptation for Vision-Language models Yassine Ouali Adrian Bulat Brais Martínez Georgios Tzimiropoulos VLM 34 31 0 04 Apr 2023
MoLo: Motion-augmented Long-short Contrastive Learning for Few-shot Action Recognition Xiang Wang Shiwei Zhang Zhiwu Qing Changxin Gao Yingya Zhang Deli Zhao Nong Sang 24 40 0 03 Apr 2023
Focalized Contrastive View-invariant Learning for Self-supervised Skeleton-based Action Recognition Qianhui Men Edmond S. L. Ho Hubert P. H. Shum Howard Leung SSL 28 19 0 03 Apr 2023
DOAD: Decoupled One Stage Action Detection Network Shuning Chang Pichao Wang Fan Wang Jiashi Feng Mike Zheng Show 26 4 0 01 Apr 2023
Egocentric Auditory Attention Localization in Conversations Fiona Ryan Hao Jiang Abhinav Shukla James M. Rehg V. Ithapu EgoV 29 16 0 28 Mar 2023
SELF-VS: Self-supervised Encoding Learning For Video Summarization Hojjat Mokhtarabadi Kaveh Bahraman M. Hosseinzadeh M. Eftekhari AI4TS SSL ViT 25 0 0 28 Mar 2023
Unified Keypoint-based Action Recognition Framework via Structured Keypoint Pooling Ryo Hachiuma Fumiaki Sato Taiki Sekii 3DPC 29 37 0 27 Mar 2023
VADER: Video Alignment Differencing and Retrieval Alexander Black Simon Jenni Tu Bui Md. Mehrab Tanjim Stefano Petrangeli Ritwik Sinha Viswanathan Swaminathan John Collomosse 31 2 0 23 Mar 2023
VMCML: Video and Music Matching via Cross-Modality Lifting Yi-Shan Lee Wei-Cheng Tseng Fu-En Wang Min Sun 23 0 0 22 Mar 2023
Enhanced detection of the presence and severity of COVID-19 from CT scans using lung segmentation R. Turnbull 38 2 0 16 Mar 2023
TemporalMaxer: Maximize Temporal Context with only Max Pooling for Temporal Action Localization Tuan N. Tang Kwonyoung Kim Kwanghoon Sohn 29 29 0 16 Mar 2023
Multi-site, Multi-domain Airway Tree Modeling (ATM'22): A Public Benchmark for Pulmonary Airway Segmentation Minghui Zhang Yang Wu Hanxiao Zhang Yulei Qin Hao Zheng ... Raúl San José Estépar C. Espinosa Jiayuan Sun Guang-Zhong Yang Yun Gu 15 12 0 10 Mar 2023
VOCALExplore: Pay-as-You-Go Video Data Exploration and Model Building [Technical Report] Maureen Daum Enhao Zhang Dong He Stephen Mussmann Brandon Haynes Ranjay Krishna Magdalena Balazinska 32 4 0 07 Mar 2023
Maximizing Spatio-Temporal Entropy of Deep 3D CNNs for Efficient Video Recognition Junyan Wang Zhenhong Sun Yichen Qian Dong Gong Xiuyu Sun Ming Lin Maurice Pagnucco Yang Song 3DPC 20 11 0 05 Mar 2023
Heterogeneous Graph Learning for Acoustic Event Classification A. Shirian Mona Ahmadian Krishna Somandepalli T. Guha 27 2 0 05 Mar 2023
The DKU Post-Challenge Audio-Visual Wake Word Spotting System for the 2021 MISP Challenge: Deep Analysis Haoxu Wang Ming Cheng Qiang Fu Ming Li 39 8 0 04 Mar 2023
Brain subtle anomaly detection based on auto-encoders latent space analysis : application to de novo parkinson patients Nicolas Pinon Geoffroy Oudoumanessah Robin Trombetta M. Dojat Florence Forbes Carole Lartizien 17 6 0 27 Feb 2023
LIT-Former: Linking In-plane and Through-plane Transformers for Simultaneous CT Image Denoising and Deblurring Zhihao Chen Chuang Niu Qi Gao Ge Wang Hongming Shan MedIm ViT 3DV 36 20 0 21 Feb 2023
Audio-Visual Contrastive Learning with Temporal Self-Supervision Simon Jenni Alexander Black John Collomosse SSL 31 15 0 15 Feb 2023
Adjacent-Level Feature Cross-Fusion With 3-D CNN for Remote Sensing Image Change Detection Y. Ye Mengmeng Wang Liang Zhou Guangyang Lei Jianwei Fan Yao Qin 3DPC 27 37 0 10 Feb 2023
AIM: Adapting Image Models for Efficient Video Action Recognition Taojiannan Yang Yi Zhu Yusheng Xie Aston Zhang Chong Chen Mu Li ViT 58 144 0 06 Feb 2023
Open Problems in Applied Deep Learning M. Raissi AI4CE 42 2 0 26 Jan 2023