A Closer Look at Spatiotemporal Convolutions for Action Recognition

30 November 2017

Heng Wang

Papers citing "A Closer Look at Spatiotemporal Convolutions for Action Recognition"

50 / 477 papers shown

Title
Video Question Answering with Iterative Video-Text Co-Tokenization A. Piergiovanni K. Morton Weicheng Kuo Michael S. Ryoo A. Angelova 34 18 0 01 Aug 2022
Adaptive occlusion sensitivity analysis for visually explaining video recognition networks Tomoki Uchiyama Naoya Sogi S. Iizuka Koichiro Niinuma Kazuhiro Fukui 24 2 0 26 Jul 2022
Compositional Human-Scene Interaction Synthesis with Semantic Control Kaifeng Zhao Shaofei Wang Yan Zhang Thabo Beeler Siyu Tang 30 65 0 26 Jul 2022
Bodily Behaviors in Social Interaction: Novel Annotations and State-of-the-Art Evaluation Michal Balazia Philippe Muller Ákos Levente Tánczos A. V. Liechtenstein Franccois Brémond 17 22 0 26 Jul 2022
Graph Neural Network and Spatiotemporal Transformer Attention for 3D Video Object Detection from Point Clouds Junbo Yin Jianbing Shen Xin Gao David J. Crandall Ruigang Yang 3DPC ViT 38 59 0 26 Jul 2022
CODiT: Conformal Out-of-Distribution Detection in Time-Series Data R. Kaur Kaustubh Sridhar Sangdon Park Susmit Jha Anirban Roy O. Sokolsky Insup Lee OODD AI4TS 144 1 0 24 Jul 2022
MAR: Masked Autoencoders for Efficient Action Recognition Zhiwu Qing Shiwei Zhang Ziyuan Huang Xiang Wang Yuehuang Wang Yiliang Lv Changxin Gao Nong Sang 32 42 0 24 Jul 2022
Multimodal Emotion Recognition with Modality-Pairwise Unsupervised Contrastive Loss Riccardo Franceschini Enrico Fini Cigdem Beyan Alessandro Conti F. Arrigoni Elisa Ricci SSL OffRL 34 16 0 23 Jul 2022
Sequence Models for Drone vs Bird Classification Fatih Çagatay Akyön Erdem Akagündüz S. Altinuc A. Temi̇zel 21 1 0 21 Jul 2022
Temporal Saliency Query Network for Efficient Video Recognition Boyang Xia Zhihao Wang Wenhao Wu Haoran Wang Jungong Han 51 15 0 21 Jul 2022
Telepresence Video Quality Assessment Zhenqiang Ying Deepti Ghadiyaram A. Bovik 19 5 0 20 Jul 2022
ViGAT: Bottom-up event recognition and explanation in video using factorized graph attention network Nikolaos Gkalelis Dimitrios Daskalakis Vasileios Mezaris 19 10 0 20 Jul 2022
The Anatomy of Video Editing: A Dataset and Benchmark Suite for AI-Assisted Video Editing Dawit Mureja Argaw Fabian Caba Heilbron Joon-Young Lee Markus Woodson In So Kweon VGen 50 22 0 20 Jul 2022
Task-adaptive Spatial-Temporal Video Sampler for Few-shot Action Recognition Huabin Liu Weixian Lv John See W. Lin TTA 29 11 0 20 Jul 2022
Time Is MattEr: Temporal Self-supervision for Video Transformers Sukmin Yun Jaehyung Kim Dongyoon Han Hwanjun Song Jung-Woo Ha Jinwoo Shin ViT 19 12 0 19 Jul 2022
SVGraph: Learning Semantic Graphs from Instructional Videos Madeline Chantry Schiappa Yogesh S Rawat 17 4 0 16 Jul 2022
LaT: Latent Translation with Cycle-Consistency for Video-Text Retrieval Jinbin Bai Chunhui Liu Feiyue Ni Haofan Wang Mengying Hu Xiaofeng Guo Lele Cheng 45 11 0 11 Jul 2022
VidConv: A modernized 2D ConvNet for Efficient Video Recognition Chuong H. Nguyen Su Huynh Vinh Nguyen Ngoc-Khanh Nguyen ViT 27 3 0 08 Jul 2022
What Makes for Automatic Reconstruction of Pulmonary Segments Kaiming Kuang Li Zhang Jingyuan Li Hongwei Bran Li Jiajun Chen Bo Du Jiancheng Yang 27 8 0 07 Jul 2022
Federated Self-supervised Learning for Video Understanding Yasar Abbas Ur Rehman Yan Gao Jiajun Shen Pedro Porto Buarque de Gusmão Nicholas D. Lane FedML 39 15 0 05 Jul 2022
Spatial-Temporal Frequency Forgery Clue for Video Forgery Detection in VIS and NIR Scenario Yukai Wang Chunlei Peng Decheng Liu N. Wang Xinbo Gao 47 14 0 05 Jul 2022
Cov3d: Detection of the presence and severity of COVID-19 from CT scans using 3D ResNets R. Turnbull 24 8 0 05 Jul 2022
Large-scale Robustness Analysis of Video Action Recognition Models Madeline Chantry Schiappa Naman Biyani Prudvi Kamtam Shruti Vyas Hamid Palangi Vibhav Vineet Yogesh S Rawat AAML 37 24 0 04 Jul 2022
Revisiting Classifier: Transferring Vision-Language Models for Video Recognition Wenhao Wu Zhun Sun Wanli Ouyang VLM 103 93 0 04 Jul 2022
Timestamp-Supervised Action Segmentation with Graph Convolutional Networks Hamza Khan S. Haresh Awais Ahmed Shakeeb Siddiqui Andrey Konin Mohammad Zeeshan Quoc-Huy Tran 24 22 0 30 Jun 2022
Self-Supervised Learning for Videos: A Survey Madeline Chantry Schiappa Yogesh S Rawat M. Shah SSL 36 131 0 18 Jun 2022
Multimodal Learning with Transformers: A Survey P. Xu Xiatian Zhu David A. Clifton ViT 72 528 0 13 Jun 2022
MLP-3D: A MLP-like 3D Architecture with Grouped Time Mixing Zhaofan Qiu Ting Yao Chong-Wah Ngo Tao Mei ViT 37 15 0 13 Jun 2022
NR-DFERNet: Noise-Robust Network for Dynamic Facial Expression Recognition Hanting Li Ming-Fa Sui Zhaoqing Zhu Feng Zhao 25 27 0 10 Jun 2022
Spatial-temporal Concept based Explanation of 3D ConvNets Yi Ji Yu Wang K. Mori Jien Kato 3DPC FAtt 29 7 0 09 Jun 2022
A No-reference Quality Assessment Metric for Point Cloud Based on Captured Video Sequences Yu Fan Zicheng Zhang Wei Sun Xiongkuo Min Wei Lu Tao Wang Ning Liu Guangtao Zhai 3DPC 23 48 0 09 Jun 2022
DÁRTAGNAN: Counterfactual Video Generation Hadrien Reynaud Athanasios Vlontzos Mischa Dombrowski Ciarán M. Gilligan-Lee A. Beqiri Paul Leeson Bernhard Kainz VGen CML MedIm 30 19 0 03 Jun 2022
A Survey on Video Action Recognition in Sports: Datasets, Methods and Applications Fei Wu Qingzhong Wang Jian Bian Haoyi Xiong Ning Ding Feixiang Lu Junqing Cheng Dejing Dou AI4TS 28 52 0 02 Jun 2022
Deepfake Caricatures: Amplifying attention to artifacts increases deepfake detection by humans and machines Camilo Luciano Fosco Emilie Josephs A. Andonian Allen Lee Xi Wang A. Oliva 44 4 0 01 Jun 2022
Neural Volumetric Object Selection Zhongzheng Ren A. Agarwala Bryan C. Russell A. Schwing Oliver Wang 3DH 24 51 0 30 May 2022
Cross-Architecture Self-supervised Video Representation Learning Sheng Guo Zihua Xiong Yujie Zhong Limin Wang Xiaobo Guo Bing Han Weilin Huang SSL AI4TS 76 24 0 26 May 2022
ETAD: Training Action Detection End to End on a Laptop Shuming Liu Mengmeng Xu Chen Zhao Xu Zhao Guohao Li 44 6 0 14 May 2022
Best of Both Worlds: Multi-task Audio-Visual Automatic Speech Recognition and Active Speaker Detection Otavio Braga Olivier Siohan CVBM 27 8 0 10 May 2022
BasicTAD: an Astounding RGB-Only Baseline for Temporal Action Detection Mingdong Yang Guo Chen Yin-Dong Zheng Tong Lu Limin Wang 46 45 0 05 May 2022
TransRank: Self-supervised Video Representation Learning via Ranking-based Transformation Recognition Haodong Duan Nanxuan Zhao Kai-xiang Chen Dahua Lin ViT AI4TS 33 19 0 04 May 2022
On Negative Sampling for Audio-Visual Contrastive Learning from Movies Mahdi M. Kalayeh Shervin Ardeshir Lingyi Liu Nagendra Kamath Ashok Chandrashekar SSL 35 3 0 29 Apr 2022
HuMMan: Multi-Modal 4D Human Dataset for Versatile Sensing and Modeling Zhongang Cai Daxuan Ren Ailing Zeng Zhengyu Lin Tao Yu ... Fangzhou Hong Mingyuan Zhang Chen Change Loy Lei Yang Ziwei Liu 3DH 39 100 0 28 Apr 2022
Tragedy Plus Time: Capturing Unintended Human Activities from Weakly-labeled Videos Arnav Chakravarthy Zhiyuan Fang Yezhou Yang 35 2 0 28 Apr 2022
Self-supervised Contrastive Learning for Audio-Visual Action Recognition Yang Liu Y. Tan Haoyu Lan SSL 47 6 0 28 Apr 2022
The Wisdom of Crowds: Temporal Progressive Attention for Early Action Prediction Alexandros Stergiou Dima Damen AI4TS EgoV EDL 17 7 0 28 Apr 2022
Human-Centered Prior-Guided and Task-Dependent Multi-Task Representation Learning for Action Recognition Pre-Training Guanhong Wang Ke Lu Yang Zhou Zhanhao He Gaoang Wang SSL 32 3 0 27 Apr 2022
Contrastive Language-Action Pre-training for Temporal Localization Mengmeng Xu Erhan Gundogdu ⋆⋆ Maksim Guohao Li M. Donoser Loris Bazzani 38 27 0 26 Apr 2022
Tag-Based Attention Guided Bottom-Up Approach for Video Instance Segmentation Jyoti Kini M. Shah VOS 24 0 0 22 Apr 2022
Model-agnostic Multi-Domain Learning with Domain-Specific Adapters for Action Recognition Kazuki Omi Jun Kimata Toru Tamaki 23 7 0 15 Apr 2022
3D Convolutional Networks for Action Recognition: Application to Sport Gesture Recognition Pierre-Etienne Martin J. Benois-Pineau Renaud Péteri A. Zemmari J. Morlier 27 5 0 13 Apr 2022