Reasoning About Human-Object Interactions Through Dual Attention Networks

10 September 2019

Papers citing "Reasoning About Human-Object Interactions Through Dual Attention Networks"

32 / 32 papers shown

Title
Human-Object Interaction Detection via Disentangled Transformer Desen Zhou Zhichao Liu Jian Wang Leshan Wang T. Hu Errui Ding Jingdong Wang ViT 61 59 0 20 Apr 2022
TSM: Temporal Shift Module for Efficient Video Understanding Ji Lin Chuang Gan Song Han 85 1,688 0 20 Nov 2018
Learning Human-Object Interactions by Graph Parsing Neural Networks Siyuan Qi Wenguan Wang Baoxiong Jia Jianbing Shen Song-Chun Zhu GNN 80 537 0 23 Aug 2018
Videos as Space-Time Region Graphs Xinyu Wang Abhinav Gupta 83 755 0 05 Jun 2018
On the effectiveness of task granularity for transfer learning F. Mahdisoltani Guillaume Berger W. Gharbieh David Fleet Roland Memisevic 31 58 0 24 Apr 2018
Temporal Relational Reasoning in Videos Bolei Zhou A. Andonian Aude Oliva Antonio Torralba NAI 91 1,039 0 22 Nov 2017
Non-local Neural Networks Xinyu Wang Ross B. Girshick Abhinav Gupta Kaiming He OffRL 277 8,902 0 21 Nov 2017
Squeeze-and-Excitation Networks Jie Hu Li Shen Samuel Albanie Gang Sun Enhua Wu 401 26,365 0 05 Sep 2017
The "something something" video database for learning and evaluating visual common sense Raghav Goyal Samira Ebrahimi Kahou Vincent Michalski Joanna Materzynska S. Westphal ... Moritz Mueller-Freitag F. Hoppe Christian Thurau Ingo Bax Roland Memisevic VLM 82 1,529 0 13 Jun 2017
Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset João Carreira Andrew Zisserman 219 7,989 0 22 May 2017
The Kinetics Human Action Video Dataset W. Kay João Carreira Karen Simonyan Brian Zhang Chloe Hillier ... Tim Green T. Back Apostol Natsev Mustafa Suleyman Andrew Zisserman 228 3,796 0 19 May 2017
Detecting and Recognizing Human-Object Interactions Georgia Gkioxari Ross B. Girshick Piotr Dollár Kaiming He 74 575 0 24 Apr 2017
Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning Jiasen Lu Caiming Xiong Devi Parikh R. Socher 118 1,452 0 06 Dec 2016
An End-to-End Spatio-Temporal Attention Model for Human Action Recognition from Skeleton Data Sijie Song Cuiling Lan Junliang Xing Wenjun Zeng Jiaying Liu 175 985 0 18 Nov 2016
Aggregated Residual Transformations for Deep Neural Networks Saining Xie Ross B. Girshick Piotr Dollár Zhuowen Tu Kaiming He 497 10,305 0 16 Nov 2016
Temporal Segment Networks: Towards Good Practices for Deep Action Recognition Limin Wang Yuanjun Xiong Zhe Wang Yu Qiao Dahua Lin Xiaoou Tang Luc Van Gool ViT 98 3,831 0 02 Aug 2016
Adversarial Feature Learning Jiasen Lu Philipp Krahenbuhl Trevor Darrell GAN 107 1,608 0 31 May 2016
Dynamic Memory Networks for Visual and Textual Question Answering Caiming Xiong Stephen Merity R. Socher 69 755 0 04 Mar 2016
Deep Residual Learning for Image Recognition Kaiming He Xinming Zhang Shaoqing Ren Jian Sun MedIm 2.1K 193,426 0 10 Dec 2015
Where To Look: Focus Regions for Visual Question Answering Kevin J. Shih Saurabh Singh Derek Hoiem 68 458 0 23 Nov 2015
Structural-RNN: Deep Learning on Spatio-Temporal Graphs Ashesh Jain Amir Zamir Silvio Savarese Ashutosh Saxena GNN 128 1,093 0 17 Nov 2015
Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering Huijuan Xu Kate Saenko 68 763 0 17 Nov 2015
Action Recognition using Visual Attention Shikhar Sharma Ryan Kiros Ruslan Salakhutdinov 74 666 0 12 Nov 2015
Detecting events and key actors in multi-person videos Vignesh Ramanathan Jonathan Huang Sami Abu-El-Haija Alexander N. Gorban Kevin Patrick Murphy Li Fei-Fei 61 209 0 09 Nov 2015
Stacked Attention Networks for Image Question Answering Zichao Yang Xiaodong He Jianfeng Gao Li Deng Alex Smola BDL 103 1,877 0 07 Nov 2015
VQA: Visual Question Answering Aishwarya Agrawal Jiasen Lu Stanislaw Antol Margaret Mitchell C. L. Zitnick Dhruv Batra Devi Parikh CoGe 186 5,464 0 03 May 2015
Beyond Short Snippets: Deep Networks for Video Classification Joe Yue-Hei Ng Matthew J. Hausknecht Sudheendra Vijayanarasimhan Oriol Vinyals R. Monga G. Toderici 139 2,336 0 31 Mar 2015
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift Sergey Ioffe Christian Szegedy OOD 439 43,277 0 11 Feb 2015
Show and Tell: A Neural Image Caption Generator Oriol Vinyals Alexander Toshev Samy Bengio D. Erhan 3DV 229 6,018 0 17 Nov 2014
Long-term Recurrent Convolutional Networks for Visual Recognition and Description Jeff Donahue Lisa Anne Hendricks Marcus Rohrbach Subhashini Venugopalan S. Guadarrama Kate Saenko Trevor Darrell VLM 156 6,048 0 17 Nov 2014
Going Deeper with Convolutions Christian Szegedy Wei Liu Yangqing Jia P. Sermanet Scott E. Reed Dragomir Anguelov D. Erhan Vincent Vanhoucke Andrew Rabinovich 422 43,635 0 17 Sep 2014
Two-Stream Convolutional Networks for Action Recognition in Videos Karen Simonyan Andrew Zisserman 237 7,526 0 09 Jun 2014