Stacked Attention Networks for Image Question Answering

7 November 2015

Li Deng

Papers citing "Stacked Attention Networks for Image Question Answering"

50 / 277 papers shown

Title
Multi-modality Latent Interaction Network for Visual Question Answering Peng Gao Haoxuan You Zhanpeng Zhang Xiaogang Wang Hongsheng Li 25 82 0 10 Aug 2019
VisualBERT: A Simple and Performant Baseline for Vision and Language Liunian Harold Li Mark Yatskar Da Yin Cho-Jui Hsieh Kai-Wei Chang VLM 70 1,917 0 09 Aug 2019
Question-Agnostic Attention for Visual Question Answering M. Farazi Salman H Khan Nick Barnes 13 10 0 09 Aug 2019
An Empirical Study on Leveraging Scene Graphs for Visual Question Answering Cheng Zhang Wei-Lun Chao D. Xuan 23 50 0 28 Jul 2019
HA-CCN: Hierarchical Attention-based Crowd Counting Network Vishwanath A. Sindagi Vishal M. Patel 20 187 0 24 Jul 2019
Compact Global Descriptor for Neural Networks Xiangyu He Ke Cheng Qiang Chen Qinghao Hu Peisong Wang Jian Cheng 31 8 0 23 Jul 2019
Gated Recurrent Neural Network Approach for Multilabel Emotion Detection in Microblogs Prabod Rathnayaka Supun Abeysinghe Chamod Samarajeewa Isura Manchanayake M. Walpola Rashmika Nawaratne T. Bandaragoda D. Alahakoon 16 21 0 17 Jul 2019
Deep Modular Co-Attention Networks for Visual Question Answering Zhou Yu Jun Yu Yuhao Cui Dacheng Tao Q. Tian 36 796 0 25 Jun 2019
RUBi: Reducing Unimodal Biases in Visual Question Answering Rémi Cadène Corentin Dancette H. Ben-younes Matthieu Cord Devi Parikh CML 19 369 0 24 Jun 2019
Scene Text Visual Question Answering Ali Furkan Biten Rubèn Pérez Tito Andrés Mafla Lluís Gómez Marçal Rusiñol Ernest Valveny C. V. Jawahar Dimosthenis Karatzas 36 343 0 31 May 2019
Self-Critical Reasoning for Robust Visual Question Answering Jialin Wu Raymond J. Mooney OOD NAI 32 159 0 24 May 2019
Aggregation Cross-Entropy for Sequence Recognition Zecheng Xie Yaoxiong Huang Yuanzhi Zhu Lianwen Jin Yuliang Liu Lele Xie 25 92 0 17 Apr 2019
Question Guided Modular Routing Networks for Visual Question Answering Yanze Wu Qiang Sun Jianqi Ma Bin Li Yanwei Fu Yao Peng Xiangyang Xue 23 1 0 17 Apr 2019
DSTP-RNN: a dual-stage two-phase attention-based recurrent neural networks for long-term and multivariate time series prediction Yeqi Liu Chuanyang Gong Ling Yang Yingyi Chen AI4TS 19 305 0 16 Apr 2019
MAANet: Multi-view Aware Attention Networks for Image Super-Resolution Jingcai Guo Shiheng Ma Song Guo SupR 11 5 0 12 Apr 2019
Factor Graph Attention Idan Schwartz Seunghak Yu Tamir Hazan A. Schwing 24 110 0 11 Apr 2019
A Simple Baseline for Audio-Visual Scene-Aware Dialog Idan Schwartz A. Schwing Tamir Hazan 27 69 0 11 Apr 2019
Reasoning Visual Dialogs with Structural and Partial Observations Zilong Zheng Wenguan Wang Siyuan Qi Song-Chun Zhu 39 117 0 11 Apr 2019
Multi-vision Attention Networks for On-line Red Jujube Grading Xiaoye Sun Liyan Ma Gongyang Li 9 9 0 31 Mar 2019
MirrorGAN: Learning Text-to-image Generation by Redescription Tingting Qiao Jing Zhang Duanqing Xu Dacheng Tao VLM GAN 31 538 0 14 Mar 2019
Spatiotemporal Pyramid Network for Video Action Recognition Yunbo Wang Mingsheng Long Jianmin Wang Philip S. Yu 32 227 0 04 Mar 2019
Improving Referring Expression Grounding with Cross-modal Attention-guided Erasing Xihui Liu Zihao Wang Jing Shao Xiaogang Wang Hongsheng Li ObjD 19 180 0 03 Mar 2019
Learning To Follow Directions in Street View Karl Moritz Hermann Mateusz Malinowski Piotr Wojciech Mirowski Andras Banki-Horvath Keith Anderson R. Hadsell SSL 24 66 0 01 Mar 2019
Answer Them All! Toward Universal Visual Question Answering Models Robik Shrestha Kushal Kafle Christopher Kanan 19 82 0 01 Mar 2019
Pyramid Feature Attention Network for Saliency detection Ting Zhao Xiangqian Wu 14 607 0 01 Mar 2019
Image-Question-Answer Synergistic Network for Visual Dialog Dalu Guo Chang Xu Dacheng Tao 19 74 0 26 Feb 2019
MUREL: Multimodal Relational Reasoning for Visual Question Answering Rémi Cadène H. Ben-younes Matthieu Cord Nicolas Thome LRM 19 271 0 25 Feb 2019
Dual Attention Networks for Visual Reference Resolution in Visual Dialog Gi-Cheon Kang Jaeseo Lim Byoung-Tak Zhang 22 72 0 25 Feb 2019
Multi-step Reasoning via Recurrent Dual Attention for Visual Dialog Zhe Gan Yu Cheng Ahmed El Kholy Linjie Li Jingjing Liu Jianfeng Gao 11 104 0 01 Feb 2019
Learning Spatial Pyramid Attentive Pooling in Image Synthesis and Image-to-Image Translation Wei Sun Tianfu Wu 21 13 0 18 Jan 2019
Scene Graph Reasoning with Prior Visual Relationship for Visual Question Answering Zhuoqian Yang Zengchang Qin Jing Yu Yue Hu GNN 25 16 0 23 Dec 2018
Toward Multimodal Model-Agnostic Meta-Learning Risto Vuorio Shao-Hua Sun Hexiang Hu Joseph J. Lim 55 31 0 18 Dec 2018
PiCANet: Pixel-wise Contextual Attention Learning for Accurate Saliency Detection Nian Liu Junwei Han Ming-Hsuan Yang SSeg 36 99 0 15 Dec 2018
Selective Feature Connection Mechanism: Concatenating Multi-layer CNN Features with a Feature Selector Chen Du Chunheng Wang Yanna Wang Cunzhao Shi Baihua Xiao 22 42 0 15 Nov 2018
Holistic Multi-modal Memory Network for Movie Question Answering Anran Wang Anh Tuan Luu Chuan-Sheng Foo Erik Cambria Yi Tay V. Chandrasekhar 36 20 0 12 Nov 2018
Zero-Shot Transfer VQA Dataset Yuanpeng Li Yi Yang Jianyu Wang Wei-ping Xu 13 8 0 02 Nov 2018
Semantic Aware Attention Based Deep Object Co-segmentation Hong Chen Yifei Huang Hideki Nakayama SSeg 24 73 0 16 Oct 2018
Overcoming Language Priors in Visual Question Answering with Adversarial Regularization S. Ramakrishnan Aishwarya Agrawal Stefan Lee AAML 20 235 0 08 Oct 2018
Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding Kexin Yi Jiajun Wu Chuang Gan Antonio Torralba Pushmeet Kohli J. Tenenbaum NAI 43 599 0 04 Oct 2018
How clever is the FiLM model, and how clever can it be? A. Kuhnle Huiyuan Xie Ann A. Copestake 30 6 0 09 Sep 2018
Faithful Multimodal Explanation for Visual Question Answering Jialin Wu Raymond J. Mooney 20 90 0 08 Sep 2018
Interpretable Visual Question Answering by Reasoning on Dependency Trees Qingxing Cao Bailin Li Xiaodan Liang Liang Lin 33 55 0 06 Sep 2018
Diverse and Coherent Paragraph Generation from Images Moitreya Chatterjee A. Schwing 19 66 0 03 Sep 2018
Robust Attentional Aggregation of Deep Feature Sets for Multi-view 3D Reconstruction Bo Yang Sen Wang Andrew Markham Niki Trigoni 3DPC 3DV 26 138 0 02 Aug 2018
Image Classification for Arabic: Assessing the Accuracy of Direct English to Arabic Translations Abdulkareem Alsudais VLM 27 4 0 13 Jul 2018
Topic-Guided Attention for Image Captioning Zhihao Zhu Zhan Xue Zejian Yuan 30 23 0 10 Jul 2018
Learning Visual Knowledge Memory Networks for Visual Question Answering Zhou Su Chen Zhu Yinpeng Dong Dongqi Cai Yurong Chen Jianguo Li 34 62 0 13 Jun 2018
Visual Reasoning by Progressive Module Networks Seung Wook Kim Makarand Tapaswi Sanja Fidler ReLM LRM 36 12 0 06 Jun 2018
R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering Pan Lu Lei Ji Wei Zhang Nan Duan M. Zhou Jianyong Wang CoGe 25 79 0 24 May 2018
Stacked Semantic-Guided Attention Model for Fine-Grained Zero-Shot Learning YunLong Yu Zhong Ji Yanwei Fu Jichang Guo Yanwei Pang Zhongfei Zhang VLM 24 27 0 21 May 2018