The VQA-Machine: Learning How to Use Existing Vision Algorithms to
Answer New Questions

The VQA-Machine: Learning How to Use Existing Vision Algorithms to Answer New Questions

16 December 2016

Peng Wang

Qi Wu

Chunhua Shen

Anton Van Den Hengel

Papers citing "The VQA-Machine: Learning How to Use Existing Vision Algorithms to Answer New Questions"

14 / 14 papers shown

Title
Divide and Conquer: Answering Questions with Object Factorization and Compositional Reasoning Shi Chen Qi Zhao 47 5 0 18 Mar 2023
Multimodal E-Commerce Product Classification Using Hierarchical Fusion Tsegaye Misikir Tashu Sara Fattouh Peter Kiss Tomáš Horváth 24 1 0 07 Jul 2022
From Pixels to Objects: Cubic Visual Attention for Visual Question Answering Jingkuan Song Pengpeng Zeng Lianli Gao Heng Tao Shen 32 62 0 04 Jun 2022
Recent Advances and Trends in Multimodal Deep Learning: A Review Jabeen Summaira Xi Li Amin Muhammad Shoib Songyuan Li Abdul Jabbar HAI 18 55 0 24 May 2021
Language-guided Navigation via Cross-Modal Grounding and Alternate Adversarial Learning Weixia Zhang Chao Ma Qi Wu Xiaokang Yang 39 44 0 22 Nov 2020
Graph R-CNN for Scene Graph Generation Jianwei Yang Jiasen Lu Stefan Lee Dhruv Batra Devi Parikh GNN 57 836 0 01 Aug 2018
Visual Reasoning by Progressive Module Networks Seung Wook Kim Makarand Tapaswi Sanja Fidler ReLM LRM 33 12 0 06 Jun 2018
Inverse Visual Question Answering: A New Benchmark and VQA Diagnosis Tool Feng Liu Tao Xiang Timothy M. Hospedales Wankou Yang Changyin Sun 30 29 0 16 Mar 2018
Visual Interpretability for Deep Learning: a Survey Quanshi Zhang Song-Chun Zhu FaML HAI 17 809 0 02 Feb 2018
Object-based reasoning in VQA Mikyas T. Desta Larry Chen Tomasz Kornuta 32 33 0 29 Jan 2018
Tell-and-Answer: Towards Explainable Visual Question Answering using Attributes and Captions Qing Li Jianlong Fu D. Yu Tao Mei Jiebo Luo FAtt XAI CoGe 51 60 0 27 Jan 2018
Solving Visual Madlibs with Multiple Cues Tatiana Tommasi Arun Mallya Bryan A. Plummer Svetlana Lazebnik Alexander C. Berg Tamara L. Berg 37 18 0 11 Aug 2016
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 167 1,464 0 06 Jun 2016
Explicit Knowledge-based Reasoning for Visual Question Answering Peng Wang Qi Wu Chunhua Shen Anton Van Den Hengel A. Dick 39 257 0 09 Nov 2015