Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources

22 November 2015

Qi Wu

Peng Wang

Chunhua Shen

A. Dick

Anton Van Den Hengel

ArXiv PDF HTML

Papers citing "Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources"

50 / 64 papers shown

Title
Text-Guided Coarse-to-Fine Fusion Network for Robust Remote Sensing Visual Question Answering Zhicheng Zhao Changfu Zhou Yu Zhang Chenglong Li Xiaoliang Ma Jin Tang 81 0 0 24 Nov 2024
What Makes a Maze Look Like a Maze? Joy Hsu Jiayuan Mao J. Tenenbaum Noah D. Goodman Jiajun Wu OCL 59 6 0 12 Sep 2024
MemeMQA: Multimodal Question Answering for Memes via Rationale-Based Inferencing Siddhant Agarwal Shivam Sharma Preslav Nakov Tanmoy Chakraborty 24 4 0 18 May 2024
Multi-modal Learning with Missing Modality via Shared-Specific Feature Modelling Hu Wang Yuanhong Chen Congbo Ma Jodie Avery Louise Hull G. Carneiro 26 79 0 26 Jul 2023
The Contribution of Knowledge in Visiolinguistic Learning: A Survey on Tasks and Challenges Maria Lymperaiou Giorgos Stamou VLM 32 4 0 04 Mar 2023
What do you MEME? Generating Explanations for Visual Semantic Role Labelling in Memes Shivam Sharma Siddhant Agarwal Tharun Suresh Preslav Nakov Md. Shad Akhtar Tanmoy Charkraborty VLM 28 18 0 01 Dec 2022
From Pixels to Objects: Cubic Visual Attention for Visual Question Answering Jingkuan Song Pengpeng Zeng Lianli Gao Heng Tao Shen 32 62 0 04 Jun 2022
MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based Visual Question Answering Yang Ding Jing Yu Bangchang Liu Yue Hu Mingxin Cui Qi Wu 13 62 0 17 Mar 2022
NEWSKVQA: Knowledge-Aware News Video Question Answering Pranay Gupta Manish Gupta 24 7 0 08 Feb 2022
Achieving Human Parity on Visual Question Answering Ming Yan Haiyang Xu Chenliang Li Junfeng Tian Bin Bi ... Ji Zhang Songfang Huang Fei Huang Luo Si Rong Jin 32 12 0 17 Nov 2021
How to find a good image-text embedding for remote sensing visual question answering? Christel Chappuis Sylvain Lobry B. Kellenberger Bertrand Le Saux D. Tuia 40 20 0 24 Sep 2021
Communicating Visualizations without Visuals: Investigation of Visualization Alternative Text for People with Visual Impairments C. Jung Shubham Mehta Atharva Kulkarni Yuhang Zhao Yea-Seul Kim 105 55 0 08 Aug 2021
Zero-shot Visual Question Answering using Knowledge Graph Zhuo Chen Jiaoyan Chen Yuxia Geng Jeff Z. Pan Zonggang Yuan Huajun Chen 20 70 0 12 Jul 2021
Towards General Purpose Vision Systems Tanmay Gupta Amita Kamath Aniruddha Kembhavi Derek Hoiem 11 50 0 01 Apr 2021
Learning to Respond with Your Favorite Stickers: A Framework of Unifying Multi-Modality and User Preference in Multi-Turn Dialog Shen Gao Xiuying Chen Li Liu Dongyan Zhao Rui Yan 24 14 0 05 Nov 2020
VMSMO: Learning to Generate Multimodal Summary for Video-based News Articles Li Mingzhe Xiuying Chen Shen Gao Zhangming Chan Dongyan Zhao Rui Yan 33 82 0 12 Oct 2020
Knowledge-Based Video Question Answering with Unsupervised Scene Descriptions Noa Garcia Yuta Nakashima 23 32 0 17 Jul 2020
Give Me Something to Eat: Referring Expression Comprehension with Commonsense Knowledge Peng Wang Dongyang Liu Hui Li Qi Wu ObjD 24 19 0 02 Jun 2020
On the General Value of Evidence, and Bilingual Scene-Text Visual Question Answering Xinyu Wang Yuliang Liu Chunhua Shen Chun Chet Ng Canjie Luo Lianwen Jin C. Chan Anton Van Den Hengel Liangwei Wang 31 91 0 24 Feb 2020
Accuracy vs. Complexity: A Trade-off in Visual Question Answering Models M. Farazi Salman H. Khan Nick Barnes 23 17 0 20 Jan 2020
A Review on Intelligent Object Perception Methods Combining Knowledge-based Reasoning and Machine Learning Filippos Gouidis Alexandros Vassiliades T. Patkos Antonis Argyros Nick Bassiliades Dimitris Plexousakis OCL 29 12 0 26 Dec 2019
TAB-VCR: Tags and Attributes based Visual Commonsense Reasoning Baselines Jingxiang Lin Unnat Jain A. Schwing LRM ReLM 34 9 0 31 Oct 2019
KnowIT VQA: Answering Knowledge-Based Questions about Videos Noa Garcia Mayu Otani Chenhui Chu Yuta Nakashima 30 77 0 23 Oct 2019
Diving Deeper into Underwater Image Enhancement: A Survey Saeed Anwar Chongyi Li 30 192 0 17 Jul 2019
Integrating Knowledge and Reasoning in Image Understanding Somak Aditya Yezhou Yang Chitta Baral OCL 36 40 0 24 Jun 2019
MMKG: Multi-Modal Knowledge Graphs Ye Liu Hui Li Alberto García-Durán Mathias Niepert Daniel Oñoro-Rubio David S. Rosenblum 21 193 0 13 Mar 2019
Image-Question-Answer Synergistic Network for Visual Dialog Dalu Guo Chang Xu Dacheng Tao 19 74 0 26 Feb 2019
Coarse-to-fine: A RNN-based hierarchical attention model for vehicle re-identification Xiu-Shen Wei Chen-Da Liu-Zhang Lingqiao Liu Chunhua Shen Jianxin Wu 19 43 0 11 Dec 2018
From Recognition to Cognition: Visual Commonsense Reasoning Rowan Zellers Yonatan Bisk Ali Farhadi Yejin Choi LRM BDL OCL ReLM 50 866 0 27 Nov 2018
Hybrid Knowledge Routed Modules for Large-scale Object Detection Chenhan Jiang Hang Xu Xiangdan Liang Liang Lin VLM ObjD 39 86 0 30 Oct 2018
Textually Enriched Neural Module Networks for Visual Question Answering Khyathi Raghavi Chandu Mary Arpita Pyreddy Matthieu Felix N. Joshi 24 6 0 23 Sep 2018
Long Activity Video Understanding using Functional Object-Oriented Network Ahmad Babaeian Jelodar D. Paulius Yu Sun 23 35 0 03 Jul 2018
Learning Visual Knowledge Memory Networks for Visual Question Answering Zhou Su Chen Zhu Yinpeng Dong Dongqi Cai Yurong Chen Jianguo Li 34 62 0 13 Jun 2018
R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering Pan Lu Lei Ji Wei Zhang Nan Duan M. Zhou Jianyong Wang CoGe 25 79 0 24 May 2018
Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs Xinyu Wang Yufei Ye Abhinav Gupta 18 584 0 21 Mar 2018
Feature Selective Small Object Detection via Knowledge-based Recurrent Attentive Neural Network Kai Yi Zhiqiang Jian Shi-tao Chen N. Zheng ObjD 28 6 0 13 Mar 2018
Object-based reasoning in VQA Mikyas T. Desta Larry Chen Tomasz Kornuta 32 33 0 29 Jan 2018
Tell-and-Answer: Towards Explainable Visual Question Answering using Attributes and Captions Qing Li Jianlong Fu D. Yu Tao Mei Jiebo Luo FAtt XAI CoGe 51 60 0 27 Jan 2018
TieNet: Text-Image Embedding Network for Common Thorax Disease Classification and Reporting in Chest X-rays Xiaosong Wang Yifan Peng Le Lu Zhiyong Lu Ronald M. Summers MedIm 38 462 0 12 Jan 2018
Incorporating External Knowledge to Answer Open-Domain Visual Questions with Dynamic Memory Networks Guohao Li Hang Su Wenwu Zhu 38 46 0 03 Dec 2017
Don't Just Assume; Look and Answer: Overcoming Priors for Visual Question Answering Aishwarya Agrawal Dhruv Batra Devi Parikh Aniruddha Kembhavi OOD 58 582 0 01 Dec 2017
Asking the Difficult Questions: Goal-Oriented Visual Question Generation via Intermediate Rewards Junjie Zhang Qi Wu Chunhua Shen Jian Zhang Jianfeng Lu Anton Van Den Hengel LRM 40 29 0 21 Nov 2017
Survey of Recent Advances in Visual Question Answering Supriya Pandhre Shagun Sodhani 10 14 0 24 Sep 2017
Multi-modal Factorized Bilinear Pooling with Co-Attention Learning for Visual Question Answering Zhou Yu Jun-chen Yu Jianping Fan Dacheng Tao 41 663 0 04 Aug 2017
MUTAN: Multimodal Tucker Fusion for Visual Question Answering H. Ben-younes Rémi Cadène Matthieu Cord Nicolas Thome 67 578 0 18 May 2017
Survey of Visual Question Answering: Datasets and Techniques A. Gupta 18 38 0 10 May 2017
ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases Xiaosong Wang Yifan Peng Le Lu Zhiyong Lu M. Bagheri Ronald M. Summers LM&MA 22 2,473 0 05 May 2017
Show, Ask, Attend, and Answer: A Strong Baseline For Visual Question Answering V. Kazemi Ali Elqursh OOD 28 183 0 11 Apr 2017
An Analysis of Visual Question Answering Algorithms Kushal Kafle Christopher Kanan 30 230 0 28 Mar 2017
VQABQ: Visual Question Answering by Basic Questions Jia-Hong Huang Modar Alfadly Guohao Li 27 24 0 19 Mar 2017