Select, Substitute, Search: A New Benchmark for Knowledge-Augmented
Visual Question Answering

Select, Substitute, Search: A New Benchmark for Knowledge-Augmented Visual Question Answering

9 March 2021

Mayank Kothyari

Vishwajeet Kumar

Ganesh Ramakrishnan

Soumen Chakrabarti

Papers citing "Select, Substitute, Search: A New Benchmark for Knowledge-Augmented Visual Question Answering"

6 / 6 papers shown

Title
Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent Yangning Li Hai-Tao Zheng Xinyu Wang Yong-feng Jiang Zhen Zhang ... Hui Wang Hai-Tao Zheng Pengjun Xie Philip S. Yu Fei Huang 65 16 0 05 Nov 2024
COCO is "ALL'' You Need for Visual Instruction Fine-tuning Xiaotian Han Yiqi Wang Bohan Zhai Quanzeng You Hongxia Yang VLM MLLM 33 2 0 17 Jan 2024
Can Pre-trained Vision and Language Models Answer Visual Information-Seeking Questions? Yang Chen Hexiang Hu Yi Luan Haitian Sun Soravit Changpinyo Alan Ritter Ming-Wei Chang 48 80 0 23 Feb 2023
A-OKVQA: A Benchmark for Visual Question Answering using World Knowledge Dustin Schwenk Apoorv Khandelwal Christopher Clark Kenneth Marino Roozbeh Mottaghi 16 505 0 03 Jun 2022
Can Open Domain Question Answering Systems Answer Visual Knowledge Questions? Jiawen Zhang Abhijit Mishra Avinesh P.V.S Siddharth Patwardhan Sachin Agarwal 24 0 0 09 Feb 2022
MoCA: Incorporating Multi-stage Domain Pretraining and Cross-guided Multimodal Attention for Textbook Question Answering Fangzhi Xu Qika Lin Xiaozhong Liu Lingling Zhang Tianzhe Zhao Qianyi Chai Yudai Pan 14 2 0 06 Dec 2021