Multimodal Inverse Cloze Task for Knowledge-based Visual Question Answering

11 January 2023

Papers citing "Multimodal Inverse Cloze Task for Knowledge-based Visual Question Answering"

10 / 10 papers shown

Title
Cross-modal Retrieval for Knowledge-based Visual Question Answering Paul Lerner Olivier Ferret C. Guinaudeau 33 7 0 11 Jan 2024
Pre-Training Multi-Modal Dense Retrievers for Outside-Knowledge Visual Question Answering Alireza Salemi Mahta Rafiee Hamed Zamani 24 8 0 28 Jun 2023
The Contribution of Knowledge in Visiolinguistic Learning: A Survey on Tasks and Challenges Maria Lymperaiou Giorgos Stamou VLM 32 4 0 04 Mar 2023
A Unified End-to-End Retriever-Reader Framework for Knowledge-based VQA Yangyang Guo Liqiang Nie Yongkang Wong Y. Liu Zhiyong Cheng Mohan S. Kankanhalli 77 39 0 30 Jun 2022
Unsupervised Corpus Aware Language Model Pre-training for Dense Passage Retrieval Luyu Gao Jamie Callan RALM 175 329 0 12 Aug 2021
Efficient Retrieval Optimized Multi-task Learning He Fun S. Gandhi Sujith Ravi RALM 18 6 0 20 Apr 2021
WIT: Wikipedia-based Image Text Dataset for Multimodal Multilingual Machine Learning Krishna Srinivasan K. Raman Jiecao Chen Michael Bendersky Marc Najork VLM 208 310 0 02 Mar 2021
Transformers in Vision: A Survey Salman Khan Muzammal Naseer Munawar Hayat Syed Waqas Zamir Fahad Shahbaz Khan M. Shah ViT 227 2,431 0 04 Jan 2021
RocketQA: An Optimized Training Approach to Dense Passage Retrieval for Open-Domain Question Answering Yingqi Qu Yuchen Ding Jing Liu Kai Liu Ruiyang Ren Xin Zhao Daxiang Dong Hua Wu Haifeng Wang RALM OffRL 214 594 0 16 Oct 2020
Pretrained Transformers for Text Ranking: BERT and Beyond Jimmy J. Lin Rodrigo Nogueira Andrew Yates VLM 239 611 0 13 Oct 2020