Retrieval Meets Reasoning: Even High-school Textbook Knowledge Benefits
Multimodal Reasoning

Retrieval Meets Reasoning: Even High-school Textbook Knowledge Benefits Multimodal Reasoning

31 May 2024

Cheng Tan

Jingxuan Wei

Linzhuang Sun

Siyuan Li

Ruifeng Guo

Stan Z. Li

Papers citing "Retrieval Meets Reasoning: Even High-school Textbook Knowledge Benefits Multimodal Reasoning"

15 / 15 papers shown

Title
CoMT: A Novel Benchmark for Chain of Multi-modal Thought on Large Vision-Language Models Zihui Cheng Qiguang Chen Jin Zhang Hao Fei Xiaocheng Feng Wanxiang Che Min Li L. Qin VLM MLLM LRM 75 4 0 17 Dec 2024
VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents S. Yu C. Tang Bokai Xu Junbo Cui Junhao Ran ... Zhenghao Liu Shuo Wang Xu Han Zhiyuan Liu Maosong Sun VLM 39 23 0 14 Oct 2024
Retrieval-Augmented Generation for AI-Generated Content: A Survey Penghao Zhao Hailin Zhang Qinhan Yu Zhengren Wang Yunteng Geng Fangcheng Fu Ling Yang Wentao Zhang Jie Jiang Bin Cui 3DV 115 228 0 29 Feb 2024
InternLM-XComposer2: Mastering Free-form Text-Image Composition and Comprehension in Vision-Language Large Model Xiao-wen Dong Pan Zhang Yuhang Zang Yuhang Cao Bin Wang ... Conghui He Xingcheng Zhang Yu Qiao Dahua Lin Jiaqi Wang VLM MLLM 87 244 0 29 Jan 2024
Corrective Retrieval Augmented Generation Shi-Qi Yan Jia-Chen Gu Yun Zhu Zhen-Hua Ling RALM 137 72 0 29 Jan 2024
Chain-of-Note: Enhancing Robustness in Retrieval-Augmented Language Models W. Yu Hongming Zhang Xiaoman Pan Kaixin Ma Hongwei Wang Dong Yu KELM RALM LRM 70 102 0 15 Nov 2023
Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection Akari Asai Zeqiu Wu Yizhong Wang Avirup Sil Hannaneh Hajishirzi RALM 162 631 0 17 Oct 2023
Lift Yourself Up: Retrieval-augmented Text Generation with Self Memory Xin Cheng Di Luo Xiuying Chen Lemao Liu Dongyan Zhao Rui Yan RALM 150 91 0 03 May 2023
Prophet: Prompting Large Language Models with Complementary Answer Heuristics for Knowledge-based Visual Question Answering Zhou Yu Xuecheng Ouyang Zhenwei Shao Mei Wang Jun Yu MLLM 94 11 0 03 Mar 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 270 4,244 0 30 Jan 2023
Learn to Explain: Multimodal Reasoning via Thought Chains for Science Question Answering Pan Lu Swaroop Mishra Tony Xia Liang Qiu Kai-Wei Chang Song-Chun Zhu Oyvind Tafjord Peter Clark A. Kalyan ELM ReLM LRM 211 1,106 0 20 Sep 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 367 8,495 0 28 Jan 2022
An Empirical Study of GPT-3 for Few-Shot Knowledge-Based VQA Zhengyuan Yang Zhe Gan Jianfeng Wang Xiaowei Hu Yumao Lu Zicheng Liu Lijuan Wang 174 402 0 10 Sep 2021
Efficient Nearest Neighbor Language Models Junxian He Graham Neubig Taylor Berg-Kirkpatrick RALM 195 103 0 09 Sep 2021
Co-learning: Learning from Noisy Labels with Self-supervision Cheng Tan Jun-Xiong Xia Lirong Wu Stan Z. Li NoLa 73 116 0 05 Aug 2021