Enhancing LLMs' Reasoning-Intensive Multimedia Search Capabilities through Fine-Tuning and Reinforcement Learning

Enhancing LLMs' Reasoning-Intensive Multimedia Search Capabilities through Fine-Tuning and Reinforcement Learning

24 May 2025

ArXiv (abs)PDF HTML

Papers citing "Enhancing LLMs' Reasoning-Intensive Multimedia Search Capabilities through Fine-Tuning and Reinforcement Learning"

14 / 14 papers shown

Title
MM-IFEngine: Towards Multimodal Instruction Following Shengyuan Ding Shenxi Wu Xiangyu Zhao Yuhang Zang Haodong Duan Xiaoyi Dong Pan Zhang Yuhang Cao Dahua Lin Jiaqi Wang OffRL 127 5 0 10 Apr 2025
Zero-shot Benchmarking: A Framework for Flexible and Scalable Automatic Evaluation of Language Models José P. Pombal Nuno M. Guerreiro Ricardo Rei André F. T. Martins ALM 126 2 0 01 Apr 2025
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning Bowen Jin Hansi Zeng Zhenrui Yue Dong Wang Sercan O. Arik Dong Wang Hamed Zamani Jiawei Han RALM ReLM KELM OffRL AI4TS LRM 204 122 0 12 Mar 2025
AgentRM: Enhancing Agent Generalization with Reward Modeling Yu Xia Jingru Fan Weize Chen Siyu Yan Xin Cong Zhong Zhang Yaojie Lu Yankai Lin Zhiyuan Liu Maosong Sun 94 4 0 25 Feb 2025
RAS: Retrieval-And-Structuring for Knowledge-Intensive LLM Generation Pengcheng Jiang Lang Cao Ruike Zhu Minhao Jiang Yunyi Zhang Jimeng Sun Jiawei Han RALM 211 4 0 16 Feb 2025
Qwen2.5-32B: Leveraging Self-Consistent Tool-Integrated Reasoning for Bengali Mathematical Olympiad Problem Solving Saad Tahmid Sourav Sarker LRM AIMat 63 1 0 08 Nov 2024
Neural Spacetimes for DAG Representation Learning Haitz Sáez de Ocáriz Borde Anastasis Kratsios Marc T. Law Xiaowen Dong Michael Bronstein CML 125 2 0 25 Aug 2024
MindSearch: Mimicking Human Minds Elicits Deep AI Searcher Zehui Chen Kuikun Liu Qiuchen Wang Jiangning Liu Wenwei Zhang Kai Chen Feng Zhao LLMAG 131 29 0 29 Jul 2024
When Search Engine Services meet Large Language Models: Visions and Challenges Haoyi Xiong Jiang Bian Yuchen Li Xuhong Li Jundong Li Shuaiqiang Wang Dawei Yin Sumi Helal 119 36 0 28 Jun 2024
FinLLMs: A Framework for Financial Reasoning Dataset Generation with Large Language Models Ziqiang Yuan Kaiyuan Wang Shoutai Zhu Ye Yuan Jingya Zhou Yanlin Zhu Wenqi Wei 68 9 0 19 Jan 2024
Comparing Traditional and LLM-based Search for Consumer Choice: A Randomized Experiment S. Spatharioti David M. Rothschild D. Goldstein Jake M. Hofman 91 56 0 07 Jul 2023
CAMEL: Communicative Agents for "Mind" Exploration of Large Language Model Society Ge Li Hasan Hammoud Hani Itani Dmitrii Khizbullin Guohao Li SyDa ALM 130 513 0 31 Mar 2023
Supervised Contrastive Learning for Pre-trained Language Model Fine-tuning Beliz Gunel Jingfei Du Alexis Conneau Ves Stoyanov 63 507 0 03 Nov 2020
Deep reinforcement learning from human preferences Paul Christiano Jan Leike Tom B. Brown Miljan Martic Shane Legg Dario Amodei 218 3,377 0 12 Jun 2017