Improving Factuality and Reasoning in Language Models through Multiagent Debate

23 May 2023

Yilun Du

Shuang Li

Antonio Torralba

Papers citing "Improving Factuality and Reasoning in Language Models through Multiagent Debate"

50 / 465 papers shown

Title
MAMM-Refine: A Recipe for Improving Faithfulness in Generation with Multi-Agent Collaboration David Wan Justin Chih-Yao Chen Elias Stengel-Eskin Joey Tianyi Zhou LLMAG LRM 65 1 0 19 Mar 2025
Don't lie to your friends: Learning what you know from collaborative self-play Jacob Eisenstein Reza Aghajani Adam Fisch Dheeru Dua Fantine Huot Mirella Lapata Vicky Zayats Jonathan Berant 72 0 0 18 Mar 2025
Temporal Consistency for LLM Reasoning Process Error Identification Jiacheng Guo Yue Wu Jiahao Qiu Kaixuan Huang Xinzhe Juan L. Yang Mengdi Wang LRM 63 1 0 18 Mar 2025
MDTeamGPT: A Self-Evolving LLM-based Multi-Agent Framework for Multi-Disciplinary Team Medical Consultation Kai-xiang Chen Xianrui Li Tianpei Yang Hewei Wang Wei Dong Yang Gao LLMAG LM&MA 76 2 0 18 Mar 2025
Why Do Multi-Agent LLM Systems Fail? Mert Cemri Melissa Z. Pan Shuyi Yang Lakshya A Agrawal Bhavya Chopra ... Dan Klein Kannan Ramchandran Matei A. Zaharia Joseph E. Gonzalez Ion Stoica LLMAG Presented at ResearchTrend Connect \| LLMAG on 23 Apr 2025 131 9 0 17 Mar 2025
Modality-Composable Diffusion Policy via Inference-Time Distribution-level Composition Jiahang Cao Qiang Zhang Hanzhong Guo Jiaxu Wang Hao-Ran Cheng Renjing Xu DiffM 60 0 0 16 Mar 2025
SagaLLM: Context Management, Validation, and Transaction Guarantees for Multi-Agent LLM Planning Edward Y. Chang Longling Geng LLMAG LRM 46 0 0 15 Mar 2025
LVAgent: Long Video Understanding by Multi-Round Dynamical Collaboration of MLLM Agents Boyu Chen Zhengrong Yue Siran Chen Zehua Wang Yang Liu Peng Li Yansen Wang VLM 198 0 0 13 Mar 2025
Thinking Machines: A Survey of LLM based Reasoning Strategies Dibyanayan Bandyopadhyay Soham Bhattacharjee Asif Ekbal LRM ELM 48 5 0 13 Mar 2025
ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning Bo Liu Yunxiang Li Yangqiu Song Hanjing Wang Linyi Yang Mark W. Schmidt Jun Wang Weinan Zhang Shuyue Hu Ying Wen LLMAG KELM LRM AI4CE 92 6 0 12 Mar 2025
Investigating the Effectiveness of a Socratic Chain-of-Thoughts Reasoning Method for Task Planning in Robotics, A Case Study Veronica Bot Zheyuan Xu LRM LLMAG LM&Ro 67 0 0 11 Mar 2025
Research on Superalignment Should Advance Now with Parallel Optimization of Competence and Conformity HyunJin Kim Xiaoyuan Yi Jing Yao Muhua Huang Jinyeong Bak James Evans Xing Xie 44 0 0 08 Mar 2025
STiL: Semi-supervised Tabular-Image Learning for Comprehensive Task-Relevant Information Exploration in Multimodal Classification Siyi Du Xinzhe Luo D. O’Regan Chen Qin 69 0 0 08 Mar 2025
Intent-Aware Self-Correction for Mitigating Social Biases in Large Language Models Panatchakorn Anantaprayoon Masahiro Kaneko Naoaki Okazaki LRM KELM 55 0 0 08 Mar 2025
Extracting and Emulsifying Cultural Explanation to Improve Multilingual Capability of LLMs Hamin Koo Jaehyung Kim 48 0 0 07 Mar 2025
Enhancing Reasoning with Collaboration and Memory Julie Michelman Nasrin Baratalipour Matthew Abueg LLMAG FedML 64 1 0 07 Mar 2025
Evaluating open-source Large Language Models for automated fact-checking Nicoló Fontana Francesco Corso Enrico Zuccolotto Francesco Pierri HILM 62 0 0 07 Mar 2025
QG-SMS: Enhancing Test Item Analysis via Student Modeling and Simulation Bang Nguyen Tingting Du Mengxia Yu Lawrence Angrave Meng Jiang AI4Ed 71 0 0 07 Mar 2025
Efficient Algorithms for Verifying Kruskal Rank in Sparse Linear Regression and Related Applications Fengqin Zhou 62 0 0 06 Mar 2025
AgentSafe: Safeguarding Large Language Model-based Multi-agent Systems via Hierarchical Data Management Junyuan Mao Fanci Meng Yifan Duan Miao Yu Xiaojun Jia Junfeng Fang Keli Zhang Kaidi Wang Qingsong Wen LLMAG AAML 58 1 0 06 Mar 2025
LLMs Can Generate a Better Answer by Aggregating Their Own Responses Zichong Li Xinyu Feng Yuheng Cai Zixuan Zhang Tianyi Liu Chen Liang Weizhu Chen Haoyu Wang T. Zhao LRM 55 1 0 06 Mar 2025
MAS-GPT: Training LLMs to Build LLM-based Multi-Agent Systems Guangyi Liu Shuo Tang Rui Ge Yaxin Du Zhenfei Yin Tian Jin Jing Shao LLMAG 90 1 0 05 Mar 2025
Shakespearean Sparks: The Dance of Hallucination and Creativity in LLMs' Decoding Layers Zicong He Boxuan Zhang Lu Cheng 52 0 0 04 Mar 2025
Instruct-of-Reflection: Enhancing Large Language Models Iterative Reflection Capabilities via Dynamic-Meta Instruction Liping Liu Chunhong Zhang Likang Wu Chuang Zhao Zheng Hu Ming He Jianping Fan LLMAG LRM 41 0 0 02 Mar 2025
Rehearse With User: Personalized Opinion Summarization via Role-Playing based on Large Language Models Yanyue Zhang Yulan He Deyu Zhou 42 0 0 01 Mar 2025
PodAgent: A Comprehensive Framework for Podcast Generation Yujia Xiao Lei He Haohan Guo Fenglong Xie Tan Lee 180 0 0 01 Mar 2025
The Power of Personality: A Human Simulation Perspective to Investigate Large Language Model Agents Yifan Duan Yihong Tang Xuefeng Bai Kehai Chen J. Li Min Zhang LLMAG 225 0 0 28 Feb 2025
LangProBe: a Language Programs Benchmark Shangyin Tan Lakshya A Agrawal Arnav Singhvi Liheng Lai Michael J Ryan Dan Klein Omar Khattab Koushik Sen Matei A. Zaharia 64 0 0 27 Feb 2025
Multi-Agent Verification: Scaling Test-Time Compute with Multiple Verifiers Shalev Lifshitz Sheila A. McIlraith Yilun Du LRM 57 6 0 27 Feb 2025
Multi-LLM Collaborative Search for Complex Problem Solving Sen Yang Yafu Li Wai Lam Yu Cheng LLMAG LRM 68 1 0 26 Feb 2025
Voting or Consensus? Decision-Making in Multi-Agent Debate Lars Benedikt Kaesberg Jonas Becker Jan Philip Wahle Terry Ruas Bela Gipp 74 1 0 26 Feb 2025
Stay Focused: Problem Drift in Multi-Agent Debate Jonas Becker Lars Benedikt Kaesberg Andreas Stephan Jan Philip Wahle Terry Ruas Bela Gipp 59 1 0 26 Feb 2025
Weaker LLMs' Opinions Also Matter: Mixture of Opinions Enhances LLM's Mathematical Reasoning Yanan Chen Ali Pesaranghader Tanmana Sadhu LRM 57 0 0 26 Feb 2025
Harnessing Multiple Large Language Models: A Survey on LLM Ensemble Zhijun Chen Jingzheng Li Pengpeng Chen Zhuoran Li Kai Sun Yuankai Luo Qianren Mao Dingqi Yang Hailong Sun Philip S. Yu ELM 55 5 0 25 Feb 2025
Enhancing Text Classification with a Novel Multi-Agent Collaboration Framework Leveraging BERT Hediyeh Baban Sai A Pidapar Aashutosh Nema Sichen Lu LLMAG 82 0 0 25 Feb 2025
MobileSteward: Integrating Multiple App-Oriented Agents with Self-Evolution to Automate Cross-App Instructions Yuxuan Liu Hongda Sun Wei Liu Jian Luan Bo Du Rui Yan 58 2 0 24 Feb 2025
CopyJudge: Automated Copyright Infringement Identification and Mitigation in Text-to-Image Diffusion Models Shunchang Liu Zhuan Shi Lingjuan Lyu Yaochu Jin Boi Faltings 66 2 0 24 Feb 2025
METAL: A Multi-Agent Framework for Chart Generation with Test-Time Scaling Bingxuan Li Yiwei Wang Jiuxiang Gu Kai-Wei Chang Nanyun Peng AI4CE 72 3 0 24 Feb 2025
The Lottery LLM Hypothesis, Rethinking What Abilities Should LLM Compression Preserve? Zhenheng Tang Xiang Liu Qian Wang Peijie Dong Bingsheng He Xiaowen Chu Bo Li LRM 61 1 0 24 Feb 2025
The Hidden Strength of Disagreement: Unraveling the Consensus-Diversity Tradeoff in Adaptive Multi-Agent Systems Zengqing Wu Takayuki Ito 42 0 0 23 Feb 2025
RewardDS: Privacy-Preserving Fine-Tuning for Large Language Models via Reward Driven Data Synthesis Jianwei Wang Junyao Yang Haoran Li Huiping Zhuang Cen Chen Ziqian Zeng SyDa 49 0 0 23 Feb 2025
Pub-Guard-LLM: Detecting Fraudulent Biomedical Articles with Reliable Explanations Lihu Chen Shuojie Fu Gabriel Freedman Cemre Zor Guy Martin James Kinross Uddhav Vaghela Ovidiu Serban Francesca Toni DeLMO 68 0 0 21 Feb 2025
M-MAD: Multidimensional Multi-Agent Debate for Advanced Machine Translation Evaluation Zhaopeng Feng Jiayuan Su Jiamei Zheng Jiahan Ren Yan Zhang Jian Wu Hongwei Wang Zuozhu Liu ELM 208 0 0 21 Feb 2025
S^3cMath: Spontaneous Step-level Self-correction Makes Large Language Models Better Mathematical Reasoners Yuchen Yan Jin Jiang Yang Liu Yixin Cao Xin Xu Hao Fei Xunliang Cai Jian Shao ReLM LRM KELM 120 7 0 21 Feb 2025
Optimizing Model Selection for Compound AI Systems Lingjiao Chen Jared Quincy Davis Boris Hanin Peter Bailis Matei A. Zaharia James Zou Ion Stoica 63 1 0 20 Feb 2025
Autellix: An Efficient Serving Engine for LLM Agents as General Programs Michael Luo Xiaoxiang Shi Colin Cai Tianjun Zhang Justin Wong ... Chi Wang Yanping Huang Zhifeng Chen Joseph E. Gonzalez Ion Stoica 55 3 0 20 Feb 2025
Counterfactual-Consistency Prompting for Relative Temporal Understanding in Large Language Models Jongho Kim Seung-won Hwang LRM AI4CE 58 0 0 17 Feb 2025
Towards Top-Down Reasoning: An Explainable Multi-Agent Approach for Visual Question Answering Zeqing Wang Wentao Wan Qiqing Lao Runmeng Chen Minjie Lang Keze Wang Liang Lin Liang Lin LRM 103 3 0 17 Feb 2025
Divergent Thoughts toward One Goal: LLM-based Multi-Agent Collaboration System for Electronic Design Automation Haoyuan Wu Haisheng Zheng Zhuolun He Bei Yu 45 0 0 15 Feb 2025
PathFinder: A Multi-Modal Multi-Agent System for Medical Diagnostic Decision-Making Applied to Histopathology Fatemeh Ghezloo M. S. Seyfioglu Rustin Soraki Wisdom O. Ikezogwo Beibin Li Tejoram Vivekanandan J. Elmore Ranjay Krishna Linda G. Shapiro 100 4 0 13 Feb 2025