Improving Factuality and Reasoning in Language Models through Multiagent Debate

23 May 2023

Yilun Du

Shuang Li

Antonio Torralba

Papers citing "Improving Factuality and Reasoning in Language Models through Multiagent Debate"

50 / 461 papers shown

Title
Beyond Frameworks: Unpacking Collaboration Strategies in Multi-Agent Systems Haochun Wang Sendong Zhao Jiadong Wang Zewen Qiang Bing Qin Ting Liu 2 0 0 18 May 2025
OMAC: A Broad Optimization Framework for LLM-Based Multi-Agent Collaboration Shijun Li Hilaf Hasson Joydeep Ghosh LLMAG 4 0 0 17 May 2025
PeerGuard: Defending Multi-Agent Systems Against Backdoor Attacks Through Mutual Reasoning Falong Fan Xi Li LLMAG AAML 5 0 0 16 May 2025
Rethinking the Role of Prompting Strategies in LLM Test-Time Scaling: A Perspective of Probability Theory Yexiang Liu Zekun Li Zhi Fang Nan Xu Ran He Tieniu Tan LRM 17 0 0 16 May 2025
Internet of Agents: Fundamentals, Applications, and Challenges Yuntao Wang Shaolong Guo Yanghe Pan Zhou Su Fahao Chen Tom H. Luan Peng Li Jiawen Kang Dusit Niyato LLMAG LM&Ro AI4CE 63 0 0 12 May 2025
FalseReject: A Resource for Improving Contextual Safety and Mitigating Over-Refusals in LLMs via Structured Reasoning Zhehao Zhang Weijie Xu Fanyou Wu Chandan K. Reddy 29 0 0 12 May 2025
Security of Internet of Agents: Attacks and Countermeasures Yuntao Wang Yanghe Pan Shaolong Guo Zhou Su LLMAG 44 0 0 12 May 2025
Must Read: A Systematic Survey of Computational Persuasion Nimet Beyza Bozdag Shuhaib Mehri Xiaocheng Yang Hyeonjeong Ha Zirui Cheng Esin Durmus Jiaxuan You Heng Ji Gokhan Tur Dilek Hakkani-Tur 46 0 0 12 May 2025
Learning from Peers in Reasoning Models Tongxu Luo Wenyu Du Jiaxi Bi Stephen Chung Zhengyang Tang Hao Yang M. Zhang Benyou Wang LRM 41 0 0 12 May 2025
Towards Multi-Agent Reasoning Systems for Collaborative Expertise Delegation: An Exploratory Design Study Baixuan Xu Chunyang Li Weiqi Wang Wei Fan Tianshi Zheng Haizhou Shi Tao Fan Yangqiu Song Qiang Yang 31 0 0 12 May 2025
Toward Reasonable Parrots: Why Large Language Models Should Argue with Us by Design Elena Musi Nadin Kokciyan Khalid Al Khatib Davide Ceolin Emmanuelle Dietz ... Jodi Schneider Jonas Scholz Cor Steging Jacky Visser Henning Wachsmuth LRM 49 0 0 08 May 2025
Adaptive Stress Testing Black-Box LLM Planners Neeloy Chakraborty John Pohovey Melkior Ornik Katherine Driggs-Campbell 28 0 0 08 May 2025
G-FOCUS: Towards a Robust Method for Assessing UI Design Persuasiveness Jaehyun Jeon Janghan Yoon Minsoo Kim Sumin Shim Yejin Choi Hanbin Kim Youngjae Yu AAML 47 0 0 08 May 2025
Sailing AI by the Stars: A Survey of Learning from Rewards in Post-Training and Test-Time Scaling of Large Language Models Xiaobao Wu LRM 72 1 0 05 May 2025
Multi-agents based User Values Mining for Recommendation L. Chen Wei Yuan Tong Chen Xiangyu Zhao Nguyen Quoc Viet Hung Hongzhi Yin OffRL 49 0 0 02 May 2025
Always Tell Me The Odds: Fine-grained Conditional Probability Estimation Liaoyaqi Wang Zhengping Jiang Anqi Liu Benjamin Van Durme 61 0 0 02 May 2025
MAC-Tuning: LLM Multi-Compositional Problem Reasoning with Enhanced Knowledge Boundary Awareness Junsheng Huang Zhitao He Sandeep Polisetty Q. Wang May Fung KELM 47 0 0 30 Apr 2025
Evolution of AI in Education: Agentic Workflows Firuz Kamalov David Santandreu Calonge Linda Smail Dilshod Azizov Dimple R. Thadani Theresa Kwong Amara Atif 50 1 0 25 Apr 2025
Redefining Superalignment: From Weak-to-Strong Alignment to Human-AI Co-Alignment to Sustainable Symbiotic Society Feifei Zhao Yijiao Wang Enmeng Lu Dongcheng Zhao Bing Han ... Chao Liu Yaodong Yang Yi Zeng Boyuan Chen Jinyu Fan 83 0 0 24 Apr 2025
RAGEN: Understanding Self-Evolution in LLM Agents via Multi-Turn Reinforcement Learning Zihan Wang Kaidi Wang Q. Wang Pingyue Zhang Linjie Li ... Jiajun Wu L. Fei-Fei Lijuan Wang Yejin Choi Manling Li 89 4 0 24 Apr 2025
A Self-Improving Coding Agent Maxime Robeyns Martin Szummer Laurence Aitchison LLMAG 46 0 0 21 Apr 2025
FlowReasoner: Reinforcing Query-Level Meta-Agents Hongcheng Gao Yue Liu Yufei He Longxu Dou C. Du Zhijie Deng Bryan Hooi Min Lin Tianyu Pang AIFin LRM 29 1 0 21 Apr 2025
Planet as a Brain: Towards Internet of AgentSites based on AIOS Server Xiang Zhang Yongfeng Zhang 44 0 0 19 Apr 2025
Teaching Large Language Models to Reason through Learning and Forgetting Tianwei Ni Allen Nie Sapana Chaudhary Yao Liu Huzefa Rangwala Rasool Fakoor ReLM CLL LRM 163 0 0 15 Apr 2025
EMAFusion: A Self-Optimizing System for Seamless LLM Selection and Integration Soham Shah Kumar Shridhar Surojit Chatterjee Souvik Sen 36 0 0 14 Apr 2025
Can Competition Enhance the Proficiency of Agents Powered by Large Language Models in the Realm of News-driven Time Series Forecasting? Yuxuan Zhang Yangyang Feng Daifeng Li Kexin Zhang Junlan Chen Bowen Deng LLMAG AI4TS 42 0 0 14 Apr 2025
Reasoning Court: Combining Reasoning, Action, and Judgment for Multi-Hop Reasoning Jingtian Wu Claire Cardie LRM 29 0 0 14 Apr 2025
A Short Survey on Small Reasoning Models: Training, Inference, Applications and Research Directions Chengyu Wang Taolin Zhang Richang Hong Jun Huang ReLM LRM 45 1 0 12 Apr 2025
Synthesizing High-Quality Programming Tasks with LLM-based Expert and Student Agents Manh Hung Nguyen Victor-Alexandru Pădurean Alkis Gotovos Sebastian Tschiatschek Adish Singla 24 0 0 10 Apr 2025
Hogwild! Inference: Parallel LLM Generation via Concurrent Attention Gleb Rodionov Roman Garipov Alina Shutova George Yakushev Vage Egiazarian Anton Sinitsin Denis Kuznedelev Dan Alistarh LRM 32 2 0 08 Apr 2025
Debate Only When Necessary: Adaptive Multiagent Collaboration for Efficient LLM Reasoning Sugyeong Eo Hyeonseok Moon Evelyn Hayoon Zi Chanjun Park Heuiseok Lim LLMAG 51 1 0 07 Apr 2025
Weak-for-Strong: Training Weak Meta-Agent to Harness Strong Executors Fan Nie Lan Feng Haotian Ye Weixin Liang Pan Lu Huaxiu Yao Alexandre Alahi James Zou 83 0 0 07 Apr 2025
Cognitive Debiasing Large Language Models for Decision-Making Yougang Lyu Shijie Ren Yue Feng Zihan Wang Z. Chen Z. Z. Ren Maarten de Rijke 43 0 0 05 Apr 2025
Cultural Learning-Based Culture Adaptation of Language Models Chen Cecilia Liu Anna Korhonen Iryna Gurevych 39 0 0 03 Apr 2025
CoLa -- Learning to Interactively Collaborate with Large LMs Abhishek Sharma Dan Goldwasser LLMAG SyDa 64 0 0 03 Apr 2025
Achieving Unanimous Consensus in Decision Making Using Multi-Agents Apurba Pokharel Ram Dantu Shakila Zaman Sirisha Talapuru Vinh Quach 49 1 0 02 Apr 2025
A Survey of Scaling in Large Language Model Reasoning Zihan Chen Song Wang Zhen Tan Xingbo Fu Zhenyu Lei Peng Wang Huan Liu Cong Shen Jundong Li LRM 88 0 0 02 Apr 2025
Do We Truly Need So Many Samples? Multi-LLM Repeated Sampling Efficiently Scales Test-Time Compute Jianhao Chen Zishuo Xun Bocheng Zhou Han Qi Qiaosheng Zhang ... Wei Hu Yuzhong Qu W. Ouyang Wanli Ouyang Shuyue Hu 74 1 0 01 Apr 2025
The Illusionist's Prompt: Exposing the Factual Vulnerabilities of Large Language Models with Linguistic Nuances Yining Wang Yansen Wang Xi Li Mi Zhang Geng Hong Min Yang AAML HILM 67 0 0 01 Apr 2025
DebFlow: Automating Agent Creation via Agent Debate Jinwei Su Yinghui Xia Ronghua Shi Jianhui Wang Jianuo Huang Yansen Wang Tianyu Shi Yang Jingsong Lewei He 42 0 0 31 Mar 2025
$$\textit{Agents Under Siege}$: Breaking Pragmatic Multi-Agent LLM Systems with Optimized Prompt Attacks$ $\textit{Agents Under Siege}$ : Breaking Pragmatic Multi-Agent LLM Systems with Optimized Prompt Attacks Rana Muhammad Shahroz Khan Zhen Tan Sukwon Yun Charles Flemming Tianlong Chen AAML LLMAG Presented at ResearchTrend Connect \| LLMAG on 23 Apr 2025 99 3 0 31 Mar 2025
Aurelia: Test-time Reasoning Distillation in Audio-Visual LLMs Sanjoy Chowdhury Hanan Gani Nishit Anand Sayan Nag Ruohan Gao Mohamed Elhoseiny Salman Khan Dinesh Manocha LRM 54 0 0 29 Mar 2025
A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond Xiaoye Qu Yafu Li Zhaochen Su Weigao Sun Jianhao Yan ... Chaochao Lu Yue Zhang Xian-Sheng Hua Bowen Zhou Yu Cheng ReLM OffRL LRM 91 16 0 27 Mar 2025
Debate-Driven Multi-Agent LLMs for Phishing Email Detection Ngoc Tuong Vy Nguyen Felix D Childress Yunting Yin LLMAG 39 1 0 27 Mar 2025
When Debate Fails: Bias Reinforcement in Large Language Models Jihwan Oh Minchan Jeong Jongwoo Ko Se-Young Yun LLMAG AI4CE 49 0 0 21 Mar 2025
LEMMA: Learning from Errors for MatheMatical Advancement in LLMs Zhuoshi Pan Yu Li Honglin Lin Qizhi Pei Zinan Tang Wei Wu Chenlin Ming H. V. Zhao Zeang Sheng Lijun Wu LRM 59 1 0 21 Mar 2025
MAMM-Refine: A Recipe for Improving Faithfulness in Generation with Multi-Agent Collaboration David Wan Justin Chih-Yao Chen Elias Stengel-Eskin Joey Tianyi Zhou LLMAG LRM 65 1 0 19 Mar 2025
MDTeamGPT: A Self-Evolving LLM-based Multi-Agent Framework for Multi-Disciplinary Team Medical Consultation Kai-xiang Chen Xianrui Li Tianpei Yang Hewei Wang Wei Dong Yang Gao LLMAG LM&MA 76 2 0 18 Mar 2025
Don't lie to your friends: Learning what you know from collaborative self-play Jacob Eisenstein Reza Aghajani Adam Fisch Dheeru Dua Fantine Huot Mirella Lapata Vicky Zayats Jonathan Berant 72 0 0 18 Mar 2025
Temporal Consistency for LLM Reasoning Process Error Identification Jiacheng Guo Yue Wu Jiahao Qiu Kaixuan Huang Xinzhe Juan L. Yang Mengdi Wang LRM 63 1 0 18 Mar 2025