Fine-Tuning with Divergent Chains of Thought Boosts Reasoning Through
Self-Correction in Language Models

Fine-Tuning with Divergent Chains of Thought Boosts Reasoning Through Self-Correction in Language Models

3 July 2024

Harish Tayyar Madabushi

Papers citing "Fine-Tuning with Divergent Chains of Thought Boosts Reasoning Through Self-Correction in Language Models"

12 / 12 papers shown

Title
Short-Path Prompting in LLMs: Analyzing Reasoning Instability and Solutions for Robust Performance Zuoli Tang Junjie Ou Kaiqin Hu Chunwei Wu Zhaoxin Huan Chilin Fu Xiaolu Zhang Jun Zhou Chenliang Li ReLM LRM 40 0 0 13 Apr 2025
AgentRxiv: Towards Collaborative Autonomous Research Samuel Schmidgall Michael Moor 65 3 0 23 Mar 2025
S^3cMath: Spontaneous Step-level Self-correction Makes Large Language Models Better Mathematical Reasoners Yuchen Yan Jin Jiang Yang Liu Yixin Cao Xin Xu M. Zhang Xunliang Cai Jian Shao ReLM LRM KELM 117 7 0 21 Feb 2025
CLIPPER: Compression enables long-context synthetic data generation Chau Minh Pham Yapei Chang Mohit Iyyer SyDa 85 1 0 21 Feb 2025
Compressed Chain of Thought: Efficient Reasoning Through Dense Representations Jeffrey Cheng Benjamin Van Durme LRM 79 28 0 17 Dec 2024
Scaling Up Membership Inference: When and How Attacks Succeed on Large Language Models Haritz Puerto Martin Gubri Sangdoo Yun Seong Joon Oh MIALM 602 2 2 31 Oct 2024
On Memorization of Large Language Models in Logical Reasoning Chulin Xie Yangsibo Huang Chiyuan Zhang Da Yu Xinyun Chen Bill Yuchen Lin Bo Li Badih Ghazi Ravi Kumar LRM 53 20 0 30 Oct 2024
Code Prompting Elicits Conditional Reasoning Abilities in Text+Code LLMs Haritz Puerto Martin Tutek Somak Aditya Xiaodan Zhu Iryna Gurevych ReCod ReLM LRM 48 9 0 18 Jan 2024
Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes Lokesh Nagalapatti Chun-Liang Li Chih-Kuan Yeh Hootan Nakhost Yasuhisa Fujii Alexander Ratner Ranjay Krishna Chen-Yu Lee Tomas Pfister ALM 220 502 0 03 May 2023
Self-Consistency Improves Chain of Thought Reasoning in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Sharan Narang Aakanksha Chowdhery Denny Zhou ReLM BDL LRM AI4CE 314 3,248 0 21 Mar 2022
ConditionalQA: A Complex Reading Comprehension Dataset with Conditional Answers Haitian Sun William W. Cohen Ruslan Salakhutdinov 67 33 0 13 Oct 2021
Did Aristotle Use a Laptop? A Question Answering Benchmark with Implicit Reasoning Strategies Mor Geva Daniel Khashabi Elad Segal Tushar Khot Dan Roth Jonathan Berant RALM 250 677 0 06 Jan 2021