Towards Revealing the Mystery behind Chain of Thought: A Theoretical Perspective

24 May 2023

Papers citing "Towards Revealing the Mystery behind Chain of Thought: A Theoretical Perspective"

50 / 163 papers shown

Title
On the Thinking-Language Modeling Gap in Large Language Models Chenxi Liu Yongqiang Chen Tongliang Liu James Cheng Bo Han Kun Zhang LRM AI4CE 7 0 0 19 May 2025
Reasoning by Superposition: A Theoretical Perspective on Chain of Continuous Thought Hanlin Zhu Shibo Hao Zhiting Hu Jiantao Jiao Stuart Russell Yuandong Tian OffRL LRM 9 0 0 18 May 2025
DMN-Guided Prompting: A Low-Code Framework for Controlling LLM Behavior Shaghayegh Abedi Amin Jalali 2 0 0 16 May 2025
Rethinking the Role of Prompting Strategies in LLM Test-Time Scaling: A Perspective of Probability Theory Yexiang Liu Zekun Li Zhi Fang Nan Xu Ran He Tieniu Tan LRM 17 0 0 16 May 2025
Spectral Policy Optimization: Coloring your Incorrect Reasoning in GRPO Peter Chen Xiaopeng Li Zhiyu Li Xi Chen Tianyi Lin 9 0 0 16 May 2025
Training Strategies for Efficient Embodied Reasoning William Chen Suneel Belkhale Suvir Mirchandani Oier Mees Danny Driess Karl Pertsch Sergey Levine OffRL LRM 23 0 0 13 May 2025
Lost in Transmission: When and Why LLMs Fail to Reason Globally Tobias Schnabel Kiran Tomlinson Adith Swaminathan Jennifer Neville LRM 35 0 0 13 May 2025
Learn to Think: Bootstrapping LLM Reasoning Capability Through Graph Representation Learning Hang Gao Chenhao Zhang Tie Wang Junsuo Zhao Fengge Wu Changwen Zheng Huaping Liu LRM 34 0 0 09 May 2025
Chain-of-Thought Tokens are Computer Program Variables Fangwei Zhu Peiyi Wang Zhifang Sui LRM 44 0 0 08 May 2025
Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization Kesen Zhao B. Zhu Qianru Sun Hanwang Zhang MLLM LRM 86 0 0 25 Apr 2025
Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction Vaishnavh Nagarajan Chen Henry Wu Charles Ding Aditi Raghunathan 38 0 0 21 Apr 2025
Do Prompt Patterns Affect Code Quality? A First Empirical Assessment of ChatGPT-Generated Code Antonio Della Porta Stefano Lambiase Fabio Palomba 24 0 0 18 Apr 2025
Benchmarking Systematic Relational Reasoning with Large Language and Reasoning Models Irtaza Khalid Amir Masoud Nourollah Steven Schockaert LRM 43 0 0 30 Mar 2025
RARE: Retrieval-Augmented Reasoning Modeling Zhengren Wang Jiayang Yu Dongsheng Ma Zhengzhang Chen Yu Wang ... Zhiyu Li Yanfeng Wang Weinan E Linpeng Tang Feiyu Xiong RALM LRM 42 3 0 30 Mar 2025
Think Before Recommend: Unleashing the Latent Reasoning Power for Sequential Recommendation Jiakai Tang Sunhao Dai Teng Shi Jun Xu X. Chen Wen Chen Wu Jian Yuning Jiang LRM 75 5 0 28 Mar 2025
Analyzable Chain-of-Musical-Thought Prompting for High-Fidelity Music Generation Max W. Y. Lam Yijin Xing Weiya You Jingcheng Wu Zongyu Yin ... T. Zhao Chien-Hung Liu Xuchen Song Yang Li Yahui Zhou LRM 64 2 0 25 Mar 2025
Video-VoT-R1: An efficient video inference model integrating image packing and AoE architecture Cheng Li Jiexiong Liu Yixuan Chen Yanqin Jia MLLM VLM 76 0 0 20 Mar 2025
CoE: Chain-of-Explanation via Automatic Visual Concept Circuit Description and Polysemanticity Quantification Wenlong Yu Qilong Wang Chuang Liu Dong Li Q. Hu LRM 60 0 0 19 Mar 2025
Policy Frameworks for Transparent Chain-of-Thought Reasoning in Large Language Models Yihang Chen Haikang Deng Kaiqiao Han Qingyue Zhao LRM 55 0 0 14 Mar 2025
When Do Transformers Outperform Feedforward and Recurrent Networks? A Statistical Perspective Alireza Mousavi-Hosseini Clayton Sanford Denny Wu Murat A. Erdogdu 50 0 0 14 Mar 2025
Language Models, Graph Searching, and Supervision Adulteration: When More Supervision is Less and How to Make More More Arvid Frydenlund LRM 52 0 0 13 Mar 2025
VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search Yiming Jia Jiashi Li Xiang Yue Bo Li Ping Nie Kai Zou Wenhu Chen LRM 79 2 0 13 Mar 2025
Autoregressive Image Generation with Vision Full-view Prompt Miaomiao Cai G. Wang Wei Li Zhijun Tu Hanting Chen Shaohui Lin Jie Hu LRM 70 0 0 13 Mar 2025
A Survey of Large Language Model Empowered Agents for Recommendation and Search: Towards Next-Generation Information Retrieval Yu Zhang Shutong Qiao Jiaqi Zhang Tzu-Heng Lin Chen Gao Yong Li LM&Ro LM&MA 90 1 0 07 Mar 2025
Towards Understanding Multi-Round Large Language Model Reasoning: Approximability, Learnability and Generalizability Chenhui Xu Dancheng Liu Jiajie Li Amir Nassereldine Zhaohui Li Jinjun Xiong LRM 70 0 0 05 Mar 2025
Compositional Reasoning with Transformers, RNNs, and Chain of Thought Gilad Yehudai Noah Amsel Joan Bruna LRM 62 1 0 03 Mar 2025
Beyond In-Distribution Success: Scaling Curves of CoT Granularity for Language Model Generalization Ru Wang Wei Huang Selena Song Haoyu Zhang Yusuke Iwasawa Y. Matsuo Jiaxian Guo OODD LRM 75 2 0 25 Feb 2025
Unveiling and Causalizing CoT: A Causal Pespective Jiarun Fu LiZhong Ding Hao Li P. Li Qiuning Wei Xu Chen LRM 83 0 0 25 Feb 2025
The Lottery LLM Hypothesis, Rethinking What Abilities Should LLM Compression Preserve? Zhenheng Tang Xiang Liu Qian Wang Peijie Dong Bingsheng He Xiaowen Chu Bo Li LRM 61 1 0 24 Feb 2025
Reasoning with Latent Thoughts: On the Power of Looped Transformers Nikunj Saunshi Nishanth Dikkala Zhiyuan Li Sanjiv Kumar Sashank J. Reddi OffRL LRM AI4CE 64 10 0 24 Feb 2025
CoT-UQ: Improving Response-wise Uncertainty Quantification in LLMs with Chain-of-Thought Boxuan Zhang Ruqi Zhang LRM 32 2 0 24 Feb 2025
CoT-ICL Lab: A Petri Dish for Studying Chain-of-Thought Learning from In-Context Demonstrations Vignesh Kothapalli Hamed Firooz Maziar Sanjabi 68 0 0 21 Feb 2025
Looped ReLU MLPs May Be All You Need as Practical Programmable Computers Yingyu Liang Zhizhou Sha Zhenmei Shi Zhao Song Yufa Zhou 101 18 0 21 Feb 2025
To Think or Not to Think: Exploring the Unthinking Vulnerability in Large Reasoning Models Zihao Zhu Hongbao Zhang Ruotong Wang Ke Xu Siwei Lyu Baoyuan Wu AAML LRM 67 5 0 16 Feb 2025
GCoT: Chain-of-Thought Prompt Learning for Graphs Xingtong Yu Chang Zhou Zhongwei Kuai Xinming Zhang Yuan Fang LRM 72 2 0 12 Feb 2025
Enhancing Auto-regressive Chain-of-Thought through Loop-Aligned Reasoning Qifan Yu Zhenyu He Sijie Li Xun Zhou Jun Zhang Jingjing Xu Di He OffRL LRM 89 4 0 12 Feb 2025
When More is Less: Understanding Chain-of-Thought Length in LLMs Yuyang Wu Yifei Wang Tianqi Du Stefanie Jegelka Yisen Wang LRM 54 24 0 11 Feb 2025
XiHeFusion: Harnessing Large Language Models for Science Communication in Nuclear Fusion Xinyu Wang Qingquan Yang Fuling Wang Qiang Chen Wentao Wu ... Wanli Lv Meiwen Chen Zehua Chen Guosheng Xu Jin Tang AI4CE 48 0 0 08 Feb 2025
Dynamic Chain-of-Thought: Towards Adaptive Deep Reasoning Libo Wang LRM 159 1 0 07 Feb 2025
Lower Bounds for Chain-of-Thought Reasoning in Hard-Attention Transformers Alireza Amiri Xinting Huang Mark Rofin Michael Hahn LRM 201 0 0 04 Feb 2025
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? Yutong Yin Zhaoran Wang LRM ReLM 167 0 0 27 Jan 2025
Circuit Complexity Bounds for Visual Autoregressive Model Yekun Ke Xiaoyu Li Yingyu Liang Zhenmei Shi Zhao Song 45 5 0 08 Jan 2025
Natural Language Fine-Tuning Jiaheng Liu Yue Wang Zhiqi Lin Min Chen Yixue Hao Long Hu 31 1 0 31 Dec 2024
$Theoretical Constraints on the Expressive Power of $\mathsf{RoPE}$-based Tensor Attention Transformers$ Theoretical Constraints on the Expressive Power of $\mathsf{RoPE}$ -based Tensor Attention Transformers Xiaoyu Li Yingyu Liang Zhenmei Shi Zhao Song Mingda Wan 125 8 0 23 Dec 2024
Theoretical limitations of multi-layer Transformer Lijie Chen Binghui Peng Hongxun Wu AI4CE 72 6 0 04 Dec 2024
Enhancing Zero-shot Chain of Thought Prompting via Uncertainty-Guided Strategy Selection Shanu Kumar Saish Mendke Karody Lubna Abdul Rahman Santosh Kurasa Parag Agrawal Sandipan Dandapat LLMAG LRM 70 2 0 30 Nov 2024
$The Two-Hop Curse: LLMs trained on A$\rightarrow$B, B$\rightarrow$C fail to learn A$\rightarrow$C$ The Two-Hop Curse: LLMs trained on A $\rightarrow$ B, B $\rightarrow$ C fail to learn A $\rightarrow$ C Mikita Balesni Tomek Korbak Owain Evans ReLM LRM 81 0 0 25 Nov 2024
Unraveling Arithmetic in Large Language Models: The Role of Algebraic Structures Fu-Chieh Chang Pei-Yuan Wu Pei-Yuan Wu LRM 109 1 0 25 Nov 2024
Reducing Reasoning Costs: The Path of Optimization for Chain of Thought via Sparse Attention Mechanism Libo Wang LRM AI4CE 48 3 0 14 Nov 2024
Quantifying artificial intelligence through algebraic generalization Takuya Ito Murray Campbell L. Horesh Tim Klinger Parikshit Ram ELM 53 0 0 08 Nov 2024