Large Language and Reasoning Models are Shallow Disjunctive Reasoners

30 March 2025

Irtaza Khalid

Amir Masoud Nourollah

Steven Schockaert

LRM

ArXiv PDF HTML

Papers citing "Large Language and Reasoning Models are Shallow Disjunctive Reasoners"

29 / 29 papers shown

Title
Can Large Language Models Reason about the Region Connection Calculus? Anthony G Cohn Robert E Blackwell LRM 90 3 0 29 Nov 2024
Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics Yaniv Nikankin Anja Reusch Aaron Mueller Yonatan Belinkov AIFin LRM 79 29 0 28 Oct 2024
LLMs Still Can't Plan; Can LRMs? A Preliminary Evaluation of OpenAI's o1 on PlanBench Karthik Valmeekam Kaya Stechly Subbarao Kambhampati LLMAG LRM ELM 87 49 0 20 Sep 2024
To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning Zayne Sprague Fangcong Yin Juan Diego Rodriguez Dongwei Jiang Manya Wadhwa Prasann Singhal Xinyu Zhao Xi Ye Kyle Mahowald Greg Durrett ReLM LRM 157 101 0 18 Sep 2024
Gemma 2: Improving Open Language Models at a Practical Size Gemma Team Gemma Team Morgane Riviere Shreya Pathak Pier Giuseppe Sessa Cassidy Hardin ... Noah Fiedel Armand Joulin Kathleen Kenealy Robert Dadashi Alek Andreev VLM MoE OSLM 84 772 0 31 Jul 2024
Beyond Instruction Following: Evaluating Inferential Rule Following of Large Language Models Wangtao Sun Chenxiang Zhang Xueyou Zhang Ziyang Huang Haotian Xu Pei Chen Shizhu He Jun Zhao Kang Liu ELM LRM 56 0 0 11 Jul 2024
Understanding Transformers via N-gram Statistics Timothy Nguyen 57 10 0 30 Jun 2024
Reframing Spatial Reasoning Evaluation in Language Models: A Real-World Simulation Benchmark for Qualitative Reasoning Fangjun Li David C. Hogg Anthony G. Cohn LRM 52 7 0 23 May 2024
A Careful Examination of Large Language Model Performance on Grade School Arithmetic Hugh Zhang Jeff Da Dean Lee Vaughn Robinson Catherine Wu ... Qin Lyu Sean Hendryx Russell Kaplan Michele Lunati Summer Yue ALM LRM ELM 62 100 0 01 May 2024
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models Zhihong Shao Peiyi Wang Qihao Zhu Runxin Xu Jun-Mei Song ... Haowei Zhang Mingchuan Zhang Yiming Li Yu-Huan Wu Daya Guo ReLM LRM 91 953 0 05 Feb 2024
DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence Daya Guo Qihao Zhu Dejian Yang Zhenda Xie Kai Dong ... Yu-Huan Wu Yiming Li Fuli Luo Yingfei Xiong W. Liang ELM 98 735 0 25 Jan 2024
Advancing Spatial Reasoning in Large Language Models: An In-Depth Evaluation and Enhancement Using the StepGame Benchmark Fangjun Li David C. Hogg Anthony G. Cohn LRM 64 27 0 08 Jan 2024
Proving Test Set Contamination in Black Box Language Models Yonatan Oren Nicole Meister Niladri Chatterji Faisal Ladhak Tatsunori B. Hashimoto HILM 49 139 0 26 Oct 2023
SWE-bench: Can Language Models Resolve Real-World GitHub Issues? Carlos E. Jimenez John Yang Alexander Wettig Shunyu Yao Kexin Pei Ofir Press Karthik Narasimhan ELM 52 529 0 10 Oct 2023
The Reversal Curse: LLMs trained on "A is B" fail to learn "B is A" Lukas Berglund Meg Tong Max Kaufmann Mikita Balesni Asa Cooper Stickland Tomasz Korbak Owain Evans LRM 58 260 0 21 Sep 2023
Faith and Fate: Limits of Transformers on Compositionality Nouha Dziri Ximing Lu Melanie Sclar Xiang Lorraine Li Liwei Jian ... Sean Welleck Xiang Ren Allyson Ettinger Zaïd Harchaoui Yejin Choi ReLM LRM 77 367 0 29 May 2023
Towards Revealing the Mystery behind Chain of Thought: A Theoretical Perspective Guhao Feng Bohang Zhang Yuntian Gu Haotian Ye Di He Liwei Wang LRM 75 236 0 24 May 2023
QLoRA: Efficient Finetuning of Quantized LLMs Tim Dettmers Artidoro Pagnoni Ari Holtzman Luke Zettlemoyer ALM 118 2,454 0 23 May 2023
FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness Tri Dao Daniel Y. Fu Stefano Ermon Atri Rudra Christopher Ré VLM 166 2,131 0 27 May 2022
StepGame: A New Benchmark for Robust Multi-Hop Spatial Reasoning in Texts Zhengxiang Shi Qiang Zhang Aldo Lipani 116 72 0 18 Apr 2022
Show Your Work: Scratchpads for Intermediate Computation with Language Models Maxwell Nye Anders Andreassen Guy Gur-Ari Henryk Michalewski Jacob Austin ... Aitor Lewkowycz Maarten Bosma D. Luan Charles Sutton Augustus Odena ReLM LRM 139 728 0 30 Nov 2021
8-bit Optimizers via Block-wise Quantization Tim Dettmers M. Lewis Sam Shleifer Luke Zettlemoyer MQ 99 286 0 06 Oct 2021
SpartQA: : A Textual Question Answering Benchmark for Spatial Reasoning Roshanak Mirzaee Hossein Rajaby Faghihi Qiang Ning Parisa Kordjmashidi 44 79 0 12 Apr 2021
Learning Reasoning Strategies in End-to-End Differentiable Proving Pasquale Minervini Sebastian Riedel Pontus Stenetorp Edward Grefenstette Tim Rocktaschel LRM 68 96 0 13 Jul 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 529 41,106 0 28 May 2020
Compositionality decomposed: how do neural networks generalise? Dieuwke Hupkes Verna Dankers Mathijs Mul Elia Bruni CoGe 104 330 0 22 Aug 2019
CLUTRR: A Diagnostic Benchmark for Inductive Reasoning from Text Koustuv Sinha Shagun Sodhani Jin Dong Joelle Pineau William L. Hamilton 56 206 0 16 Aug 2019
Attention Is All You Need Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 501 129,831 0 12 Jun 2017
Adam: A Method for Stochastic Optimization Diederik P. Kingma Jimmy Ba ODL 1.0K 149,474 0 22 Dec 2014