Evaluating Step-by-Step Reasoning through Symbolic Verification

Evaluating Step-by-Step Reasoning through Symbolic Verification

16 December 2022

Papers citing "Evaluating Step-by-Step Reasoning through Symbolic Verification"

13 / 13 papers shown

Title
Rosetta-PL: Propositional Logic as a Benchmark for Large Language Model Reasoning Shaun Baek Shaun Esua-Mensah Cyrus Tsui Sejan Vigneswaralingam Abdullah Alali Michael Lu Vasu Sharma Sean O'Brien Kevin Zhu LRM 58 0 0 25 Mar 2025
Testing the General Deductive Reasoning Capacity of Large Language Models Using OOD Examples Abulhair Saparov Richard Yuanzhe Pang Vishakh Padmakumar Nitish Joshi Seyed Mehran Kazemi Najoung Kim He He ELM LRM 24 86 0 24 May 2023
Improved Logical Reasoning of Language Models via Differentiable Symbolic Programming Hanlin Zhang Jiani Huang Ziyang Li Mayur Naik Eric P. Xing ReLM LRM 30 28 0 05 May 2023
Complex QA and language models hybrid architectures, Survey Xavier Daull P. Bellot Emmanuel Bruno Vincent Martin Elisabeth Murisasco ELM 28 15 0 17 Feb 2023
Reasoning with Language Model Prompting: A Survey Shuofei Qiao Yixin Ou Ningyu Zhang Xiang Chen Yunzhi Yao Shumin Deng Chuanqi Tan Fei Huang Huajun Chen ReLM ELM LRM 71 311 0 19 Dec 2022
Language Models Are Greedy Reasoners: A Systematic Formal Analysis of Chain-of-Thought Abulhair Saparov He He ELM LRM ReLM 121 275 0 03 Oct 2022
Large Language Models are Zero-Shot Reasoners Takeshi Kojima S. Gu Machel Reid Yutaka Matsuo Yusuke Iwasawa ReLM LRM 328 4,077 0 24 May 2022
Train Short, Test Long: Attention with Linear Biases Enables Input Length Extrapolation Ofir Press Noah A. Smith M. Lewis 253 695 0 27 Aug 2021
Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Prompt Order Sensitivity Yao Lu Max Bartolo Alastair Moore Sebastian Riedel Pontus Stenetorp AILaw LRM 279 1,124 0 18 Apr 2021
What Makes Good In-Context Examples for GPT- $3$ ? Jiachang Liu Dinghan Shen Yizhe Zhang Bill Dolan Lawrence Carin Weizhu Chen AAML RALM 275 1,312 0 17 Jan 2021
LIME: Learning Inductive Bias for Primitives of Mathematical Reasoning Yuhuai Wu M. Rabe Wenda Li Jimmy Ba Roger C. Grosse Christian Szegedy AIMat LRM 75 51 0 15 Jan 2021
Language Models as Knowledge Bases? Fabio Petroni Tim Rocktaschel Patrick Lewis A. Bakhtin Yuxiang Wu Alexander H. Miller Sebastian Riedel KELM AI4MH 417 2,588 0 03 Sep 2019
e-SNLI: Natural Language Inference with Natural Language Explanations Oana-Maria Camburu Tim Rocktaschel Thomas Lukasiewicz Phil Blunsom LRM 260 620 0 04 Dec 2018