EquiBench: Benchmarking Code Reasoning Capabilities of Large Language Models via Equivalence Checking

EquiBench: Benchmarking Code Reasoning Capabilities of Large Language Models via Equivalence Checking

18 February 2025

Thiago S. F. X. Teixeira

Papers citing "EquiBench: Benchmarking Code Reasoning Capabilities of Large Language Models via Equivalence Checking"

1 / 1 papers shown

Title
CodeARC: Benchmarking Reasoning Capabilities of LLM Agents for Inductive Program Synthesis Anjiang Wei Tarun Suresh Jiannan Cao Naveen Kannan Yuheng Wu Kai Yan Thiago S. F. X. Teixeira Ke Wang Alex Aiken ELM LRM 43 0 0 29 Mar 2025