ReClor: A Reading Comprehension Dataset Requiring Logical Reasoning

11 February 2020

Weihao Yu

Papers citing "ReClor: A Reading Comprehension Dataset Requiring Logical Reasoning"

50 / 159 papers shown

Title
Toward Generalizable Evaluation in the LLM Era: A Survey Beyond Benchmarks Yixin Cao Shibo Hong Xuzhao Li Jiahao Ying Yubo Ma ... Juanzi Li Aixin Sun Xuanjing Huang Tat-Seng Chua Tianwei Zhang ALM ELM 86 2 0 26 Apr 2025
Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning FangZhi Xu Hang Yan Chang Ma Haiteng Zhao Qiushi Sun Kanzhi Cheng Junxian He Jun Liu Zhiyong Wu LRM 34 1 0 11 Apr 2025
Generative Evaluation of Complex Reasoning in Large Language Models Haowei Lin Xinbing Wang Ruilin Yan Baizhou Huang Haotian Ye Jianhua Zhu Zihao Wang James Zou Jianzhu Ma Yitao Liang ReLM ELM LRM 186 0 0 03 Apr 2025
Efficient Inference for Large Reasoning Models: A Survey Yi Liu Jiaying Wu Yufei He Hongcheng Gao Hongyu Chen Baolong Bi Jiaheng Zhang Zhiqi Huang Bryan Hooi LLMAG LRM 73 7 0 29 Mar 2025
$ϕ$ -Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation Fangzhi Xu Hang Yan Chang Ma Haiteng Zhao Jun Liu Qika Lin Zhiyong Wu 58 2 0 17 Mar 2025
MRCEval: A Comprehensive, Challenging and Accessible Machine Reading Comprehension Benchmark Shengkun Ma Hao Peng Lei Hou Juanzi Li ELM 96 0 0 10 Mar 2025
MastermindEval: A Simple But Scalable Reasoning Benchmark Jonas Golde Patrick Haller Fabio Barth Alan Akbik LRM ReLM ELM 53 2 0 07 Mar 2025
Development and Enhancement of Text-to-Image Diffusion Models Rajdeep Roshan Sahu VLM 64 0 0 07 Mar 2025
Order Doesn't Matter, But Reasoning Does: Training LLMs with Order-Centric Augmentation Qianxi He Qianyu He Jiaqing Liang Yanghua Xiao Weikang Zhou Zeye Sun Fei Yu LRM 74 0 0 27 Feb 2025
Can Large Language Models Unveil the Mysteries? An Exploration of Their Ability to Unlock Information in Complex Scenarios Chao Wang Luning Zhang Ziyi Wang Yang Zhou ELM VLM LRM 60 1 0 27 Feb 2025
Code to Think, Think to Code: A Survey on Code-Enhanced Reasoning and Reasoning-Driven Code Intelligence in LLMs Dayu Yang Tianyang Liu Daoan Zhang Antoine Simoulin Xiaoyi Liu ... Zhaopu Teng Xin Qian Grey Yang Jiebo Luo Julian McAuley ReLM OffRL LRM 89 3 0 26 Feb 2025
Visual Reasoning Evaluation of Grok, Deepseek Janus, Gemini, Qwen, Mistral, and ChatGPT Nidhal Jegham Marwan Abdelatti Abdeltawab Hendawi VLM LRM 60 1 0 23 Feb 2025
InductionBench: LLMs Fail in the Simplest Complexity Class Wenyue Hua Tyler Wong Sun Fei Liangming Pan Adam Jardine William Yang Wang LRM 73 3 0 20 Feb 2025
MIH-TCCT: Mitigating Inconsistent Hallucinations in LLMs via Event-Driven Text-Code Cyclic Training Xinxin You Xien Liu Qixin Sun Huan Zhang Kaiyin Zhou Shaohui Liu Guoping Hu Shijin Wang Si Liu Ji Wu 85 0 0 13 Feb 2025
Large Language Models Meet Symbolic Provers for Logical Reasoning Evaluation Chengwen Qi Ren Ma Bowen Li He Du Binyuan Hui Jinwang Wu Yuanjun Laili Conghui He ReLM LRM 86 2 0 10 Feb 2025
Vision-Language Models Can Self-Improve Reasoning via Reflection Kanzhi Cheng Yantao Li Fangzhi Xu Jianbing Zhang Hao Zhou Yang Liu ReLM LRM 49 17 0 30 Oct 2024
Leveraging LLMs for Hypothetical Deduction in Logical Inference: A Neuro-Symbolic Approach Qingchuan Li Jiatong Li Tongxuan Liu Yuting Zeng Mingyue Cheng Weizhe Huang Qi Liu LRM AI4CE 54 2 0 29 Oct 2024
Belief in the Machine: Investigating Epistemological Blind Spots of Language Models Mirac Suzgun Tayfun Gur Federico Bianchi Daniel E. Ho Thomas Icard Dan Jurafsky James Zou 31 1 0 28 Oct 2024
From Babbling to Fluency: Evaluating the Evolution of Language Models in Terms of Human Language Acquisition Qiyuan Yang Pengda Wang Luke D. Plonsky Frederick L. Oswald Hanjie Chen ELM 28 2 0 17 Oct 2024
COrAL: Order-Agnostic Language Modeling for Efficient Iterative Refinement Yuxi Xie Anirudh Goyal Xiaobao Wu Xunjian Yin Xiao Xu Min-Yen Kan Liangming Pan William Yang Wang LRM 110 1 0 12 Oct 2024
Autonomous Evaluation of LLMs for Truth Maintenance and Reasoning Tasks Rushang Karia Daniel Bramblett D. Dobhal Siddharth Srivastava ELM LRM 35 0 0 11 Oct 2024
PositionID: LLMs can Control Lengths, Copy and Paste with Explicit Positional Awareness Zekun Wang Feiyu Duan Yibo Zhang Wangchunshu Zhou Ke Xu Wenhao Huang Jie Fu LLMAG 26 1 0 09 Oct 2024
CodePMP: Scalable Preference Model Pretraining for Large Language Model Reasoning Huimu Yu Xing Wu Weidong Yin Debing Zhang Songlin Hu LRM 33 5 0 03 Oct 2024
ReGenesis: LLMs can Grow into Reasoning Generalists via Self-Improvement Xiangyu Peng Congying Xia Xinyi Yang Caiming Xiong Chien-Sheng Wu Chen Xing LRM 48 2 0 03 Oct 2024
Logic-of-Thought: Injecting Logic into Contexts for Full Reasoning in Large Language Models Tongxuan Liu Wenjiang Xu Weizhe Huang Yuting Zeng Jiaxing Wang Hailong Yang Hailong Yang Jing Li LRM ReLM 52 5 0 26 Sep 2024
Thought-Path Contrastive Learning via Premise-Oriented Data Augmentation for Logical Reading Comprehension Chenxu Wang Ping Jian Zhen Yang LRM 27 0 0 22 Sep 2024
LogicPro: Improving Complex Logical Reasoning via Program-Guided Learning Jin Jiang Yuchen Yan Yang Liu Yonggang Jin Shuai Peng Hao Fei Xunliang Cai Yixin Cao Liangcai Gao Zhi Tang LRM 52 3 0 19 Sep 2024
Programming Refusal with Conditional Activation Steering Bruce W. Lee Inkit Padhi K. Ramamurthy Erik Miehling Pierre L. Dognin Manish Nagireddy Amit Dhurandhar LLMSV 105 14 0 06 Sep 2024
100 instances is all you need: predicting the success of a new LLM on unseen data by testing on a few instances Lorenzo Pacchiardi Lucy G. Cheke José Hernández-Orallo ALM LRM ELM 36 4 0 05 Sep 2024
CogniDual Framework: Self-Training Large Language Models within a Dual-System Theoretical Framework for Improving Cognitive Tasks Yongxin Deng Xihe Qiu Xiaoyu Tan Chao Qu Jing Pan Yuan Cheng Yinghui Xu Wei Chu 36 3 0 05 Sep 2024
The Compressor-Retriever Architecture for Language Model OS Yuan Yang Siheng Xiong Ehsan Shareghi Faramarz Fekri RALM KELM 32 1 0 02 Sep 2024
LogicGame: Benchmarking Rule-Based Reasoning Abilities of Large Language Models Jiayi Gui Yiming Liu Jiale Cheng Xiaotao Gu Xiao-Yang Liu Hongning Wang Yuxiao Dong Jie Tang Minlie Huang ELM LLMAG LRM 40 2 0 28 Aug 2024
Recent Advances in Multi-Choice Machine Reading Comprehension: A Survey on Methods and Datasets Shima Foolad Kourosh Kiani R. Rastgoo FaML 45 0 0 04 Aug 2024
Inductive or Deductive? Rethinking the Fundamental Reasoning Abilities of LLMs Kewei Cheng Jingfeng Yang Haoming Jiang Zhengyang Wang Binxuan Huang ... Zheng Li Yifan Gao Xian Li Bing Yin Yizhou Sun ELM LRM 33 11 0 31 Jul 2024
Categorical Syllogisms Revisited: A Review of the Logical Reasoning Abilities of LLMs for Analyzing Categorical Syllogism Shi Zong Jimmy Lin ELM LRM 43 2 0 26 Jun 2024
Multi-LogiEval: Towards Evaluating Multi-Step Logical Reasoning Ability of Large Language Models Nisarg Patel Mohith Kulkarni Mihir Parmar Aashna Budhiraja Mutsumi Nakamura Neeraj Varshney Chitta Baral ELM LRM 45 6 0 24 Jun 2024
Instruction Pre-Training: Language Models are Supervised Multitask Learners Daixuan Cheng Yuxian Gu Shaohan Huang Junyu Bi Minlie Huang Furu Wei SyDa 65 20 0 20 Jun 2024
Can LLMs Reason in the Wild with Programs? Yuan Yang Siheng Xiong Ali Payani Ehsan Shareghi Faramarz Fekri LRM 40 13 0 19 Jun 2024
Exploring and Benchmarking the Planning Capabilities of Large Language Models Bernd Bohnet Azade Nova Aaron T Parisi Kevin Swersky Katayoon Goshvadi Hanjun Dai Dale Schuurmans Noah Fiedel Hanie Sedghi 41 8 0 18 Jun 2024
DetectBench: Can Large Language Model Detect and Piece Together Implicit Evidence? Zhouhong Gu Lin Zhang Xiaoxuan Zhu Jiangjie Chen Wenhao Huang ... Shusen Wang Zheyu Ye Yan Gao Hongwei Feng Yanghua Xiao RALM 37 1 0 18 Jun 2024
RUPBench: Benchmarking Reasoning Under Perturbations for Robustness Evaluation in Large Language Models Yuqing Wang Yun Zhao LRM AAML ELM 27 1 0 16 Jun 2024
Break the Chain: Large Language Models Can be Shortcut Reasoners Mengru Ding Hanmeng Liu Zhizhang Fu Jian Song Wenbo Xie Yue Zhang KELM LRM 36 7 0 04 Jun 2024
PathReasoner: Modeling Reasoning Path with Equivalent Extension for Logical Question Answering Fangzhi Xu Qika Lin Tianzhe Zhao Jiawei Han Jun Liu LRM 35 1 0 29 May 2024
Quantifying In-Context Reasoning Effects and Memorization Effects in LLMs Siyu Lou Yuntian Chen Xiaodan Liang Liang Lin Quanshi Zhang 42 2 0 20 May 2024
Logical Negation Augmenting and Debiasing for Prompt-based Methods Yitian Li Jidong Tian Hao He Yaohui Jin 38 0 0 08 May 2024
Optimizing Language Model's Reasoning Abilities with Weak Supervision Yongqi Tong Sizhe Wang Dawei Li Yifan Wang Simeng Han Zi Lin Chengsong Huang Jiaxin Huang Jingbo Shang LRM ReLM 42 8 0 07 May 2024
Logic Agent: Enhancing Validity with Logic Rule Invocation Hanmeng Liu Zhiyang Teng Chaoli Zhang Yue Zhang LRM LLMAG 45 4 0 28 Apr 2024
LogicBench: Towards Systematic Evaluation of Logical Reasoning Ability of Large Language Models Mihir Parmar Nisarg Patel Neeraj Varshney Mutsumi Nakamura Man Luo Santosh Mashetty Arindam Mitra Chitta Baral LRM ReLM ELM 38 24 0 23 Apr 2024
Improving Language Model Reasoning with Self-motivated Learning Yunlong Feng Yang Xu Libo Qin Yasheng Wang Wanxiang Che LRM ReLM 42 7 0 10 Apr 2024
MACM: Utilizing a Multi-Agent System for Condition Mining in Solving Complex Mathematical Problems Bin Lei LLMAG AI4CE 41 11 0 06 Apr 2024