Reasoning in Language Models

ReLM

Dedicated to advancing the capability of language models to perform complex reasoning tasks, enhancing their ability to understand and generate logical, contextually appropriate responses.

Neighbor communities

51015

Featured Papers

0 / 0 papers shown

All papers

50 / 1,877 papers shown

SpatiaLQA: A Benchmark for Evaluating Spatial Logical Reasoning in Vision-Language Models Yuechen Xie Xiaoyan Zhang Yicheng Shan Hao Zhu Rui Tang Rong Wei Mingli Song Yuanyu Wan Jie Song ReLM CoGe LRM 12 0 0 24 Feb 2026
SpecMind: Cognitively Inspired, Interactive Multi-Turn Framework for Postcondition Inference Cuong Chi Le Minh V.T Pham Tung Vu Duy Cuong Duc Van Huy N. Phan Hoang N. Phan Tien N. Nguyen ReLM LRM 1 0 1 24 Feb 2026
In-context Pre-trained Time-Series Foundation Models adapt to Unseen Tasks Shangqing Xu Harshavardhan Kamarthi Haoxin Liu B. Aditya Prakash AI4TS ReLM AI4CE 1 0 0 23 Feb 2026
Classroom Final Exam: An Instructor-Tested Reasoning Benchmark Chongyang Gao Diji Yang Shuyan Zhou Xichen Yan Luchuan Song Shuo Li Kezhen Chen ReLM ELM LRM 3 0 0 23 Feb 2026
Watson & Holmes: A Naturalistic Benchmark for Comparing Human and LLM Reasoning Thatchawin Leelawat Lewis D Griffin ReLM ELM LRM 1 0 0 23 Feb 2026
ReSyn: Autonomously Scaling Synthetic Environments for Reasoning Models Andre He Nathaniel Weir Kaj Bostrom Allen Nie Darion Cassel Sam Bayless Huzefa Rangwala OffRL SyDa ReLM LRM 0 0 0 23 Feb 2026
Reasoning Capabilities of Large Language Models. Lessons Learned from General Game Playing Maciej Świechowski Adam Żychowski Jacek Mańdziuk ReLM LRM ELM 0 0 0 22 Feb 2026
$Think$^{2}$: Grounded Metacognitive Reasoning in Large Language Models$ Think $^{2}$ : Grounded Metacognitive Reasoning in Large Language Models Abraham Paul Elenjical Vivek Hruday Kavuri Vasudeva Varma LLMAG ReLM LRM 16 0 0 21 Feb 2026
The Token Games: Evaluating Language Model Reasoning with Puzzle Duels Simon Henniger Gabriel Poesia ReLM ELM LRM 24 0 0 19 Feb 2026
Balancing Faithfulness and Performance in Reasoning via Multi-Listener Soft Execution Nithin Sivakumaran Shoubin Yu Hyunji Lee Yue Zhang Ali Payani Mohit Bansal Elias Stengel-Eskin ReLM LRM 19 0 0 18 Feb 2026
Saliency-Aware Multi-Route Thinking: Revisiting Vision-Language Reasoning Mingjia Shi Yinhan He Yaochen Zhu Jundong Li ReLM LRM VLM 10 0 0 18 Feb 2026
LLM-WikiRace Benchmark: How Far Can LLMs Plan over Real-World Knowledge Graphs? Juliusz Ziomek William Bankes Lorenz Wolf Shyam Sundhar Ramesh Xiaohang Tang Ilija Bogunovic ReLM LRM ELM 23 0 0 18 Feb 2026
Escaping the Cognitive Well: Efficient Competition Math with Off-the-Shelf Models Xingyu Dang Rohit Agarwal Rodrigo Porto Anirudh Goyal Liam H Fowl Sanjeev Arora ReLM LRM 16 0 0 18 Feb 2026
Recursive Concept Evolution for Compositional Reasoning in Large Language Models Sarim Chaudhry ReLM LRM 40 0 0 17 Feb 2026
The Potential of CoT for Reasoning: A Closer Look at Trace Dynamics Gregor Bachmann Yichen Jiang Seyed Mohsen Moosavi Dezfooli Moin Nabi ReLM LRM 32 0 0 16 Feb 2026
Goldilocks RL: Tuning Task Difficulty to Escape Sparse Rewards for Reasoning Ilia Mahrooghi Aryo Lotfi Emmanuel Abbe ReLM RALM LRM 21 0 0 16 Feb 2026
Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models Xin Xu Clive Bai Kai Yang Tianhao Chen Yangkun Chen Weijie Liu Hao Chen Yang Wang Saiyong Yang Can Yang OffRL ReLM LRM 58 0 0 12 Feb 2026
Think Longer to Explore Deeper: Learn to Explore In-Context via Length-Incentivized Reinforcement Learning Futing Wang Jianhao Yan Yun Luo Ganqu Cui Zhi Wang Xiaoye Qu Yue Zhang Yu Cheng Tao Lin OffRL ReLM LRM 70 0 0 12 Feb 2026
CacheMind: From Miss Rates to Why -- Natural-Language, Trace-Grounded Reasoning for Cache Replacement Kaushal Mhapsekar Azam Ghanbari Bita Aslrousta Samira Mirbagher-Ajorpaz ReLM LRM 9 0 0 12 Feb 2026
Do MLLMs Really Understand Space? A Mathematical Reasoning Evaluation Shuo Lu Jianjie Cheng Yinuo Xu Yongcan Yu Lijun Sheng ... Meng Wang Qianlong Xie Xingxing Wang Ran He Jian Liang ReLM LRM 31 0 0 12 Feb 2026
Extending Puzzle for Mixture-of-Experts Reasoning Models with Application to GPT-OSS Acceleration Akhiad Bercovich Nir Ailon Vladimir Anisimov Tomer Asida Nave Assaf ... Elad Segal Ido Shahaf Oren Tropp Ran Zilberstein Ran El-Yaniv ReLM LRM 164 0 0 12 Feb 2026
What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis Xirui Li Ming Li Tianyi Zhou OffRL ReLM LRM 45 0 0 12 Feb 2026
MultiCube-RAG for Multi-hop Question Answering Jimeng Shi Wei Hu Runchu Tian Bowen Jin Wonbin Kweon ... Yunfan Kang Dingqi Ye Sizhe Zhou Shaowen Wang Jiawei Han ReLM LRM 9 0 0 11 Feb 2026
MetaphorStar: Image Metaphor Understanding and Reasoning with End-to-End Visual Reinforcement Learning Chenhao Zhang Yazhe Niu Hongsheng Li OffRL ReLM VLM LRM 31 0 0 11 Feb 2026
MapVerse: A Benchmark for Geospatial Question Answering on Diverse Real-World Maps Sharat Bhat Harshita Khandelwal Tushar Kataria Vivek Gupta ReLM 30 0 0 11 Feb 2026
Reinforcing Chain-of-Thought Reasoning with Self-Evolving Rubrics Leheng Sheng Wenchang Ma Ruixin Hong Xiang Wang An Zhang Tat-Seng Chua ReLM LRM 53 0 0 11 Feb 2026
On the Optimal Reasoning Length for RL-Trained Language Models Daisuke Nohara Taishi Nakamura Rio Yokota OffRL ReLM LRM 18 0 0 10 Feb 2026
Fundamental Reasoning Paradigms Induce Out-of-Domain Generalization in Language Models Mingzi Cao Xingwei Tan Mahmud Elahi Akhter Marco Valentino Maria Liakata Xi Wang Nikolaos Aletras ReLM LRM 27 0 0 09 Feb 2026
Improving Data and Reward Design for Scientific Reasoning in Large Language Models Zijie Chen Zhenghao Lin Xiao Liu Zhenzhong Lan Yeyun Gong Peng Cheng ReLM LRM 64 0 0 09 Feb 2026
Reasoning aligns language models to human cognition Gonçalo Guiomar Elia Torre Pehuen Moure Victoria Shavina Mario Giulianelli Shih-Chii Liu Valerio Mante ReLM LRM 55 0 0 09 Feb 2026
iGRPO: Self-Feedback-Driven LLM Reasoning Ali Hatamizadeh Shrimai Prabhumoye Igor Gitman Ximing Lu Seungju Han Wei Ping Yejin Choi Jan Kautz ReLM LRM 33 0 0 09 Feb 2026
Latent Reasoning with Supervised Thinking States Ido Amos Avi Caciularu Mor Geva Amir Globerson Jonathan Herzig Lior Shani Idan Szpektor BDL ReLM LRM 54 0 0 09 Feb 2026
New Skills or Sharper Primitives? A Probabilistic Perspective on the Emergence of Reasoning in RLVR Zhilin Wang Yafu Li Shunkai Zhang Zhi Wang Haoran Zhang Xiaoye Qu Yu Cheng ReLM LRM 36 0 0 09 Feb 2026
Emergent Search and Backtracking in Latent Reasoning Models Jasmine Cui Charles Ye KELM ReLM LRM 26 0 0 08 Feb 2026
SPD-Faith Bench: Diagnosing and Improving Faithfulness in Chain-of-Thought for Multimodal Large Language Models Weijiang Lv Yaoxuan Feng Xiaobo Xia Jiayu Wang Yan Jing Wenchao Chen Bo Chen ReLM LRM 48 0 0 08 Feb 2026
Emergent Structured Representations Support Flexible In-Context Inference in Large Language Models Ningyu Xu Qi Zhang Xipeng Qiu Xuanjing Huang ReLM LRM 35 0 0 08 Feb 2026
Free(): Learning to Forget in Malloc-Only Reasoning Models Yilun Zheng Dongyang Ma Tian Liang Jiahao Xu Xinting Huang Lihui Chen Haitao Mi Yan Wang ReLM LRM 74 0 0 08 Feb 2026
Learning to Self-Verify Makes Language Models Better Reasoners Yuxin Chen Yu Wang Yi Zhang Ziang Ye Zhengzhou Cai ... Hui Su Xunliang Cai Xiang Wang An Zhang Tat-Seng Chua ReLM LRM 33 0 0 07 Feb 2026
VERIFY-RL: Verifiable Recursive Decomposition for Reinforcement Learning in Mathematical Reasoning Kaleem Ullah Qasim Jiashu Zhang Hao Li Muhammad Kafeel Shaheen ReLM LRM 28 0 0 07 Feb 2026
Inference-Time Rethinking with Latent Thought Vectors for Math Reasoning Deqian Kong Minglu Zhao Aoyang Qin Bo Pang Chenxin Tao ... Amit Kumar Matt Sarte Chuan Li Jianwen Xie Ying Nian Wu BDL ReLM LRM 29 0 0 06 Feb 2026
LogicSkills: A Structured Benchmark for Formal Reasoning in Large Language Models Brian Rabern Philipp Mondorf Barbara Plank ReLM LRM ELM 17 0 0 06 Feb 2026
LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning Xinwu Ye Yicheng Mao Jia Zhang Yimeng Liu Li Hao ... Xiangxiang Zeng Mengdi Wang Le Cong Shenghua Gao Xiangru Tang ReLM LRM AI4CE 28 0 0 06 Feb 2026
InftyThink+: Effective and Efficient Infinite-Horizon Reasoning via Reinforcement Learning Yuchen Yan Liang Jiang Jin Jiang Shuaicheng Li Zujie Wen Zhiqiang Zhang Jun Zhou Jian Shao Yueting Zhuang Yongliang Shen ReLM OffRL LRM 61 0 0 06 Feb 2026
TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning Zihao Jiang Miao Peng Zhenyan Shan Wenjie Xu Ben Liu Gong Chen Ziqi Gao Min Peng ReLM LRM 51 0 0 05 Feb 2026
TangramSR: Can Vision-Language Models Reason in Continuous Geometric Space? Yikun Zong Cheston Tan ReLM LRM VLM 44 0 0 05 Feb 2026
Stop Rewarding Hallucinated Steps: Faithfulness-Aware Step-Level Reinforcement Learning for Small Reasoning Models Shuo Nie Hexuan Deng Chao Wang Ruiyu Fang Xuebo Liu Shuangyong Song Yu Li Min Zhang Xuelong Li ReLM HILM LRM 88 0 0 05 Feb 2026
VRIQ: Benchmarking and Analyzing Visual-Reasoning IQ of VLMs Tina Khezresmaeilzadeh Jike Zhong Konstantinos Psounis ReLM CoGe LRM 94 0 0 05 Feb 2026
Decomposed Prompting Does Not Fix Knowledge Gaps, But Helps Models Say "I Don't Know" Dhruv Madhwal Lyuxin David Zhang Dan Roth Tomer Wolfson Vivek Gupta ReLM 31 0 0 04 Feb 2026
Gradually Compacting Large Language Models for Reasoning Like a Boiling Frog Yiran Zhao Shengyang Zhou Zijian Wu Tongyan Hu Yuhui Xu Rengan Dou Kenji Kawaguchi Shafiq Joty Junnan Li Michael Qizhe Shieh ReLM LRM 33 0 0 04 Feb 2026
Fluid Representations in Reasoning Models Dmitrii Kharlapenko Alessandro Stolfo Arthur Conmy Mrinmaya Sachan Zhijing Jin ReLM AIFin LRM 47 0 0 04 Feb 2026

Loading #Papers per Month with "ReLM"

Past speakers

Name (-)

Top Contributors

Name (-)

Top Organizations at ResearchTrend.AI

Name (-)

Social Events

Date	Location	Event
No social events available