Title
Have Large Language Models Learned to Reason? A Characterization via 3-SAT Phase Transition Rishi Hazra Gabriele Venturato Pedro Zuidberg Dos Martires Luc de Raedt ReLM LRM 63 0 0 04 Apr 2025
The Lyme Disease Controversy: An AI-Driven Discourse Analysis of a Quarter Century of Academic Debate and Divides Teo Susnjak Cole Palffy Tatiana Zimina Nazgul Altynbekova Kunal Garg Leona Gilbert 130 0 0 04 Apr 2025
Large (Vision) Language Models are Unsupervised In-Context Learners Artyom Gadetsky Andrei Atanov Yulun Jiang Zhitong Gao Ghazal Hosseini Mighan Amir Zamir Maria Brbić VLM MLLM LRM 69 0 0 03 Apr 2025
Recitation over Reasoning: How Cutting-Edge Language Models Can Fail on Elementary School-Level Reasoning Problems? Kai Yan Yufei Xu Zhengyin Du Xuesong Yao Zhilin Wang Xiaowen Guo Jiecao Chen ReLM ELM LRM 95 3 0 01 Apr 2025
Efficient Construction of Model Family through Progressive Training Using Model Expansion Kazuki Yano Sho Takase Sosuke Kobayashi Shun Kiyono Jun Suzuki 53 0 0 01 Apr 2025
Exploring GPT-4 for Robotic Agent Strategy with Real-Time State Feedback and a Reactive Behaviour Framework Thomas O'Brien Ysobel Sims LLMAG 41 2 0 30 Mar 2025
How do language models learn facts? Dynamics, curricula and hallucinations Nicolas Zucchet J. Bornschein Stephanie C. Y. Chan Andrew Kyle Lampinen Razvan Pascanu Soham De KELM HILM LRM 77 3 1 27 Mar 2025
Sociotechnical Effects of Machine Translation Joss Moorkens Andy Way Séamus Lankford 45 1 0 26 Mar 2025
Hacia la interpretabilidad de la detección anticipada de riesgos de depresión utilizando grandes modelos de lenguaje Horacio Thompson Maximiliano Sapino Edgardo Ferretti Marcelo Errecalde 53 0 0 26 Mar 2025
ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation Oucheng Huang Yuhang Ma Zeng Zhao Mingrui Wu Jiayi Ji Rongsheng Zhang Z. Hu Xiaoshuai Sun Rongrong Ji 43 0 0 22 Mar 2025
1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities Kevin Wang Ishaan Javali Michał Bortkiewicz Tomasz Trzciñski Benjamin Eysenbach SSL OffRL 69 0 0 19 Mar 2025
Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey Yixuan Wang Shengqiong Wu Yuyao Zhang William Yang Wang Ziwei Liu Jiebo Luo Hao Fei LRM 92 8 0 16 Mar 2025
Bridging Language Models and Financial Analysis Alejandro Lopez-Lira Jihoon Kwon Sangwoon Yoon Jy-yong Sohn Chanyeol Choi AIFin 41 0 0 14 Mar 2025
Examples as the Prompt: A Scalable Approach for Efficient LLM Adaptation in E-Commerce Jingying Zeng Zhenwei Dai Hui Liu Samarth Varshney Zhiji Liu Chen Luo Zhen Li Qi He X. Tang 41 1 0 14 Mar 2025
Uncertainty in Action: Confidence Elicitation in Embodied Agents Tianjiao Yu Vedant Shah Muntasir Wahed Kiet A. Nguyen Adheesh Sunil Juvekar Tal August Ismini Lourentzou 51 0 0 13 Mar 2025
Teaching LLMs How to Learn with Contextual Fine-Tuning Younwoo Choi Muhammad Adil Asif Ziwen Han John Willes Rahul G. Krishnan LRM 36 0 0 12 Mar 2025
Medical Large Language Model Benchmarks Should Prioritize Construct Validity Ahmed M. Alaa Thomas Hartvigsen Niloufar Golchini Shiladitya Dutta Frances Dean Inioluwa Deborah Raji Travis Zack AI4MH ELM LM&MA 47 2 0 12 Mar 2025
BAMBI: Developing Baby Language Models for Italian Alice Suozzi Luca Capone Gianluca E. Lebani Alessandro Lenci 50 0 0 12 Mar 2025
Attention Hijackers: Detect and Disentangle Attention Hijacking in LVLMs for Hallucination Mitigation Beitao Chen Xinyu Lyu Lianli Gao Jingkuan Song H. Shen 67 1 0 11 Mar 2025
Large Language Model as Meta-Surrogate for Data-Driven Many-Task Optimization: A Proof-of-Principle Study Xuzhi Zhang Yue-jiao Gong Jun Zhang 64 0 0 11 Mar 2025
ProtTeX: Structure-In-Context Reasoning and Editing of Proteins with Large Language Models Zicheng Ma Chuanliu Fan Zhicong Wang Zhenyu Chen Xiaohan Lin Yongqian Li Shihao Feng Jun Zhang Ziqiang Cao Y. Gao 45 0 0 11 Mar 2025
TokenButler: Token Importance is Predictable Yash Akhauri Ahmed F. AbouElhamayed Yifei Gao Chi-chih Chang Nilesh Jain Mohamed S. Abdelfattah 50 0 0 10 Mar 2025
SKG-LLM: Developing a Mathematical Model for Stroke Knowledge Graph Construction Using Large Language Models Ali Sarabadani Kheirolah Rahsepar Fard Hamid Dalvand 49 0 0 09 Mar 2025
Research on Superalignment Should Advance Now with Parallel Optimization of Competence and Conformity HyunJin Kim Xiaoyuan Yi Jing Yao Muhua Huang Jinyeong Bak James Evans Xing Xie 44 0 0 08 Mar 2025
Visual Cues of Gender and Race are Associated with Stereotyping in Vision-Language Models Messi H.J. Lee Soyeon Jeon Jacob M. Montgomery Calvin K Lai VLM CoGe 74 0 0 07 Mar 2025
Multi-Task Reinforcement Learning Enables Parameter Scaling Reginald McLean Evangelos Chataroulas Jordan Terry Isaac Woungang Nariman Farsad Pablo Samuel Castro LRM 44 1 0 07 Mar 2025
Generalized Interpolating Discrete Diffusion Dimitri von Rutte J. Fluri Yuhui Ding Antonio Orvieto Bernhard Scholkopf Thomas Hofmann DiffM 67 0 0 06 Mar 2025
Cite Before You Speak: Enhancing Context-Response Grounding in E-commerce Conversational LLM-Agents Jingying Zeng Hui Liu Zhenwei Dai X. Tang Chen Luo Samarth Varshney Zhen Li Qi He HILM 64 1 0 05 Mar 2025
SpiritSight Agent: Advanced GUI Agent with One Look Zhiyuan Huang Ziming Cheng Junting Pan Zhaohui Hou Mingjie Zhan LLMAG 101 2 0 05 Mar 2025
Beyond Cosine Decay: On the effectiveness of Infinite Learning Rate Schedule for Continual Pre-training Paul Janson Vaibhav Singh Paria Mehrbod Adam Ibrahim Irina Rish Eugene Belilovsky Benjamin Thérien CLL 78 0 0 04 Mar 2025
AugFL: Augmenting Federated Learning with Pretrained Models Sheng Yue Zerui Qin Yongheng Deng Ju Ren Yaoxue Zhang Junshan Zhang FedML 85 0 0 04 Mar 2025
Adaptively evaluating models with task elicitation Davis Brown Prithvi Balehannina Helen Jin Shreya Havaldar Hamed Hassani Eric Wong ALM ELM 93 0 0 03 Mar 2025
LLMs are everywhere: Ubiquitous Utilization of AI Models through Air Computing Baris Yamansavascilar Atay Ozgovde Cem Ersoy 39 0 0 02 Mar 2025
Position: Solve Layerwise Linear Models First to Understand Neural Dynamical Phenomena (Neural Collapse, Emergence, Lazy/Rich Regime, and Grokking) Yoonsoo Nam Seok Hyeong Lee Clementine Domine Yea Chan Park Charles London Wonyl Choi Niclas Goring Seungjai Lee AI4CE 38 0 0 28 Feb 2025
Triple Phase Transitions: Understanding the Learning Dynamics of Large Language Models from a Neuroscience Perspective Yuko Nakagi Keigo Tada Sota Yoshino Shinji Nishimoto Yu Takagi LRM 37 0 0 28 Feb 2025
Thinking Slow, Fast: Scaling Inference Compute with Distilled Reasoners Daniele Paliotta Junxiong Wang Matteo Pagliardini Kevin Y. Li Aviv Bick J. Zico Kolter Albert Gu F. Fleuret Tri Dao ReLM LRM 51 7 0 27 Feb 2025
Emergent Symbolic Mechanisms Support Abstract Reasoning in Large Language Models Yukang Yang Declan Campbell Kaixuan Huang Mengdi Wang Jonathan D. Cohen Taylor Webb LRM 67 2 0 27 Feb 2025
Knowledge Bridger: Towards Training-free Missing Multi-modality Completion Guanzhou Ke Shengfeng He Xinyu Wang Bo Wang Guoqing Chao Yuyao Zhang Yi Xie HeXing Su 68 0 0 27 Feb 2025
Can Large Language Models Unveil the Mysteries? An Exploration of Their Ability to Unlock Information in Complex Scenarios Chao Wang Luning Zhang Ziyi Wang Yang Zhou ELM VLM LRM 60 1 0 27 Feb 2025
(Mis)Fitting: A Survey of Scaling Laws Margaret Li Sneha Kudugunta Luke Zettlemoyer 69 2 0 26 Feb 2025
General Reasoning Requires Learning to Reason from the Get-go Seungwook Han Jyothish Pari Samuel J. Gershman Pulkit Agrawal LRM 157 0 0 26 Feb 2025
Grandes modelos de lenguaje: de la predicción de palabras a la comprensión? Carlos Gómez-Rodríguez SyDa AILaw ELM VLM 111 0 0 25 Feb 2025
Beyond In-Distribution Success: Scaling Curves of CoT Granularity for Language Model Generalization Ru Wang Wei Huang Selena Song Haoyu Zhang Yusuke Iwasawa Y. Matsuo Jiaxian Guo OODD LRM 75 2 0 25 Feb 2025
Towards Auto-Regressive Next-Token Prediction: In-Context Learning Emerges from Generalization Zixuan Gong Xiaolin Hu Huayi Tang Yong Liu 33 0 0 24 Feb 2025
Distributional Scaling Laws for Emergent Capabilities Rosie Zhao Tian Qin David Alvarez-Melis Sham Kakade Naomi Saphra LRM 39 0 0 24 Feb 2025
Reasoning with Latent Thoughts: On the Power of Looped Transformers Nikunj Saunshi Nishanth Dikkala Zhiyuan Li Sanjiv Kumar Sashank J. Reddi OffRL LRM AI4CE 58 10 0 24 Feb 2025
Forecasting Rare Language Model Behaviors Erik Jones Meg Tong Jesse Mu Mohammed Mahfoud Jan Leike Roger C. Grosse Jared Kaplan William Fithian Ethan Perez Mrinank Sharma 47 2 0 24 Feb 2025
The Relationship Between Reasoning and Performance in Large Language Models -- o3 (mini) Thinks Harder, Not Longer Marthe Ballon Andres Algaba Vincent Ginis LRM ReLM 44 4 0 24 Feb 2025
Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective Chengyin Xu Kaiyuan Chen Xiao Li Ke Shen Chenggang Li OffRL 46 0 0 24 Feb 2025
Memory Helps, but Confabulation Misleads: Understanding Streaming Events in Videos with MLLMs Gengyuan Zhang Mingcong Ding Tong Liu Yao Zhang Volker Tresp 82 1 0 24 Feb 2025