Title
ThinkVideo: High-Quality Reasoning Video Segmentation with Chain of Thoughts Shiu-hong Kao Yu-Wing Tai Chi-Keung Tang VOS MLLM VGen LRM 89 0 0 01 Jul 2025
OrderChain: Towards General Instruct-Tuning for Stimulating the Ordinal Understanding Ability of MLLM Jinhong Wang Shuo Tong Jian Liu Dongqi Tang Weiqiang Wang Wentong Li Hongxia Xu Danny Chen Jintai Chen Jian Wu LRM 74 0 0 01 Jul 2025
Think Before You Segment: High-Quality Reasoning Segmentation with GPT Chain of Thoughts Shiu-hong Kao Yu-Wing Tai Chi-Keung Tang MLLM LRM 277 1 0 01 Jul 2025
MM-AttacKG: A Multimodal Approach to Attack Graph Construction with Large Language Models Yongheng Zhang Xinyun Zhao Yunshan Ma Haokai Ma Yingxiao Guan Guozheng Yang Yuliang Lu Xiang Wang 5 0 0 20 Jun 2025
No Free Lunch: Rethinking Internal Feedback for LLM Reasoning Yanzhi Zhang Zhaoxi Zhang Haoxiang Guan Yilin Cheng Yitong Duan Chen Wang Yue Wang Shuxin Zheng Jiyan He ReLM LRM 23 0 0 20 Jun 2025
BREAD: Branched Rollouts from Expert Anchors Bridge SFT & RL for Reasoning Xuechen Zhang Zijian Huang Yingcong Li Chenshun Ni Jiasi Chen Samet Oymak OffRL MoE LRM 17 0 0 20 Jun 2025
Towards Effective Complementary Security Analysis using Large Language Models Jonas Wagner Simon Müller Christian Näther Jan-Philipp Steghöfer Andreas Both 7 0 0 20 Jun 2025
Enhancing Step-by-Step and Verifiable Medical Reasoning in MLLMs Haoran Sun Yankai Jiang Wenjie Lou Yujie Zhang Wenjie Li Lilong Wang Mianxin Liu Lei Liu Xiaosong Wang LRM 7 0 0 20 Jun 2025
RealSR-R1: Reinforcement Learning for Real-World Image Super-Resolution with Vision-Language Chain-of-Thought Junbo Qiao Miaomiao Cai Wei Li Y. Liu X. Y. Huang Gaoqi He Jiao Xie Jie Hu X. Chen Shaohui Lin SupR VLM LRM 25 0 0 20 Jun 2025
Dissecting the SWE-Bench Leaderboards: Profiling Submitters and Architectures of LLM- and Agent-Based Repair Systems Matias Martinez Xavier Franch 5 0 0 20 Jun 2025
When Can Model-Free Reinforcement Learning be Enough for Thinking? Josiah P. Hanna Nicholas Corrado OffRL LM&Ro ReLM LRM AI4CE 23 0 0 20 Jun 2025
From Concepts to Components: Concept-Agnostic Attention Module Discovery in Transformers Jingtong Su Julia Kempe Karen Ullrich 5 0 0 20 Jun 2025
Machine Mental Imagery: Empower Multimodal Reasoning with Latent Visual Tokens Zeyuan Yang Xueyang Yu Delin Chen Maohao Shen Chuang Gan LRM 5 0 0 20 Jun 2025
Multi-Objective Recommendation in the Era of Generative AI: A Survey of Recent Progress and Future Prospects Zihan Hong Yushi Wu Zhiting Zhao Shanshan Feng Jianghong Ma Jiao Liu Tianjun Wei 3DV 5 0 0 20 Jun 2025
AutoV: Learning to Retrieve Visual Prompt for Large Vision-Language Models Yuan Zhang Chun-Kai Fan Tao Huang Ming Lu Sicheng Yu Junwen Pan Kuan Cheng Qi She Shanghang Zhang VLM LRM 7 0 0 19 Jun 2025
OSWorld-Human: Benchmarking the Efficiency of Computer-Use Agents Reyna Abhyankar Qi Qi Yiying Zhang LLMAG 5 0 0 19 Jun 2025
LazyEviction: Lagged KV Eviction with Attention Pattern Observation for Efficient Long Reasoning Haoyue Zhang Hualei Zhang Xiaosong Ma Jie Zhang Song Guo LRM 7 0 0 19 Jun 2025
Next-Token Prediction Should be Ambiguity-Sensitive: A Meta-Learning Perspective Léo Gagnon Eric Elmoznino Sarthak Mittal Tom Marty Tejas Kasetty Dhanya Sridhar Guillaume Lajoie 5 0 0 19 Jun 2025
Explainable Rule Application via Structured Prompting: A Neural-Symbolic Approach Albert Sadowski Jarosław A. Chudziak AILaw ELM LRM 31 0 0 19 Jun 2025
Initial Investigation of LLM-Assisted Development of Rule-Based Clinical NLP System Jianlin Shi Brian T. Bucher 5 0 0 19 Jun 2025
Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights Zhiyuan Liang Dongwen Tang Yuhao Zhou Xuanlei Zhao Mingjia Shi ... Damian Borth Michael M. Bronstein Yang You Zhangyang Wang Kai Wang OffRL 7 0 0 19 Jun 2025
Unpacking Generative AI in Education: Computational Modeling of Teacher and Student Perspectives in Social Media Discourse Paulina DeVito Akhil Vallala Sean Mcmahon Yaroslav Hinda Benjamin Thaw Hanqi Zhuang Hari Kalva 5 0 0 19 Jun 2025
Advancing Harmful Content Detection in Organizational Research: Integrating Large Language Models with Elo Rating System Mustafa Akben Aaron Satko 5 0 0 19 Jun 2025
CC-LEARN: Cohort-based Consistency Learning Xiao Ye Shaswat Shrivastava Zhaonan Li Jacob Dineen Shijie Lu Avneet Ahuja Ming shen Zhikun Xu Ben Zhou OffRL LRM 35 0 0 18 Jun 2025
Learning Algorithms in the Limit Hristo Papazov Nicolas Flammarion 18 0 0 18 Jun 2025
Fractional Reasoning via Latent Steering Vectors Improves Inference Time Compute Sheng Liu Tianlang Chen Pan Lu Haotian Ye Yizheng Chen Lei Xing James Zou ReLM LRM 9 0 0 18 Jun 2025
MEM1: Learning to Synergize Memory and Reasoning for Efficient Long-Horizon Agents Zijian Zhou Ao Qu Zhaoxuan Wu Sunghwan Kim Alok Prakash Daniela Rus Jinhua Zhao Bryan Kian Hsiang Low Paul Liang LLMAG OffRL LRM 5 0 0 18 Jun 2025
HeurAgenix: Leveraging LLMs for Solving Complex Combinatorial Optimization Challenges Xianliang Yang Ling Zhang Haolong Qian Lei Song Jiang Bian 10 0 0 18 Jun 2025
Systems-Theoretic and Data-Driven Security Analysis in ML-enabled Medical Devices Gargi Mitra Mohammadreza Hallajiyan Inji Kim Athish Pranav Dharmalingam Mohammed Elnawawy Shahrear Iqbal Karthik Pattabiraman Homa Alemzadeh 10 0 0 18 Jun 2025
AgentGroupChat-V2: Divide-and-Conquer Is What LLM-Based Multi-Agent System Need Zhouhong Gu Xiaoxuan Zhu Yin Cai Hao Shen Xingzhou Chen ... Hongwei Feng Yanghua Xiao Zheyu Ye Yao Hu Shaosheng Cao LLMAG 12 0 0 18 Jun 2025
PhishDebate: An LLM-Based Multi-Agent Framework for Phishing Website Detection Wenhao Li S. Manickam Yung-wey Chong Shankar Karuppayah LLMAG 33 0 0 18 Jun 2025
Research on Graph-Retrieval Augmented Generation Based on Historical Text Knowledge Graphs Yang Fan Zhang Qi Xing Wenqian Liu Chang Liu Liu RALM 13 0 0 18 Jun 2025
ProtoReasoning: Prototypes as the Foundation for Generalizable Reasoning in LLMs Feng He Zijun Chen Xinnian Liang Tingting Ma Yunqi Qiu Shuangzhi Wu Junchi Yan LRM 56 0 0 18 Jun 2025
Managing Complex Failure Analysis Workflows with LLM-based Reasoning and Acting Agents Aline Dobrovsky Konstantin Schekotihin Christian Burmer LLMAG 15 0 0 18 Jun 2025
Optimizing Web-Based AI Query Retrieval with GPT Integration in LangChain A CoT-Enhanced Prompt Engineering Approach Wenqi Guan Yang Fang 20 0 0 18 Jun 2025
Excessive Reasoning Attack on Reasoning LLMs Wai Man Si Mingjie Li Michael Backes Yang Zhang AAML LRM 19 0 0 17 Jun 2025
Don't throw the baby out with the bathwater: How and why deep learning for ARC Jack Cole Mohamed Osman LRM 33 0 0 17 Jun 2025
StorySage: Conversational Autobiography Writing Powered by a Multi-Agent Framework Shayan Talaei Meijin Li Kanu Grover James Kent Hippler Diyi Yang Amin Saberi 20 0 0 17 Jun 2025
CALM: Contextual Analog Logic with Multimodality Maxwell J. Jacobson Corey J. Maley Yexiang Xue 10 0 0 17 Jun 2025
Optimizing Length Compression in Large Reasoning Models Zhengxiang Cheng Dongping Chen Mingyang Fu Tianyi Zhou OffRL MQ LRM 20 0 0 17 Jun 2025
Treasure Hunt: Real-time Targeting of the Long Tail using Training-Time Markers Daniel D'souza Julia Kreutzer Adrien Morisot Ahmet Üstün Sara Hooker 14 0 0 17 Jun 2025
MIST: Towards Multi-dimensional Implicit Bias and Stereotype Evaluation of LLMs via Theory of Mind Yanlin Li Hao Liu Huimin Liu Y. X. Wei Yupeng Hu 13 0 0 17 Jun 2025
Cost-Efficient Serving of LLM Agents via Test-Time Plan Caching Qizheng Zhang Michael Wornow Kunle Olukotun 10 0 0 17 Jun 2025
SHADE-Arena: Evaluating Sabotage and Monitoring in LLM Agents Jonathan Kutasov Yuqi Sun Paul Colognese Teun van der Weij Linda Petrini ... Xiang Deng Henry Sleight Tyler Tracy Buck Shlegeris Joe Benton LLMAG 22 0 0 17 Jun 2025
Re-Initialization Token Learning for Tool-Augmented Large Language Models Chenghao Li Liu Liu B. Yu Jiayan Qiu Yibing Zhan LLMAG CLL KELM 34 0 0 17 Jun 2025
Prefix-Tuning+: Modernizing Prefix-Tuning by Decoupling the Prefix from Attention Haonan Wang Brian K Chen Siquan Li Xinhe Liang Hwee Kuan Lee Kenji Kawaguchi Tianyang Hu 7 0 0 16 Jun 2025
ExtendAttack: Attacking Servers of LRMs via Extending Reasoning Zhenhao Zhu Yue Liu Yingwei Ma Hongcheng Gao Nuo Chen Yanpei Guo Wenjie Qu Huiying Xu Xinzhong Zhu Jiaheng Zhang AAML LRM 17 0 0 16 Jun 2025
Querying Large Automotive Software Models: Agentic vs. Direct LLM Approaches Lukasz Mazur Nenad Petrovic James Pontes Miranda Ansgar Radermacher Robert Rasche Alois Knoll 13 0 0 16 Jun 2025
Ego-R1: Chain-of-Tool-Thought for Ultra-Long Egocentric Video Reasoning Shulin Tian Ruiqi Wang Hongming Guo Penghao Wu Yuhao Dong Xiuying Wang Jingkang Yang Hao Zhang Hongyuan Zhu Ziwei Liu RALM LRM 14 0 0 16 Jun 2025
Language Agents for Hypothesis-driven Clinical Decision Making with Reinforcement Learning David Bani-Harouni Chantal Pellegrini Ege Özsoy Matthias Keicher Nassir Navab LLMAG LM&MA 9 0 0 16 Jun 2025