Title
Large Language Models for Toxic Language Detection in Low-Resource Balkan Languages Amel Muminovic Amela Kadric Muminovic 54 0 0 11 Jun 2025
SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending Yuxuan Kuang Haoran Geng Amine Elhafsi Tan-Dzung Do Pieter Abbeel Jitendra Malik Marco Pavone Yue Wang 75 1 0 11 Jun 2025
Causal Sufficiency and Necessity Improves Chain-of-Thought Reasoning Xiangning Yu Zhuohan Wang Linyi Yang Haoxuan Li Anjie Liu Xiao Xue Jun Wang Mengyue Yang ReLM LRM ELM 72 0 0 11 Jun 2025
Flow Matching Meets PDEs: A Unified Framework for Physics-Constrained Generation Giacomo Baldan Qiang Liu Alberto Guardone Nils Thuerey AI4CE 21 1 0 10 Jun 2025
ClimateViz: A Benchmark for Statistical Reasoning and Fact Verification on Scientific Charts Ruiran Su Jiasheng Si Zhijiang Guo J. Pierrehumbert 63 0 0 10 Jun 2025
Enhancing Reasoning Capabilities of Small Language Models with Blueprints and Prompt Template Search Dongge Han Menglin Xia Daniel Madrigal Diaz Samuel Kessler Ankur Mallick Xuchao Zhang Mirian Hipolito Garcia Jin Xu Victor Rühle Saravan Rajmohan LRM 37 0 0 10 Jun 2025
ORFS-agent: Tool-Using Agents for Chip Design Optimization Amur Ghose Andrew B. Kahng Sayak Kundu Zhiang Wang AI4CE 13 0 0 10 Jun 2025
Olica: Efficient Structured Pruning of Large Language Models without Retraining Jiujun He Huazhen Lin 24 0 0 10 Jun 2025
CAF-I: A Collaborative Multi-Agent Framework for Enhanced Irony Detection with Large Language Models Ziqi.Liu Ziyang.Zhou Mingxuan.Hu 22 0 0 10 Jun 2025
Reinforce LLM Reasoning through Multi-Agent Reflection Yurun Yuan Tengyang Xie LRM 20 0 0 10 Jun 2025
G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration Samuel Holt Max Ruiz Luyten Antonin Berthon M. Schaar 30 1 0 10 Jun 2025
MEMETRON: Metaheuristic Mechanisms for Test-time Response Optimization of Large Language Models S. Nguyen Theja Tulabandhula 18 0 0 10 Jun 2025
Stronger Language Models Produce More Human-Like Errors Andrew Keenan Richardson Ryan Othniel Kearns Sean Moss Vincent Wang-Ma'scianica Philipp Koralus ReLM LRM 21 0 0 10 Jun 2025
The Curious Language Model: Strategic Test-Time Information Acquisition Michael Cooper Rohan Wadhawan John Michael Giorgi Chenhao Tan Davis Liang 26 0 0 10 Jun 2025
ADAM: Autonomous Discovery and Annotation Model using LLMs for Context-Aware Annotations Amirreza Rouhi Solmaz Arezoomandan Knut Peterson Joseph T. Woods David Han VLM 32 0 0 10 Jun 2025
Can A Gamer Train A Mathematical Reasoning Model? Andrew Shin ReLM LRM 26 0 0 10 Jun 2025
A Survey on Large Language Models for Mathematical Reasoning Peng-Yuan Wang Tian-Shuo Liu Chenyang Wang Yi-Di Wang Shu Yan ... Xu-Hui Liu Xin-Wei Chen Jia-Cheng Xu Ziniu Li Yang Yu LRM 18 0 0 10 Jun 2025
Transforming Expert Knowledge into Scalable Ontology via Large Language Models Ikkei Itoku David Theil Evelyn Eichelsdoerfer Uehara S. Bhaduri Junnosuke Kuroda Toshi Yumoto Alex Gil Natalie Perez Rajesh Kumar Cherukuri Naumaan Nayyar 40 0 0 10 Jun 2025
TuneGenie: Reasoning-based LLM agents for preferential music generation Amitesh Pandey Jafarbek Arifdjanov Ansh Tiwari LRM 9 0 0 10 Jun 2025
ABC-FHE : A Resource-Efficient Accelerator Enabling Bootstrappable Parameters for Client-Side Fully Homomorphic Encryption Sungwoong Yune Hyojeong Lee Adiwena Putra Hyunjun Cho Cuong Duong Manh Jaeho Jeon Joo-Young Kim 7 0 0 10 Jun 2025
Did I Faithfully Say What I Thought? Bridging the Gap Between Neural Activity and Self-Explanations in Large Language Models Milan Bhan Jean-Noel Vittaut Nicolas Chesneau Sarath Chandar Marie-Jeanne Lesot LRM 22 0 0 10 Jun 2025
Safeguarding Multimodal Knowledge Copyright in the RAG-as-a-Service Environment Tianyu Chen Jian Lou Wenjie Wang 18 0 0 10 Jun 2025
Fast ECoT: Efficient Embodied Chain-of-Thought via Thoughts Reuse Zhekai Duan Yuan Zhang Shikai Geng Gaowen Liu Joschka Boedecker Chris Xiaoxuan Lu LRM 17 0 0 09 Jun 2025
From Debate to Equilibrium: Belief-Driven Multi-Agent LLM Reasoning via Bayesian Nash Equilibrium Xie Yi Zhanke Zhou Chentao Cao Qiyu Niu Tongliang Liu Bo Han 13 0 0 09 Jun 2025
Federated In-Context Learning: Iterative Refinement for Improved Answer Quality Ruhan Wang Zhiyong Wang Chengkai Huang Rui Wang Tong Yu Lina Yao John C. S. Lui Dongruo Zhou 10 0 0 09 Jun 2025
Mimicking or Reasoning: Rethinking Multi-Modal In-Context Learning in Vision-Language Models Chengyue Huang Yuchen Zhu Sichen Zhu Jingyun Xiao Moises Andrade Shivang Chopra Z. Kira ReLM VLM LRM 15 0 0 09 Jun 2025
GUI-Reflection: Empowering Multimodal GUI Models with Self-Reflection Behavior Penghao Wu Shengnan Ma Bo Wang Jiaheng Yu Lewei Lu Ziwei Liu 16 0 0 09 Jun 2025
LLM-BT-Terms: Back-Translation as a Framework for Terminology Standardization and Dynamic Semantic Embedding Li Weigang Pedro Brom 19 0 0 09 Jun 2025
Fact in Fragments: Deconstructing Complex Claims via LLM-based Atomic Fact Extraction and Verification Liwen Zheng Chaozhuo Li Zheng Liu Feiran Huang Haoran Jia Zaisheng Ye Xi Zhang HILM 15 0 0 09 Jun 2025
Enhancing Watermarking Quality for LLMs via Contextual Generation States Awareness Peiru Yang Xintian Li Wanchun Ni Jinhua Yin Huili Wang Guoshun Nan Shangguang Wang Yongfeng Huang Tao Qi 10 0 0 09 Jun 2025
Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions Lu Ma Hao Liang Meiyi Qiang Lexiang Tang Xiaochen Ma ... Junbo Niu Chengyu Shen Runming He Bin Cui Wentao Zhang ReLM OffRL LRM 15 0 0 09 Jun 2025
KokushiMD-10: Benchmark for Evaluating Large Language Models on Ten Japanese National Healthcare Licensing Examinations Junyu Liu Kaiqi Yan Tianyang Wang Qian Niu Momoko Nagai-Tanima Tomoki Aoyama LM&MA ELM 27 0 0 09 Jun 2025
Graph-of-Causal Evolution: Challenging Chain-of-Model for Reasoning Libo Wang LRM 13 0 0 09 Jun 2025
Prime the search: Using large language models for guiding geometric task and motion planning by warm-starting tree search Dongryung Lee Sejune Joo Kimin Lee Beomjoon Kim LM&Ro LRM 13 1 0 08 Jun 2025
History-Aware Cross-Attention Reinforcement: Self-Supervised Multi Turn and Chain-of-Thought Fine-Tuning with vLLM Andrew Kiruluta Andreas Lemos Priscilla Burity LRM 18 0 0 08 Jun 2025
From Tool Calling to Symbolic Thinking: LLMs in a Persistent Lisp Metaprogramming Loop Jordi de la Torre LLMAG KELM 18 0 0 08 Jun 2025
Robotic Policy Learning via Human-assisted Action Preference Optimization Wenke Xia Yichu Yang Hongtao Wu Xiao Ma Tao Kong Di Hu 16 0 0 08 Jun 2025
Semantic-preserved Augmentation with Confidence-weighted Fine-tuning for Aspect Category Sentiment Analysis Yaping Chai Haoran Xie J. Qin 18 0 0 08 Jun 2025
Position: Simulating Society Requires Simulating Thought Chance Jiajie Li Jiayi Wu Zhenze Mo Ao Qu Yuhan Tang ... Jiangbo Yu Jinhua Zhao Paul Liang Luis Alonso Kent Larson LM&Ro LRM AI4CE 17 0 0 08 Jun 2025
Multi-Step Visual Reasoning with Visual Tokens Scaling and Verification Tianyi Bai Zengjie Hu Fupeng Sun Jiantao Qiu Yizhen Jiang Guangxin He Bohan Zeng Conghui He Binhang Yuan Wentao Zhang OffRL LRM 9 0 0 08 Jun 2025
Taxonomy of migration scenarios for Qiskit refactoring using LLMs José Manuel Suárez Luís Mariano Bibbó Joaquín Bogado Alejandro Fernandez 5 1 0 08 Jun 2025
Overclocking LLM Reasoning: Monitoring and Controlling Thinking Path Lengths in LLMs Roy Eisenstadt Itamar Zimerman Lior Wolf LRM 10 0 0 08 Jun 2025
Question Answering under Temporal Conflict: Evaluating and Organizing Evolving Knowledge with LLMs Atahan Özer Çağatay Yıldız KELM 18 0 0 08 Jun 2025
Chain-of-Code Collapse: Reasoning Failures in LLMs via Adversarial Prompting in Code Generation Jaechul Roh Varun Gandhi Shivani Anilkumar Arin Garg AAML ReLM LRM 21 0 0 08 Jun 2025
The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity Parshin Shojaee Iman Mirzadeh Keivan Alizadeh Maxwell Horton Samy Bengio Mehrdad Farajtabar LRM 19 9 0 07 Jun 2025
QuantMCP: Grounding Large Language Models in Verifiable Financial Reality Yifan Zeng AIFin 19 0 0 07 Jun 2025
Vision-EKIPL: External Knowledge-Infused Policy Learning for Visual Reasoning Chaoyang Wang Zeyu Zhang Haiyun Jiang OffRL LRM 13 0 0 07 Jun 2025
Cross-Entropy Games for Language Models: From Implicit Knowledge to General Capability Measures Clément Hongler Andrew Emil ELM 13 0 0 07 Jun 2025
KnowCoder-V2: Deep Knowledge Analysis Zixuan Li Wenxuan Liu Long Bai Chunmao Zhang Wei Li ... Bingbing Xu Xuhui Jiang Xiaolong Jin Jiafeng Guo Xueqi Cheng 15 0 0 07 Jun 2025
United Minds or Isolated Agents? Exploring Coordination of LLMs under Cognitive Load Theory HaoYang Shang Xuan Liu Zi Liang J. Zhang Haibo Hu Song Guo LLMAG 18 0 0 07 Jun 2025