Title
Code Summarization Beyond Function Level Vladimir Makharev Vladimir Ivanov 101 0 0 23 Feb 2025
Automatic Input Rewriting Improves Translation with Large Language Models Dayeon Ki Marine Carpuat 89 0 0 23 Feb 2025
Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models Qianqi Yan Yue Fan Hongquan Li Shan Jiang Yang Zhao Xinze Guan Ching-Chen Kuo Xinze Wang VLM LRM 227 2 0 22 Feb 2025
Single-Channel EEG Tokenization Through Time-Frequency Modeling Jathurshan Pradeepkumar Xihao Piao Zheng Chen Jimeng Sun 115 2 0 22 Feb 2025
RAG-Enhanced Collaborative LLM Agents for Drug Discovery Namkyeong Lee Edward De Brouwer Ehsan Hajiramezanali Tommaso Biancalani Chanyoung Park Gabriele Scalia 168 0 0 22 Feb 2025
Wrong Answers Can Also Be Useful: PlausibleQA -- A Large-Scale QA Dataset with Answer Plausibility Scores Jamshid Mozafari Abdelrahman Abdallah Bhawna Piryani Adam Jatowt 108 0 0 22 Feb 2025
Recurrent Knowledge Identification and Fusion for Language Model Continual Learning Yujie Feng Xujia Wang Zexin Lu Shenghong Fu Guangyuan Shi Yongxin Xu Yasha Wang Philip S. Yu Xu Chu Xiao-Ming Wu CLL KELM 122 1 0 22 Feb 2025
Instruction-Tuning LLMs for Event Extraction with Annotation Guidelines Saurabh Srivastava Sweta Pati Ziyu Yao 127 3 0 22 Feb 2025
Dynamic Parallel Tree Search for Efficient LLM Reasoning Yifu Ding Wentao Jiang Shunyu Liu Yongcheng Jing Jinpei Guo ... Zengmao Wang Ziqiang Liu Di Lin Xianglong Liu Dacheng Tao LRM 122 11 0 22 Feb 2025
SpinQuant: LLM quantization with learned rotations Zechun Liu Changsheng Zhao Igor Fedorov Bilge Soran Dhruv Choudhary Raghuraman Krishnamoorthi Vikas Chandra Yuandong Tian Tijmen Blankevoort MQ 265 126 0 21 Feb 2025
Dynamic Low-Rank Sparse Adaptation for Large Language Models Weizhong Huang Yuxin Zhang Xiawu Zheng Yang Liu Jing Lin Yiwu Yao Rongrong Ji 212 2 0 21 Feb 2025
How do Multimodal Foundation Models Encode Text and Speech? An Analysis of Cross-Lingual and Cross-Modal Representations Hyunji Lee Danni Liu Supriti Sinhamahapatra Jan Niehues 189 2 0 21 Feb 2025
Enhancing Domain-Specific Retrieval-Augmented Generation: Synthetic Data Generation and Evaluation using Reasoning Models Aryan Jadon Avinash Patil Shashank Kumar SyDa 87 1 0 21 Feb 2025
Protein Large Language Models: A Comprehensive Survey Yijia Xiao Wanjia Zhao Junkai Zhang Yiqiao Jin Han Zhang ... Xiao Luo Yu Zhang James Zou Yizhou Sun Wei Wang LM&MA AI4CE 147 4 0 21 Feb 2025
PPC-GPT: Federated Task-Specific Compression of Large Language Models via Pruning and Chain-of-Thought Distillation Tao Fan Guoqiang Ma Yuanfeng Song Lixin Fan Kai Chen Qiang Yang 90 1 0 21 Feb 2025
EAGER-LLM: Enhancing Large Language Models as Recommenders through Exogenous Behavior-Semantic Integration Minjie Hong Yan Xia Ziyi Wang Jieming Zhu Ye Wang ... Xiaoda Yang Quanyu Dai Zhenhua Dong Zhimeng Zhang Zhou Zhao 83 4 0 21 Feb 2025
LOVA3: Learning to Visual Question Answering, Asking and Assessment Henry Hengyuan Zhao Pan Zhou Difei Gao Zechen Bai Mike Zheng Shou 165 9 0 21 Feb 2025
Forgotten Polygons: Multimodal Large Language Models are Shape-Blind William Rudman Michal Golovanesky Amir Bar Vedant Palit Yann LeCun Carsten Eickhoff Ritambhara Singh LRM 184 4 0 21 Feb 2025
LESA: Learnable LLM Layer Scaling-Up Yifei Yang Zouying Cao Xinbei Ma Yao Yao L. Qin Zhongfu Chen Hai Zhao 179 0 0 20 Feb 2025
Prompting a Weighting Mechanism into LLM-as-a-Judge in Two-Step: A Case Study Wenwen Xie Gray Gwizdz Dongji Feng 136 0 0 20 Feb 2025
Specializing Large Language Models to Simulate Survey Response Distributions for Global Populations Yong Cao Haijiang Liu Arnav Arora Isabelle Augenstein Paul Röttger Daniel Hershcovich 133 4 0 20 Feb 2025
C2T: A Classifier-Based Tree Construction Method in Speculative Decoding Feiye Huo Jianchao Tan Kai Zhang Xunliang Cai Shengli Sun 81 1 0 20 Feb 2025
LLMPopcorn: An Empirical Study of LLMs as Assistants for Popular Micro-video Generation Junchen Fu Xuri Ge Kaiwen Zheng Ioannis Arapakis Xin Xin J. Jose 152 1 0 20 Feb 2025
External Large Foundation Model: How to Efficiently Serve Trillions of Parameters for Online Ads Recommendation Mingfu Liang Xi Liu Rong Jin B. Liu Qiuling Suo ... Bo Long Wenlin Chen Rocky Liu Santanu Kolay Haoyang Li 104 2 0 20 Feb 2025
Simplifying Formal Proof-Generating Models with ChatGPT and Basic Searching Techniques Sangjun Han Taeil Hur Youngmi Hur Kathy Sangkyung Lee Myungyoon Lee Hyojae Lim 492 0 0 20 Feb 2025
FairKV: Balancing Per-Head KV Cache for Fast Multi-GPU Inference Bingzhe Zhao Ke Cheng Aomufei Yuan Yuxuan Tian Ruiguang Zhong Chengchen Hu Tong Yang Lian Yu 122 0 0 19 Feb 2025
PLDR-LLMs Learn A Generalizable Tensor Operator That Can Replace Its Own Deep Neural Net At Inference Burc Gokden 118 0 0 19 Feb 2025
Is This Collection Worth My LLM's Time? Automatically Measuring Information Potential in Text Corpora Tristan Karch Luca Engel Philippe Schwaller Frédéric Kaplan 160 0 0 19 Feb 2025
EvoP: Robust LLM Inference via Evolutionary Pruning Shangyu Wu Hongchao Du Ying Xiong Shuai Chen Tei-Wei Kuo Nan Guan Chun Jason Xue 102 1 0 19 Feb 2025
Towards Adaptive Memory-Based Optimization for Enhanced Retrieval-Augmented Generation Qitao Qin Yucong Luo Yihang Lu Zhibo Chu Xianwei Meng 56 0 0 19 Feb 2025
MoM: Linear Sequence Modeling with Mixture-of-Memories Jusen Du Weigao Sun Disen Lan Jiaxi Hu Yu Cheng KELM 162 5 0 19 Feb 2025
MaskPrune: Mask-based LLM Pruning for Layer-wise Uniform Structures Jiayu Qin Jianchao Tan Kai Zhang Xunliang Cai Wei Wang 77 0 0 19 Feb 2025
GSQ-Tuning: Group-Shared Exponents Integer in Fully Quantized Training for LLMs On-Device Fine-tuning Sifan Zhou Shuo Wang Zhihang Yuan Mingjia Shi Yuzhang Shang Dawei Yang MQ ALM 208 0 0 18 Feb 2025
DSMoE: Matrix-Partitioned Experts with Dynamic Routing for Computation-Efficient Dense LLMs Minxuan Lv Zhenpeng Su Leiyu Pan Yizhe Xiong Zijia Lin ... Guiguang Ding Cheng Luo Di Zhang Kun Gai Songlin Hu MoE 120 0 0 18 Feb 2025
None of the Others: a General Technique to Distinguish Reasoning from Memorization in Multiple-Choice LLM Evaluation Benchmarks Eva Sánchez Salido Julio Gonzalo Guillermo Marco ELM 140 4 0 18 Feb 2025
Scalable Model Merging with Progressive Layer-wise Distillation Jing Xu Jiazheng Li J.N. Zhang MoMe FedML 327 2 0 18 Feb 2025
Pre-training Auto-regressive Robotic Models with 4D Representations Dantong Niu Yuvan Sharma Haoru Xue Giscard Biamby Junyi Zhang Ziteng Ji Trevor Darrell Roei Herzig 167 2 0 18 Feb 2025
Re-Align: Aligning Vision Language Models via Retrieval-Augmented Direct Preference Optimization Shuo Xing Yuping Wang Peiran Li Ruizheng Bai Yansen Wang Chan-wei Hu Chengxuan Qian Huaxiu Yao Zhengzhong Tu 187 8 0 18 Feb 2025
Soundwave: Less is More for Speech-Text Alignment in LLMs Yunke Zhang Zhiheng Liu Fan Bu Ruiyu Zhang Benyou Wang Haoyang Li AuLLM SyDa VLM 170 1 0 18 Feb 2025
PTQ1.61: Push the Real Limit of Extremely Low-Bit Post-Training Quantization Methods for Large Language Models Jiaqi Zhao Miao Zhang Ming Wang Yuzhang Shang Kaihao Zhang Weili Guan Yaowei Wang Min Zhang MQ 114 1 0 18 Feb 2025
Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis Jiaqi Zhao Ming Wang Miao Zhang Yuzhang Shang Xuebo Liu Yaowei Wang Min Zhang Liqiang Nie MQ 250 2 0 18 Feb 2025
MatterChat: A Multi-Modal LLM for Material Science Yingheng Tang Wenbin Xu Jie Cao Jianzhu Ma Weilu Gao Steve Farrell Benjamin Erichson Michael W. Mahoney Andy Nonaka 196 8 0 18 Feb 2025
USPilot: An Embodied Robotic Assistant Ultrasound System with Large Language Model Enhanced Graph Planner Mingcong Chen Siqi Fan Guanglin Cao Yun-hui Liu Hongbin Liu 110 0 0 18 Feb 2025
Subword models struggle with word learning, but surprisal hides it Bastian Bunzeck Sina Zarrieß 41 3 0 18 Feb 2025
"I know myself better, but not really greatly": How Well Can LLMs Detect and Explain LLM-Generated Texts? Jiazhou Ji Jie Guo Weidong Qiu Zheng Huang Yang Xu Xinru Lu Xiaoyu Jiang Ruizhe Li Shujun Li DeLMO 31 2 0 18 Feb 2025
Programming Every Example: Lifting Pre-training Data Quality Like Experts at Scale Fan Zhou Zengzhi Wang Qian Liu Junlong Li Pengfei Liu ALM 224 15 0 17 Feb 2025
InfiR : Crafting Effective Small Language Models and Multimodal Small Language Models in Reasoning C. Xie Shuo Cai Wenjun Wang Pengxiang Li Zhijie Sang ... Xiaotian Han Jianbo Yuan Shengyu Zhang Leilei Gan Hongxia Yang LRM 132 1 0 17 Feb 2025
HedgeAgents: A Balanced-aware Multi-agent Financial Trading System Xiangyu Li Yawen Zeng Xiaofen Xing Jin Xu Xiangmin Xu AIFin 187 3 0 17 Feb 2025
Language Models Can See Better: Visual Contrastive Decoding For LLM Multimodal Reasoning Yuqi Pang Bowen Yang Haoqin Tu Yun Cao Zeyu Zhang LRM MLLM 103 0 0 17 Feb 2025
DAST: Context-Aware Compression in LLMs via Dynamic Allocation of Soft Tokens Shaoshen Chen Yangning Li Zishan Xu Hai-Tao Zheng Xin Su Zifei Shan Hai-Tao Zheng 68 0 0 17 Feb 2025