Title
A Sliding Layer Merging Method for Efficient Depth-Wise Pruning in LLMs Xuan Ding Rui Sun Yunjian Zhang Xiu Yan Yueqi Zhou Kaihao Huang Suzhong Fu Angelica I Aviles-Rivero Chuanlong Xie Yao Zhu 260 1 0 26 Feb 2025
Where Are We? Evaluating LLM Performance on African Languages Ife Adebara Hawau Olamide Toyin Nahom Tesfu Ghebremichael AbdelRahim Elmadany Muhammad Abdul-Mageed 134 2 0 26 Feb 2025
Sparse Brains are Also Adaptive Brains: Cognitive-Load-Aware Dynamic Activation for LLMs Yiheng Yang Yujie Wang Chi Ma Lei Yu Emmanuele Chersoni Chu-Ren Huang 146 0 0 26 Feb 2025
JailBench: A Comprehensive Chinese Security Assessment Benchmark for Large Language Models Shuyi Liu Simiao Cui Haoran Bu Yuming Shang Xi Zhang ELM 85 1 0 26 Feb 2025
Simulation of Language Evolution under Regulated Social Media Platforms: A Synergistic Approach of Large Language Models and Genetic Algorithms Jinyu Cai Yusei Ishimizu Mingyue Zhang Munan Li Jialong Li Kenji Tei LLMAG 123 1 1 26 Feb 2025
Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement Yaxuan Kong Yiyuan Yang Yoontae Hwang Wenjie Du Stefan Zohren Zhangyang Wang Ming Jin Qingsong Wen AI4TS 144 9 0 26 Feb 2025
Project Alexandria: Towards Freeing Scientific Knowledge from Copyright Burdens via LLMs Christoph Schuhmann Gollam Rabby Ameya Prabhu Tawsif Ahmed Andreas Hochlehnert ... Ludwig Schmidt R. Kaczmarczyk Sören Auer J. Jitsev Matthias Bethge 525 0 0 26 Feb 2025
M2-omni: Advancing Omni-MLLM for Comprehensive Modality Support with Competitive Performance Qingpei Guo Kaiyou Song Zipeng Feng Ziping Ma Qinglong Zhang ... Yunxiao Sun Tai-WeiChang Jingdong Chen Ming Yang Jun Zhou MLLM VLM 220 4 0 26 Feb 2025
U-Sticker: A Large-Scale Multi-Domain User Sticker Dataset for Retrieval and Personalization Heng Er Metilda Chee Jiayin Wang Zhiqiang Guo Weizhi Ma Qinglang Guo Min Zhang 87 1 0 26 Feb 2025
A Survey on Foundation-Model-Based Industrial Defect Detection Tianle Yang Luyao Chang Jiadong Yan Jiajian Li Zhi Wang Ke Zhang AI4CE 167 3 0 26 Feb 2025
Reference-Aligned Retrieval-Augmented Question Answering over Heterogeneous Proprietary Documents Nayoung Choi Grace Byun Andrew Chung Ellie S. Paek S. Lee Jinho D. Choi RALM 275 1 0 26 Feb 2025
UQABench: Evaluating User Embedding for Prompting LLMs in Personalized Question Answering Liu Liu Shilei Liu Yujin Yuan Yanzhe Zhang Bencheng Yan ... Di Wang Wenbo Su Pengjie Wang Jian Xu Bo Zheng 121 1 0 26 Feb 2025
Drop-Upcycling: Training Sparse Mixture of Experts with Partial Re-initialization Taishi Nakamura Takuya Akiba Kazuki Fujii Yusuke Oda Rio Yokota Jun Suzuki MoMe MoE 134 2 0 26 Feb 2025
CodeIF: Benchmarking the Instruction-Following Capabilities of Large Language Models for Code Generation K. Yan Hongcheng Guo Xuanqing Shi Jinfeng Xu Yaonan Gu Hui Yuan ALM 144 1 0 26 Feb 2025
Nexus: An Omni-Perceptive And -Interactive Model for Language, Audio, And Vision Che Liu Yingji Zhang D. Zhang Weijie Zhang Chenggong Gong ... André Freitas Qifan Wang Z. Xu Rongjuncheng Zhang Yong Dai AuLLM 244 2 0 26 Feb 2025
Can Large Language Models Extract Customer Needs as well as Professional Analysts? Artem Timoshenko Chengfeng Mao J. Hauser ELM 132 0 0 25 Feb 2025
Task-Driven Semantic Quantization and Imitation Learning for Goal-Oriented Communications Yu-Chieh Chao Yubei Chen Weiwei Wang Achintha Wijesinghe Suchinthaka Wanninayaka Songyang Zhang Zhi Ding DiffM 128 0 0 25 Feb 2025
Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference Zhuo Chen Xinyu Wang Yong Jiang Zhen Zhang Xinyu Geng Pengjun Xie Fei Huang Kewei Tu 176 1 0 25 Feb 2025
LAM: Large Avatar Model for One-shot Animatable Gaussian Head Yisheng He Xiaodong Gu Xiaodan Ye Chao Xu Zhengyi Zhao Yuan Dong Weihao Yuan Zilong Dong Liefeng Bo 3DGS 169 0 0 25 Feb 2025
CaseGen: A Benchmark for Multi-Stage Legal Case Documents Generation Haitao Li Jiaying Ye Yiran Hu Jia Chen Qingyao Ai ... Junjie Chen Yuxiao Chen Cheng Luo Quan Zhou Yixiao Liu AILaw ELM 134 2 0 25 Feb 2025
FACT-AUDIT: An Adaptive Multi-Agent Framework for Dynamic Fact-Checking Evaluation of Large Language Models Hongzhan Lin Yang Deng Yuxuan Gu Wenxuan Zhang Jing Ma See-Kiong Ng Tat-Seng Chua LLMAG KELM HILM 148 1 0 25 Feb 2025
ChatMotion: A Multimodal Multi-Agent for Human Motion Analysis Li Lei Jia Sen Wang Jianhao An Zhaochong Li Jiaang Hwang Jenq-Neng Belongie Serge 72 3 0 25 Feb 2025
Detecting Offensive Memes with Social Biases in Singapore Context Using Multimodal Large Language Models Cao Yuxuan Wu Jiayang Alistair Cheong Liang Chuen Bryan Shan Guanrong Theodore Lee Chong Jen Sherman Chann Zhi Shen 320 0 0 25 Feb 2025
Harnessing Multiple Large Language Models: A Survey on LLM Ensemble Zhijun Chen Jingzheng Li Pengpeng Chen Zhuoran Li Kai Sun Yuankai Luo Qianren Mao Dingqi Yang Hailong Sun Philip S. Yu ELM 134 20 0 25 Feb 2025
From Small to Large Language Models: Revisiting the Federalist Papers So Won Jeong Veronika Rockova 201 0 0 25 Feb 2025
RankCoT: Refining Knowledge for Retrieval-Augmented Generation through Ranking Chain-of-Thoughts Mingyan Wu Zhenghao Liu Yukun Yan Xinze Li S. Yu Zheni Zeng Yu Gu Ge Yu RALM AI4TS LRM 91 2 0 25 Feb 2025
LevelRAG: Enhancing Retrieval-Augmented Generation with Multi-hop Logic Planning over Rewriting Augmented Searchers Zhuocheng Zhang Yang Feng Min Zhang 135 1 0 25 Feb 2025
OmniQuery: Contextually Augmenting Captured Multimodal Memory to Enable Personal Question Answering Jiahao Nick Li Zhuohao Jerry Zhang Zhang 180 2 0 24 Feb 2025
Measuring and Benchmarking Large Language Models' Capabilities to Generate Persuasive Language Amalie Brogaard Pauli Isabelle Augenstein Ira Assent 103 9 0 24 Feb 2025
In-context learning of evolving data streams with tabular foundational models Afonso Lourenço João Gama Eric P. Xing Goreti Marreiros 135 0 0 24 Feb 2025
CHBench: A Chinese Dataset for Evaluating Health in Large Language Models Chenlu Guo Nuo Xu Yi-Ju Chang Yuan Wu AI4MH LM&MA 118 2 0 24 Feb 2025
Filtered not Mixed: Stochastic Filtering-Based Online Gating for Mixture of Large Language Models Raeid Saqur Anastasis Kratsios Florian Krach Yannick Limmer Jacob-Junqi Tian John Willes Blanka Horvath Frank Rudzicz MoE 150 0 0 24 Feb 2025
CoT-UQ: Improving Response-wise Uncertainty Quantification in LLMs with Chain-of-Thought Boxuan Zhang Ruqi Zhang LRM 76 3 0 24 Feb 2025
Parameter Efficient Merging for Multimodal Large Language Models with Complementary Parameter Adaptation Fanhu Zeng Haiyang Guo Fei Zhu Li Shen Hao Tang MoMe 227 4 0 24 Feb 2025
VaViM and VaVAM: Autonomous Driving through Video Generative Modeling Florent Bartoccioni Elias Ramzi Victor Besnier Shashanka Venkataramanan Tuan-Hung Vu ... Mickael Chen Éloi Zablocki Andrei Bursuc Eduardo Valle Matthieu Cord VGen 181 2 0 24 Feb 2025
On the Robustness of Transformers against Context Hijacking for Linear Classification Tianle Li Chenyang Zhang Xingwu Chen Yuan Cao Difan Zou 126 2 0 24 Feb 2025
PiCO: Peer Review in LLMs based on the Consistency Optimization Kun-Peng Ning Shuo Yang Yu-Yang Liu Jia-Yu Yao Zhen-Hui Liu Yu Wang Ming Pang Li Yuan ALM 217 9 0 24 Feb 2025
When Compression Meets Model Compression: Memory-Efficient Double Compression for Large Language Models Weilan Wang Yu Mao Dongdong Tang Hongchao Du Nan Guan Chun Jason Xue MQ 126 2 0 24 Feb 2025
Unsupervised Topic Models are Data Mixers for Pre-training Language Models Jiahui Peng Xinlin Zhuang Qiu Jiantao Ren Ma Jing Yu Tianyi Bai Zeang Sheng 102 3 0 24 Feb 2025
Steering into New Embedding Spaces: Analyzing Cross-Lingual Alignment Induced by Model Interventions in Multilingual Language Models Anirudh Sundar Sinead Williamson Katherine Metcalf B. Theobald Skyler Seto Masha Fedzechkina LLMSV 137 1 0 24 Feb 2025
RLTHF: Targeted Human Feedback for LLM Alignment Yifei Xu Tusher Chakraborty Emre Kıcıman Bibek Aryal Eduardo Rodrigues ... Rafael Padilha Leonardo Nunes Shobana Balakrishnan Songwu Lu Ranveer Chandra 163 2 0 24 Feb 2025
Large Language Models and Mathematical Reasoning Failures Johan Boye Birger Moell ELM LRM 85 4 0 24 Feb 2025
Extraction multi-étiquettes de relations en utilisant des couches de Transformer Ngoc Luyen Le Gildas Tagny Ngompé 108 0 0 24 Feb 2025
Surgical Scene Understanding in the Era of Foundation AI Models: A Comprehensive Review Ufaq Khan Umair Nawaz A. Qayyum Shazad Ashraf Muhammad Bilal Junaid Qadir 145 0 0 24 Feb 2025
CORAL: Learning Consistent Representations across Multi-step Training with Lighter Speculative Drafter Yepeng Weng Dianwen Mei Huishi Qiu Xujie Chen Li Liu Jiang Tian Zhongchao Shi 180 0 0 24 Feb 2025
Encryption-Friendly LLM Architecture Donghwan Rho Taeseong Kim Minje Park Jung Woo Kim Hyunsik Chae Jung Hee Cheon Ernest K. Ryu 230 6 0 24 Feb 2025
LightMamba: Efficient Mamba Acceleration on FPGA with Quantization and Hardware Co-design Renjie Wei Songqiang Xu Linfeng Zhong Zebin Yang Qingyu Guo Yidan Wang Runsheng Wang Meng Li 150 1 0 24 Feb 2025
Do LLMs Make Mistakes Like Students? Exploring Natural Alignment between Language Models and Human Error Patterns Naiming Liu Shashank Sonkar Richard Baraniuk AI4Ed 117 0 0 24 Feb 2025
Unified Prompt Attack Against Text-to-Image Generation Models Duo Peng Qiuhong Ke Mark He Huang Ping Hu Jing Liu 91 1 0 23 Feb 2025
Code Summarization Beyond Function Level Vladimir Makharev Vladimir Ivanov 101 0 0 23 Feb 2025