Title
Compact Recurrent Transformer with Persistent Memory Edison Mucllari Z. Daniels David C. Zhang Qiang Ye CLL VLM 125 0 0 02 May 2025
Dual-Forecaster: A Multimodal Time Series Model Integrating Descriptive and Predictive Texts Wenfa Wu Guanyu Zhang Zheng Tan Yi Wang Hongsheng Qi AI4TS 115 2 0 02 May 2025
CSE-SFP: Enabling Unsupervised Sentence Representation Learning via a Single Forward Pass Bowen Zhang Zixin Song Chunping Li 59 1 0 01 May 2025
Humanizing LLMs: A Survey of Psychological Measurements with Tools, Datasets, and Human-Agent Applications Wenhan Dong Yuemeng Zhao Zhen Sun Yule Liu Zifan Peng ... Jun Wu Ruiming Wang Shengmin Xu Xinyi Huang Xinlei He LLMAG 194 1 0 30 Apr 2025
Confidence in Large Language Model Evaluation: A Bayesian Approach to Limited-Sample Challenges Xiao Xiao Yu Su Sijing Zhang Zhang Chen Yadong Chen Tian Liu 107 0 0 30 Apr 2025
Combatting Dimensional Collapse in LLM Pre-Training Data via Diversified File Selection Ziqing Fan Siyuan Du Shengchao Hu Pingjie Wang Li Shen Yanzhe Zhang Dacheng Tao Yucheng Wang 94 2 0 29 Apr 2025
Multimodal Large Language Models for Medicine: A Comprehensive Survey Jiarui Ye Hao Tang LM&MA 194 0 0 29 Apr 2025
WenyanGPT: A Large Language Model for Classical Chinese Tasks Xinyu Yao Mengdi Wang Bo Chen Xiaobing Zhao 117 0 0 29 Apr 2025
Learning Streaming Video Representation via Multitask Training Yibin Yan Jilan Xu Shangzhe Di Yikun Liu Yudi Shi Qirui Chen Zeqian Li Yifei Huang Weidi Xie CLL 171 1 0 28 Apr 2025
Accelerating Mixture-of-Experts Training with Adaptive Expert Replication Athinagoras Skiadopoulos Mark Zhao Swapnil Gandhi Thomas Norrie Shrijeet Mukherjee Christos Kozyrakis MoE 149 0 0 28 Apr 2025
Revisiting Transformers through the Lens of Low Entropy and Dynamic Sparsity Ruifeng Ren Yong Liu 425 1 0 26 Apr 2025
E-InMeMo: Enhanced Prompting for Visual In-Context Learning Jiahao Zhang Bowen Wang Hong Liu Liangzhi Li Yuta Nakashima Hajime Nagahara VLM 177 0 0 25 Apr 2025
Memory Reviving, Continuing Learning and Beyond: Evaluation of Pre-trained Encoders and Decoders for Multimodal Machine Translation Zhuang Yu Shiliang Sun Jing Zhao Tengfei Song Hao Yang 93 0 0 25 Apr 2025
Visual and Textual Prompts in VLLMs for Enhancing Emotion Recognition Zhifeng Wang Qixuan Zhang Peter Zhang Wenjia Niu Kaihao Zhang Ramesh Sankaranarayana Sabrina Caldwell Tom Gedeon 94 0 0 24 Apr 2025
Distilling semantically aware orders for autoregressive image generation Rishav Pramanik Antoine Poupon Juan A. Rodriguez Masih Aminbeidokhti David Vazquez Christopher Pal Zhaozheng Yin M. Pedersoli 87 0 0 23 Apr 2025
QuaDMix: Quality-Diversity Balanced Data Selection for Efficient LLM Pretraining Fengze Liu Weidong Zhou Binbin Liu Zhimiao Yu Yifan Zhang ... Yifeng Yu Bingni Zhang Xiaohuan Zhou Taifeng Wang Yong Cao 144 1 0 23 Apr 2025
EduBot -- Can LLMs Solve Personalized Learning and Programming Assignments? Yibin Wang Jiaxi Xie Lakshminarayanan Subramanian AI4Ed 102 0 0 23 Apr 2025
Cost-Effective Text Clustering with Large Language Models Hongtao Wang Taiyan Zhang Renchi Yang Jianliang Xu 85 0 0 22 Apr 2025
Multimodal Perception for Goal-oriented Navigation: A Survey I-Tak Ieong Hao Tang LM&Ro LRM 104 0 0 22 Apr 2025
Context-Enhanced Contrastive Search for Improved LLM Text Generation Jaydip Sen Rohit Pandey Hetvi Waghela 160 0 0 22 Apr 2025
Honey, I Shrunk the Language Model: Impact of Knowledge Distillation Methods on Performance and Explainability Daniel Hendriks Philipp Spitzer Niklas Kühl G. Satzger 135 2 0 22 Apr 2025
Research on Navigation Methods Based on LLMs Anlong Zhang Jianmin Ji 68 0 0 22 Apr 2025
Testing LLMs' Capabilities in Annotating Translations Based on an Error Typology Designed for LSP Translation: First Experiments with ChatGPT Joachim Minder Guillaume Wisniewski Natalie Kübler 103 0 0 21 Apr 2025
Kuwain 1.5B: An Arabic SLM via Language Injection Khalil Hennara Sara Chrouf Mohamed Motaism Hamed Zeina Aldallal Omar Hadid Safwan AlModhayan 99 2 0 21 Apr 2025
Efficient Split Federated Learning for Large Language Models over Communication Networks Kai Zhao Zhaohui Yang Ye Hu Mingzhe Chen Chen Zhu Zhaoyang Zhang 81 0 0 20 Apr 2025
PolicyEvol-Agent: Evolving Policy via Environment Perception and Self-Awareness with Theory of Mind Yajie Yu Yue Feng LLMAG 84 0 0 20 Apr 2025
Generative Multimodal Pretraining with Discrete Diffusion Timestep Tokens Kaihang Pan Wang Lin Zhongqi Yue Tenglong Ao Liyu Jia Wei Zhao Juncheng Billy Li Siliang Tang Hanwang Zhang 116 8 0 20 Apr 2025
Harnessing Generative LLMs for Enhanced Financial Event Entity Extraction Performance Soo-joon Choi Ji-jun Park 85 0 0 20 Apr 2025
Improving the Serving Performance of Multi-LoRA Large Language Models via Efficient LoRA and KV Cache Management Hang Zhang Jiuchen Shi Yixiao Wang Quan Chen Yizhou Shan Minyi Guo 93 0 0 19 Apr 2025
Bias Analysis and Mitigation through Protected Attribute Detection and Regard Classification Takuma Udagawa Yang Zhao H. Kanayama Bishwaranjan Bhattacharjee 65 0 0 19 Apr 2025
CPR: Leveraging LLMs for Topic and Phrase Suggestion to Facilitate Comprehensive Product Reviews Ekta Gujral Apurva Sinha Lishi Ji Bijayani Sanghamitra Mishra 49 0 0 18 Apr 2025
Analysing the Robustness of Vision-Language-Models to Common Corruptions Muhammad Usama Syeda Aishah Asim Syed Bilal Ali Syed Talal Wasim Umair Bin Mansoor VLM 93 0 0 18 Apr 2025
HPU: High-Bandwidth Processing Unit for Scalable, Cost-effective LLM Inference via GPU Co-processing Myunghyun Rhee Joonseop Sim Taeyoung Ahn Seungyong Lee Daegun Yoon Euiseok Kim Kyoung Park Youngpyo Joo Hosik Kim 59 0 0 18 Apr 2025
Remedy: Learning Machine Translation Evaluation from Human Preferences with Reward Modeling Shaomu Tan Christof Monz 112 0 0 18 Apr 2025
GraphAttack: Exploiting Representational Blindspots in LLM Safety Mechanisms Sinan He An Wang 63 0 0 17 Apr 2025
Low-hallucination Synthetic Captions for Large-Scale Vision-Language Model Pre-training Xinsong Zhang Yarong Zeng Xinting Huang Hu Hu Runquan Xie Han Hu Zhanhui Kang MLLM VLM 269 2 0 17 Apr 2025
Can Pre-training Indicators Reliably Predict Fine-tuning Outcomes of LLMs? Hansi Zeng Kai Hui Honglei Zhuang Zhen Qin Zhenrui Yue Hamed Zamani Dana Alon 63 0 0 16 Apr 2025
Could Thinking Multilingually Empower LLM Reasoning? Changjiang Gao Xu Huang Wenhao Zhu Shujian Huang Lei Li Fei Yuan LRM 91 2 0 16 Apr 2025
Multimodal LLM Augmented Reasoning for Interpretable Visual Perception Analysis Shravan Chaudhari Trilokya Akula Yoon Kim Tom Blake LRM 93 0 0 16 Apr 2025
Fine-Tuning Large Language Models on Quantum Optimization Problems for Circuit Generation Linus Jern Valter Uotila Cong Yu Bo Zhao MQ LRM 93 0 0 15 Apr 2025
A Dual-Space Framework for General Knowledge Distillation of Large Language Models Wei Wei Songming Zhang Yunlong Liang Fandong Meng Yufeng Chen Jinan Xu Jie Zhou 127 0 0 15 Apr 2025
When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers Hongkang Li Yihua Zhang Shuai Zhang Ming Wang Sijia Liu Pin-Yu Chen MoMe 266 10 0 15 Apr 2025
LayoutCoT: Unleashing the Deep Reasoning Potential of Large Language Models for Layout Generation Hengyu Shi Junhao Su Huansheng Ning Xiaoming Wei Jialin Gao 3DV AI4TS LRM 108 0 0 15 Apr 2025
KeyMPs: One-Shot Vision-Language Guided Motion Generation by Sequencing DMPs for Occlusion-Rich Tasks Edgar Anarossi Yuhwan Kwon Hirotaka Tahara Shohei Tanaka Keisuke Shirai Masashi Hamaya C. C. Beltran-Hernandez Atsushi Hashimoto Takamitsu Matsubara 83 0 0 14 Apr 2025
Improving In-Context Learning with Reasoning Distillation Nafis Sadeq Xin Xu Zhouhang Xie Julian McAuley Byungkyu Kang Prarit Lamba Xiang Gao RALM ReLM LRM 81 0 0 14 Apr 2025
Can We Edit LLMs for Long-Tail Biomedical Knowledge? Xinhao Yi Jake Lever Kevin Bryson Zaiqiao Meng KELM 82 0 0 14 Apr 2025
Lumos: Efficient Performance Modeling and Estimation for Large-scale LLM Training Mingyu Liang Hiwot Tadese Kassa Wenyin Fu Brian Coutinho Louis Feng Christina Delimitrou 40 0 0 12 Apr 2025
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model Team Seawead Ceyuan Yang Zhijie Lin Yang Zhao Shanchuan Lin ... Zuquan Song Zhenheng Yang Jiashi Feng Jianchao Yang Lu Jiang DiffM 198 22 0 11 Apr 2025
LoRI: Reducing Cross-Task Interference in Multi-Task Low-Rank Adaptation Juzheng Zhang Jiacheng You Ashwinee Panda Tom Goldstein MoMe 111 4 0 10 Apr 2025
Redefining Machine Translation on Social Network Services with Large Language Models Hongcheng Guo Fei Zhao Shaosheng Cao Xinze Lyu Ziqiang Liu ... Boyang Wang Hui Yuan Chonggang Lu Zhe Xu Yao Hu 72 1 0 10 Apr 2025