Title
Fast Best-of-N Decoding via Speculative Rejection Hanshi Sun Momin Haider Ruiqi Zhang Huitao Yang Jiahao Qiu Ming Yin Mengdi Wang Peter L. Bartlett Andrea Zanette BDL 129 52 0 26 Oct 2024
Layer by Layer: Uncovering Where Multi-Task Learning Happens in Instruction-Tuned Large Language Models Zheng Zhao Yftah Ziser Shay B. Cohen 68 2 0 25 Oct 2024
OReole-FM: successes and challenges toward billion-parameter foundation models for high-resolution satellite imagery P. Dias A. Tsaris Jordan Bowman Abhishek Potnis Jacob Arndt H. Yang D. Lunga 51 5 0 25 Oct 2024
Cobblestone: Iterative Automation for Formal Verification Saketh Ram Kasibatla Arpan Agarwal Yuriy Brun Sorin Lerner Talia Ringer Emily First 43 1 0 25 Oct 2024
Two are better than one: Context window extension with multi-grained self-injection Wei Han Pan Zhou Soujanya Poria Shuicheng Yan 70 0 0 25 Oct 2024
SegLLM: Multi-round Reasoning Segmentation XuDong Wang Shaolun Zhang Shufan Li Konstantinos Kallidromitis Kehan Li Yusuke Kato Kazuki Kozuka Trevor Darrell VLM LRM 117 2 0 24 Oct 2024
A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs A. S. Rawat Veeranjaneyulu Sadhanala Afshin Rostamizadeh Ayan Chakrabarti Wittawat Jitkrittum ... Rakesh Shivanna Sashank J. Reddi A. Menon Rohan Anil Sanjiv Kumar 152 3 0 24 Oct 2024
Task Calibration: Calibrating Large Language Models on Inference Tasks Yingjie Li Yun Luo Xiaotian Xie Yue Zhang LRM 66 0 0 24 Oct 2024
BATON: Enhancing Batch-wise Inference Efficiency for Large Language Models via Dynamic Re-batching Peizhuang Cong Qizhi Chen Haochen Zhao Tong Yang KELM 82 2 0 24 Oct 2024
Knowledge Distillation Using Frontier Open-source LLMs: Generalizability and the Role of Synthetic Data Anup Shirgaonkar Nikhil Pandey Nazmiye Ceren Abay Tolga Aktas Vijay Aski ALM SyDa 70 1 0 24 Oct 2024
Aligning CodeLLMs with Direct Preference Optimization Yibo Miao Bofei Gao Shanghaoran Quan Junyang Lin Daoguang Zan Qingbin Liu Jian Yang Tianyu Liu Zhijie Deng 108 6 0 24 Oct 2024
Parameter-Efficient Fine-Tuning in Large Models: A Survey of Methodologies Liwen Wang Sheng Chen Linnan Jiang Shu Pan Runze Cai Sen Yang Fei Yang 197 7 0 24 Oct 2024
CoreInfer: Accelerating Large Language Model Inference with Semantics-Inspired Adaptive Sparse Activation Qinsi Wang Saeed Vahidian Hancheng Ye Jianyang Gu Jianyi Zhang Yiran Chen 38 4 0 23 Oct 2024
Multi-Draft Speculative Sampling: Canonical Decomposition and Theoretical Limits Ashish Khisti MohammadReza Ebrahimi Hassan Dbouk Arash Behboodi Roland Memisevic Christos Louizos 41 2 0 23 Oct 2024
Towards Reliable Evaluation of Behavior Steering Interventions in LLMs Itamar Pres Laura Ruis Ekdeep Singh Lubana David M. Krueger LLMSV 75 10 0 22 Oct 2024
LoRA-C: Parameter-Efficient Fine-Tuning of Robust CNN for IoT Devices Chuntao Ding Xu Cao Jianhang Xie Linlin Fan Shangguang Wang Zhichao Lu 89 2 0 22 Oct 2024
Decoding Time Series with LLMs: A Multi-Agent Framework for Cross-Domain Annotation Minhua Lin Zhe Chen Yanchi Liu Xujiang Zhao Zongyu Wu Junxiang Wang Xiang Zhang Suhang Wang Haifeng Chen AI4TS 127 11 0 22 Oct 2024
MiniPLM: Knowledge Distillation for Pre-Training Language Models Yuxian Gu Hao Zhou Fandong Meng Jie Zhou Minlie Huang 233 7 0 22 Oct 2024
Natural GaLore: Accelerating GaLore for memory-efficient LLM Training and Fine-tuning Arijit Das 36 2 0 21 Oct 2024
Towards Optimal Adapter Placement for Efficient Transfer Learning Aleksandra I. Nowak Otniel-Bogdan Mercea Anurag Arnab Jonas Pfeiffer Yann N. Dauphin Utku Evci 84 1 0 21 Oct 2024
Reducing Hallucinations in Vision-Language Models via Latent Space Steering Sheng Liu Haotian Ye Lei Xing James Zou VLM LLMSV 173 9 0 21 Oct 2024
Who's Who: Large Language Models Meet Knowledge Conflicts in Practice Quang Hieu Pham Hoang Ngo Anh Tuan Luu Dat Quoc Nguyen RALM HILM 91 9 0 21 Oct 2024
RAC: Efficient LLM Factuality Correction with Retrieval Augmentation Changmao Li Jeffrey Flanigan KELM LRM 57 3 0 21 Oct 2024
Scalable Data Ablation Approximations for Language Models through Modular Training and Merging Clara Na Ian H. Magnusson A. Jha Tom Sherborne Emma Strubell Jesse Dodge Pradeep Dasigi MoMe 78 5 0 21 Oct 2024
CartesianMoE: Boosting Knowledge Sharing among Experts via Cartesian Product Routing in Mixture-of-Experts Zhenpeng Su Xing Wu Zijia Lin Yizhe Xiong Minxuan Lv Guangyuan Ma Hui Chen Songlin Hu Guiguang Ding MoE 126 4 0 21 Oct 2024
Unveiling and Consulting Core Experts in Retrieval-Augmented MoE-based LLMs Xin Zhou Ping Nie Yiwen Guo Haojie Wei Zhanqiu Zhang Pasquale Minervini Ruotian Ma Tao Gui Qi Zhang Xuanjing Huang MoE 74 0 0 20 Oct 2024
A Survey of Hallucination in Large Visual Language Models Wei Lan Wenyi Chen Qingfeng Chen Shirui Pan Huiyu Zhou Yi-Lun Pan LRM 98 6 0 20 Oct 2024
Causality for Large Language Models Anpeng Wu Kun Kuang Minqin Zhu Yingrong Wang Yujia Zheng Kairong Han Yangqiu Song Guangyi Chen Leilei Gan Kun Zhang LRM 125 9 0 20 Oct 2024
Lossless KV Cache Compression to 2% Zhen Yang Jizong Han Kan Wu Ruobing Xie An Wang Xingwu Sun Zhanhui Kang VLM MQ 90 2 0 20 Oct 2024
A Prompt Engineering Approach and a Knowledge Graph based Framework for Tackling Legal Implications of Large Language Model Answers George Hannah Rita T. Sousa Ioannis Dasoulas Claudia dÁmato AILaw ELM 66 1 0 19 Oct 2024
Large Language Models Are Overparameterized Text Encoders Thennal D K Tim Fischer Chris Biemann 85 2 0 18 Oct 2024
MomentumSMoE: Integrating Momentum into Sparse Mixture of Experts R. Teo Tan M. Nguyen MoE 94 3 0 18 Oct 2024
RA-BLIP: Multimodal Adaptive Retrieval-Augmented Bootstrapping Language-Image Pre-training Muhe Ding Yang Ma Pengda Qin Jianlong Wu Yuhong Li Liqiang Nie 80 1 0 18 Oct 2024
Leveraging Large Language Models for Enhancing Public Transit Services Jiahao Wang Amer Shalaby 51 2 0 18 Oct 2024
Paths-over-Graph: Knowledge Graph Empowered Large Language Model Reasoning Xingyu Tan Xiaoyang Wang Qing Liu Xiwei Xu Xin Yuan Wenjie Zhang LRM 200 10 0 18 Oct 2024
VLM-Grounder: A VLM Agent for Zero-Shot 3D Visual Grounding Runsen Xu Zhiwei Huang Tai Wang Yuxiao Chen Jiangmiao Pang Dahua Lin VGen 110 18 0 17 Oct 2024
FiTv2: Scalable and Improved Flexible Vision Transformer for Diffusion Model ZiDong Wang Zeyu Lu Di Huang Cai Zhou Wanli Ouyang and Lei Bai 126 6 0 17 Oct 2024
Large Language Models as Narrative-Driven Recommenders Lukas Eberhard Thorsten Ruprechter Denis Helic LRM 124 0 0 17 Oct 2024
Cerberus: Efficient Inference with Adaptive Parallel Decoding and Sequential Knowledge Enhancement Yuxuan Liu Wenyuan Li Laizhong Cui Hailiang Yang OffRL 67 0 0 17 Oct 2024
Retrieval-Enhanced Named Entity Recognition Enzo Shiraishi Raphael Y. de Camargo Henrique L. P. Silva Ronaldo C. Prati RALM 118 0 0 17 Oct 2024
From Single to Multi: How LLMs Hallucinate in Multi-Document Summarization Catarina G. Belem Pouya Pezeskhpour Hayate Iso Seiji Maekawa Nikita Bhutani Estevam R. Hruschka HILM 148 3 0 17 Oct 2024
A Survey on Data Synthesis and Augmentation for Large Language Models Ke Wang Jiahui Zhu Minjie Ren Ziqiang Liu Shiwei Li ... Yiming Lei Xiaoyu Wu Qiqi Zhan Qingjie Liu Yunhong Wang SyDa 186 21 0 16 Oct 2024
Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance Yaojie Lu Shenzhi Yang Cheng Qian Guirong Chen Qinyu Luo ... Weiwen Liu Yasheng Wang Zhiyuan Liu Fangming Liu Maosong Sun LLMAG 56 11 0 16 Oct 2024
MAX: Masked Autoencoder for X-ray Fluorescence in Geological Investigation An-Sheng Lee Yu-Wen Pao Hsuan-Tien Lin Sofia Ya Hsuan Liou 57 1 0 16 Oct 2024
Enhancing LLM Agents for Code Generation with Possibility and Pass-rate Prioritized Experience Replay Yuyang Chen Kaiyan Zhao Yiming Wang Ming Yang Jian Zhang Yan Li 165 1 0 16 Oct 2024
Triple Modality Fusion: Aligning Visual, Textual, and Graph Data with Large Language Models for Multi-Behavior Recommendations Luyi Ma Xiaohan Li Zezhong Fan Kai Zhao Jianpeng Xu Praveen Kanumala Kaushiki Nag Sushant Kumar Sushant Kumar Kannan Achan 132 5 0 16 Oct 2024
Identifying Task Groupings for Multi-Task Learning Using Pointwise V-Usable Information Yingya Li Timothy A. Miller Steven Bethard G. Savova 77 2 0 16 Oct 2024
Channel-Wise Mixed-Precision Quantization for Large Language Models Zihan Chen Bike Xie Jundong Li Cong Shen MQ 127 3 0 16 Oct 2024
MMFuser: Multimodal Multi-Layer Feature Fuser for Fine-Grained Vision-Language Understanding Yue Cao Yangzhou Liu Zhe Chen Guangchen Shi Wenhai Wang Danhuai Zhao Tong Lu 127 9 0 15 Oct 2024
Tending Towards Stability: Convergence Challenges in Small Language Models Richard Diehl Martinez Pietro Lesci P. Buttery 105 4 0 15 Oct 2024