Title
On Speeding Up Language Model Evaluation Jin Peng Zhou Christian K. Belardi Ruihan Wu Travis Zhang Carla P. Gomes Wen Sun Kilian Q. Weinberger 168 2 0 08 Jul 2024
AI Safety in Generative AI Large Language Models: A Survey Jaymari Chua Yun Yvonna Li Shiyi Yang Chen Wang Lina Yao LM&MA 102 19 0 06 Jul 2024
Re-Tuning: Overcoming the Compositionality Limits of Large Language Models with Recursive Tuning Eric Pasewark Kyle Montgomery Kefei Duan Dawn Song Chenguang Wang LRM CLL ReLM 85 1 0 05 Jul 2024
Rethinking Visual Prompting for Multimodal Large Language Models with External Knowledge Yuanze Lin Yunsheng Li Dongdong Chen Weijian Xu Ronald Clark Philip Torr Lu Yuan LRM VLM 81 8 0 05 Jul 2024
Seed-ASR: Understanding Diverse Speech and Contexts with LLM-based Speech Recognition Ye Bai Jingping Chen Jitong Chen Wei Chen Zhuo Chen ... Wanyi Zhang Yang Zhang Yawei Zhang Yijie Zheng Ming Zou AuLLM 123 28 0 05 Jul 2024
Defense Against Syntactic Textual Backdoor Attacks with Token Substitution Xinglin Li Xianwen He Yao Li Minhao Cheng 74 1 0 04 Jul 2024
A Survey on Natural Language Counterfactual Generation Yongjie Wang Xiaoqi Qiu Yu Yue Xu Guo Zhiwei Zeng Yuhong Feng Zhiqi Shen 85 9 0 04 Jul 2024
Uncertainty-Guided Optimization on Large Language Model Search Trees Julia Grosse Ruotian Wu Ahmad Rashid Philipp Hennig Pascal Poupart Agustinus Kristiadi 109 3 0 04 Jul 2024
TongGu: Mastering Classical Chinese Understanding with Knowledge-Grounded Large Language Models Jiahuan Cao Dezhi Peng Peirong Zhang Yongxin Shi Yang Liu Kai Ding Lianwen Jin 53 1 0 04 Jul 2024
Cognitive Modeling with Scaffolded LLMs: A Case Study of Referential Expression Generation Polina Tsvilodub Michael Franke Fausto Carcassi 77 1 0 04 Jul 2024
MSfusion: A Dynamic Model Splitting Approach for Resource-Constrained Machines to Collaboratively Train Larger Models Jin Xie Songze Li FedML 90 0 0 04 Jul 2024
An Empirical Study on Capability of Large Language Models in Understanding Code Semantics Thu-Trang Nguyen Thanh Trong Vu H. Vo Son Nguyen ELM 73 3 0 04 Jul 2024
InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output Pan Zhang Xiaoyi Dong Yuhang Zang Yuhang Cao Rui Qian ... Kai Chen Jifeng Dai Yu Qiao Dahua Lin Jiaqi Wang 146 117 0 03 Jul 2024
Universal Length Generalization with Turing Programs Kaiying Hou David Brandfonbrener Sham Kakade Samy Jelassi Eran Malach 121 11 0 03 Jul 2024
Enhancing Translation Accuracy of Large Language Models through Continual Pre-Training on Parallel Data Minato Kondo T. Utsuro Masaaki Nagata CLL 78 5 0 03 Jul 2024
Towards More Realistic Extraction Attacks: An Adversarial Perspective Yash More Prakhar Ganesh G. Farnadi AAML 126 7 0 02 Jul 2024
MMedAgent: Learning to Use Medical Tools with Multi-modal Agent Binxu Li Tiankai Yan Yuanting Pan Zhe Xu Jie Luo Ruiyang Ji Shilong Liu Haoyu Dong Zihao Lin Yixin Wang LM&MA 91 35 0 02 Jul 2024
Is Your AI-Generated Code Really Safe? Evaluating Large Language Models on Secure Code Generation with CodeSecEval Jiexin Wang Xitong Luo Liuwen Cao Hongkui He Hailin Huang Jiayuan Xie Adam Jatowt Yi Cai ELM 76 18 0 02 Jul 2024
Meerkat: Audio-Visual Large Language Model for Grounding in Space and Time Sanjoy Chowdhury Sayan Nag Subhrajyoti Dasgupta Jun Chen Mohamed Elhoseiny Ruohan Gao Dinesh Manocha VLM MLLM 100 15 0 01 Jul 2024
Mobile-Bench: An Evaluation Benchmark for LLM-based Mobile Agents Shihan Deng Weikai Xu Hongda Sun Wei Liu Tao Tan ... Ang Li Jian Luan Bin Wang Rui Yan Shuo Shang LLMAG 106 21 0 01 Jul 2024
Universal Approximation Theory: The Basic Theory for Transformer-based Large Language Models Wei Wang Qing Li 46 0 0 01 Jul 2024
SplitLoRA: A Split Parameter-Efficient Fine-Tuning Framework for Large Language Models Zheng Lin Xuanjie Hu Yuxin Zhang Zhe Chen Zihan Fang Xianhao Chen Ang Li Praneeth Vepakomma Yue Gao 96 37 0 01 Jul 2024
From Introspection to Best Practices: Principled Analysis of Demonstrations in Multimodal In-Context Learning Nan Xu Fei Wang Sheng Zhang Hoifung Poon Muhao Chen 143 7 0 01 Jul 2024
Eliminating Position Bias of Language Models: A Mechanistic Approach Ziqi Wang Hanlin Zhang Xiner Li Kuan-Hao Huang Chi Han Shuiwang Ji Sham Kakade Hao Peng Heng Ji 173 20 0 01 Jul 2024
LLM4GEN: Leveraging Semantic Representation of LLMs for Text-to-Image Generation Mushui Liu Yuhang Ma Yang Zhen Jun Dan Yunlong Yu Zeng Zhao Zhipeng Hu Bai Liu Changjie Fan VLM DiffM 133 20 0 30 Jun 2024
Parm: Efficient Training of Large Sparsely-Activated Models with Dedicated Schedules Xinglin Pan Wenxiang Lin Shaoshuai Shi Xiaowen Chu Weinong Sun Bo Li MoE 92 5 0 30 Jun 2024
Applying RLAIF for Code Generation with API-usage in Lightweight LLMs Sujan Dutta Sayantan Mahinder R. Anantha Bortik Bandyopadhyay ALM 75 7 0 28 Jun 2024
YuLan: An Open-source Large Language Model Yutao Zhu Kun Zhou Kelong Mao Wentong Chen Yiding Sun ... Wenbing Huang Ze-Feng Gao Yueguo Chen Weizheng Lu Ji-Rong Wen ALM ELM 70 1 0 28 Jun 2024
Direct Preference Knowledge Distillation for Large Language Models Yixing Li Yuxian Gu Li Dong Dequan Wang Yu Cheng Furu Wei 121 8 0 28 Jun 2024
The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning Shaobo Cui Zhijing Jin Bernhard Schölkopf Boi Faltings CML LRM 96 4 0 27 Jun 2024
Resolving Discrepancies in Compute-Optimal Scaling of Language Models Tomer Porian Mitchell Wortsman J. Jitsev Ludwig Schmidt Y. Carmon 177 26 0 27 Jun 2024
Chat AI: A Seamless Slurm-Native Solution for HPC-Based Services Ali Doosthosseini Jonathan Decker Hendrik Nolte Julian M. Kunkel 130 4 0 27 Jun 2024
Fairness and Bias in Multimodal AI: A Survey Tosin Adewumi Lama Alkhaled Namrata Gurung G. V. Boven Irene Pagliai 119 10 0 27 Jun 2024
SSP: Self-Supervised Prompting for Cross-Lingual Transfer to Low-Resource Languages using Large Language Models Vipul Rathore Aniruddha Deb Ankish Chandresh Parag Singla Mausam LRM 78 0 0 27 Jun 2024
FFN: a Fine-grained Chinese-English Financial Domain Parallel Corpus Yuxin Fu Shijing Si Leyi Mai Xi-ang Li 78 1 0 27 Jun 2024
Lifelong Robot Library Learning: Bootstrapping Composable and Generalizable Skills for Embodied Control with Language Models Georgios Tziafas Hamidreza Kasaei KELM LM&Ro 98 9 0 26 Jun 2024
LoongTrain: Efficient Training of Long-Sequence LLMs with Head-Context Parallelism Diandian Gu Peng Sun Qinghao Hu Ting Huang Xun Chen ... Jiarui Fang Yonggang Wen Tianwei Zhang Xin Jin Xuanzhe Liu LRM 89 9 0 26 Jun 2024
Unveiling and Controlling Anomalous Attention Distribution in Transformers Ruiqing Yan Xingbo Du Haoyu Deng Linghan Zheng Qiuzhuang Sun Jifang Hu Yuhang Shao Penghao Jiang Jinrong Jiang Lian Zhao 69 1 0 26 Jun 2024
Assessing "Implicit" Retrieval Robustness of Large Language Models Xiaoyu Shen Rexhina Blloshmi Dawei Zhu Jiahuan Pei Wei Zhang RALM KELM 151 2 0 26 Jun 2024
JailbreakZoo: Survey, Landscapes, and Horizons in Jailbreaking Large Language and Vision-Language Models Haibo Jin Leyang Hu Xinuo Li Peiyan Zhang Chonghan Chen Jun Zhuang Haohan Wang PILM 113 33 0 26 Jun 2024
Learning Neural Networks with Sparse Activations Pranjal Awasthi Nishanth Dikkala Pritish Kamath Raghu Meka 134 4 0 26 Jun 2024
PaCoST: Paired Confidence Significance Testing for Benchmark Contamination Detection in Large Language Models Huixuan Zhang Yun Lin Xiaojun Wan 144 0 0 26 Jun 2024
A Survey on Mixture of Experts in Large Language Models Weilin Cai Juyong Jiang Fan Wang Jing Tang Sunghun Kim Jiayi Huang MoE 102 70 0 26 Jun 2024
Banishing LLM Hallucinations Requires Rethinking Generalization Johnny Li Saksham Consul Eda Zhou James Wong Naila Farooqui ... Zhuxiaona Wei Tian Wu Ben Echols Sharon Zhou Gregory Diamos LRM 68 13 0 25 Jun 2024
The FineWeb Datasets: Decanting the Web for the Finest Text Data at Scale Guilherme Penedo Hynek Kydlícek Loubna Ben Allal Anton Lozhkov Margaret Mitchell Colin Raffel Leandro von Werra Thomas Wolf 144 265 0 25 Jun 2024
MedCare: Advancing Medical LLMs through Decoupling Clinical Alignment and Knowledge Aggregation Yusheng Liao Shuyang Jiang Yanfeng Wang Yu Wang 105 3 0 25 Jun 2024
A Three-Pronged Approach to Cross-Lingual Adaptation with Multilingual LLMs Vaibhav Singh Amrith Krishna Karthika NJ Ganesh Ramakrishnan 123 4 0 25 Jun 2024
Dual-Space Knowledge Distillation for Large Language Models Songming Zhang Xue Zhang Zengkui Sun Yufeng Chen Jinan Xu 90 9 0 25 Jun 2024
ARES: Alternating Reinforcement Learning and Supervised Fine-Tuning for Enhanced Multi-Modal Chain-of-Thought Reasoning Through Diverse AI Feedback Ju-Seung Byun Jiyun Chun Jihyung Kil Andrew Perrault ReLM LRM 139 3 0 25 Jun 2024
Paraphrase and Aggregate with Large Language Models for Minimizing Intent Classification Errors Vikas Yadav Zheng Tang Vijay Srinivasan 99 12 0 24 Jun 2024