Title
ChartMimic: Evaluating LMM's Cross-Modal Reasoning Capability via Chart-to-Code Generation Cheng Yang Chufan Shi Yaxin Liu Bo Shui Junjie Wang ... Yuxiang Zhang Gongye Liu Xiaomei Nie Deng Cai Yujiu Yang MLLM LRM 51 24 0 14 Jun 2024
Unpacking DPO and PPO: Disentangling Best Practices for Learning from Preference Feedback Hamish Ivison Yizhong Wang Jiacheng Liu Zeqiu Wu Valentina Pyatkin Nathan Lambert Noah A. Smith Yejin Choi Hannaneh Hajishirzi 46 43 0 13 Jun 2024
The Impact of Initialization on LoRA Finetuning Dynamics Soufiane Hayou Nikhil Ghosh Bin Yu AI4CE 36 12 0 12 Jun 2024
UICoder: Finetuning Large Language Models to Generate User Interface Code through Automated Feedback Jason Wu E. Schoop Alan Leung Titus Barik Jeffrey P. Bigham Jeffrey Nichols 27 12 0 11 Jun 2024
Adversarial Tuning: Defending Against Jailbreak Attacks for LLMs Fan Liu Zhao Xu Hao Liu AAML 51 11 0 07 Jun 2024
Uncovering Limitations of Large Language Models in Information Seeking from Tables Chaoxu Pang Yixuan Cao Chunhao Yang Ping Luo RALM LMTD 41 3 0 06 Jun 2024
A + B: A General Generator-Reader Framework for Optimizing LLMs to Unleash Synergy Potential Wei Tang Yixin Cao Jiahao Ying Bo Wang Yuyue Zhao Yong Liao Pengyuan Zhou 47 3 0 06 Jun 2024
Sparsity-Accelerated Training for Large Language Models Da Ma Lu Chen Pengyu Wang Hongshen Xu Hanqi Li Liangtai Sun Su Zhu Shuai Fan Kai Yu LRM 33 0 0 03 Jun 2024
From Symbolic Tasks to Code Generation: Diversification Yields Better Task Performers Dylan Zhang Justin Wang Francois Charton 38 0 0 30 May 2024
Preference Learning Algorithms Do Not Learn Preference Rankings Angelica Chen Sadhika Malladi Lily H. Zhang Xinyi Chen Qiuyi Zhang Rajesh Ranganath Kyunghyun Cho 38 24 0 29 May 2024
Self-Exploring Language Models: Active Preference Elicitation for Online Alignment Shenao Zhang Donghan Yu Hiteshi Sharma Ziyi Yang Shuohang Wang Hany Hassan Zhaoran Wang LRM 50 28 0 29 May 2024
AlchemistCoder: Harmonizing and Eliciting Code Capability by Hindsight Tuning on Multi-source Data Zifan Song Yudong Wang Wenwei Zhang Kuikun Liu Chengqi Lyu ... Qipeng Guo Hang Yan Dahua Lin Kai-xiang Chen Cairong Zhao SyDa 46 2 0 29 May 2024
Low-rank finetuning for LLMs: A fairness perspective Saswat Das Marco Romanelli Cuong Tran Zarreen Reza B. Kailkhura Ferdinando Fioretto 40 1 0 28 May 2024
Learning diverse attacks on large language models for robust red-teaming and safety tuning Seanie Lee Minsu Kim Lynn Cherif David Dobre Juho Lee ... Kenji Kawaguchi Gauthier Gidel Yoshua Bengio Nikolay Malkin Moksh Jain AAML 63 12 0 28 May 2024
SimPO: Simple Preference Optimization with a Reference-Free Reward Yu Meng Mengzhou Xia Danqi Chen 68 372 0 23 May 2024
xRAG: Extreme Context Compression for Retrieval-augmented Generation with One Token Xin Cheng Xun Wang Xingxing Zhang Tao Ge Si-Qing Chen Furu Wei Huishuai Zhang Dongyan Zhao 67 31 0 22 May 2024
Disperse-Then-Merge: Pushing the Limits of Instruction Tuning via Alignment Tax Reduction Tingchen Fu Deng Cai Lemao Liu Shuming Shi Rui Yan MoMe 64 13 0 22 May 2024
MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning Ting Jiang Shaohan Huang Shengyue Luo Zihan Zhang Haizhen Huang ... Weiwei Deng Feng Sun Qi Zhang Deqing Wang Fuzhen Zhuang 40 35 0 20 May 2024
Towards Modular LLMs by Building and Reusing a Library of LoRAs O. Ostapenko Zhan Su Edoardo Ponti Laurent Charlin Nicolas Le Roux Matheus Pereira Lucas Caccia Alessandro Sordoni MoMe 49 31 0 18 May 2024
Facilitating Opinion Diversity through Hybrid NLP Approaches Michiel van der Meer 47 0 0 15 May 2024
HumanRankEval: Automatic Evaluation of LMs as Conversational Assistants Milan Gritta Gerasimos Lampouras Ignacio Iacobacci ALM 37 1 0 15 May 2024
PARDEN, Can You Repeat That? Defending against Jailbreaks via Repetition Ziyang Zhang Qizhen Zhang Jakob N. Foerster AAML 43 18 0 13 May 2024
LlamaTurk: Adapting Open-Source Generative Large Language Models for Low-Resource Language Cagri Toraman VLM 46 5 0 13 May 2024
A Survey of Large Language Models for Graphs Xubin Ren Jiabin Tang Dawei Yin Nitesh Chawla Chao Huang 30 34 0 10 May 2024
Self-Improving Customer Review Response Generation Based on LLMs Guy Azov Tatiana Pelc Adi Fledel Alon Gila Kamhi 40 0 0 06 May 2024
Beyond Performance: Quantifying and Mitigating Label Bias in LLMs Philipp Benz Maitreya Patel 129 10 0 04 May 2024
The Power of Question Translation Training in Multilingual Reasoning: Broadened Scope and Deepened Insights Wenhao Zhu Shujian Huang Fei Yuan Cheng Chen Jiajun Chen Alexandra Birch LRM 52 5 0 02 May 2024
Building a Large Japanese Web Corpus for Large Language Models Naoaki Okazaki Kakeru Hattori Hirai Shota Hiroki Iida Masanari Ohi Kazuki Fujii Taishi Nakamura Mengsay Loem Rio Yokota Sakae Mizuki 57 7 0 27 Apr 2024
Examining the robustness of LLM evaluation to the distributional assumptions of benchmarks Melissa Ailem Katerina Marazopoulou Charlotte Siska James Bono 64 15 0 25 Apr 2024
Does Instruction Tuning Make LLMs More Consistent? Constanza Fierro Jiaang Li Anders Sogaard LRM 40 2 0 23 Apr 2024
Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment Zhaofeng Wu Ananth Balashankar Yoon Kim Jacob Eisenstein Ahmad Beirami 46 14 0 18 Apr 2024
SuRe: Summarizing Retrievals using Answer Candidates for Open-domain QA of LLMs Jaehyung Kim Jaehyun Nam Sangwoo Mo Jongjin Park Sang-Woo Lee Minjoon Seo Jung-Woo Ha Jinwoo Shin AIFin RALM ELM 45 35 0 17 Apr 2024
Unveiling Imitation Learning: Exploring the Impact of Data Falsity to Large Language Model Hyunsoo Cho ALM 27 0 0 15 Apr 2024
CodecLM: Aligning Language Models with Tailored Synthetic Data Zifeng Wang Chun-Liang Li Vincent Perot Long T. Le Jin Miao Zizhao Zhang Chen-Yu Lee Tomas Pfister SyDa ALM 31 18 0 08 Apr 2024
Teaching Llama a New Language Through Cross-Lingual Knowledge Transfer Hele-Andra Kuulmets Taido Purason Agnes Luhtaru Mark Fishel 29 17 0 05 Apr 2024
Untangle the KNOT: Interweaving Conflicting Knowledge and Reasoning Skills in Large Language Models Yantao Liu Zijun Yao Xin Lv Yuchen Fan S. Cao Jifan Yu Lei Hou Juanzi Li 47 2 0 04 Apr 2024
Evaluating Generative Language Models in Information Extraction as Subjective Question Correction Yuchen Fan Yantao Liu Zijun Yao Jifan Yu Lei Hou Juanzi Li ELM 29 3 0 04 Apr 2024
Concept -- An Evaluation Protocol on Conversational Recommender Systems with System-centric and User-centric Factors Chen Huang Peixin Qin Yang Deng Wenqiang Lei Jiancheng Lv Tat-Seng Chua 49 6 0 04 Apr 2024
Comparing Bad Apples to Good Oranges: Aligning Large Language Models via Joint Preference Optimization Hritik Bansal Ashima Suvarna Gantavya Bhatt Nanyun Peng Kai-Wei Chang Aditya Grover ALM 64 9 0 31 Mar 2024
Dual-Personalizing Adapter for Federated Foundation Models Yiyuan Yang Guodong Long Taoshu Shen Jing Jiang Michael Blumenstein 96 20 0 28 Mar 2024
Disentangling Length from Quality in Direct Preference Optimization Ryan Park Rafael Rafailov Stefano Ermon Chelsea Finn ALM 56 112 0 28 Mar 2024
COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning Yuelin Bai Xinrun Du Yiming Liang Yonggang Jin Ziqiang Liu ... Chenghua Lin Jie Fu Min Yang Shiwen Ni Ge Zhang ALM 48 33 0 26 Mar 2024
Comprehensive Reassessment of Large-Scale Evaluation Outcomes in LLMs: A Multifaceted Statistical Approach Kun Sun Rong Wang Anders Sogaard 37 3 0 22 Mar 2024
FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions Orion Weller Benjamin Chang Sean MacAvaney Kyle Lo Arman Cohan Benjamin Van Durme Dawn J Lawrie Luca Soldaini 63 30 0 22 Mar 2024
LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models Yaowei Zheng Richong Zhang Junhao Zhang Yanhan Ye Zheyan Luo Zhangchi Feng Yongqiang Ma 55 401 0 20 Mar 2024
Automated Data Curation for Robust Language Model Fine-Tuning Jiuhai Chen Jonas W. Mueller ALM 42 20 0 19 Mar 2024
Third-Party Language Model Performance Prediction from Instruction Rahul Nadkarni Yizhong Wang Noah A. Smith ELM LRM 53 0 0 19 Mar 2024
ORPO: Monolithic Preference Optimization without Reference Model Jiwoo Hong Noah Lee James Thorne OSLM 42 213 0 12 Mar 2024
MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation Zhongwei Wan Che Liu Xin Wang Chaofan Tao Hui Shen Zhenwu Peng Jie Fu Rossella Arcucci Huaxiu Yao Mi Zhang 55 7 0 07 Mar 2024
LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error Boshi Wang Hao Fang Jason Eisner Benjamin Van Durme Yu-Chuan Su CLL 34 7 0 07 Mar 2024