Title
BoA: Attention-aware Post-training Quantization without Backpropagation Junhan Kim Ho-Young Kim Eulrang Cho Chungman Lee Joonyoung Kim Yongkweon Jeon MQ 38 0 0 19 Jun 2024
DrVideo: Document Retrieval Based Long Video Understanding Ziyu Ma Chenhui Gou Hengcan Shi Bin Sun Shutao Li Hamid Rezatofighi Jianfei Cai VLM 36 13 0 18 Jun 2024
What Are the Odds? Language Models Are Capable of Probabilistic Reasoning Akshay Paruchuri Jake Garrison Shun Liao John Hernandez Jacob Sunshine Tim Althoff Xin Liu Daniel J. McDuff LRM 39 7 0 18 Jun 2024
ChatGLM: A Family of Large Language Models from GLM-130B to GLM-4 All Tools Team GLM : Aohan Zeng Bin Xu Bowen Wang ... Zhaoyu Wang Zhen Yang Zhengxiao Du Zhenyu Hou Zihan Wang ALM 79 515 0 18 Jun 2024
Cross-Lingual Unlearning of Selective Knowledge in Multilingual Language Models Minseok Choi Kyunghyun Min Jaegul Choo MU AAML 43 2 0 18 Jun 2024
VoCo-LLaMA: Towards Vision Compression with Large Language Models Xubing Ye Yukang Gan Xiaoke Huang Yixiao Ge Yansong Tang MLLM VLM 43 23 0 18 Jun 2024
AI "News" Content Farms Are Easy to Make and Hard to Detect: A Case Study in Italian Giovanni Puccetti Anna Rogers Chiara Alzetta F. Dell’Orletta Andrea Esuli 49 8 0 17 Jun 2024
LiLiuM: eBay's Large Language Models for e-commerce Christian Herold Michael Kozielski Leonid Ekimov Pavel Petrushkov P. Vandenbussche Shahram Khadivi 43 1 0 17 Jun 2024
Prefixing Attention Sinks can Mitigate Activation Outliers for Large Language Model Quantization Seungwoo Son Wonpyo Park Woohyun Han Kyuyeun Kim Jaeho Lee MQ 37 10 0 17 Jun 2024
Save It All: Enabling Full Parameter Tuning for Federated Large Language Models via Cycle Block Gradient Descent Lin Wang Zhichao Wang Xiaoying Tang 51 1 0 17 Jun 2024
Breaking Boundaries: Investigating the Effects of Model Editing on Cross-linguistic Performance Somnath Banerjee Avik Halder Rajarshi Mandal Sayan Layek Ian Soboroff Rima Hazra Animesh Mukherjee 65 1 0 17 Jun 2024
Promoting Data and Model Privacy in Federated Learning through Quantized LoRA Jianhao Zhu Changze Lv Xiaohua Wang Muling Wu Wenhao Liu Tianlong Li Zixuan Ling Cenyuan Zhang Xiaoqing Zheng Xuanjing Huang 49 4 0 16 Jun 2024
AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models Xiyang Wu Tianrui Guan Dianqi Li Shuaiyi Huang Xiaoyu Liu ... Abhinav Shrivastava Furong Huang Jordan L. Boyd-Graber Dinesh Manocha Dinesh Manocha HILM LRM VLM MLLM 38 14 0 16 Jun 2024
ShareLoRA: Parameter Efficient and Robust Large Language Model Fine-tuning via Shared Low-Rank Adaptation Yurun Song Junchen Zhao Ian G. Harris Sangeetha Abdu Jyothi 32 3 0 16 Jun 2024
Breaking the Memory Wall: A Study of I/O Patterns and GPU Memory Utilization for Hybrid CPU-GPU Offloaded Optimizers Avinash Maurya Jie Ye M. Rafique Franck Cappello Bogdan Nicolae 33 2 0 15 Jun 2024
A Survey of Large Language Models for Financial Applications: Progress, Prospects and Challenges Yuqi Nie Yaxuan Kong Xiaowen Dong John M. Mulvey H. Vincent Poor Qingsong Wen Stefan Zohren AIFin 50 43 0 15 Jun 2024
Datasets for Multilingual Answer Sentence Selection Matteo Gabburo S. Campese Federico Agostini Alessandro Moschitti 48 0 0 14 Jun 2024
A Survey on Large Language Models from General Purpose to Medical Applications: Datasets, Methodologies, and Evaluations Jinqiang Wang Huansheng Ning Yi Peng Qikai Wei Daniel Tesfai Wenwei Mao Tao Zhu Runhe Huang LM&MA AI4MH ELM 54 5 0 14 Jun 2024
SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages Holy Lovenia Rahmad Mahendra Salsabil Maulana Akbar Lester James V. Miranda Jennifer Santoso ... Genta Indra Winata Ruochen Zhang Fajri Koto Zheng-Xin Yong Samuel Cahyawijaya 98 9 0 14 Jun 2024
ProxyLM: Predicting Language Model Performance on Multilingual Tasks via Proxy Models David Anugraha Genta Indra Winata Chenyue Li Patrick Amadeus Irawan En-Shiun Annie Lee 48 7 0 13 Jun 2024
Sharing Matters: Analysing Neurons Across Languages and Tasks in LLMs Weixuan Wang Barry Haddow Wei Peng Alexandra Birch MILM 45 11 0 13 Jun 2024
Deep Exploration of Cross-Lingual Zero-Shot Generalization in Instruction Tuning Janghoon Han Changho Lee Joongbo Shin Stanley Jungkyu Choi Honglak Lee Kynghoon Bae ALM 32 1 0 13 Jun 2024
Image Textualization: An Automatic Framework for Creating Accurate and Detailed Image Descriptions Renjie Pi Jianshu Zhang Jipeng Zhang Rui Pan Zhekai Chen Tong Zhang 3DV 49 19 0 11 Jun 2024
MINERS: Multilingual Language Models as Semantic Retrievers Genta Indra Winata Ruochen Zhang David Ifeoluwa Adelani RALM 54 5 0 11 Jun 2024
BertaQA: How Much Do Language Models Know About Local Culture? Julen Etxaniz Gorka Azkune A. Soroa Oier López de Lacalle Mikel Artetxe 44 6 0 11 Jun 2024
Efficiently Exploring Large Language Models for Document-Level Machine Translation with In-context Learning Menglong Cui Jiangcun Du Shaolin Zhu Deyi Xiong 29 12 0 11 Jun 2024
Effectively Compress KV Heads for LLM Hao Yu Zelan Yang Shen Li Yong Li Jianxin Wu MQ VLM 44 13 0 11 Jun 2024
Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation Peize Sun Yi Jiang Shoufa Chen Shilong Zhang Bingyue Peng Ping Luo Zehuan Yuan VLM 68 230 0 10 Jun 2024
ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization Haoran You Yipin Guo Yichao Fu Wei Zhou Huihong Shi Xiaofan Zhang Souvik Kundu Amir Yazdanbakhsh Y. Lin KELM 59 7 0 10 Jun 2024
Are Large Language Models Actually Good at Text Style Transfer? Sourabrata Mukherjee Atul Kr. Ojha Ondrej Dusek 33 11 0 09 Jun 2024
Zero-Shot End-To-End Spoken Question Answering In Medical Domain Yanis Labrak Adel Moumen Richard Dufour Mickael Rouvier ELM LM&MA MedIm 42 0 0 09 Jun 2024
SinkLoRA: Enhanced Efficiency and Chat Capabilities for Long-Context Large Language Models Hengyu Zhang RALM 47 2 0 09 Jun 2024
DeepStack: Deeply Stacking Visual Tokens is Surprisingly Simple and Effective for LMMs Lingchen Meng Jianwei Yang Rui Tian Xiyang Dai Zuxuan Wu Jianfeng Gao Yu-Gang Jiang VLM 30 9 0 06 Jun 2024
Legal Documents Drafting with Fine-Tuned Pre-Trained Large Language Model Chun-Hsien Lin Pu-Jen Cheng AILaw 40 4 0 06 Jun 2024
Repurposing Language Models into Embedding Models: Finding the Compute-Optimal Recipe Alicja Ziarko Albert Q. Jiang Bartosz Piotrowski Wenda Li M. Jamnik Piotr Miłoś 40 0 0 06 Jun 2024
Pre-trained Transformer Uncovers Meaningful Patterns in Human Mobility Data Alameen Najjar 39 0 0 06 Jun 2024
IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models David Ifeoluwa Adelani Jessica Ojo Israel Abebe Azime Jian Yun Zhuang Jesujoba Oluwadara Alabi ... Salomey Osei Sokhar Samb Tadesse Kebede Guge Pontus Stenetorp Pontus Stenetorp ELM 70 7 0 05 Jun 2024
LLM-based Rewriting of Inappropriate Argumentation using Reinforcement Learning from Machine Feedback Timon Ziegenbein Gabriella Skitalinskaya Alireza Bayat Makou Henning Wachsmuth LLMAG KELM 37 5 0 05 Jun 2024
Which Side Are You On? A Multi-task Dataset for End-to-End Argument Summarisation and Evaluation Hao Li Yuping Wu Viktor Schlegel Riza Batista-Navarro Tharindu Madusanka ... Jiayan Zeng Xiaochi Wang Xinran He Yizhi Li Goran Nenadic 38 6 0 05 Jun 2024
NUMCoT: Numerals and Units of Measurement in Chain-of-Thought Reasoning using Large Language Models Ancheng Xu Minghuan Tan Lei Wang Min Yang Ruifeng Xu LRM 57 0 0 05 Jun 2024
FedMKT: Federated Mutual Knowledge Transfer for Large and Small Language Models Tao Fan Guoqiang Ma Yan Kang Hanlin Gu Yuanfeng Song Lixin Fan Kai Chen Qiang Yang 28 10 0 04 Jun 2024
UniOQA: A Unified Framework for Knowledge Graph Question Answering with Large Language Models Zhuoyang Li Liran Deng Hui Liu Qiaoqiao Liu Junzhao Du RALM 40 4 0 04 Jun 2024
LLMs Beyond English: Scaling the Multilingual Capability of LLMs with Cross-Lingual Feedback Wen Lai Mohsen Mesgar Alexander Fraser LRM ALM 56 19 0 03 Jun 2024
The Life Cycle of Large Language Models: A Review of Biases in Education Jinsook Lee Yann Hicke Renzhe Yu Christopher A. Brooks René F. Kizilcec AI4Ed 44 1 0 03 Jun 2024
Demonstration Augmentation for Zero-shot In-context Learning Yi Su Yunpeng Tai Yixin Ji Juntao Li Bowen Yan Min Zhang RALM 46 7 0 03 Jun 2024
Strengthened Symbol Binding Makes Large Language Models Reliable Multiple-Choice Selectors Mengge Xue Zhenyu Hu Liqun Liu Kuo Liao Shuang Li Honglin Han Meng Zhao Chengguo Yin 51 5 0 03 Jun 2024
Wav2Prompt: End-to-End Speech Prompt Generation and Tuning For LLM in Zero and Few-shot Learning Keqi Deng Guangzhi Sun Phil Woodland VLM 44 4 0 01 Jun 2024
A Survey on Large Language Models for Code Generation Juyong Jiang Fan Wang Jiasi Shen Sungju Kim Sunghun Kim 56 169 0 01 Jun 2024
Effective Interplay between Sparsity and Quantization: From Theory to Practice Simla Burcu Harma Ayan Chakraborty Elizaveta Kostenok Danila Mishin Dongho Ha ... Martin Jaggi Ming Liu Yunho Oh Suvinay Subramanian Amir Yazdanbakhsh MQ 49 6 0 31 May 2024
Improving Reward Models with Synthetic Critiques Zihuiwen Ye Fraser Greenlee-Scott Max Bartolo Phil Blunsom Jon Ander Campos Matthias Gallé ALM SyDa LRM 40 22 0 31 May 2024