Title
Adapting Large Language Models for Document-Level Machine Translation Minghao Wu Thuy-Trang Vu Lizhen Qu George F. Foster Gholamreza Haffari 93 43 0 12 Jan 2024
Extreme Compression of Large Language Models via Additive Quantization Vage Egiazarian Andrei Panferov Denis Kuznedelev Elias Frantar Artem Babenko Dan Alistarh MQ 102 91 0 11 Jan 2024
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models Damai Dai Chengqi Deng Chenggang Zhao R. X. Xu Huazuo Gao ... Panpan Huang Fuli Luo Chong Ruan Zhifang Sui W. Liang MoE 46 252 0 11 Jan 2024
Tuning LLMs with Contrastive Alignment Instructions for Machine Translation in Unseen, Low-resource Languages Zhuoyuan Mao Yen Yu ALM 23 2 0 11 Jan 2024
How Proficient Are Large Language Models in Formal Languages? An In-Depth Insight for Knowledge Base Question Answering Jinxi Liu S. Cao Jiaxin Shi Tingjian Zhang Lunyiu Nie Linmei Hu Lei Hou Juanzi Li ELM 33 3 0 11 Jan 2024
Theory of Mind abilities of Large Language Models in Human-Robot Interaction : An Illusion? Mudit Verma Siddhant Bhambri Subbarao Kambhampati 37 21 0 10 Jan 2024
Aligning Translation-Specific Understanding to General Understanding in Large Language Models Yi-Chong Huang Xiaocheng Feng Baohang Li Chengpeng Fu Wenshuai Huo Ting Liu Bing Qin 30 0 0 10 Jan 2024
Multi-User Chat Assistant (MUCA): a Framework Using LLMs to Facilitate Group Conversations Manqing Mao Paishun Ting Yijian Xiang Mingyang Xu Julia Chen Jianzhe Lin LLMAG 44 6 0 10 Jan 2024
DebugBench: Evaluating Debugging Capability of Large Language Models Runchu Tian Yining Ye Yujia Qin Xin Cong Yankai Lin ... Yesai Wu Haotian Hui Weichuan Liu Zhiyuan Liu Maosong Sun ELM 48 30 0 09 Jan 2024
MERA: A Comprehensive LLM Evaluation in Russian Alena Fenogenova Artem Chervyakov Nikita Martynov Anastasia Kozlova Maria Tikhonova ... Nikita Savushkin Polina Mikhailova Denis Dimitrov Alexander Panchenko Sergey Markov ELM 49 10 0 09 Jan 2024
TechGPT-2.0: A large language model project to solve the task of knowledge graph construction Jiaqi Wang Yuying Chang Zhong Li Ning An Qi Ma Lei Hei Haibo Luo Yifei Lu Feiliang Ren 21 6 0 09 Jan 2024
TeleChat Technical Report Zhongjiang He Zihan Wang Xinzhan Liu Shixuan Liu Yitong Yao ... Zilu Huang Sishi Xiong Yuxiang Zhang Chao Wang Shuangyong Song AI4MH LRM ALM 66 3 0 08 Jan 2024
MERBench: A Unified Evaluation Benchmark for Multimodal Emotion Recognition Zheng Lian Guoying Zhao Yong Ren Hao Gu Haiyang Sun Lan Chen Bin Liu Jianhua Tao 31 12 0 07 Jan 2024
PIXAR: Auto-Regressive Language Modeling in Pixel Space Yintao Tai Xiyang Liao Alessandro Suglia Antonio Vergari MLLM 26 7 0 06 Jan 2024
Towards ASR Robust Spoken Language Understanding Through In-Context Learning With Word Confusion Networks Kevin Everson Yile Gu Huck Yang Prashanth Gurunath Shivakumar Guan-Ting Lin ... Shalini Ghosh Wael Hamza Hung-yi Lee Ariya Rastrow A. Stolcke 30 5 0 05 Jan 2024
MLLM-Protector: Ensuring MLLM's Safety without Hurting Performance Renjie Pi Tianyang Han Jianshu Zhang Yueqi Xie Rui Pan Qing Lian Hanze Dong Jipeng Zhang Tong Zhang AAML 36 61 0 05 Jan 2024
Infinite-LLM: Efficient LLM Service for Long Context with DistAttention and Distributed KVCache Bin Lin Chen Zhang Tao Peng Hanyu Zhao Wencong Xiao ... Shen Li Zhigang Ji Tao Xie Yong Li Wei Lin 52 48 0 05 Jan 2024
Understanding LLMs: A Comprehensive Overview from Training to Inference Yi-Hsueh Liu Haoyang He Tianle Han Xu-Yao Zhang Mengyuan Liu ... Xintao Hu Tuo Zhang Ning Qiang Tianming Liu Bao Ge SyDa 45 66 0 04 Jan 2024
A Comprehensive Survey of Hallucination Mitigation Techniques in Large Language Models S.M. Towhidul Islam Tonmoy S. M. M. Zaman Vinija Jain Anku Rani Vipula Rawte Aman Chadha Amitava Das HILM 48 187 0 02 Jan 2024
Has Your Pretrained Model Improved? A Multi-head Posterior Based Approach Prince Osei Aboagye Yan Zheng Junpeng Wang Uday Singh Saini Xin Dai ... Yujie Fan Zhongfang Zhuang Shubham Jain Liang Wang Wei Zhang 32 0 0 02 Jan 2024
Vietnamese Poem Generation & The Prospect Of Cross-Language Poem-To-Poem Translation Triet Minh Huynh Quan Le Bao 23 1 0 02 Jan 2024
LLaMA Beyond English: An Empirical Study on Language Capability Transfer Jun Zhao Zhihao Zhang Luhui Gao Qi Zhang Tao Gui Xuanjing Huang ELM 35 70 0 02 Jan 2024
Evaluating Large Language Models on the GMAT: Implications for the Future of Business Education Vahid Ashrafimoghari Necdet Gurkan Jordan W. Suchow ELM 48 6 0 02 Jan 2024
DocLLM: A layout-aware generative language model for multimodal document understanding Dongsheng Wang Natraj Raman Mathieu Sibue Zhiqiang Ma Petr Babkin Simerjot Kaur Yulong Pei Armineh Nourbakhsh Xiaomo Liu VLM 24 54 0 31 Dec 2023
State of What Art? A Call for Multi-Prompt LLM Evaluation Moran Mizrahi Guy Kaplan Daniel Malkin Rotem Dror Dafna Shahaf Gabriel Stanovsky ELM 60 129 0 31 Dec 2023
keqing: knowledge-based question answering is a nature chain-of-thought mentor of LLM Chaojie Wang Yishi Xu Zhong Peng Chenxi Zhang Bo Chen Xinrun Wang Lei Feng Bo An 81 18 0 31 Dec 2023
Unicron: Economizing Self-Healing LLM Training at Scale Tao He Xue Li Zhibin Wang Kun Qian Jingbo Xu Wenyuan Yu Jingren Zhou 27 15 0 30 Dec 2023
Olapa-MCoT: Enhancing the Chinese Mathematical Reasoning Capability of LLMs Shaojie Zhu Zhaobin Wang Chengxiang Zhuo Hui Lu Bo Hu Zang Li LRM 35 0 0 29 Dec 2023
Differentially Private Low-Rank Adaptation of Large Language Model Using Federated Learning Xiao-Yang Liu Rongyi Zhu Daochen Zha Jiechao Gao Shan Zhong Matt White Meikang Qiu 29 16 0 29 Dec 2023
Fast Inference of Mixture-of-Experts Language Models with Offloading Artyom Eliseev Denis Mazur MoE 19 43 0 28 Dec 2023
Large Language Models for Conducting Advanced Text Analytics Information Systems Research Benjamin Ampel Chi-Heng Yang Junjie Hu Hsinchun Chen 50 7 0 27 Dec 2023
PanGu- $π$ : Enhancing Language Model Architectures via Nonlinearity Compensation Yunhe Wang Hanting Chen Yehui Tang Tianyu Guo Kai Han ... Qinghua Xu Qun Liu Jun Yao Chao Xu Dacheng Tao 73 17 0 27 Dec 2023
Task Contamination: Language Models May Not Be Few-Shot Anymore Changmao Li Jeffrey Flanigan 105 96 0 26 Dec 2023
Align on the Fly: Adapting Chatbot Behavior to Established Norms Chunpu Xu Steffi Chern Ethan Chern Ge Zhang Zekun Wang Ruibo Liu Jing Li Jie Fu Pengfei Liu 24 20 0 26 Dec 2023
EcomGPT-CT: Continual Pre-training of E-commerce Large Language Models with Semi-structured Data Shirong Ma Shen Huang Shulin Huang Xiaobin Wang Yangning Li Hai-Tao Zheng Pengjun Xie Fei Huang Yong-jia Jiang 53 6 0 25 Dec 2023
A Comprehensive Analysis of the Effectiveness of Large Language Models as Automatic Dialogue Evaluators Chen Zhang L. F. D’Haro Yiming Chen Malu Zhang Haizhou Li ELM 21 29 0 24 Dec 2023
Towards Efficient Generative Large Language Model Serving: A Survey from Algorithms to Systems Xupeng Miao Gabriele Oliaro Zhihao Zhang Xinhao Cheng Hongyi Jin Tianqi Chen Zhihao Jia 73 77 0 23 Dec 2023
YAYI 2: Multilingual Open-Source Large Language Models Yin Luo Qingchao Kong Nan Xu Jia Cao Bao Hao ... Zhaoxin Yu Zhengda Luo Wenji Mao Lei Wang Dajun Zeng ALM OSLM 51 7 0 22 Dec 2023
Typhoon: Thai Large Language Models Kunat Pipatanakul Phatrasek Jirabovonvisut Potsawee Manakul Sittipong Sripaisarnmongkol Ruangsak Patomwong Pathomporn Chokchainant Kasima Tharnpipitchai 52 16 0 21 Dec 2023
CORECODE: A Common Sense Annotated Dialogue Dataset with Benchmark Tasks for Chinese Large Language Models Dan Shi Chaobin You Jian-Tao Huang Taihao Li Deyi Xiong LRM 35 0 0 20 Dec 2023
Lookahead: An Inference Acceleration Framework for Large Language Model with Lossless Generation Accuracy Yao-Min Zhao Zhitian Xie Chen Liang Chenyi Zhuang Jinjie Gu 70 12 0 20 Dec 2023
Optimizing Distributed Training on Frontier for Large Language Models Sajal Dash Isaac Lyngaas Junqi Yin Xiao Wang Romain Egele Guojing Cong Feiyi Wang Prasanna Balaprakash ALM MoE 91 13 0 20 Dec 2023
Building a Llama2-finetuned LLM for Odia Language Utilizing Domain Knowledge Instruction Set Guneet Singh Kohli Shantipriya Parida Sambit Sekhar Samirit Saha Nipun B. Nair Parul Agarwal Sonal Khosla Kusumlata Patiyal Debasish Dhal 40 13 0 19 Dec 2023
Jack of All Tasks, Master of Many: Designing General-purpose Coarse-to-Fine Vision-Language Model Shraman Pramanick Guangxing Han Rui Hou Sayan Nag Ser-Nam Lim Nicolas Ballas Qifan Wang Rama Chellappa Amjad Almahairi VLM MLLM 53 29 0 19 Dec 2023
Parameter-Efficient Fine-Tuning Methods for Pretrained Language Models: A Critical Review and Assessment Lingling Xu Haoran Xie S. J. Qin Xiaohui Tao F. Wang 65 137 0 19 Dec 2023
G-LLaVA: Solving Geometric Problem with Multi-Modal Large Language Model Jiahui Gao Renjie Pi Jipeng Zhang Jiacheng Ye Wanjun Zhong ... Lanqing Hong Jianhua Han Hang Xu Zhenguo Li Lingpeng Kong SyDa ReLM LRM 52 97 0 18 Dec 2023
Split and Rephrase with Large Language Models David Ponce Thierry Etchegoyhen Jesús Calleja-Perez Harritxu Gete ReLM LRM 62 2 0 18 Dec 2023
From Good to Great: Improving Math Reasoning with Tool-Augmented Interleaf Prompting Nuo Chen Hongguang Li Baoyuan Wang Jia Li RALM ReLM LRM 28 7 0 18 Dec 2023
kNN-ICL: Compositional Task-Oriented Parsing Generalization with Nearest Neighbor In-Context Learning Wenting Zhao Ye Liu Yao Wan Yibo Wang Qingyang Wu Zhongfen Deng Jiangshu Du Shuaiqi Liu Yunlong Xu Philip S. Yu 52 7 0 17 Dec 2023
Distinguishing Translations by Human, NMT, and ChatGPT: A Linguistic and Statistical Approach Zhaokun Jiang Qianxi Lv Ziyin Zhang 32 1 0 17 Dec 2023