v1v2v3 (latest)

Measuring Massive Multitask Language Understanding

7 September 2020

Papers citing "Measuring Massive Multitask Language Understanding"

50 / 3,408 papers shown

Title
Towards Consistent Natural-Language Explanations via Explanation-Consistency Finetuning Yanda Chen Chandan Singh Xiaodong Liu Simiao Zuo Bin Yu He He Jianfeng Gao LRM 81 14 0 25 Jan 2024
MoE-Infinity: Efficient MoE Inference on Personal Machines with Sparsity-Aware Expert Cache Leyang Xue Yao Fu Zhan Lu Luo Mai Mahesh K. Marina MoE 85 4 0 25 Jan 2024
Demystifying Chains, Trees, and Graphs of Thoughts Maciej Besta Florim Memedi Zhenyu Zhang Robert Gerstenberger Guangyuan Piao ... Aleš Kubíček H. Niewiadomski Aidan O'Mahony Onur Mutlu Torsten Hoefler AI4CE LRM 368 33 0 25 Jan 2024
SpacTor-T5: Pre-training T5 Models with Span Corruption and Replaced Token Detection Ke Ye Heinrich Jiang Afshin Rostamizadeh Ayan Chakrabarti Giulia DeSalvo Jean-François Kagy Lazaros Karydas Gui Citovsky Sanjiv Kumar 66 0 0 24 Jan 2024
Benchmarking LLMs via Uncertainty Quantification Fanghua Ye Mingming Yang Jianhui Pang Longyue Wang Derek F. Wong Emine Yilmaz Shuming Shi Zhaopeng Tu ELM 249 59 0 23 Jan 2024
GRATH: Gradual Self-Truthifying for Large Language Models Weixin Chen Basel Alomair Yue Liu HILM SyDa 49 6 0 22 Jan 2024
APT: Adaptive Pruning and Tuning Pretrained Language Models for Efficient Training and Inference Bowen Zhao Hannaneh Hajishirzi Qingqing Cao 127 21 0 22 Jan 2024
Large Language Model based Multi-Agents: A Survey of Progress and Challenges Taicheng Guo Preslav Nakov Yaqi Wang Ruidi Chang Shichao Pei Nitesh Chawla Olaf Wiest Xiangliang Zhang LLMAG LM&Ro AI4CE LRM 166 334 0 21 Jan 2024
Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback Songyang Gao Qiming Ge Wei Shen Shihan Dou Junjie Ye ... Yicheng Zou Zhi Chen Hang Yan Qi Zhang Dahua Lin 78 11 0 21 Jan 2024
Instructional Fingerprinting of Large Language Models Lyne Tchapmi Fei Wang Mingyu Derek Ma Pang Wei Koh Chaowei Xiao Muhao Chen WaLM 67 33 0 21 Jan 2024
Orion-14B: Open-source Multilingual Large Language Models Du Chen Yi Huang Xiaopu Li Yongqiang Li Yongqiang Liu Haihui Pan Leichao Xu Dacheng Zhang Zhipeng Zhang Kun Han 62 4 0 20 Jan 2024
Pruning for Protection: Increasing Jailbreak Resistance in Aligned LLMs Without Fine-Tuning Adib Hasan Ileana Rugina Alex Wang AAML 96 24 0 19 Jan 2024
Knowledge Verification to Nip Hallucination in the Bud Fanqi Wan Xinting Huang Leyang Cui Xiaojun Quan Wei Bi Shuming Shi HILM 61 4 0 19 Jan 2024
LangBridge: Multilingual Reasoning Without Multilingual Supervision Dongkeun Yoon Joel Jang Sungdong Kim Seungone Kim Sheikh Shafayat Minjoon Seo LRM 56 15 0 19 Jan 2024
Sowing the Wind, Reaping the Whirlwind: The Impact of Editing Language Models Rima Hazra Sayan Layek Somnath Banerjee Soujanya Poria KELM 106 20 0 19 Jan 2024
SocraSynth: Multi-LLM Reasoning with Conditional Statistics Edward Y. Chang LLMAG LRM 82 8 0 19 Jan 2024
Sketch-Guided Constrained Decoding for Boosting Blackbox Large Language Models without Logit Access Saibo Geng Berkay Döner Chris Wendler Martin Josifoski Robert West 107 4 0 18 Jan 2024
Self-Rewarding Language Models Weizhe Yuan Richard Yuanzhe Pang Kyunghyun Cho Xian Li Sainbayar Sukhbaatar Jing Xu Jason Weston ReLM SyDa ALM LRM 403 340 0 18 Jan 2024
Evaluating LLMs' Mathematical and Coding Competency through Ontology-guided Interventions Pengfei Hong Navonil Majumder Deepanway Ghosal Somak Aditya Rada Mihalcea Soujanya Poria LRM 99 5 0 17 Jan 2024
Augmenting Math Word Problems via Iterative Question Composing Haoxiong Liu Yifan Zhang Yifan Luo Andrew Chi-Chih Yao SyDa LRM 151 46 0 17 Jan 2024
Understanding User Experience in Large Language Model Interactions Jiayin Wang Weizhi Ma Peijie Sun Min Zhang Jian-yun Nie 80 36 0 16 Jan 2024
The What, Why, and How of Context Length Extension Techniques in Large Language Models -- A Detailed Survey Saurav Pawar S.M. Towhidul Islam Tonmoy S. M. M. Zaman Vinija Jain Aman Chadha Amitava Das 68 29 0 15 Jan 2024
Improving Domain Adaptation through Extended-Text Reading Comprehension Ting Jiang Shaohan Huang Shengyue Luo Zihan Zhang Haizhen Huang ... Weiwei Deng Feng Sun Qi Zhang Deqing Wang Fuzhen Zhuang AI4CE 89 11 0 14 Jan 2024
Quantized Side Tuning: Fast and Memory-Efficient Tuning of Quantized Large Language Models Zhengxin Zhang Dan Zhao Xupeng Miao Gabriele Oliaro Qing Li Yong Jiang Zhihao Jia MQ 90 9 0 13 Jan 2024
Knowledge Distillation for Closed-Source Language Models Hongzhan Chen Xiaojun Quan Hehong Chen Ming Yan Ji Zhang BDL 49 2 0 13 Jan 2024
The Unreasonable Effectiveness of Easy Training Data for Hard Tasks Peter Hase Mohit Bansal Peter Clark Sarah Wiegreffe 158 35 0 12 Jan 2024
Relying on the Unreliable: The Impact of Language Models' Reluctance to Express Uncertainty Kaitlyn Zhou Jena D. Hwang Xiang Ren Maarten Sap 94 68 0 12 Jan 2024
An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models Gantavya Bhatt Yifang Chen Arnav M. Das Jifan Zhang Sang T. Truong ... Jeff Bilmes S. Du Kevin Jamieson Jordan T. Ash Robert D. Nowak 115 15 0 12 Jan 2024
Intention Analysis Makes LLMs A Good Jailbreak Defender Yuqi Zhang Liang Ding Lefei Zhang Dacheng Tao LLMSV 78 29 0 12 Jan 2024
AntEval: Evaluation of Social Interaction Competencies in LLM-Driven Agents Yuanzhi Liang Linchao Zhu Yi Yang LLMAG 62 0 0 12 Jan 2024
PersianMind: A Cross-Lingual Persian-English Large Language Model Pedram Rostami Ali Salemi M. Dousti CLL LRM 56 5 0 12 Jan 2024
Extreme Compression of Large Language Models via Additive Quantization Vage Egiazarian Andrei Panferov Denis Kuznedelev Elias Frantar Artem Babenko Dan Alistarh MQ 207 105 0 11 Jan 2024
Improving Large Language Models via Fine-grained Reinforcement Learning with Minimum Editing Constraint Zhipeng Chen Kun Zhou Wayne Xin Zhao Junchen Wan Fuzheng Zhang Di Zhang Ji-Rong Wen KELM 106 35 0 11 Jan 2024
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models Damai Dai Chengqi Deng Chenggang Zhao R. X. Xu Huazuo Gao ... Panpan Huang Fuli Luo Chong Ruan Zhifang Sui W. Liang MoE 127 321 0 11 Jan 2024
Investigating Data Contamination for Pre-training Language Models Minhao Jiang Ken Ziyu Liu Ming Zhong Rylan Schaeffer Siru Ouyang Jiawei Han Sanmi Koyejo 101 72 0 11 Jan 2024
Designing Heterogeneous LLM Agents for Financial Sentiment Analysis Frank Xing AIFin 106 58 0 11 Jan 2024
Scaling Laws for Forgetting When Fine-Tuning Large Language Models Damjan Kalajdzievski CLL 91 12 0 11 Jan 2024
REBUS: A Robust Evaluation Benchmark of Understanding Symbols Andrew Gritsevskiy Arjun Panickssery Aaron Kirtland Derik Kauffman Hans Gundlach Irina Gritsevskaya Joe Cavanagh Jonathan Chiang Lydia La Roux Michelle Hung ReLM 44 1 0 11 Jan 2024
DCR: Divide-and-Conquer Reasoning for Multi-choice Question Answering with LLMs Zijie Meng Yan Zhang Zhaopeng Feng Zuozhu Liu LRM 72 5 0 10 Jan 2024
ANGO: A Next-Level Evaluation Benchmark For Generation-Oriented Language Models In Chinese Domain Bingchao Wang ALM ELM 20 0 0 10 Jan 2024
How predictable is language model benchmark performance? David Owen ELM LRM 96 22 0 09 Jan 2024
RoSA: Accurate Parameter-Efficient Fine-Tuning via Robust Adaptation Mahdi Nikdan Soroush Tabesh Elvir Crnčević Dan Alistarh 121 32 0 09 Jan 2024
Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths in Large Language Models Zhen Qin Weigao Sun Dong Li Xuyang Shen Weixuan Sun Yiran Zhong 121 28 0 09 Jan 2024
MERA: A Comprehensive LLM Evaluation in Russian Alena Fenogenova Artem Chervyakov Nikita Martynov Anastasia Kozlova Maria Tikhonova ... Nikita Savushkin Polina Mikhailova Denis Dimitrov Alexander Panchenko Sergey Markov ELM 97 12 0 09 Jan 2024
TransportationGames: Benchmarking Transportation Knowledge of (Multimodal) Large Language Models Xue Zhang Xiangyu Shi Xinyue Lou Rui Qi Yufeng Chen Jinan Xu Wenjuan Han 77 5 0 09 Jan 2024
Mixtral of Experts Albert Q. Jiang Alexandre Sablayrolles Antoine Roux A. Mensch Blanche Savary ... Théophile Gervet Thibaut Lavril Thomas Wang Timothée Lacroix William El Sayed MoE LLMAG 173 1,129 0 08 Jan 2024
TeleChat Technical Report Zhongjiang He Zihan Wang Xinzhan Liu Shixuan Liu Yitong Yao ... Zilu Huang Sishi Xiong Yuxiang Zhang Chao Wang Shuangyong Song AI4MH LRM ALM 89 4 0 08 Jan 2024
InFoBench: Evaluating Instruction Following Ability in Large Language Models Yiwei Qin Kaiqiang Song Yebowen Hu Wenlin Yao Sangwoo Cho Xiaoyang Wang Xuansheng Wu Fei Liu Pengfei Liu Dong Yu ELM 104 52 0 07 Jan 2024
Examining Forgetting in Continual Pre-training of Aligned Large Language Models Chen-An Li Hung-Yi Lee CLL KELM 53 11 0 06 Jan 2024
DeepSeek LLM: Scaling Open-Source Language Models with Longtermism DeepSeek-AI Xiao Bi : Xiao Bi Deli Chen Guanting Chen ... Yao Zhao Shangyan Zhou Shunfeng Zhou Qihao Zhu Yuheng Zou LRM ALM 206 381 0 05 Jan 2024