v1v2v3 (latest)

Measuring Massive Multitask Language Understanding

7 September 2020

Papers citing "Measuring Massive Multitask Language Understanding"

50 / 3,408 papers shown

Title
Have LLMs Advanced Enough? A Challenging Problem Solving Benchmark For Large Language Models Daman Arora H. Singh Mausam ELM LRM 134 55 0 24 May 2023
The Art of SOCRATIC QUESTIONING: Recursive Thinking with Large Language Models Jingyuan Qi Zhiyang Xu Ying Shen Minqian Liu dingnan jin Qifan Wang Lifu Huang ReLM LRM KELM 63 13 0 24 May 2023
How Predictable Are Large Language Model Capabilities? A Case Study on BIG-bench Qinyuan Ye Harvey Yiyun Fu Xiang Ren Robin Jia ELM 115 24 0 24 May 2023
In-Context Impersonation Reveals Large Language Models' Strengths and Biases Leonard Salewski Stephan Alaniz Isabel Rio-Torto Eric Schulz Zeynep Akata 102 159 0 24 May 2023
Estimating Large Language Model Capabilities without Labeled Test Data Harvey Yiyun Fu Qinyuan Ye Albert Xu Xiang Ren Robin Jia 73 9 0 24 May 2023
Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for Large Language Models Sheng Shen Le Hou Yan-Quan Zhou Nan Du Shayne Longpre ... Vincent Zhao Hongkun Yu Kurt Keutzer Trevor Darrell Denny Zhou ALM MoE 107 60 0 24 May 2023
Emergent inabilities? Inverse scaling over the course of pretraining J. Michaelov Benjamin Bergen LRM ReLM 61 3 0 24 May 2023
Increasing Probability Mass on Answer Choices Does Not Always Improve Accuracy Sarah Wiegreffe Matthew Finlayson Oyvind Tafjord Peter Clark Ashish Sabharwal 74 7 0 24 May 2023
Sources of Hallucination by Large Language Models on Inference Tasks Nick McKenna Tianyi Li Liang Cheng Mohammad Javad Hosseini Mark Johnson Mark Steedman LRM HILM 103 201 0 23 May 2023
RetICL: Sequential Retrieval of In-Context Examples with Reinforcement Learning Alexander Scarlatos Andrew Lan OffRL LRM 104 24 0 23 May 2023
Improving Factuality and Reasoning in Language Models through Multiagent Debate Yilun Du Shuang Li Antonio Torralba J. Tenenbaum Igor Mordatch LLMAG LRM 184 751 0 23 May 2023
QLoRA: Efficient Finetuning of Quantized LLMs Tim Dettmers Artidoro Pagnoni Ari Holtzman Luke Zettlemoyer ALM 163 2,641 0 23 May 2023
Query Rewriting for Retrieval-Augmented Large Language Models Xinbei Ma Yeyun Gong Pengcheng He Hai Zhao Nan Duan KELM LRM 111 115 0 23 May 2023
Enhancing Chat Language Models by Scaling High-quality Instructional Conversations Ning Ding Yulin Chen Bokai Xu Yujia Qin Zhi Zheng Shengding Hu Zhiyuan Liu Maosong Sun Bowen Zhou ALM 152 555 0 23 May 2023
Skill-Based Few-Shot Selection for In-Context Learning Shengnan An Bo Zhou Zeqi Lin Qiang Fu B. Chen Nanning Zheng Weizhu Chen Jian-Guang Lou 116 34 0 23 May 2023
Memory-Efficient Fine-Tuning of Compressed Large Language Models via sub-4-bit Integer Quantization Jeonghoon Kim J. H. Lee Sungdong Kim Joonsuk Park Kang Min Yoo S. Kwon Dongsoo Lee MQ 157 105 0 23 May 2023
Can Large Language Models Capture Dissenting Human Voices? Noah Lee Na Min An James Thorne ALM 104 32 0 23 May 2023
Aligning Large Language Models through Synthetic Feedback Sungdong Kim Sanghwan Bae Jamin Shin Soyoung Kang Donghyun Kwak Kang Min Yoo Minjoon Seo ALM SyDa 152 70 0 23 May 2023
Exploring Self-supervised Logic-enhanced Training for Large Language Models Fangkai Jiao Zhiyang Teng Bosheng Ding Zhengyuan Liu Nancy F. Chen Shafiq Joty ReLM LRM 49 5 0 23 May 2023
Knowledge of Knowledge: Exploring Known-Unknowns Uncertainty with Large Language Models Alfonso Amayuelas Kyle Wong Liangming Pan Wenhu Chen Wenjie Wang 103 29 0 23 May 2023
Polyglot or Not? Measuring Multilingual Encyclopedic Knowledge in Foundation Models Tim Schott Daniel Furman Shreshta Bhat ELM 76 4 0 23 May 2023
CLASS: A Design Framework for building Intelligent Tutoring Systems based on Learning Science principles Shashank Sonkar Lucy Liu D. B. Mallick Richard G. Baraniuk 106 42 0 22 May 2023
Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources Xingxuan Li Ruochen Zhao Yew Ken Chia Bosheng Ding Shafiq Joty Soujanya Poria Lidong Bing HILM BDL LRM 129 102 0 22 May 2023
Should We Attend More or Less? Modulating Attention for Fairness A. Zayed Gonçalo Mordido Samira Shabanian Sarath Chandar 83 10 0 22 May 2023
RWKV: Reinventing RNNs for the Transformer Era Bo Peng Eric Alcaide Quentin G. Anthony Alon Albalak Samuel Arcadinho ... Qihang Zhao P. Zhou Qinghua Zhou Jian Zhu Rui-Jie Zhu 240 614 0 22 May 2023
Iterative Forward Tuning Boosts In-Context Learning in Language Models Jiaxi Yang Binyuan Hui Min Yang Bailin Wang Bowen Li Binhua Li Fei Huang Yongbin Li 107 16 0 22 May 2023
ExplainCPE: A Free-text Explanation Benchmark of Chinese Pharmacist Examination Dongfang Li Jindi Yu Baotian Hu Zhenran Xu Hao Fei ELM 71 11 0 22 May 2023
Meta-in-context learning in large language models Julian Coda-Forno Marcel Binz Zeynep Akata M. Botvinick Jane X. Wang Eric Schulz LRM 319 44 0 22 May 2023
Enhancing Small Medical Learners with Privacy-preserving Contextual Prompting Xinlu Zhang Shiyang Li Xianjun Yang Chenxin Tian Yao Qin Linda R. Petzold 131 9 0 22 May 2023
Model-Generated Pretraining Signals Improves Zero-Shot Generalization of Text-to-Text Transformers Linyuan Gong Chenyan Xiong Xiaodong Liu Payal Bajaj Yiqing Xie Alvin Cheung Jianfeng Gao Xia Song VLM AI4CE 70 2 0 21 May 2023
Evaluating the Performance of Large Language Models on GAOKAO Benchmark Xiaotian Zhang Chun-yan Li Yi Zong Zhengyu Ying Liang He Xipeng Qiu ALM ELM 122 115 0 21 May 2023
VNHSGE: VietNamese High School Graduation Examination Dataset for Large Language Models Dao Xuan-Quy Le Ngoc-Bich Vo The-Duy Phan Xuan-Dung Ngo Bac-Bien Nguyen Van-Tien Nguyen Thi-My-Thanh Nguyen Hong-Phuoc 61 16 0 20 May 2023
Evaluation of medium-large Language Models at zero-shot closed book generative question answering René Peinl Johannes Wirth ELM 47 7 0 19 May 2023
Prompting with Pseudo-Code Instructions Mayank Mishra Praveen Venkateswaran Riyaz Ahmad Bhat V. Rudramurthy Danish Contractor Srikanth G. Tamilselvam 107 14 0 19 May 2023
Separating form and meaning: Using self-consistency to quantify task understanding across multiple senses Xenia Ohmer Elia Bruni Dieuwke Hupkes LRM 111 16 0 19 May 2023
Examining Inter-Consistency of Large Language Models Collaboration: An In-depth Analysis via Debate Kai Xiong Xiao Ding Yixin Cao Ting Liu Bing Qin 117 78 0 19 May 2023
Compress, Then Prompt: Improving Accuracy-Efficiency Trade-off of LLM Inference with Transferable Prompt Zhaozhuo Xu Zirui Liu Beidi Chen Yuxin Tang Jue Wang Kaixiong Zhou Helen Zhou Anshumali Shrivastava MQ 96 32 0 17 May 2023
M3KE: A Massive Multi-Level Multi-Subject Knowledge Evaluation Benchmark for Chinese Large Language Models Chuang Liu Renren Jin Yuqi Ren Linhao Yu Tianyu Dong ... Peiyi Zhang Qingqing Lyu Xiaowen Su Qun Liu Deyi Xiong ELM ALM 119 26 0 17 May 2023
Knowledge Card: Filling LLMs' Knowledge Gaps with Plug-in Specialized Language Models Shangbin Feng Weijia Shi Yuyang Bai Vidhisha Balachandran Tianxing He Yulia Tsvetkov KELM 133 37 0 17 May 2023
C-Eval: A Multi-Level Multi-Discipline Chinese Evaluation Suite for Foundation Models Yuzhen Huang Yuzhuo Bai Zhihao Zhu Junlei Zhang Jinghan Zhang ... Yikai Zhang Jiayi Lei Yao Fu Maosong Sun Junxian He ELM LRM 144 552 0 15 May 2023
Symbol tuning improves in-context learning in language models Jerry W. Wei Le Hou Andrew Kyle Lampinen Xiangning Chen Da Huang ... Xinyun Chen Yifeng Lu Denny Zhou Tengyu Ma Quoc V. Le LRM 90 80 0 15 May 2023
Not All Languages Are Created Equal in LLMs: Improving Multilingual Capability by Cross-Lingual-Thought Prompting Haoyang Huang Tianyi Tang Dongdong Zhang Wayne Xin Zhao Ting Song Yan Xia Furu Wei LRM 114 179 0 11 May 2023
Active Retrieval Augmented Generation Zhengbao Jiang Frank F. Xu Luyu Gao Zhiqing Sun Qian Liu Jane Dwivedi-Yu Yiming Yang Jamie Callan Graham Neubig RALM 102 294 0 11 May 2023
Taking Advice from ChatGPT Peter Zhang 70 5 0 11 May 2023
Long-Tailed Question Answering in an Open World Yinpei Dai Hao Lang Yinhe Zheng Fei Huang Yongbin Li VLM 76 9 0 11 May 2023
RECKONING: Reasoning through Dynamic Knowledge Encoding Zeming Chen Gail Weiss E. Mitchell Asli Celikyilmaz Antoine Bosselut KELM LRM 106 13 0 10 May 2023
Multilingual LLMs are Better Cross-lingual In-context Learners with Alignment Eshaan Tanwar Subhabrata Dutta Manish Borthakur Tanmoy Chakraborty 101 57 0 10 May 2023
StarCoder: may the source be with you! Raymond Li Loubna Ben Allal Yangtian Zi Niklas Muennighoff Denis Kocetkov ... Sean M. Hughes Thomas Wolf Arjun Guha Leandro von Werra H. D. Vries 149 799 0 09 May 2023
The Current State of Summarization Fabian Retkowski 78 6 0 08 May 2023
How Do In-Context Examples Affect Compositional Generalization? Shengnan An Zeqi Lin Qiang Fu B. Chen Nanning Zheng Jian-Guang Lou Dongmei Zhang 121 55 0 08 May 2023