Title
How Predictable Are Large Language Model Capabilities? A Case Study on BIG-bench Qinyuan Ye Harvey Yiyun Fu Xiang Ren Robin Jia ELM 26 21 0 24 May 2023
Universal Self-Adaptive Prompting Xingchen Wan Ruoxi Sun Hootan Nakhost H. Dai Julian Martin Eisenschlos Sercan Ö. Arik Tomas Pfister LRM 38 9 0 24 May 2023
Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for Large Language Models Sheng Shen Le Hou Yan-Quan Zhou Nan Du Shayne Longpre ... Vincent Zhao Hongkun Yu Kurt Keutzer Trevor Darrell Denny Zhou ALM MoE 35 54 0 24 May 2023
Do prompt positions really matter? Junyu Mao Stuart E. Middleton Mahesan Niranjan VLM 31 3 0 23 May 2023
Navigating Prompt Complexity for Zero-Shot Classification: A Study of Large Language Models in Computational Social Science Yida Mu Benze Wu William Thorne Ambrose Robinson Nikolaos Aletras Carolina Scarton Kalina Bontcheva Xingyi Song 23 18 0 23 May 2023
VIP5: Towards Multimodal Foundation Models for Recommendation Shijie Geng Juntao Tan Shuchang Liu Zuohui Fu Yongfeng Zhang 29 69 0 23 May 2023
Dr.ICL: Demonstration-Retrieved In-context Learning Man Luo Xin Xu Zhuyun Dai Panupong Pasupat Mehran Kazemi Chitta Baral Vaiva Imbrasaite Vincent Zhao RALM 26 48 0 23 May 2023
The CoT Collection: Improving Zero-shot and Few-shot Learning of Language Models via Chain-of-Thought Fine-Tuning Seungone Kim Se June Joo Doyoung Kim Joel Jang Seonghyeon Ye Jamin Shin Minjoon Seo ALM RALM LRM 23 96 0 23 May 2023
PaD: Program-aided Distillation Can Teach Small Models Reasoning Better than Chain-of-thought Fine-tuning Xuekai Zhu Biqing Qi Kaiyan Zhang Xingwei Long Zhouhan Lin Bowen Zhou ALM LRM 38 19 0 23 May 2023
Learning from Mistakes via Cooperative Study Assistant for Large Language Models Danqing Wang Lei Li 32 6 0 23 May 2023
Exploring Self-supervised Logic-enhanced Training for Large Language Models Fangkai Jiao Zhiyang Teng Bosheng Ding Zhengyuan Liu Nancy F. Chen Shafiq R. Joty ReLM LRM 32 4 0 23 May 2023
Can ChatGPT Defend its Belief in Truth? Evaluating LLM Reasoning via Debate Boshi Wang Xiang Yue Huan Sun ELM LRM 46 60 0 22 May 2023
Lion: Adversarial Distillation of Proprietary Large Language Models Yuxin Jiang Chunkit Chan Mingyang Chen Wei Wang ALM 28 23 0 22 May 2023
Evaluation of medium-large Language Models at zero-shot closed book generative question answering René Peinl Johannes Wirth ELM 26 7 0 19 May 2023
Post Hoc Explanations of Language Models Can Improve Language Models Satyapriya Krishna Jiaqi Ma Dylan Slack Asma Ghandeharioun Sameer Singh Himabindu Lakkaraju ReLM LRM 28 54 0 19 May 2023
Instruction Tuned Models are Quick Learners Himanshu Gupta Saurabh Arjun Sawant Swaroop Mishra Mutsumi Nakamura Arindam Mitra Santosh Mashetty Chitta Baral 26 26 0 17 May 2023
PaLM 2 Technical Report Rohan Anil Andrew M. Dai Orhan Firat Melvin Johnson Dmitry Lepikhin ... Ce Zheng Wei Zhou Denny Zhou Slav Petrov Yonghui Wu ReLM LRM 110 1,148 0 17 May 2023
LeTI: Learning to Generate from Textual Interactions Xingyao Wang Hao Peng Reyhaneh Jabbarvand Heng Ji 35 30 0 17 May 2023
Reprompting: Automated Chain-of-Thought Prompt Inference Through Gibbs Sampling Weijia Xu Andrzej Banburski-Fahey Nebojsa Jojic ReLM LRM 21 32 0 17 May 2023
Natural Language Decomposition and Interpretation of Complex Utterances Harsh Jhamtani Hao Fang Patrick Xia Eran Levy Jacob Andreas Benjamin Van Durme ReLM 23 7 0 15 May 2023
C-Eval: A Multi-Level Multi-Discipline Chinese Evaluation Suite for Foundation Models Yuzhen Huang Yuzhuo Bai Zhihao Zhu Junlei Zhang Jinghan Zhang ... Yikai Zhang Jiayi Lei Yao Fu Maosong Sun Junxian He ELM LRM 22 497 0 15 May 2023
Symbol tuning improves in-context learning in language models Jerry W. Wei Le Hou Andrew Kyle Lampinen Xiangning Chen Da Huang ... Xinyun Chen Yifeng Lu Denny Zhou Tengyu Ma Quoc V. Le LRM 28 73 0 15 May 2023
CodeIE: Large Code Generation Models are Better Few-Shot Information Extractors Peng Li Tianxiang Sun Qiong Tang Hang Yan Yuanbin Wu Xuanjing Huang Technology SyDa 36 67 0 09 May 2023
Read, Diagnose and Chat: Towards Explainable and Interactive LLMs-Augmented Depression Detection in Social Media Wei Qin Zetong Chen Lei Wang Yunshi Lan Wei Ren Richang Hong AI4MH 30 18 0 09 May 2023
Prompted LLMs as Chatbot Modules for Long Open-domain Conversation Gibbeum Lee Volker Hartmann Jongho Park Dimitris Papailiopoulos Kangwook Lee 27 62 0 08 May 2023
Language Models Don't Always Say What They Think: Unfaithful Explanations in Chain-of-Thought Prompting Miles Turpin Julian Michael Ethan Perez Sam Bowman ReLM LRM 27 383 0 07 May 2023
Plan-and-Solve Prompting: Improving Zero-Shot Chain-of-Thought Reasoning by Large Language Models Lei Wang Wanyu Xu Yihuai Lan Zhiqiang Hu Yunshi Lan Roy Ka-Wei Lee Ee-Peng Lim ReLM LRM 34 314 0 06 May 2023
Faithful Question Answering with Monte-Carlo Planning Ruixin Hong Hongming Zhang Honghui Zhao Dong Yu Changshui Zhang ReLM LRM 58 19 0 04 May 2023
Few-shot In-context Learning for Knowledge Base Question Answering Tianle Li Xueguang Ma Alex Zhuang Yu Gu Yu-Chuan Su Wenhu Chen 96 76 0 02 May 2023
Causal Reasoning and Large Language Models: Opening a New Frontier for Causality Emre Kıcıman Robert Osazuwa Ness Amit Sharma Chenhao Tan LRM ELM 24 259 0 28 Apr 2023
Exploring the Curious Case of Code Prompts Li Zhang Liam Dugan Hainiu Xu Chris Callison-Burch LRM 45 14 0 26 Apr 2023
An Evaluation on Large Language Model Outputs: Discourse and Memorization Adrian de Wynter Xun Wang Alex Sokolov Qilong Gu Si-Qing Chen ELM 87 32 0 17 Apr 2023
Towards Better Instruction Following Language Models for Chinese: Investigating the Impact of Training Data and Evaluation Yunjie Ji Yan Gong Yong Deng Yiping Peng Qiang Niu Baochang Ma Xiangang Li ALM ELM 22 22 0 16 Apr 2023
VISAR: A Human-AI Argumentative Writing Assistant with Visual Programming and Rapid Draft Prototyping Zheng Zhang Jie Ying Gao Ranjodh Singh Dhaliwal Toby Jia-Jun Li 33 86 0 16 Apr 2023
Teaching Large Language Models to Self-Debug Xinyun Chen Maxwell Lin Nathanael Scharli Denny Zhou LRM 36 639 0 11 Apr 2023
Mastering Symbolic Operations: Augmenting Language Models with Compiled Neural Networks Yixuan Weng Minjun Zhu Fei Xia Bin Li Shizhu He Kang Liu Jun Zhao 36 5 0 04 Apr 2023
BloombergGPT: A Large Language Model for Finance Shijie Wu Ozan Irsoy Steven Lu Vadim Dabravolski Mark Dredze Sebastian Gehrmann P. Kambadur David S. Rosenberg Gideon Mann AIFin 76 786 0 30 Mar 2023
When Brain-inspired AI Meets AGI Lin Zhao Lu Zhang Zihao Wu Yuzhong Chen Haixing Dai ... Xi Jiang Xiang Li Dajiang Zhu Dinggang Shen Tianming Liu AI4CE 32 89 0 28 Mar 2023
Exploring the Impact of Instruction Data Scaling on Large Language Models: An Empirical Study on Real-World Use Cases Yunjie Ji Yong Deng Yan Gong Yiping Peng Qiang Niu L. Zhang Baochang Ma Xiangang Li ALM 19 93 0 26 Mar 2023
Natural Language Reasoning, A Survey Fei Yu Hongbo Zhang Prayag Tiwari Benyou Wang ReLM LRM 49 51 0 26 Mar 2023
GPT is becoming a Turing machine: Here are some ways to program it A. Jojic Zhen Wang Nebojsa Jojic LRM 55 17 0 25 Mar 2023
Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language Models Qingyu Lu Baopu Qiu Liang Ding Liping Xie Tom Kocmi Dacheng Tao LRM ALM ELM 26 107 0 24 Mar 2023
Language Model Behavior: A Comprehensive Survey Tyler A. Chang Benjamin Bergen VLM LRM LM&MA 27 103 0 20 Mar 2023
Large Language Model Instruction Following: A Survey of Progresses and Challenges Renze Lou Kai Zhang Wenpeng Yin ALM LRM 32 20 0 18 Mar 2023
ART: Automatic multi-step reasoning and tool-use for large language models Bhargavi Paranjape Scott M. Lundberg Sameer Singh Hannaneh Hajishirzi Luke Zettlemoyer Marco Tulio Ribeiro KELM ReLM LRM 23 140 0 16 Mar 2023
A Theory of Emergent In-Context Learning as Implicit Structure Induction Michael Hahn Navin Goyal LRM 8 74 0 14 Mar 2023
ICL-D3IE: In-Context Learning with Diverse Demonstrations Updating for Document Information Extraction Jiabang He Lei Wang Yingpeng Hu Ning Liu Hui-juan Liu Xingdong Xu Hengtao Shen MLLM 6 47 0 09 Mar 2023
Auditing large language models: a three-layered approach Jakob Mokander Jonas Schuett Hannah Rose Kirk Luciano Floridi AILaw MLAU 48 194 0 16 Feb 2023
Augmented Language Models: a Survey Grégoire Mialon Roberto Dessì Maria Lomeli Christoforos Nalmpantis Ramakanth Pasunuru ... Jane Dwivedi-Yu Asli Celikyilmaz Edouard Grave Yann LeCun Thomas Scialom LRM KELM 47 367 0 15 Feb 2023
The Capacity for Moral Self-Correction in Large Language Models Deep Ganguli Amanda Askell Nicholas Schiefer Thomas I. Liao Kamil.e Lukovsiut.e ... Tom B. Brown C. Olah Jack Clark Sam Bowman Jared Kaplan LRM ReLM 45 158 0 15 Feb 2023