Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?

25 February 2022

Luke Zettlemoyer

Papers citing "Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?"

50 / 973 papers shown

Title
Tuning Language Models as Training Data Generators for Augmentation-Enhanced Few-Shot Learning Yu Meng Martin Michalski Jiaxin Huang Yu Zhang Tarek F. Abdelzaher Jiawei Han VLM 51 46 0 06 Nov 2022
LMentry: A Language Model Benchmark of Elementary Language Tasks Avia Efrat Or Honovich Omer Levy 29 19 0 03 Nov 2022
Two-stage LLM Fine-tuning with Less Specialization and More Generalization Yihan Wang Si Si Daliang Li Michal Lukasik Felix X. Yu Cho-Jui Hsieh Inderjit S Dhillon Sanjiv Kumar 43 29 0 01 Nov 2022
Learning New Tasks from a Few Examples with Soft-Label Prototypes Avyav Kumar Singh Ekaterina Shutova H. Yannakoudakis VLM 27 0 0 31 Oct 2022
Pneg: Prompt-based Negative Response Generation for Dialogue Response Selection Task Nyoungwoo Lee chaeHun Park Ho-Jin Choi Jaegul Choo 22 6 0 31 Oct 2022
Don't Prompt, Search! Mining-based Zero-Shot Learning with Language Models Mozes van de Kar Mengzhou Xia Danqi Chen Mikel Artetxe 39 19 0 26 Oct 2022
A Case for Business Process-Specific Foundation Models Yara Rizk Praveen Venkateswaran Vatche Isahagian Vinod Muthusamy AI4CE 31 9 0 26 Oct 2022
Same Pre-training Loss, Better Downstream: Implicit Bias Matters for Language Models Hong Liu Sang Michael Xie Zhiyuan Li Tengyu Ma AI4CE 40 49 0 25 Oct 2022
Weakly Supervised Data Augmentation Through Prompting for Dialogue Understanding Maximillian Chen Alexandros Papangelis Chenyang Tao Andrew Rosenbaum Seokhwan Kim Yang Liu Zhou Yu Dilek Z. Hakkani-Tür 39 32 0 25 Oct 2022
Code4Struct: Code Generation for Few-Shot Event Structure Prediction Xingyao Wang Sha Li Heng Ji 23 75 0 23 Oct 2022
ProGen: Progressive Zero-shot Dataset Generation via In-context Feedback Jiacheng Ye Jiahui Gao Jiangtao Feng Zhiyong Wu Tao Yu Lingpeng Kong SyDa VLM 76 72 0 22 Oct 2022
TabLLM: Few-shot Classification of Tabular Data with Large Language Models S. Hegselmann Alejandro Buendia Hunter Lang Monica Agrawal Xiaoyi Jiang David Sontag LMTD 55 211 0 19 Oct 2022
Schema-aware Reference as Prompt Improves Data-Efficient Knowledge Graph Construction Yunzhi Yao Shengyu Mao Ningyu Zhang Xiangnan Chen Shumin Deng Xi Chen Huajun Chen 28 9 0 19 Oct 2022
Robustness of Demonstration-based Learning Under Limited Data Scenario Hongxin Zhang Yanzhe Zhang Ruiyi Zhang Diyi Yang 40 13 0 19 Oct 2022
Challenging BIG-Bench Tasks and Whether Chain-of-Thought Can Solve Them Mirac Suzgun Nathan Scales Nathanael Scharli Sebastian Gehrmann Yi Tay ... Aakanksha Chowdhery Quoc V. Le Ed H. Chi Denny Zhou Jason W. Wei ALM ELM LRM ReLM 92 997 0 17 Oct 2022
Prompting GPT-3 To Be Reliable Chenglei Si Zhe Gan Zhengyuan Yang Shuohang Wang Jianfeng Wang Jordan L. Boyd-Graber Lijuan Wang KELM LRM 50 279 0 17 Oct 2022
Bootstrapping Multilingual Semantic Parsers using Large Language Models Abhijeet Awasthi Nitish Gupta Bidisha Samanta Shachi Dave Sunita Sarawagi Partha P. Talukdar 37 7 0 13 Oct 2022
Data-Efficiency with a Single GPU: An Exploration of Transfer Methods for Small Language Models Alon Albalak Akshat Shrivastava Chinnadhurai Sankar Adithya Sagar Mike Ross 32 3 0 08 Oct 2022
AlphaTuning: Quantization-Aware Parameter-Efficient Adaptation of Large-Scale Pre-Trained Language Models S. Kwon Jeonghoon Kim Jeongin Bae Kang Min Yoo Jin-Hwa Kim Baeseong Park Byeongwook Kim Jung-Woo Ha Nako Sung Dongsoo Lee MQ 29 30 0 08 Oct 2022
Automatic Chain of Thought Prompting in Large Language Models Zhuosheng Zhang Aston Zhang Mu Li Alexander J. Smola ReLM LRM 67 575 0 07 Oct 2022
Achieving and Understanding Out-of-Distribution Generalization in Systematic Reasoning in Small-Scale Transformers A. Nam Mustafa Abdool Trevor C. Maxfield James L. McClelland NAI LRM AI4CE 28 1 0 07 Oct 2022
Efficiently Enhancing Zero-Shot Performance of Instruction Following Model via Retrieval of Soft Prompt Seonghyeon Ye Joel Jang Doyoung Kim Yongrae Jo Minjoon Seo VLM 36 2 0 06 Oct 2022
Guess the Instruction! Flipped Learning Makes Language Models Stronger Zero-Shot Learners Seonghyeon Ye Doyoung Kim Joel Jang Joongbo Shin Minjoon Seo FedML VLM UQCV LRM 19 25 0 06 Oct 2022
Can Large Language Models Truly Understand Prompts? A Case Study with Negated Prompts Joel Jang Seonghyeon Ye Minjoon Seo ELM LRM 95 64 0 26 Sep 2022
News Summarization and Evaluation in the Era of GPT-3 Tanya Goyal Junyi Jessy Li Greg Durrett ELM 29 385 0 26 Sep 2022
WinoDict: Probing language models for in-context word acquisition Julian Martin Eisenschlos Jeremy R. Cole Fangyu Liu William W. Cohen KELM 24 11 0 25 Sep 2022
In-context Learning and Induction Heads Catherine Olsson Nelson Elhage Neel Nanda Nicholas Joseph Nova Dassarma ... Tom B. Brown Jack Clark Jared Kaplan Sam McCandlish C. Olah 250 460 0 24 Sep 2022
Selecting Better Samples from Pre-trained LLMs: A Case Study on Question Generation Xingdi Yuan Tong Wang Yen-Hsiang Wang Emery Fine Rania Abdelghani Pauline Lucas Hélene Sauzéon Pierre-Yves Oudeyer 30 29 0 22 Sep 2022
NL2INTERFACE: Interactive Visualization Interface Generation from Natural Language Queries Yiru Chen Ryan Li Austin Mac Tianbao Xie Tao Yu Eugene Wu 38 13 0 19 Sep 2022
Text and Patterns: For Effective Chain of Thought, It Takes Two to Tango Aman Madaan Amir Yazdanbakhsh LRM 151 116 0 16 Sep 2022
On the Relation between Sensitivity and Accuracy in In-context Learning Yanda Chen Chen Zhao Zhou Yu Kathleen McKeown He He 182 77 0 16 Sep 2022
Selective Annotation Makes Language Models Better Few-Shot Learners Hongjin Su Jungo Kasai Chen Henry Wu Weijia Shi Tianlu Wang ... Rui Zhang Mari Ostendorf Luke Zettlemoyer Noah A. Smith Tao Yu 17 244 0 05 Sep 2022
Let Me Check the Examples: Enhancing Demonstration Learning via Explicit Imitation Sirui Wang Kaiwen Wei Hongzhi Zhang Yun Li Wei Yu Wu 34 2 0 31 Aug 2022
What Can Transformers Learn In-Context? A Case Study of Simple Function Classes Shivam Garg Dimitris Tsipras Percy Liang Gregory Valiant 26 449 0 01 Aug 2022
Dynamically Retrieving Knowledge via Query Generation for Informative Dialogue Generation Zhongtian Hu Lifang Wang Yangqi Chen Yushuang Liu Ronghan Li Meng Zhao Xinyu Lu Zejun Jiang 22 7 0 30 Jul 2022
TalkToModel: Explaining Machine Learning Models with Interactive Natural Language Conversations Dylan Slack Satyapriya Krishna Himabindu Lakkaraju Sameer Singh 24 74 0 08 Jul 2022
Emergent Abilities of Large Language Models Jason W. Wei Yi Tay Rishi Bommasani Colin Raffel Barret Zoph ... Tatsunori Hashimoto Oriol Vinyals Percy Liang J. Dean W. Fedus ELM ReLM LRM 60 2,344 0 15 Jun 2022
LIFT: Language-Interfaced Fine-Tuning for Non-Language Machine Learning Tasks Tuan Dinh Yuchen Zeng Ruisu Zhang Ziqian Lin Michael Gira Shashank Rajput Jy-yong Sohn Dimitris Papailiopoulos Kangwook Lee LMTD 39 126 0 14 Jun 2022
Making Large Language Models Better Reasoners with Step-Aware Verifier Yifei Li Zeqi Lin Shizhuo Zhang Qiang Fu B. Chen Jian-Guang Lou Weizhu Chen ReLM LRM 36 210 0 06 Jun 2022
Large Language Models are Few-Shot Clinical Information Extractors Monica Agrawal S. Hegselmann Hunter Lang Yoon Kim David Sontag BDL LM&MA 167 334 0 25 May 2022
Ground-Truth Labels Matter: A Deeper Look into Input-Label Demonstrations Kang Min Yoo Junyeob Kim Hyuhng Joon Kim Hyunsoo Cho Hwiyeol Jo Sang-Woo Lee Sang-goo Lee Taeuk Kim 31 123 0 25 May 2022
InstructDial: Improving Zero and Few-shot Generalization in Dialogue through Instruction Tuning Prakhar Gupta Cathy Jiao Yi-Ting Yeh Shikib Mehri M. Eskénazi Jeffrey P. Bigham ALM 41 47 0 25 May 2022
RLPrompt: Optimizing Discrete Text Prompts with Reinforcement Learning Mingkai Deng Jianyu Wang Cheng-Ping Hsieh Yihan Wang Han Guo Tianmin Shu Meng Song Eric P. Xing Zhiting Hu 27 319 0 25 May 2022
Evaluating the Impact of Model Scale for Compositional Generalization in Semantic Parsing Linlu Qiu Peter Shaw Panupong Pasupat Tianze Shi Jonathan Herzig Emily Pitler Fei Sha Kristina Toutanova AI4CE LRM 33 52 0 24 May 2022
Large Language Models are Zero-Shot Reasoners Takeshi Kojima S. Gu Machel Reid Yutaka Matsuo Yusuke Iwasawa ReLM LRM 328 4,077 0 24 May 2022
Instruction Induction: From Few Examples to Natural Language Task Descriptions Or Honovich Uri Shaham Samuel R. Bowman Omer Levy ELM LRM 120 136 0 22 May 2022
Prototypical Calibration for Few-shot Learning of Language Models Zhixiong Han Y. Hao Li Dong Yutao Sun Furu Wei 178 52 0 20 May 2022
Selection-Inference: Exploiting Large Language Models for Interpretable Logical Reasoning Antonia Creswell Murray Shanahan I. Higgins ReLM LRM 28 341 0 19 May 2022
Few-Shot Parameter-Efficient Fine-Tuning is Better and Cheaper than In-Context Learning Haokun Liu Derek Tam Mohammed Muqeeth Jay Mohta Tenghao Huang Joey Tianyi Zhou Colin Raffel 38 849 0 11 May 2022
The Unreliability of Explanations in Few-shot Prompting for Textual Reasoning Xi Ye Greg Durrett ReLM LRM 36 168 0 06 May 2022