Papers citing "Language Models are Few-Shot Learners"

50 / 10,698 papers shown

Title
Understanding Human Intelligence through Human Limitations Thomas L. Griffiths 28 64 0 29 Sep 2020
Utility is in the Eye of the User: A Critique of NLP Leaderboards Kawin Ethayarajh Dan Jurafsky ELM 24 51 0 29 Sep 2020
From Twitter to Traffic Predictor: Next-Day Morning Traffic Prediction Using Social Media Data Weiran Yao Sean Qian 11 47 0 29 Sep 2020
Pchatbot: A Large-Scale Dataset for Personalized Chatbot Hongjin Qian Xiaohe Li Hanxun Zhong Yu Guo Yueyuan Ma Yutao Zhu Zhanliang Liu Zhanliang Liu Ji-Rong Wen 41 43 0 28 Sep 2020
KG-BART: Knowledge Graph-Augmented BART for Generative Commonsense Reasoning Ye Liu Yao Wan Lifang He Hao Peng Philip S. Yu 26 188 0 26 Sep 2020
RealToxicityPrompts: Evaluating Neural Toxic Degeneration in Language Models Samuel Gehman Suchin Gururangan Maarten Sap Yejin Choi Noah A. Smith 32 1,130 0 24 Sep 2020
Controlling Style in Generated Dialogue Eric Michael Smith Diana Gonzalez-Rico Emily Dinan Y-Lan Boureau AI4CE 34 50 0 22 Sep 2020
VirtualFlow: Decoupling Deep Learning Models from the Underlying Hardware Andrew Or Haoyu Zhang M. Freedman 14 9 0 20 Sep 2020
Conditionally Adaptive Multi-Task Learning: Improving Transfer Learning in NLP Using Fewer Parameters & Less Data Jonathan Pilault Amine Elhattami C. Pal CLL MoE 24 89 0 19 Sep 2020
Generation-Augmented Retrieval for Open-domain Question Answering Yuning Mao Pengcheng He Xiaodong Liu Yelong Shen Jianfeng Gao Jiawei Han Weizhu Chen RALM 33 238 0 17 Sep 2020
Self-Supervised Meta-Learning for Few-Shot Natural Language Classification Tasks Trapit Bansal Rishikesh Jha Tsendsuren Munkhdalai Andrew McCallum SSL VLM 20 87 0 17 Sep 2020
Review: Deep Learning in Electron Microscopy Jeffrey M. Ede 34 79 0 17 Sep 2020
Efficient Transformer-based Large Scale Language Representations using Hardware-friendly Block Structured Pruning Bingbing Li Zhenglun Kong Tianyun Zhang Ji Li ZeLin Li Hang Liu Caiwen Ding VLM 29 64 0 17 Sep 2020
Generative Language-Grounded Policy in Vision-and-Language Navigation with Bayes' Rule Shuhei Kurita Kyunghyun Cho LM&Ro 17 23 0 16 Sep 2020
Automated Source Code Generation and Auto-completion Using Deep Learning: Comparing and Discussing Current Language-Model-Related Approaches Juan Cruz-Benito Sanjay Vishwakarma Francisco Martín-Fernández Ismael Faro Ibm Quantum 22 30 0 16 Sep 2020
Evaluating representations by the complexity of learning low-loss predictors William F. Whitney M. Song David Brandfonbrener Jaan Altosaar Kyunghyun Cho 25 23 0 15 Sep 2020
Critical Thinking for Language Models Gregor Betz Christian Voigt Kyle Richardson SyDa ReLM LRM AI4CE 18 35 0 15 Sep 2020
It's Not Just Size That Matters: Small Language Models Are Also Few-Shot Learners Timo Schick Hinrich Schütze 27 955 0 15 Sep 2020
MLMLM: Link Prediction with Mean Likelihood Masked Language Model Louis Clouâtre P. Trempe Amal Zouaq Sarath Chandar 25 43 0 15 Sep 2020
The Radicalization Risks of GPT-3 and Advanced Neural Language Models Kris McGuffie Alex Newhouse 9 149 0 15 Sep 2020
Efficient Transformers: A Survey Yi Tay Mostafa Dehghani Dara Bahri Donald Metzler VLM 109 1,102 0 14 Sep 2020
GeDi: Generative Discriminator Guided Sequence Generation Ben Krause Akhilesh Deepak Gotmare Bryan McCann N. Keskar Shafiq R. Joty R. Socher Nazneen Rajani 56 389 0 14 Sep 2020
The Hardware Lottery Sara Hooker 27 203 0 14 Sep 2020
Abstract Neural Networks Matthew Sotoudeh Aditya V. Thakur 8 19 0 11 Sep 2020
The Intriguing Relation Between Counterfactual Explanations and Adversarial Examples Timo Freiesleben GAN 38 62 0 11 Sep 2020
SoK: Certified Robustness for Deep Neural Networks Linyi Li Tao Xie Bo-wen Li AAML 30 128 0 09 Sep 2020
Adversarial Watermarking Transformer: Towards Tracing Text Provenance with Data Hiding Sahar Abdelnabi Mario Fritz WaLM 23 143 0 07 Sep 2020
Accenture at CheckThat! 2020: If you say so: Post-hoc fact-checking of claims using transformer-based models Evan Williams Paul Rodrigues Valerie Novak 34 42 0 05 Sep 2020
Learning to summarize from human feedback Nisan Stiennon Long Ouyang Jeff Wu Daniel M. Ziegler Ryan J. Lowe Chelsea Voss Alec Radford Dario Amodei Paul Christiano ALM 19 1,984 0 02 Sep 2020
Accelerating Sparse DNN Models without Hardware-Support via Tile-Wise Sparsity Cong Guo B. Hsueh Jingwen Leng Yuxian Qiu Yue Guan Zehuan Wang Xiaoying Jia Xipeng Li M. Guo Yuhao Zhu 35 83 0 29 Aug 2020
A Survey of Evaluation Metrics Used for NLG Systems Ananya B. Sai Akash Kumar Mohankumar Mitesh M. Khapra ELM 33 228 0 27 Aug 2020
Periodic Stochastic Gradient Descent with Momentum for Decentralized Training Hongchang Gao Heng-Chiao Huang 20 25 0 24 Aug 2020
Tearing Down the Memory Wall Zaid Qureshi Vikram Sharma Mailthody S. Min I-Hsin Chung Jinjun Xiong Wen-mei W. Hwu GNN 23 9 0 24 Aug 2020
Language Models as Few-Shot Learner for Task-Oriented Dialogue Systems Andrea Madotto Zihan Liu Zhaojiang Lin Pascale Fung 43 58 0 14 Aug 2020
Communication-Efficient and Distributed Learning Over Wireless Networks: Principles and Applications Jihong Park S. Samarakoon Anis Elgabli Joongheon Kim M. Bennis Seong-Lyun Kim Mérouane Debbah 34 161 0 06 Aug 2020
Aligning AI With Shared Human Values Dan Hendrycks Collin Burns Steven Basart Andrew Critch J. Li D. Song Jacob Steinhardt 37 517 0 05 Aug 2020
Word meaning in minds and machines Brenden Lake G. Murphy NAI 15 117 0 04 Aug 2020
PowerGossip: Practical Low-Rank Communication Compression in Decentralized Deep Learning Thijs Vogels Sai Praneeth Karimireddy Martin Jaggi FedML 9 54 0 04 Aug 2020
Representation Learning with Video Deep InfoMax R. Devon Hjelm Philip Bachman SSL MDE 26 28 0 27 Jul 2020
Bollyrics: Automatic Lyrics Generator for Romanised Hindi N. Jain A. Chauhan Atharva Chewale Ojas Mithbavkar Ujjaval Shah M. Singh 18 1 0 25 Jul 2020
Contextualizing Enhances Gradient Based Meta Learning Evan Vogelbaum Rumen Dangovski L. Jing Marin Soljacic 34 3 0 17 Jul 2020
Deep Learning in Protein Structural Modeling and Design Wenhao Gao S. Mahajan Jeremias Sulam Jeffrey J. Gray 29 159 0 16 Jul 2020
Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering Gautier Izacard Edouard Grave RALM 20 1,108 0 02 Jul 2020
Hardware Acceleration of Sparse and Irregular Tensor Computations of ML Models: A Survey and Insights Shail Dave Riyadh Baghdadi Tony Nowatzki Sasikanth Avancha Aviral Shrivastava Baoxin Li 59 81 0 02 Jul 2020
Facts as Experts: Adaptable and Interpretable Neural Memory over Symbolic Knowledge Pat Verga Haitian Sun Livio Baldini Soares William W. Cohen KELM 35 50 0 02 Jul 2020
Computing Conceptual Distances between Breast Cancer Screening Guidelines: An Implementation of a Near-Peer Epistemic Model of Medical Disagreement Hossein Hematialam Luciana D. Garbayo Seethalakshmi Gopalakrishnan Wlodek Zadrozny 9 1 0 01 Jul 2020
Data Movement Is All You Need: A Case Study on Optimizing Transformers A. Ivanov Nikoli Dryden Tal Ben-Nun Shigang Li Torsten Hoefler 36 131 0 30 Jun 2020
Technical Report: Auxiliary Tuning and its Application to Conditional Text Generation Yoel Zeldes Dan Padnos Or Sharir Barak Peleg 23 19 0 30 Jun 2020
PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning Siqi Bao H. He Fan Wang Hua-Hong Wu Haifeng Wang Wenquan Wu Zhen Guo Zhibin Liu Xinchao Xu 30 137 0 30 Jun 2020
GShard: Scaling Giant Models with Conditional Computation and Automatic Sharding Dmitry Lepikhin HyoukJoong Lee Yuanzhong Xu Dehao Chen Orhan Firat Yanping Huang M. Krikun Noam M. Shazeer Z. Chen MoE 25 1,106 0 30 Jun 2020