Title
GENEVA: Benchmarking Generalizability for Event Argument Extraction with Hundreds of Event Types and Argument Roles Tanmay Parekh I-Hung Hsu Kuan-Hao Huang Kai-Wei Chang Nanyun Peng 124 27 0 25 May 2022
Know Where You're Going: Meta-Learning for Parameter-Efficient Fine-Tuning Mozhdeh Gheini Xuezhe Ma Jonathan May 101 5 0 25 May 2022
Evaluating the Impact of Model Scale for Compositional Generalization in Semantic Parsing Linlu Qiu Peter Shaw Panupong Pasupat Tianze Shi Jonathan Herzig Emily Pitler Fei Sha Kristina Toutanova AI4CE LRM 162 54 0 24 May 2022
EdiT5: Semi-Autoregressive Text-Editing with T5 Warm-Start Jonathan Mallinson Jakub Adamek Eric Malmi Aliaksei Severyn KELM 152 43 0 24 May 2022
PoeLM: A Meter- and Rhyme-Controllable Language Model for Unsupervised Poetry Generation Aitor Ormazabal Mikel Artetxe Manex Agirrezabal Aitor Soroa Etxabe Eneko Agirre 79 21 0 24 May 2022
ATTEMPT: Parameter-Efficient Multi-task Tuning via Attentional Mixtures of Soft Prompts Akari Asai Mohammadreza Salehi Matthew E. Peters Hannaneh Hajishirzi 196 102 0 24 May 2022
Large Language Models are Zero-Shot Reasoners Takeshi Kojima S. Gu Machel Reid Yutaka Matsuo Yusuke Iwasawa ReLM LRM 636 4,077 0 24 May 2022
Maieutic Prompting: Logically Consistent Reasoning with Recursive Explanations Jaehun Jung Lianhui Qin Sean Welleck Faeze Brahman Chandra Bhagavatula Ronan Le Bras Yejin Choi ReLM LRM 330 197 0 24 May 2022
On the Role of Bidirectionality in Language Model Pre-Training Mikel Artetxe Jingfei Du Naman Goyal Luke Zettlemoyer Ves Stoyanov 205 17 0 24 May 2022
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding Chitwan Saharia William Chan Saurabh Saxena Lala Li Jay Whang ... Raphael Gontijo-Lopes Tim Salimans Jonathan Ho David J Fleet Mohammad Norouzi VLM 651 6,107 0 23 May 2022
When does Parameter-Efficient Transfer Learning Work for Machine Translation? Ahmet Üstün Asa Cooper Stickland 97 7 0 23 May 2022
Instruction Induction: From Few Examples to Natural Language Task Descriptions Or Honovich Uri Shaham Samuel R. Bowman Omer Levy ELM LRM 286 146 0 22 May 2022
Memorization Without Overfitting: Analyzing the Training Dynamics of Large Language Models Kushal Tirumala Aram H. Markosyan Luke Zettlemoyer Armen Aghajanyan TDI 138 197 0 22 May 2022
Revisiting Pre-trained Language Models and their Evaluation for Arabic Natural Language Understanding Abbas Ghaddar Yimeng Wu Sunyam Bagga Ahmad Rashid Khalil Bibi ... Zhefeng Wang Baoxing Huai Xin Jiang Qun Liu Philippe Langlais 65 8 0 21 May 2022
Least-to-Most Prompting Enables Complex Reasoning in Large Language Models Denny Zhou Nathanael Scharli Le Hou Jason W. Wei Nathan Scales ... Dale Schuurmans Claire Cui Olivier Bousquet Quoc Le Ed H. Chi RALM LRM AI4CE 109 1,139 0 21 May 2022
A Case of Exponential Convergence Rates for SVM Vivien A. Cabannes Stefano Vigogna 79 2 0 20 May 2022
Can Foundation Models Wrangle Your Data? A. Narayan Ines Chami Laurel J. Orr Simran Arora Christopher Ré LMTD AI4CE 244 231 0 20 May 2022
Why GANs are overkill for NLP David Alvarez-Melis Vikas Garg Adam Tauman Kalai 62 2 0 19 May 2022
RankGen: Improving Text Generation with Large Ranking Models Kalpesh Krishna Yapei Chang John Wieting Mohit Iyyer AIMat 90 69 0 19 May 2022
Nebula-I: A General Framework for Collaboratively Training Deep Learning Models on Low-Bandwidth Cloud Clusters Yang Xiang Zhihua Wu Weibao Gong Siyu Ding Xianjie Mo ... Yue Yu Ge Li Yu Sun Yanjun Ma Dianhai Yu 73 5 0 19 May 2022
What company do words keep? Revisiting the distributional semantics of J.R. Firth & Zellig Harris Mikael Brunila J. LaViolette 112 21 0 16 May 2022
Heroes, Villains, and Victims, and GPT-3: Automated Extraction of Character Roles Without Training Data Dominik Stammbach Maria Antoniak Elliott Ash 219 34 0 16 May 2022
A Generalist Agent Scott E. Reed Konrad Zolna Emilio Parisotto Sergio Gomez Colmenarejo Alexander Novikov ... Yutian Chen R. Hadsell Oriol Vinyals Mahyar Bordbar Nando de Freitas LM&Ro LLMAG AI4CE 217 827 0 12 May 2022
Reducing Activation Recomputation in Large Transformer Models V. Korthikanti Jared Casper Sangkug Lym Lawrence C. McAfee M. Andersch Mohammad Shoeybi Bryan Catanzaro AI4CE 163 276 0 10 May 2022
UL2: Unifying Language Learning Paradigms Yi Tay Mostafa Dehghani Vinh Q. Tran Xavier Garcia Jason W. Wei ... Tal Schuster H. Zheng Denny Zhou N. Houlsby Donald Metzler AI4CE 144 313 0 10 May 2022
The Unreliability of Explanations in Few-shot Prompting for Textual Reasoning Xi Ye Greg Durrett ReLM LRM 127 186 0 06 May 2022
Language Models Can See: Plugging Visual Controls in Text Generation Yixuan Su Tian Lan Yahui Liu Fangyu Liu Dani Yogatama Yan Wang Lingpeng Kong Nigel Collier VLM MLLM 115 98 0 05 May 2022
Adversarial Training for High-Stakes Reliability Daniel M. Ziegler Seraphina Nix Lawrence Chan Tim Bauman Peter Schmidt-Nielsen ... Noa Nabeshima Benjamin Weinstein-Raun D. Haas Buck Shlegeris Nate Thomas AAML 137 62 0 03 May 2022
OPT: Open Pre-trained Transformer Language Models Susan Zhang Stephen Roller Naman Goyal Mikel Artetxe Moya Chen ... Daniel Simig Punit Singh Koura Anjali Sridhar Tianlu Wang Luke Zettlemoyer VLM OSLM AI4CE 428 3,714 0 02 May 2022
MRKL Systems: A modular, neuro-symbolic architecture that combines large language models, external knowledge sources and discrete reasoning Ehud D. Karpas Omri Abend Yonatan Belinkov Barak Lenz Opher Lieber ... Erez Schwartz Gal Shachaf Shai Shalev-Shwartz Amnon Shashua Moshe Tenenholtz LLMAG 74 70 0 01 May 2022
EasyNLP: A Comprehensive and Easy-to-use Toolkit for Natural Language Processing Chengyu Wang Minghui Qiu Chen Shi Taolin Zhang Tingting Liu Lei Li Jiadong Wang Ming Wang Jun Huang W. Lin 80 21 0 30 Apr 2022
Flamingo: a Visual Language Model for Few-Shot Learning Jean-Baptiste Alayrac Jeff Donahue Pauline Luc Antoine Miech Iain Barr ... Mikolaj Binkowski Ricardo Barreira Oriol Vinyals Andrew Zisserman Karen Simonyan MLLM VLM 431 3,622 0 29 Apr 2022
Inferring Implicit Relations in Complex Questions with Language Models Uri Katz Mor Geva Jonathan Berant ReLM LRM 38 11 0 28 Apr 2022
On the Effect of Pretraining Corpora on In-context Learning by a Large-scale Language Model Seongjin Shin Sang-Woo Lee Hwijeen Ahn Sungdong Kim Hyoungseok Kim ... Kyunghyun Cho Gichang Lee W. Park Jung-Woo Ha Nako Sung LRM 120 97 0 28 Apr 2022
Can deep learning match the efficiency of human visual long-term memory in storing object details? Emin Orhan VLM OCL 124 0 0 27 Apr 2022
FPGA-based AI Smart NICs for Scalable Distributed AI Training Systems Rui Ma E. Georganas A. Heinecke Andrew Boutros Eriko Nurvitadhi GNN 63 13 0 22 Apr 2022
Improving Passage Retrieval with Zero-Shot Question Generation Devendra Singh Sachan M. Lewis Mandar Joshi Armen Aghajanyan Wen-tau Yih J. Pineau Luke Zettlemoyer OOD LRM 145 168 0 15 Apr 2022
GPT-NeoX-20B: An Open-Source Autoregressive Language Model Sid Black Stella Biderman Eric Hallahan Quentin G. Anthony Leo Gao ... Shivanshu Purohit Laria Reynolds J. Tow Benqi Wang Samuel Weinbach 189 841 0 14 Apr 2022
Impossible Triangle: What's Next for Pre-trained Language Models? Chenguang Zhu Michael Zeng 86 1 0 13 Apr 2022
InCoder: A Generative Model for Code Infilling and Synthesis Daniel Fried Armen Aghajanyan Jessy Lin Sida I. Wang Eric Wallace Freda Shi Ruiqi Zhong Wen-tau Yih Luke Zettlemoyer M. Lewis SyDa 136 661 0 12 Apr 2022
Do As I Can, Not As I Say: Grounding Language in Robotic Affordances Michael Ahn Anthony Brohan Noah Brown Yevgen Chebotar Omar Cortes ... Ted Xiao Peng Xu Sichun Xu Mengyuan Yan Andy Zeng LM&Ro 220 1,992 0 04 Apr 2022
Socratic Models: Composing Zero-Shot Multimodal Reasoning with Language Andy Zeng Maria Attarian Brian Ichter K. Choromanski Adrian S. Wong ... Michael S. Ryoo Vikas Sindhwani Johnny Lee Vincent Vanhoucke Peter R. Florence ReLM LRM 189 589 0 01 Apr 2022
Training Compute-Optimal Large Language Models Jordan Hoffmann Sebastian Borgeaud A. Mensch Elena Buchatskaya Trevor Cai ... Karen Simonyan Erich Elsen Jack W. Rae Oriol Vinyals Laurent Sifre AI4TS 217 1,993 0 29 Mar 2022
STaR: Bootstrapping Reasoning With Reasoning E. Zelikman Yuhuai Wu Jesse Mu Noah D. Goodman ReLM LRM 160 512 0 28 Mar 2022
Pathways: Asynchronous Distributed Dataflow for ML P. Barham Aakanksha Chowdhery J. Dean Sanjay Ghemawat Steven Hand ... Parker Schuh Ryan Sepassi Laurent El Shafey C. A. Thekkath Yonghui Wu GNN MoE 120 133 0 23 Mar 2022
Self-Consistency Improves Chain of Thought Reasoning in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Sharan Narang Aakanksha Chowdhery Denny Zhou ReLM BDL LRM AI4CE 746 3,762 0 21 Mar 2022
WOODS: Benchmarks for Out-of-Distribution Generalization in Time Series Jean-Christophe Gagnon-Audet Kartik Ahuja Mohammad Javad Darvishi Bayazi Pooneh Mousavi G. Dumas Irina Rish OOD CML AI4TS 109 32 0 18 Mar 2022
Geographic Adaptation of Pretrained Language Models Valentin Hofmann Goran Glavaš Nikola Ljubevsić J. Pierrehumbert Hinrich Schütze VLM 130 18 0 16 Mar 2022
Iteratively Prompt Pre-trained Language Models for Chain of Thought Boshi Wang Xiang Deng Huan Sun KELM ReLM LRM 136 103 0 16 Mar 2022
HyperMixer: An MLP-based Low Cost Alternative to Transformers Florian Mai Arnaud Pannatier Fabio Fehr Haolin Chen François Marelli François Fleuret James Henderson 97 12 0 07 Mar 2022