Intermediate-Task Transfer Learning with Pretrained Models for Natural Language Understanding: When and Why Does It Work?

1 May 2020

Papers citing "Intermediate-Task Transfer Learning with Pretrained Models for Natural Language Understanding: When and Why Does It Work?"

37 / 37 papers shown

Title
PyTorch: An Imperative Style, High-Performance Deep Learning Library Adam Paszke Sam Gross Francisco Massa Adam Lerer James Bradbury ... Sasank Chilamkurthy Benoit Steiner Lu Fang Junjie Bai Soumith Chintala ODL 391 42,299 0 03 Dec 2019
Do Attention Heads in BERT Track Syntactic Dependencies? Phu Mon Htut Jason Phang Shikha Bordia Samuel R. Bowman 55 137 0 27 Nov 2019
BERTs of a feather do not generalize together: Large variability in generalization across models with similar test set performance R. Thomas McCoy Junghyun Min Tal Linzen 85 150 0 07 Nov 2019
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer Colin Raffel Noam M. Shazeer Adam Roberts Katherine Lee Sharan Narang Michael Matena Yanqi Zhou Wei Li Peter J. Liu AIMat 379 20,053 0 23 Oct 2019
Investigating BERT's Knowledge of Language: Five Analysis Methods with NPIs Alex Warstadt Yuning Cao Ioana Grosu Wei Peng Hagen Blix ... Jason Phang Anhad Mohananey Phu Mon Htut Paloma Jeretic Samuel R. Bowman 49 123 0 05 Sep 2019
Cosmos QA: Machine Reading Comprehension with Contextual Commonsense Reasoning Lifu Huang Ronan Le Bras Chandra Bhagavatula Yejin Choi AIMat RALM LRM 101 453 0 31 Aug 2019
RoBERTa: A Robustly Optimized BERT Pretraining Approach Yinhan Liu Myle Ott Naman Goyal Jingfei Du Mandar Joshi Danqi Chen Omer Levy M. Lewis Luke Zettlemoyer Veselin Stoyanov AIMat 534 24,351 0 26 Jul 2019
What Does BERT Look At? An Analysis of BERT's Attention Kevin Clark Urvashi Khandelwal Omer Levy Christopher D. Manning MILM 209 1,592 0 11 Jun 2019
Visualizing and Measuring the Geometry of BERT Andy Coenen Emily Reif Ann Yuan Been Kim Adam Pearce F. Viégas Martin Wattenberg MILM 76 417 0 06 Jun 2019
Open Sesame: Getting Inside BERT's Linguistic Knowledge Yongjie Lin Y. Tan Robert Frank 50 287 0 04 Jun 2019
MultiQA: An Empirical Investigation of Generalization and Transfer in Reading Comprehension Alon Talmor Jonathan Berant 74 173 0 31 May 2019
Choosing Transfer Languages for Cross-Lingual Learning Yu-Hsiang Lin Chian-Yu Chen Jean Lee Zirui Li Yuyan Zhang ... Zhisong Zhang Xuezhe Ma Antonios Anastasopoulos Patrick Littell Graham Neubig 79 233 0 29 May 2019
BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions Christopher Clark Kenton Lee Ming-Wei Chang Tom Kwiatkowski Michael Collins Kristina Toutanova 210 1,511 0 24 May 2019
HellaSwag: Can a Machine Really Finish Your Sentence? Rowan Zellers Ari Holtzman Yonatan Bisk Ali Farhadi Yejin Choi 154 2,446 0 19 May 2019
What do you learn from context? Probing for sentence structure in contextualized word representations Ian Tenney Patrick Xia Berlin Chen Alex Jinpeng Wang Adam Poliak ... Najoung Kim Benjamin Van Durme Samuel R. Bowman Dipanjan Das Ellie Pavlick 173 858 0 15 May 2019
BERT Rediscovers the Classical NLP Pipeline Ian Tenney Dipanjan Das Ellie Pavlick MILM SSeg 129 1,469 0 15 May 2019
Probing What Different NLP Tasks Teach Machines about Function Word Comprehension Najoung Kim Roma Patel Adam Poliak Alex Jinpeng Wang Patrick Xia ... Alexis Ross Tal Linzen Benjamin Van Durme Samuel R. Bowman Ellie Pavlick 66 107 0 25 Apr 2019
Multi-Task Deep Neural Networks for Natural Language Understanding Xiaodong Liu Pengcheng He Weizhu Chen Jianfeng Gao AI4CE 121 1,270 0 31 Jan 2019
Assessing BERT's Syntactic Abilities Yoav Goldberg 71 495 0 16 Jan 2019
Sentence Encoders on STILTs: Supplementary Training on Intermediate Labeled-data Tasks Jason Phang Thibault Févry Samuel R. Bowman 85 468 0 02 Nov 2018
CommonsenseQA: A Question Answering Challenge Targeting Commonsense Knowledge Alon Talmor Jonathan Herzig Nicholas Lourie Jonathan Berant RALM 140 1,716 0 02 Nov 2018
ReCoRD: Bridging the Gap between Human and Machine Commonsense Reading Comprehension Sheng Zhang Xiaodong Liu Jingjing Liu Jianfeng Gao Kevin Duh Benjamin Van Durme 63 313 0 30 Oct 2018
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova VLM SSL SSeg 1.6K 94,511 0 11 Oct 2018
WiC: the Word-in-Context Dataset for Evaluating Context-Sensitive Meaning Representations Mohammad Taher Pilehvar Jose Camacho-Collados 171 485 0 28 Aug 2018
SWAG: A Large-Scale Adversarial Dataset for Grounded Commonsense Inference Rowan Zellers Yonatan Bisk Roy Schwartz Yejin Choi 98 718 0 16 Aug 2018
Neural Network Acceptability Judgments Alex Warstadt Amanpreet Singh Samuel R. Bowman 219 1,406 0 31 May 2018
What you can cram into a single vector: Probing sentence embeddings for linguistic properties Alexis Conneau Germán Kruszewski Guillaume Lample Loïc Barrault Marco Baroni 321 892 0 03 May 2018
Neural-Davidsonian Semantic Proto-role Labeling Rachel Rudinger Adam R. Teichert Ryan Culkin Sheng Zhang Benjamin Van Durme VLM 37 24 0 21 Apr 2018
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 984 7,141 0 20 Apr 2018
AllenNLP: A Deep Semantic Natural Language Processing Platform Matt Gardner Joel Grus Mark Neumann Oyvind Tafjord Pradeep Dasigi Nelson F. Liu Matthew E. Peters Michael Schmitz Luke Zettlemoyer VLM 76 1,281 0 20 Mar 2018
Crowdsourcing Question-Answer Meaning Representations Julian Michael Gabriel Stanovsky Luheng He Ido Dagan Luke Zettlemoyer 107 78 0 16 Nov 2017
Crowdsourcing Multiple Choice Science Questions Johannes Welbl Nelson F. Liu Matt Gardner AI4Ed 60 500 0 19 Jul 2017
A Broad-Coverage Challenge Corpus for Sentence Understanding through Inference Adina Williams Nikita Nangia Samuel R. Bowman 507 4,473 0 18 Apr 2017
Identifying beneficial task relations for multi-task learning in deep neural networks Joachim Bingel Anders Søgaard 43 252 0 27 Feb 2017
ConceptNet 5.5: An Open Multilingual Graph of General Knowledge R. Speer Joshua Chin Catherine Havasi 177 2,889 0 12 Dec 2016
Overcoming catastrophic forgetting in neural networks J. Kirkpatrick Razvan Pascanu Neil C. Rabinowitz J. Veness Guillaume Desjardins ... A. Grabska-Barwinska Demis Hassabis Claudia Clopath D. Kumaran R. Hadsell CLL 330 7,478 0 02 Dec 2016
Adam: A Method for Stochastic Optimization Diederik P. Kingma Jimmy Ba ODL 1.6K 149,842 0 22 Dec 2014