v1v2v3 (latest)

SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems

2 May 2019

Amanpreet Singh

Papers citing "SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems"

50 / 1,500 papers shown

Title
Unsupervised Domain Clusters in Pretrained Language Models Roee Aharoni Yoav Goldberg 101 252 0 05 Apr 2020
Testing pre-trained Transformer models for Lithuanian news clustering Lukas Stankevicius M. Lukoševičius VLM 27 8 0 03 Apr 2020
Extending Automated Deduction for Commonsense Reasoning T. Tammet ReLM LRM 42 3 0 29 Mar 2020
XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization Junjie Hu Sebastian Ruder Aditya Siddhant Graham Neubig Orhan Firat Melvin Johnson ELM 228 978 0 24 Mar 2020
Data-driven models and computational tools for neurolinguistics: a language technology perspective Ekaterina Artemova Amir Bakarov A. Artemov Evgeny Burnaev M. Sharaev 44 4 0 23 Mar 2020
Pre-trained Models for Natural Language Processing: A Survey Xipeng Qiu Tianxiang Sun Yige Xu Yunfan Shao Ning Dai Xuanjing Huang LM&MA VLM 383 1,498 0 18 Mar 2020
Calibration of Pre-trained Transformers Shrey Desai Greg Durrett UQLM 337 302 0 17 Mar 2020
BERT as a Teacher: Contextual Embeddings for Sequence-Level Reward Florian Schmidt Thomas Hofmann 85 8 0 05 Mar 2020
Talking-Heads Attention Noam M. Shazeer Zhenzhong Lan Youlong Cheng Nan Ding L. Hou 143 80 0 05 Mar 2020
jiant: A Software Toolkit for Research on General-Purpose Text Understanding Models Yada Pruksachatkun Philip Yeres Haokun Liu Jason Phang Phu Mon Htut Alex Jinpeng Wang Ian Tenney Samuel R. Bowman SSeg 34 94 0 04 Mar 2020
Benchmarking Graph Neural Networks Vijay Prakash Dwivedi Chaitanya K. Joshi Anh Tuan Luu T. Laurent Yoshua Bengio Xavier Bresson 609 956 0 02 Mar 2020
Using a thousand optimization tasks to learn hyperparameter search strategies Luke Metz Niru Maheswaranathan Ruoxi Sun C. Freeman Ben Poole Jascha Narain Sohl-Dickstein 111 46 0 27 Feb 2020
Towards Learning a Universal Non-Semantic Representation of Speech Joel Shor A. Jansen Ronnie Maor Oran Lang Omry Tuval Félix de Chaumont Quitry Marco Tagliasacchi Ira Shavitt Dotan Emanuel Yinnon A. Haviv SSL 139 160 0 25 Feb 2020
Fine-Tuning Pretrained Language Models: Weight Initializations, Data Orders, and Early Stopping Jesse Dodge Gabriel Ilharco Roy Schwartz Ali Farhadi Hannaneh Hajishirzi Noah A. Smith 103 598 0 15 Feb 2020
HULK: An Energy Efficiency Benchmark Platform for Responsible Natural Language Processing Xiyou Zhou Zhiyu Zoey Chen Xiaoyong Jin Wenjie Wang 78 34 0 14 Feb 2020
GLU Variants Improve Transformer Noam M. Shazeer 177 1,026 0 12 Feb 2020
Feature Importance Estimation with Self-Attention Networks Blaž Škrlj Jannis Brugger Nada Lavrac Matej Petković FAtt MILM 88 52 0 11 Feb 2020
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 663 4,935 0 23 Jan 2020
ORB: An Open Reading Benchmark for Comprehensive Evaluation of Machine Reading Comprehension Dheeru Dua Ananth Gottumukkala Alon Talmor Sameer Singh Matt Gardner 62 10 0 29 Dec 2019
WaLDORf: Wasteless Language-model Distillation On Reading-comprehension J. Tian A. Kreuzer Pai-Hung Chen Hans-Martin Will VLM 58 3 0 13 Dec 2019
Extending Machine Language Models toward Human-Level Language Understanding James L. McClelland Felix Hill Maja R. Rudolph Jason Baldridge Hinrich Schütze LRM 78 35 0 12 Dec 2019
FlauBERT: Unsupervised Language Model Pre-training for French Hang Le Loïc Vial Jibril Frej Vincent Segonne Maximin Coavoux Benjamin Lecouteux A. Allauzen Benoît Crabbé Laurent Besacier D. Schwab AI4CE 100 401 0 11 Dec 2019
BLiMP: The Benchmark of Linguistic Minimal Pairs for English Alex Warstadt Alicia Parrish Haokun Liu Anhad Mohananey Wei Peng Sheng-Fu Wang Samuel R. Bowman 137 496 0 02 Dec 2019
Do Attention Heads in BERT Track Syntactic Dependencies? Phu Mon Htut Jason Phang Shikha Bordia Samuel R. Bowman 83 137 0 27 Nov 2019
Assessing the Benchmarking Capacity of Machine Reading Comprehension Datasets Saku Sugawara Pontus Stenetorp Kentaro Inui Akiko Aizawa 71 86 0 21 Nov 2019
What do you mean, BERT? Assessing BERT as a Distributional Semantics Model Timothee Mickus Denis Paperno Mathieu Constant Kees van Deemter 77 46 0 13 Nov 2019
Increasing Robustness to Spurious Correlations using Forgettable Examples Yadollah Yaghoobzadeh Soroush Mehri Remi Tachet Timothy J. Hazen Alessandro Sordoni OOD 63 18 0 10 Nov 2019
Generalizing Natural Language Analysis through Span-relation Representations Zhengbao Jiang Wenyuan Xu Jun Araki Graham Neubig 81 60 0 10 Nov 2019
ERASER: A Benchmark to Evaluate Rationalized NLP Models Jay DeYoung Sarthak Jain Nazneen Rajani Eric P. Lehman Caiming Xiong R. Socher Byron C. Wallace 160 640 0 08 Nov 2019
When Choosing Plausible Alternatives, Clever Hans can be Clever Pride Kavumba Naoya Inoue Benjamin Heinzerling Keshav Singh Paul Reisert Kentaro Inui 42 53 0 01 Nov 2019
Adversarial NLI: A New Benchmark for Natural Language Understanding Yixin Nie Adina Williams Emily Dinan Joey Tianyi Zhou Jason Weston Douwe Kiela 174 1,013 0 31 Oct 2019
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer Colin Raffel Noam M. Shazeer Adam Roberts Katherine Lee Sharan Narang Michael Matena Yanqi Zhou Wei Li Peter J. Liu AIMat 558 20,418 0 23 Oct 2019
Injecting Hierarchy with U-Net Transformers David Donahue Vladislav Lialin Anna Rumshisky AI4CE 26 1 0 16 Oct 2019
exBERT: A Visual Analysis Tool to Explore Learned Representations in Transformers Models Benjamin Hoover Hendrik Strobelt Sebastian Gehrmann 40 86 0 11 Oct 2019
HuggingFace's Transformers: State-of-the-art Natural Language Processing Thomas Wolf Lysandre Debut Victor Sanh Julien Chaumond Clement Delangue ... Teven Le Scao Sylvain Gugger Mariama Drame Quentin Lhoest Alexander M. Rush AI4CE 76 1,927 0 09 Oct 2019
Slice-based Learning: A Programming Model for Residual Learning in Critical Data Slices V. Chen Sen Wu Zhenzhen Weng Alexander Ratner Christopher Ré 96 56 0 13 Sep 2019
Knowledge Enhanced Contextual Word Representations Matthew E. Peters Mark Neumann IV RobertL.Logan Roy Schwartz Vidur Joshi Sameer Singh Noah A. Smith 284 662 0 09 Sep 2019
Abductive Reasoning as Self-Supervision for Common Sense Question Answering Sathyanarayanan N. Aakur Sudeep Sarkar LRM SSL OOD 48 4 0 06 Sep 2019
TabFact: A Large-scale Dataset for Table-based Fact Verification Wenhu Chen Hongmin Wang Jianshu Chen Yunkai Zhang Hong Wang Shiyang Li Xiyou Zhou William Yang Wang LMTD 127 514 0 05 Sep 2019
Evaluation Benchmarks and Learning Criteria for Discourse-Aware Sentence Representations Mingda Chen Zewei Chu Kevin Gimpel 78 46 0 31 Aug 2019
Revealing the Dark Secrets of BERT Olga Kovaleva Alexey Romanov Anna Rogers Anna Rumshisky 53 556 0 21 Aug 2019
SenseBERT: Driving Some Sense into BERT Yoav Levine Barak Lenz Or Dagan Ori Ram Dan Padnos Or Sharir Shai Shalev-Shwartz Amnon Shashua Y. Shoham SSL 91 187 0 15 Aug 2019
An Effective Domain Adaptive Post-Training Method for BERT in Response Selection Taesun Whang Dongyub Lee Chanhee Lee Kisu Yang Dongsuk Oh Heuiseok Lim 78 26 0 13 Aug 2019
RoBERTa: A Robustly Optimized BERT Pretraining Approach Yinhan Liu Myle Ott Naman Goyal Jingfei Du Mandar Joshi Danqi Chen Omer Levy M. Lewis Luke Zettlemoyer Veselin Stoyanov AIMat 764 24,612 0 26 Jul 2019
WinoGrande: An Adversarial Winograd Schema Challenge at Scale Keisuke Sakaguchi Ronan Le Bras Chandra Bhagavatula Yejin Choi 89 223 0 24 Jul 2019
Green AI Roy Schwartz Jesse Dodge Noah A. Smith Oren Etzioni 137 1,161 0 22 Jul 2019
LIAAD at SemDeep-5 Challenge: Word-in-Context (WiC) Daniel Loureiro A. Jorge 65 17 0 24 Jun 2019
Evaluating Protein Transfer Learning with TAPE Roshan Rao Nicholas Bhattacharya Neil Thomas Yan Duan Xi Chen John F. Canny Pieter Abbeel Yun S. Song SSL 108 811 0 19 Jun 2019
Human vs. Muppet: A Conservative Estimate of Human Performance on the GLUE Benchmark Nikita Nangia Samuel R. Bowman ELM ALM 82 76 0 24 May 2019
Recent Advances in Natural Language Inference: A Survey of Benchmarks, Resources, and Approaches Shane Storks Qiaozi Gao J. Chai 96 132 0 02 Apr 2019