v1v2v3 (latest)

SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems

2 May 2019

Amanpreet Singh

Papers citing "SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems"

50 / 1,500 papers shown

Title
FewCLUE: A Chinese Few-shot Learning Evaluation Benchmark Liang Xu Xiaojing Lu Chenyang Yuan Xuanwei Zhang Huilin Xu ... Guoao Wei X. Pan Xin Tian Libo Qin Hai Hu ELM 90 57 0 15 Jul 2021
AutoBERT-Zero: Evolving BERT Backbone from Scratch Jiahui Gao Hang Xu Han Shi Xiaozhe Ren Philip L. H. Yu Xiaodan Liang Xin Jiang Zhenguo Li 85 37 0 15 Jul 2021
The Benchmark Lottery Mostafa Dehghani Yi Tay A. Gritsenko Zhe Zhao N. Houlsby Fernando Diaz Donald Metzler Oriol Vinyals 114 92 0 14 Jul 2021
Indian Legal NLP Benchmarks : A Survey Prathamesh Kalamkar Janani Venugopalan Vivek Raghavan ELM AILaw VLM 58 5 0 13 Jul 2021
Noise Stability Regularization for Improving BERT Fine-tuning Hang Hua Xingjian Li Dejing Dou Chengzhong Xu Jiebo Luo 79 45 0 10 Jul 2021
FaVIQ: FAct Verification from Information-seeking Questions Jungsoo Park Sewon Min Jaewoo Kang Luke Zettlemoyer Hannaneh Hajishirzi HILM 70 40 0 05 Jul 2021
ERNIE 3.0: Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation Yu Sun Shuohuan Wang Shikun Feng Siyu Ding Chao Pang ... Ouyang Xuan Dianhai Yu Hao Tian Hua Wu Haifeng Wang 114 474 0 05 Jul 2021
Doing Good or Doing Right? Exploring the Weakness of Commonsense Causal Reasoning Models Mingyue Han Yinglin Wang LRM 72 11 0 05 Jul 2021
Combining Feature and Instance Attribution to Detect Artifacts Pouya Pezeshkpour Sarthak Jain Sameer Singh Byron C. Wallace TDI 120 42 0 01 Jul 2021
The Values Encoded in Machine Learning Research Abeba Birhane Pratyusha Kalluri Dallas Card William Agnew Ravit Dotan Michelle Bao 89 294 0 29 Jun 2021
Domain-Specific Pretraining for Vertical Search: Case Study on Biomedical Literature Yu Wang Jinchao Li Tristan Naumann Chenyan Xiong Hao Cheng ... Yang Qin Eric Horvitz Paul N. Bennett Jianfeng Gao Hoifung Poon OOD 85 14 0 25 Jun 2021
Cutting Down on Prompts and Parameters: Simple Few-Shot Learning with Language Models Robert L Logan IV Ivana Balavzević Eric Wallace Fabio Petroni Sameer Singh Sebastian Riedel VPVLM 106 212 0 24 Jun 2021
It's All in the Heads: Using Attention Heads as a Baseline for Cross-Lingual Transfer in Commonsense Reasoning Alexey Tikhonov Max Ryabinin LRM 57 64 0 22 Jun 2021
GEM: A General Evaluation Benchmark for Multimodal Tasks Lin Su Nan Duan Edward Cui Lei Ji Chenfei Wu Huaishao Luo Yongfei Liu Ming Zhong Taroon Bharti Arun Sacheti VLM 112 19 0 18 Jun 2021
LoRA: Low-Rank Adaptation of Large Language Models J. E. Hu Yelong Shen Phillip Wallis Zeyuan Allen-Zhu Yuanzhi Li Shean Wang Lu Wang Weizhu Chen OffRL AI4TS AI4CE ALM AIMat 598 10,625 0 17 Jun 2021
pysentimiento: A Python Toolkit for Opinion Mining and Social NLP tasks Juan Manuel Pérez Mariela Rajngewerc Juan Carlos Giudici D. Furman Franco Luque Laura Alonso Alemany María Vanina Martínez 62 33 0 17 Jun 2021
What Context Features Can Transformer Language Models Use? J. O'Connor Jacob Andreas KELM 77 79 0 15 Jun 2021
CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark Ningyu Zhang Mosha Chen Zhen Bi Xiaozhuan Liang Lei Li ... Jun Yan Hongying Zan Kunli Zhang Buzhou Tang Qingcai Chen LM&MA ELM 83 192 0 15 Jun 2021
Incorporating Word Sense Disambiguation in Neural Language Models Jan Philip Wahle Terry Ruas Norman Meuschke Bela Gipp 67 11 0 15 Jun 2021
Improving Paraphrase Detection with the Adversarial Paraphrasing Task Animesh Nighojkar John Licato 70 39 0 14 Jun 2021
Probing Pre-Trained Language Models for Disease Knowledge Israa Alghanmi Luis Espinosa-Anke Steven Schockaert LM&MA ELM 82 13 0 14 Jun 2021
Schema-Guided Paradigm for Zero-Shot Dialog Shikib Mehri M. Eskénazi 53 17 0 13 Jun 2021
Can Transformer Language Models Predict Psychometric Properties? Antonio Laverghetta Animesh Nighojkar Jamshidbek Mirzakhalov John Licato LM&MA 71 14 0 12 Jun 2021
Prompting Contrastive Explanations for Commonsense Reasoning Tasks Bhargavi Paranjape Julian Michael Marjan Ghazvininejad Luke Zettlemoyer Hannaneh Hajishirzi ReLM LRM 76 68 0 12 Jun 2021
A Discussion on Building Practical NLP Leaderboards: The Case of Machine Translation Sebastin Santy Prasanta Bhattacharya LLMAG 75 3 0 11 Jun 2021
Generate, Annotate, and Learn: NLP with Synthetic Text Xuanli He Islam Nassar J. Kiros Gholamreza Haffari Mohammad Norouzi 88 53 0 11 Jun 2021
A Semi-supervised Multi-task Learning Approach to Classify Customer Contact Intents Li Dong Matthew C. Spencer Amir Biagi 43 3 0 10 Jun 2021
What Would a Teacher Do? Predicting Future Talk Moves Ananya Ganesh Martha Palmer Katharina Kann 51 8 0 09 Jun 2021
Compacter: Efficient Low-Rank Hypercomplex Adapter Layers Rabeeh Karimi Mahabadi James Henderson Sebastian Ruder MoE 147 494 0 08 Jun 2021
VALUE: A Multi-Task Benchmark for Video-and-Language Understanding Evaluation Linjie Li Jie Lei Zhe Gan Licheng Yu Yen-Chun Chen ... Tamara L. Berg Joey Tianyi Zhou Jingjing Liu Lijuan Wang Zicheng Liu VLM 112 103 0 08 Jun 2021
Parameter-efficient Multi-task Fine-tuning for Transformers via Shared Hypernetworks Rabeeh Karimi Mahabadi Sebastian Ruder Mostafa Dehghani James Henderson MoE 80 313 0 08 Jun 2021
Investigating Transfer Learning in Multilingual Pre-trained Language Models through Chinese Natural Language Inference Hai Hu He Zhou Zuoyu Tian Yiwen Zhang Yina Ma Yanting Li Yixin Nie Kyle Richardson 61 11 0 07 Jun 2021
Meta-learning for downstream aware and agnostic pretraining Hongyin Luo Shuyan Dong Yung-Sung Chuang Shang-Wen Li 44 0 0 06 Jun 2021
Structured Reordering for Modeling Latent Alignments in Sequence Transduction Bailin Wang Mirella Lapata Ivan Titov BDL 99 20 0 06 Jun 2021
Strategyproof Learning: Building Trustworthy User-Generated Datasets Sadegh Farhadkhani R. Guerraoui L. Hoang FedML 87 7 0 04 Jun 2021
Reordering Examples Helps during Priming-based Few-Shot Learning Sawan Kumar Partha P. Talukdar 79 58 0 03 Jun 2021
Ethical-Advice Taker: Do Language Models Understand Natural Language Interventions? Jieyu Zhao Daniel Khashabi Tushar Khot Ashish Sabharwal Kai-Wei Chang KELM 87 53 0 02 Jun 2021
SyGNS: A Systematic Generalization Testbed Based on Natural Language Semantics Hitomi Yanaka K. Mineshima Kentaro Inui NAI AI4CE 111 11 0 02 Jun 2021
Comparing Test Sets with Item Response Theory Clara Vania Phu Mon Htut William Huang Dhara Mungra Richard Yuanzhe Pang Jason Phang Haokun Liu Kyunghyun Cho Sam Bowman 77 43 0 01 Jun 2021
Training ELECTRA Augmented with Multi-word Selection Jiaming Shen Jialu Liu Tianqi Liu Cong Yu Jiawei Han 79 9 0 31 May 2021
Tournesol: A quest for a large, secure and trustworthy database of reliable human judgments L. Hoang Louis Faucon A. Jungo S. Volodin D. Papuc ... Felix Grimberg Vlad Nitu Christine Vossen Sébastien Rouault El-Mahdi El-Mhamdi 79 15 0 29 May 2021
CoDesc: A Large Code-Description Parallel Dataset Masum Hasan Tanveer Muttaqueen Abdullah Al Ishtiaq Kazi Sajeed Mehrab Md. Mahim Anjum Haque Tahmid Hasan Wasi Uddin Ahmad Anindya Iqbal Rifat Shahriyar 71 32 0 29 May 2021
Changing the World by Changing the Data Anna Rogers 76 73 0 28 May 2021
ByT5: Towards a token-free future with pre-trained byte-to-byte models Linting Xue Aditya Barua Noah Constant Rami Al-Rfou Sharan Narang Mihir Kale Adam Roberts Colin Raffel 134 508 0 28 May 2021
LMMS Reloaded: Transformer-based Sense Embeddings for Disambiguation and Beyond Daniel Loureiro A. Jorge Jose Camacho-Collados 84 26 0 26 May 2021
Unsupervised Pronoun Resolution via Masked Noun-Phrase Prediction Minghan Shen Pratyay Banerjee Chitta Baral SSL 53 5 0 26 May 2021
True Few-Shot Learning with Language Models Ethan Perez Douwe Kiela Kyunghyun Cho 140 440 0 24 May 2021
Dynaboard: An Evaluation-As-A-Service Platform for Holistic Next-Generation Benchmarking Zhiyi Ma Kawin Ethayarajh Tristan Thrush Somya Jain Ledell Yu Wu Robin Jia Christopher Potts Adina Williams Douwe Kiela ELM 115 59 0 21 May 2021
Measuring Coding Challenge Competence With APPS Dan Hendrycks Steven Basart Saurav Kadavath Mantas Mazeika Akul Arora ... Collin Burns Samir Puranik Horace He Basel Alomair Jacob Steinhardt ELM AIMat ALM 300 712 0 20 May 2021
KLUE: Korean Language Understanding Evaluation Sungjoon Park Jihyung Moon Sungdong Kim Won Ik Cho Jiyoon Han ... Seonghyun Kim Lucy Park Alice Oh Jung-Woo Ha Kyunghyun Cho ELM VLM 119 198 0 20 May 2021