v1v2v3 (latest)

SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems

2 May 2019

Amanpreet Singh

Papers citing "SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems"

50 / 1,500 papers shown

Title
Detecting Languages Unintelligible to Multilingual Models through Local Structure Probes Louis Clouâtre Prasanna Parthasarathi Payel Das Sarath Chandar 71 3 0 09 Nov 2022
Mask More and Mask Later: Efficient Pre-training of Masked Language Models by Disentangling the [MASK] Token Baohao Liao David Thulke Sanjika Hewavitharana Hermann Ney Christof Monz 75 9 0 09 Nov 2022
SocioProbe: What, When, and Where Language Models Learn about Sociodemographics Anne Lauscher Federico Bianchi Samuel R. Bowman Dirk Hovy 91 7 0 08 Nov 2022
Bridging Fairness and Environmental Sustainability in Natural Language Processing Marius Hessenthaler Emma Strubell Dirk Hovy Anne Lauscher 92 8 0 08 Nov 2022
Tuning Language Models as Training Data Generators for Augmentation-Enhanced Few-Shot Learning Yu Meng Martin Michalski Jiaxin Huang Yu Zhang Tarek Abdelzaher Jiawei Han VLM 120 49 0 06 Nov 2022
Federated Multilingual Models for Medical Transcript Analysis Andre Manoel Mirian Hipolito Garcia Tal Baumel Shize Su Jialei Chen Dan Miller D. Karmon Robert Sim Dimitrios Dimitriadis 61 13 0 04 Nov 2022
Fine-Tuning Language Models via Epistemic Neural Networks Ian Osband S. Asghari Benjamin Van Roy Nat McAleese John Aslanides G. Irving UQLM 81 20 0 03 Nov 2022
Processing Long Legal Documents with Pre-trained Transformers: Modding LegalBERT and Longformer Dimitris Mamakas Petros Tsotsi Ion Androutsopoulos Ilias Chalkidis VLM AILaw 65 29 0 02 Nov 2022
Two-stage LLM Fine-tuning with Less Specialization and More Generalization Yihan Wang Si Si Daliang Li Michal Lukasik Felix X. Yu Cho-Jui Hsieh Inderjit S Dhillon Sanjiv Kumar 137 30 0 01 Nov 2022
Where to start? Analyzing the potential value of intermediate models Leshem Choshen Elad Venezian Shachar Don-Yehiya Noam Slonim Yoav Katz MoMe 95 27 0 31 Oct 2022
Lila: A Unified Benchmark for Mathematical Reasoning Swaroop Mishra Matthew Finlayson Pan Lu Leonard Tang Sean Welleck ... Tanmay Rajpurohit Oyvind Tafjord Ashish Sabharwal Peter Clark Ashwin Kalyan ELM AIMat ReLM LRM 93 0 0 31 Oct 2022
Parameter-Efficient Tuning Makes a Good Classification Head Zhuoyi Yang Ming Ding Yanhui Guo Qingsong Lv Jie Tang VLM 108 14 0 30 Oct 2022
token2vec: A Joint Self-Supervised Pre-training Framework Using Unpaired Speech and Text Xianghu Yue Junyi Ao Xiaoxue Gao Haizhou Li SSL 60 8 0 30 Oct 2022
Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language Models Xiaoman Pan Wenlin Yao Hongming Zhang Dian Yu Dong Yu Jianshu Chen KELM 296 25 0 28 Oct 2022
Analyzing Multi-Task Learning for Abstractive Text Summarization Frederic Kirstein Jan Philip Wahle Terry Ruas Bela Gipp 75 4 0 26 Oct 2022
PALT: Parameter-Lite Transfer of Language Models for Knowledge Graph Completion Jianhao Shen Chenguang Wang Ye Yuan Jiawei Han Heng Ji Koushik Sen Ming Zhang Dawn Song KELM ALM VPVLM 95 8 0 25 Oct 2022
ESB: A Benchmark For Multi-Domain End-to-End Speech Recognition Sanchit Gandhi Patrick von Platen Alexander M. Rush 70 25 0 24 Oct 2022
Legal-Tech Open Diaries: Lesson learned on how to develop and deploy light-weight models in the era of humongous Language Models Stelios Maroudas Sotiris Legkas Prodromos Malakasiotis Ilias Chalkidis VLM AILaw ALM ELM 80 4 0 24 Oct 2022
Composition, Attention, or Both? Ryosuke Yoshida Yohei Oseki CoGe 80 0 0 24 Oct 2022
K-SAM: Sharpness-Aware Minimization at the Speed of SGD Renkun Ni Ping Yeh-Chiang Jonas Geiping Micah Goldblum A. Wilson Tom Goldstein 64 9 0 23 Oct 2022
TAPE: Assessing Few-shot Russian Language Understanding Ekaterina Taktasheva Tatiana Shavrina Alena Fenogenova Denis Shevelev Nadezhda Katricheva ... Svetlana Iordanskaia Alena Spiridonova Valentina Kurenshchikova Ekaterina Artemova Vladislav Mikhailov AAML 77 10 0 23 Oct 2022
Model ensemble instead of prompt fusion: a sample-specific knowledge transfer method for few-shot prompt tuning Xiangyu Peng Chen Xing Prafulla Kumar Choubey Chien-Sheng Wu Caiming Xiong VLM 137 12 0 23 Oct 2022
Understanding Domain Learning in Language Models Through Subpopulation Analysis Zheng Zhao Yftah Ziser Shay B. Cohen 58 7 0 22 Oct 2022
Exploring The Landscape of Distributional Robustness for Question Answering Models Anas Awadalla Mitchell Wortsman Gabriel Ilharco Sewon Min Ian H. Magnusson Hannaneh Hajishirzi Ludwig Schmidt ELM OOD KELM 116 21 0 22 Oct 2022
Training Dynamics for Curriculum Learning: A Study on Monolingual and Cross-lingual NLU Fenia Christopoulou Gerasimos Lampouras Ignacio Iacobacci 101 4 0 22 Oct 2022
FCGEC: Fine-Grained Corpus for Chinese Grammatical Error Correction Lvxiaowei Xu Jian Wu Jiawei Peng Jiayu Fu Ming Cai 112 16 0 22 Oct 2022
What do Large Language Models Learn beyond Language? Avinash Madasu Shashank Srivastava LRM AI4CE 66 5 0 21 Oct 2022
BEANS: The Benchmark of Animal Sounds Masato Hagiwara Benjamin Hoffman Jen-Yu Liu M. Cusimano Felix Effenberger Katie Zacarian 94 27 0 21 Oct 2022
Large Language Models Can Self-Improve Jiaxin Huang S. Gu Le Hou Yuexin Wu Xuezhi Wang Hongkun Yu Jiawei Han ReLM AI4MH LRM 224 618 0 20 Oct 2022
Scaling Instruction-Finetuned Language Models Hyung Won Chung Le Hou Shayne Longpre Barret Zoph Yi Tay ... Jacob Devlin Adam Roberts Denny Zhou Quoc V. Le Jason W. Wei ReLM LRM 301 3,177 0 20 Oct 2022
Transcending Scaling Laws with 0.1% Extra Compute Yi Tay Jason W. Wei Hyung Won Chung Vinh Q. Tran David R. So ... Donald Metzler Slav Petrov N. Houlsby Quoc V. Le Mostafa Dehghani LRM 109 71 0 20 Oct 2022
Perceptual Grouping in Contrastive Vision-Language Models Kanchana Ranasinghe Brandon McKinzie S. S. Ravi Yinfei Yang Alexander Toshev Jonathon Shlens VLM 131 55 0 18 Oct 2022
Tiny-Attention Adapter: Contexts Are More Important Than the Number of Parameters Hongyu Zhao Hao Tan Hongyuan Mei MoE 81 18 0 18 Oct 2022
The Debate Over Understanding in AI's Large Language Models Melanie Mitchell D. Krakauer ELM 155 222 0 14 Oct 2022
Language Generation Models Can Cause Harm: So What Can We Do About It? An Actionable Survey Sachin Kumar Vidhisha Balachandran Lucille Njoo Antonios Anastasopoulos Yulia Tsvetkov ELM 179 91 0 14 Oct 2022
MTEB: Massive Text Embedding Benchmark Niklas Muennighoff Nouamane Tazi L. Magne Nils Reimers 575 422 0 13 Oct 2022
Language Models of Code are Few-Shot Commonsense Learners Aman Madaan Shuyan Zhou Uri Alon Yiming Yang Graham Neubig ReLM LRM 139 222 0 13 Oct 2022
Developing a general-purpose clinical language inference model from a large corpus of clinical notes Madhumita Sushil Dana Ludwig A. Butte V. Rudrapatna LM&MA 77 12 0 12 Oct 2022
Task Compass: Scaling Multi-task Pre-training with Task Prefix Zhuosheng Zhang Shuohang Wang Yichong Xu Yuwei Fang Wenhao Yu Yang Liu Han Zhao Chenguang Zhu Michael Zeng SSL LRM 70 16 0 12 Oct 2022
Voteñ'Rank: Revision of Benchmarking with Social Choice Theory Mark Rofin Vladislav Mikhailov Mikhail Florinskiy A. Kravchenko E. Tutubalina Tatiana Shavrina Daniel Karabekyan Ekaterina Artemova 87 11 0 11 Oct 2022
Model Cascading: Towards Jointly Improving Efficiency and Accuracy of NLP Systems Neeraj Varshney Chitta Baral 78 28 0 11 Oct 2022
Improving Sharpness-Aware Minimization with Fisher Mask for Better Generalization on Language Models Qihuang Zhong Liang Ding Li Shen Peng Mi Juhua Liu Bo Du Dacheng Tao AAML 90 51 0 11 Oct 2022
Multi-CLS BERT: An Efficient Alternative to Traditional Ensembling Haw-Shiuan Chang Ruei-Yao Sun Kathryn Ricci Andrew McCallum 108 15 0 10 Oct 2022
Uncertainty Quantification with Pre-trained Language Models: A Large-Scale Empirical Analysis Yuxin Xiao Paul Pu Liang Umang Bhatt Willie Neiswanger Ruslan Salakhutdinov Louis-Philippe Morency 253 98 0 10 Oct 2022
XPrompt: Exploring the Extreme of Prompt Tuning Fang Ma Chen Zhang Lei Ren Jingang Wang Qifan Wang Wei Wu Xiaojun Quan Dawei Song VLM 150 39 0 10 Oct 2022
Not another Negation Benchmark: The NaN-NLI Test Suite for Sub-clausal Negation Thinh Hung Truong Yulia Otmakhova Tim Baldwin Trevor Cohn Jey Han Lau Karin Verspoor 116 24 0 06 Oct 2022
InferES : A Natural Language Inference Corpus for Spanish Featuring Negation-Based Contrastive and Adversarial Examples Venelin Kovatchev Mariona Taulé 65 4 0 06 Oct 2022
State-of-the-art generalisation research in NLP: A taxonomy and review Dieuwke Hupkes Mario Giulianelli Verna Dankers Mikel Artetxe Yanai Elazar ... Leila Khalatbari Maria Ryskina Rita Frieske Ryan Cotterell Zhijing Jin 270 99 0 06 Oct 2022
Multiview Contextual Commonsense Inference: A New Dataset and Task Siqi Shen Deepanway Ghosal Navonil Majumder Henry Lim Rada Mihalcea Soujanya Poria LRM 74 12 0 06 Oct 2022
Ask Me Anything: A simple strategy for prompting language models Simran Arora A. Narayan Mayee F. Chen Laurel J. Orr Neel Guha Kush S. Bhatia Ines Chami Frederic Sala Christopher Ré ReLM LRM 293 219 0 05 Oct 2022