v1v2v3 (latest)

SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems

2 May 2019

Amanpreet Singh

Papers citing "SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems"

50 / 1,500 papers shown

Title
MEGA: Multilingual Evaluation of Generative AI Kabir Ahuja Harshita Diddee Rishav Hada Millicent Ochieng Krithika Ramesh ... T. Ganu Sameer Segal Maxamed Axmed Kalika Bali Sunayana Sitaram LM&MA LRM ELM 117 292 0 22 Mar 2023
Self-supervised Meta-Prompt Learning with Meta-Gradient Regularization for Few-shot Generalization Kaihang Pan Juncheng Billy Li Hongye Song Jun Lin Xiaozhong Liu Siliang Tang OffRL 104 13 0 22 Mar 2023
Language Model Behavior: A Comprehensive Survey Tyler A. Chang Benjamin Bergen VLM LRM LM&MA 111 109 0 20 Mar 2023
Mind meets machine: Unravelling GPT-4's cognitive psychology Sifatkaur Dhingra Manmeet Singh Vaisakh S.B. Neetiraj Malviya S. Gill AI4MH 86 43 0 20 Mar 2023
Self-Improving-Leaderboard(SIL): A Call for Real-World Centric Natural Language Processing Leaderboards Chanjun Park Hyeonseok Moon Seolhwa Lee Jaehyung Seo Sugyeong Eo Heu-Jeoung Lim 57 2 0 20 Mar 2023
PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing Xiaozhe Ren Pingyi Zhou Xinfan Meng Xinjing Huang Yadao Wang ... Jiansheng Wei Xin Jiang Teng Su Qun Liu Jun Yao ALM MoE 128 63 0 20 Mar 2023
Trained on 100 million words and still in shape: BERT meets British National Corpus David Samuel Andrey Kutuzov Lilja Øvrelid Erik Velldal 101 32 0 17 Mar 2023
Logical Implications for Visual Question Answering Consistency Sergio Tascon-Morales Pablo Márquez-Neila Raphael Sznitman 81 9 0 16 Mar 2023
Evaluating gesture generation in a large-scale open challenge: The GENEA Challenge 2022 Taras Kucherenko Pieter Wolfert Youngwoo Yoon Carla Viegas Teodor Nikolov Mihail Tsakov G. Henter 69 24 0 15 Mar 2023
Can ChatGPT Replace Traditional KBQA Models? An In-depth Analysis of the Question Answering Performance of the GPT LLM Family Yiming Tan Dehai Min Y. Li Wenbo Li Nan Hu Yongrui Chen Guilin Qi AI4MH ELM 104 102 0 14 Mar 2023
Implicit and Explicit Commonsense for Multi-sentence Video Captioning Shih-Han Chou James J. Little Leonid Sigal 67 2 0 14 Mar 2023
An Overview on Language Models: Recent Developments and Outlook Chengwei Wei Yun Cheng Wang Bin Wang C.-C. Jay Kuo 93 47 0 10 Mar 2023
Larger language models do in-context learning differently Jerry W. Wei Jason W. Wei Yi Tay Dustin Tran Albert Webson ... Xinyun Chen Hanxiao Liu Da Huang Denny Zhou Tengyu Ma ReLM LRM 125 374 0 07 Mar 2023
A Challenging Benchmark for Low-Resource Learning Yudong Wang Chang Ma Qingxiu Dong Lingpeng Kong Jingjing Xu 72 4 0 07 Mar 2023
Towards Zero-Shot Functional Compositionality of Language Models Hangyeol Yu Myeongho Jeong Jamin Shin Hyeongdon Moon Juneyoung Park Seungtaek Choi 69 1 0 06 Mar 2023
Dynamic Prompting: A Unified Framework for Prompt Tuning Xianjun Yang Wei Cheng Xujiang Zhao Wenchao Yu Linda R. Petzold Haifeng Chen VLM 115 16 0 06 Mar 2023
Multitask Prompt Tuning Enables Parameter-Efficient Transfer Learning Zhen Wang Yikang Shen Leonid Karlinsky Rogerio Feris Huan Sun Yoon Kim VLM VPVLM 96 118 0 06 Mar 2023
Effectiveness of Data Augmentation for Parameter Efficient Tuning with Limited Data Stephen Obadinma Hongyu Guo Xiao-Dan Zhu 70 2 0 05 Mar 2023
Language Is Not All You Need: Aligning Perception with Language Models Shaohan Huang Li Dong Wenhui Wang Y. Hao Saksham Singhal ... Johan Bjorck Vishrav Chaudhary Subhojit Som Xia Song Furu Wei VLM LRM MLLM 135 566 0 27 Feb 2023
Testing AI on language comprehension tasks reveals insensitivity to underlying meaning Vittoria Dentella Fritz Guenther Elliot Murphy G. Marcus Evelina Leivada ELM 115 31 0 23 Feb 2023
Modular Deep Learning Jonas Pfeiffer Sebastian Ruder Ivan Vulić Edoardo Ponti MoMe OOD 159 80 0 22 Feb 2023
In-context Example Selection with Influences Nguyen Tai Eric Wong 91 54 0 21 Feb 2023
Hyena Hierarchy: Towards Larger Convolutional Language Models Michael Poli Stefano Massaroli Eric Q. Nguyen Daniel Y. Fu Tri Dao S. Baccus Yoshua Bengio Stefano Ermon Christopher Ré VLM 174 314 0 21 Feb 2023
ChatGPT: Jack of all trades, master of none Jan Kocoñ Igor Cichecki Oliwier Kaszyca Mateusz Kochanek Dominika Szydło ... Maciej Piasecki Lukasz Radliñski Konrad Wojtasik Stanislaw Wo'zniak Przemyslaw Kazienko AI4MH 168 558 0 21 Feb 2023
Unsupervised Layer-wise Score Aggregation for Textual OOD Detection Maxime Darrin Guillaume Staerman Eduardo Dadalto Camara Gomes Jackie CK Cheung Pablo Piantanida Pierre Colombo OODD 451 12 0 20 Feb 2023
BBT-Fin: Comprehensive Construction of Chinese Financial Domain Pre-trained Language Model, Corpus and Benchmark Dakuan Lu Hengkui Wu Jiaqing Liang Yipei Xu Qi He Yipeng Geng Mengkun Han Ying Xin Yanghua Xiao 89 62 0 18 Feb 2023
Bounding the Capabilities of Large Language Models in Open Text Generation with Prompt Constraints Albert Lu Hongxin Zhang Yanzhe Zhang Xuezhi Wang Diyi Yang LRM 85 32 0 17 Feb 2023
Like a Good Nearest Neighbor: Practical Content Moderation and Text Classification Luke Bates Iryna Gurevych BDL AI4MH 84 0 0 17 Feb 2023
Auditing large language models: a three-layered approach Jakob Mokander Jonas Schuett Hannah Rose Kirk Luciano Floridi AILaw MLAU 152 215 0 16 Feb 2023
Backdoor Learning for NLP: Recent Advances, Challenges, and Future Research Directions Marwan Omar SILM AAML 86 20 0 14 Feb 2023
STREET: A Multi-Task Structured Reasoning and Explanation Benchmark D. Ribeiro Shen Wang Xiaofei Ma He Zhu Rui Dong ... William Yang Wang Zhiheng Huang George Karypis Bing Xiang Dan Roth LRM ReLM 82 23 0 13 Feb 2023
The Wisdom of Hindsight Makes Language Models Better Instruction Followers Tianjun Zhang Fangchen Liu Justin Wong Pieter Abbeel Joseph E. Gonzalez 103 47 0 10 Feb 2023
Is Multimodal Vision Supervision Beneficial to Language? Avinash Madasu Vasudev Lal 66 4 0 10 Feb 2023
Knowledge is a Region in Weight Space for Fine-tuned Language Models Almog Gueta Elad Venezian Colin Raffel Noam Slonim Yoav Katz Leshem Choshen 88 52 0 09 Feb 2023
DoG is SGD's Best Friend: A Parameter-Free Dynamic Step Size Schedule Maor Ivgi Oliver Hinder Y. Carmon ODL 157 66 0 08 Feb 2023
Chain of Hindsight Aligns Language Models with Feedback Hao Liu Carmelo Sferrazza Pieter Abbeel ALM 139 124 0 06 Feb 2023
A Categorical Archive of ChatGPT Failures Ali Borji ELM 143 396 0 06 Feb 2023
The Power of External Memory in Increasing Predictive Model Capacity Cenk Baykal D. Cutler Nishanth Dikkala Nikhil Ghosh Rina Panigrahy Xin Wang KELM 41 0 0 31 Jan 2023
Alternating Updates for Efficient Transformers Cenk Baykal D. Cutler Nishanth Dikkala Nikhil Ghosh Rina Panigrahy Xin Wang MoE 76 5 0 30 Jan 2023
LEXTREME: A Multi-Lingual and Multi-Task Benchmark for the Legal Domain Joel Niklaus Veton Matoshi Pooja Rani Andrea Galassi Matthias Sturmer Ilias Chalkidis ELM AILaw 100 60 0 30 Jan 2023
Progressive Prompts: Continual Learning for Language Models Anastasia Razdaibiedina Yuning Mao Rui Hou Madian Khabsa M. Lewis Amjad Almahairi VLM KELM CLL 127 142 0 29 Jan 2023
Bipol: Multi-axes Evaluation of Bias with Explainability in Benchmark Datasets Tosin Adewumi Isabella Sodergren Lama Alkhaled Sana Sabah Sabry F. Liwicki Marcus Liwicki 69 4 0 28 Jan 2023
AutoPEFT: Automatic Configuration Search for Parameter-Efficient Fine-Tuning Han Zhou Xingchen Wan Ivan Vulić Anna Korhonen 81 48 0 28 Jan 2023
Probing Out-of-Distribution Robustness of Language Models with Parameter-Efficient Transfer Learning Hyunsoo Cho Choonghyun Park Junyeop Kim Sungmin Cho Kang Min Yoo Sang-goo Lee OODD 87 3 0 27 Jan 2023
ThoughtSource: A central hub for large language model reasoning data Simon Ott Konstantin Hebenstreit Valentin Liévin C. Hother M. Moradi Maximilian Mayrhauser Robert Praas Ole Winther Matthias Samwald ReLM LRM 134 46 0 27 Jan 2023
What are the Machine Learning best practices reported by practitioners on Stack Exchange? Anamaria Mojica-Hanke A. Bayona Mario Linares-Vásquez Steffen Herbold Fabio A. González HAI 53 6 0 25 Jan 2023
FewShotTextGCN: K-hop neighborhood regularization for few-shot learning on graphs Niels van der Heijden Ekaterina Shutova H. Yannakoudakis 87 0 0 25 Jan 2023
One Model for All Domains: Collaborative Domain-Prefix Tuning for Cross-Domain NER Xiang Chen Lei Li Q. Fei Ningyu Zhang Chuanqi Tan Yong Jiang Fei Huang Huajun Chen 98 24 0 25 Jan 2023
A Stability Analysis of Fine-Tuning a Pre-Trained Model Z. Fu Anthony Man-Cho So Nigel Collier 62 3 0 24 Jan 2023
Reversing The Twenty Questions Game Parth Parikh Anisha Gupta 31 1 0 19 Jan 2023