Adversarial NLI: A New Benchmark for Natural Language Understanding

31 October 2019

Jason Weston

Douwe Kiela

ArXiv PDF HTML

Papers citing "Adversarial NLI: A New Benchmark for Natural Language Understanding"

50 / 261 papers shown

Title
Do Prompt-Based Models Really Understand the Meaning of their Prompts? Albert Webson Ellie Pavlick LRM 53 355 0 02 Sep 2021
DuTrust: A Sentiment Analysis Dataset for Trustworthiness Evaluation Lijie Wang Hao Liu Shu-ping Peng Hongxuan Tang Xinyan Xiao Ying-Cong Chen Hua Wu Haifeng Wang 25 5 0 30 Aug 2021
Noise Stability Regularization for Improving BERT Fine-tuning Hang Hua Xingjian Li Dejing Dou Chengzhong Xu Jiebo Luo 19 43 0 10 Jul 2021
Anticipating Safety Issues in E2E Conversational AI: Framework and Tooling Emily Dinan Gavin Abercrombie A. S. Bergman Shannon L. Spruit Dirk Hovy Y-Lan Boureau Verena Rieser 43 105 0 07 Jul 2021
He Thinks He Knows Better than the Doctors: BERT for Event Factuality Fails on Pragmatics Nan-Jiang Jiang M. Marneffe 21 21 0 02 Jul 2021
DocNLI: A Large-scale Dataset for Document-level Natural Language Inference Wenpeng Yin Dragomir R. Radev Caiming Xiong HILM 26 97 0 17 Jun 2021
SSMix: Saliency-Based Span Mixup for Text Classification Soyoung Yoon Gyuwan Kim Kyumin Park 22 68 0 15 Jun 2021
Improving Paraphrase Detection with the Adversarial Paraphrasing Task Animesh Nighojkar John Licato 25 39 0 14 Jun 2021
Probing Pre-Trained Language Models for Disease Knowledge Israa Alghanmi Luis Espinosa-Anke Steven Schockaert LM&MA ELM 33 13 0 14 Jun 2021
Pre-Trained Models: Past, Present and Future Xu Han Zhengyan Zhang Ning Ding Yuxian Gu Xiao Liu ... Jie Tang Ji-Rong Wen Jinhui Yuan Wayne Xin Zhao Jun Zhu AIFin MQ AI4MH 58 815 0 14 Jun 2021
Can Transformer Language Models Predict Psychometric Properties? Antonio Laverghetta Animesh Nighojkar Jamshidbek Mirzakhalov John Licato LM&MA 38 14 0 12 Jun 2021
FEVEROUS: Fact Extraction and VERification Over Unstructured and Structured information Rami Aly Zhijiang Guo M. Schlichtkrull James Thorne Andreas Vlachos Christos Christodoulopoulos O. Cocarascu Arpit Mittal HILM 27 174 0 10 Jun 2021
How Good Is NLP? A Sober Look at NLP Tasks through the Lens of Social Impact Zhijing Jin Geeticka Chauhan Brian Tse Mrinmaya Sachan Rada Mihalcea 30 25 0 04 Jun 2021
On the Efficacy of Adversarial Data Collection for Question Answering: Results from a Large-Scale Randomized Study Divyansh Kaushik Douwe Kiela Zachary Chase Lipton Wen-tau Yih AAML 11 36 0 02 Jun 2021
Evaluating Gender Bias in Natural Language Inference Shanya Sharma Manan Dey Koustuv Sinha 28 41 0 12 May 2021
Reliability Testing for Natural Language Processing Systems Samson Tan Chenyu You K. Baxter Araz Taeihagh G. Bennett Min-Yen Kan 15 38 0 06 May 2021
CrossFit: A Few-shot Learning Challenge for Cross-task Generalization in NLP Qinyuan Ye Bill Yuchen Lin Xiang Ren 223 180 0 18 Apr 2021
A Token-level Reference-free Hallucination Detection Benchmark for Free-form Text Generation Tianyu Liu Yizhe Zhang Chris Brockett Yi Mao Zhifang Sui Weizhu Chen W. Dolan HILM 228 144 0 18 Apr 2021
Improving Question Answering Model Robustness with Synthetic Adversarial Data Generation Max Bartolo Tristan Thrush Robin Jia Sebastian Riedel Pontus Stenetorp Douwe Kiela AAML 28 103 0 18 Apr 2021
Supervising Model Attention with Human Explanations for Robust Natural Language Inference Joe Stacey Yonatan Belinkov Marek Rei 30 45 0 16 Apr 2021
AR-LSAT: Investigating Analytical Reasoning of Text Wanjun Zhong Siyuan Wang Duyu Tang Zenan Xu Daya Guo Jiahai Wang Jian Yin Ming Zhou Nan Duan ELM 27 40 0 14 Apr 2021
NLI Data Sanity Check: Assessing the Effect of Data Corruption on Model Performance Aarne Talman Marianna Apidianaki S. Chatzikyriakidis Jörg Tiedemann 33 10 0 10 Apr 2021
What Will it Take to Fix Benchmarking in Natural Language Understanding? Samuel R. Bowman George E. Dahl ELM ALM 30 156 0 05 Apr 2021
Are NLP Models really able to Solve Simple Math Word Problems? Arkil Patel S. Bhattamishra Navin Goyal ReLM LRM 27 766 0 12 Mar 2021
Mind the Gap: Assessing Temporal Generalization in Neural Language Models Angeliki Lazaridou A. Kuncoro E. Gribovskaya Devang Agrawal Adam Liska ... Sebastian Ruder Dani Yogatama Kris Cao Susannah Young Phil Blunsom VLM 41 207 0 03 Feb 2021
Muppet: Massive Multi-task Representations with Pre-Finetuning Armen Aghajanyan Anchit Gupta Akshat Shrivastava Xilun Chen Luke Zettlemoyer Sonal Gupta 33 266 0 26 Jan 2021
Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity W. Fedus Barret Zoph Noam M. Shazeer MoE 11 2,075 0 11 Jan 2021
FastIF: Scalable Influence Functions for Efficient Model Interpretation and Debugging Han Guo Nazneen Rajani Peter Hase Joey Tianyi Zhou Caiming Xiong TDI 41 102 0 31 Dec 2020
Learning from the Worst: Dynamically Generated Datasets to Improve Online Hate Detection Bertie Vidgen Tristan Thrush Zeerak Talat Douwe Kiela 34 242 0 31 Dec 2020
HateCheck: Functional Tests for Hate Speech Detection Models Paul Röttger B. Vidgen Dong Nguyen Zeerak Talat Helen Z. Margetts J. Pierrehumbert 31 259 0 31 Dec 2020
DynaSent: A Dynamic Benchmark for Sentiment Analysis Christopher Potts Zhengxuan Wu Atticus Geiger Douwe Kiela 230 77 0 30 Dec 2020
Out of Order: How Important Is The Sequential Order of Words in a Sentence in Natural Language Understanding Tasks? Thang M. Pham Trung Bui Long Mai Anh Totti Nguyen 220 122 0 30 Dec 2020
Learning to Rationalize for Nonmonotonic Reasoning with Distant Supervision Faeze Brahman Vered Shwartz Rachel Rudinger Yejin Choi LRM 15 42 0 14 Dec 2020
Supervised Contrastive Learning for Pre-trained Language Model Fine-tuning Beliz Gunel Jingfei Du Alexis Conneau Ves Stoyanov 18 497 0 03 Nov 2020
ANLIzing the Adversarial Natural Language Inference Dataset Adina Williams Tristan Thrush Douwe Kiela AAML 183 46 0 24 Oct 2020
Posterior Differential Regularization with f-divergence for Improving Model Robustness Hao Cheng Xiaodong Liu L. Pereira Yaoliang Yu Jianfeng Gao 248 31 0 23 Oct 2020
What is More Likely to Happen Next? Video-and-Language Future Event Prediction Jie Lei Licheng Yu Tamara L. Berg Joey Tianyi Zhou 33 72 0 15 Oct 2020
Geometry matters: Exploring language examples at the decision boundary Debajyoti Datta Shashwat Kumar Laura E. Barnes Tom Fletcher AAML 9 3 0 14 Oct 2020
Counterfactually-Augmented SNLI Training Data Does Not Yield Better Generalization Than Unaugmented Data William Huang Haokun Liu Samuel R. Bowman 21 37 0 09 Oct 2020
What Can We Learn from Collective Human Opinions on Natural Language Inference Data? Yixin Nie Xiang Zhou Joey Tianyi Zhou 26 129 0 07 Oct 2020
InfoBERT: Improving Robustness of Language Models from An Information Theoretic Perspective Wei Ping Shuohang Wang Yu Cheng Zhe Gan R. Jia Bo-wen Li Jingjing Liu AAML 46 113 0 05 Oct 2020
Utility is in the Eye of the User: A Critique of NLP Leaderboards Kawin Ethayarajh Dan Jurafsky ELM 24 51 0 29 Sep 2020
Word meaning in minds and machines Brenden M. Lake G. Murphy NAI 15 117 0 04 Aug 2020
Open-Domain Conversational Agents: Current Progress, Open Problems, and Future Directions Stephen Roller Y-Lan Boureau Jason Weston Antoine Bordes Emily Dinan ... Kurt Shuster Eric Michael Smith Arthur Szlam Jack Urbanek Mary Williamson LLMAG AI4CE 28 51 0 22 Jun 2020
Leap-Of-Thought: Teaching Pre-Trained Models to Systematically Reason Over Implicit Knowledge Alon Talmor Oyvind Tafjord Peter Clark Yoav Goldberg Jonathan Berant ReLM LRM 36 39 0 11 Jun 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 71 40,200 0 28 May 2020
INFOTABS: Inference on Tables as Semi-structured Data Vivek Gupta Maitrey Mehta Pegah Nokhiz Vivek Srikumar LMTD 16 100 0 13 May 2020
DQI: Measuring Data Quality in NLP Swaroop Mishra Anjana Arunkumar Bhavdeep Singh Sachdeva Chris Bryan Chitta Baral 36 30 0 02 May 2020
RICA: Evaluating Robust Inference Capabilities Based on Commonsense Axioms Pei Zhou Rahul Khanna Seyeon Lee Bill Yuchen Lin Daniel E. Ho Jay Pujara Xiang Ren ReLM 19 36 0 02 May 2020
Syntactic Data Augmentation Increases Robustness to Inference Heuristics Junghyun Min R. Thomas McCoy Dipanjan Das Emily Pitler Tal Linzen 30 175 0 24 Apr 2020