BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions

24 May 2019

Papers citing "BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions"

50 / 1,143 papers shown

Title
Combining Feature and Instance Attribution to Detect Artifacts Pouya Pezeshkpour Sarthak Jain Sameer Singh Byron C. Wallace TDI 120 42 0 01 Jul 2021
Memory-efficient Transformers via Top- $k$ Attention Ankit Gupta Guy Dar Shaya Goodman David Ciprut Jonathan Berant MQ 98 60 0 13 Jun 2021
Compacter: Efficient Low-Rank Hypercomplex Adapter Layers Rabeeh Karimi Mahabadi James Henderson Sebastian Ruder MoE 144 494 0 08 Jun 2021
Parameter-efficient Multi-task Fine-tuning for Transformers via Shared Hypernetworks Rabeeh Karimi Mahabadi Sebastian Ruder Mostafa Dehghani James Henderson MoE 80 313 0 08 Jun 2021
PROST: Physical Reasoning of Objects through Space and Time Stéphane Aroca-Ouellette Cory Paik Alessandro Roncone Katharina Kann LRM 80 49 0 07 Jun 2021
A Cluster-based Approach for Improving Isotropy in Contextual Embedding Space S. Rajaee Mohammad Taher Pilehvar 75 41 0 02 Jun 2021
COM2SENSE: A Commonsense Reasoning Benchmark with Complementary Sentences Shikhar Singh Nuan Wen Yu Hou Pegah Alipoormolabashi Te-Lin Wu Xuezhe Ma Nanyun Peng LRM 95 59 0 02 Jun 2021
Comparing Test Sets with Item Response Theory Clara Vania Phu Mon Htut William Huang Dhara Mungra Richard Yuanzhe Pang Jason Phang Haokun Liu Kyunghyun Cho Sam Bowman 74 43 0 01 Jun 2021
The Out-of-Distribution Problem in Explainability and Search Methods for Feature Importance Explanations Peter Hase Harry Xie Joey Tianyi Zhou OODD LRM FAtt 106 91 0 01 Jun 2021
Corpus-Level Evaluation for Event QA: The IndiaPoliceEvents Corpus Covering the 2002 Gujarat Violence Andrew Halterman Katherine A. Keith Sheikh Muhammad Sarwar Brendan O'Connor 79 29 0 27 May 2021
True Few-Shot Learning with Language Models Ethan Perez Douwe Kiela Kyunghyun Cho 140 440 0 24 May 2021
KLUE: Korean Language Understanding Evaluation Sungjoon Park Jihyung Moon Sungdong Kim Won Ik Cho Jiyoon Han ... Seonghyun Kim Lucy Park Alice Oh Jung-Woo Ha Kyunghyun Cho ELM VLM 117 198 0 20 May 2021
Enhancing Transformers with Gradient Boosted Decision Trees for NLI Fine-Tuning Benjamin Minixhofer Milan Gritta Ignacio Iacobacci AI4CE 17 5 0 08 May 2021
Empirical Evaluation of Pre-trained Transformers for Human-Level NLP: The Role of Sample Size and Dimensionality Adithya Ganesan Matthew Matero Aravind Reddy Ravula Huy-Hien Vu H. Andrew Schwartz 90 35 0 07 May 2021
Entailment as Few-Shot Learner Sinong Wang Han Fang Madian Khabsa Hanzi Mao Hao Ma 94 184 0 29 Apr 2021
CrossFit: A Few-shot Learning Challenge for Cross-task Generalization in NLP Qinyuan Ye Bill Yuchen Lin Xiang Ren 296 185 0 18 Apr 2021
Documenting Large Webtext Corpora: A Case Study on the Colossal Clean Crawled Corpus Jesse Dodge Maarten Sap Ana Marasović William Agnew Gabriel Ilharco Dirk Groeneveld Margaret Mitchell Matt Gardner AILaw 124 454 0 18 Apr 2021
The Power of Scale for Parameter-Efficient Prompt Tuning Brian Lester Rami Al-Rfou Noah Constant VPVLM 642 4,119 0 18 Apr 2021
Competency Problems: On Finding and Removing Artifacts in Language Data Matt Gardner William Merrill Jesse Dodge Matthew E. Peters Alexis Ross Sameer Singh Noah A. Smith 242 111 0 17 Apr 2021
Surface Form Competition: Why the Highest Probability Answer Isn't Always Right Ari Holtzman Peter West Vered Schwartz Yejin Choi Luke Zettlemoyer LRM 195 239 0 16 Apr 2021
What to Pre-Train on? Efficient Intermediate Task Selection Clifton A. Poth Jonas Pfeiffer Andreas Rucklé Iryna Gurevych 113 100 0 16 Apr 2021
Multivalent Entailment Graphs for Question Answering Nick McKenna Liane Guillou Mohammad Javad Hosseini Sander Bijl de Vroe Mark Johnson Mark Steedman NAI 89 14 0 16 Apr 2021
Sequence tagging for biomedical extractive question answering Wonjin Yoon Richard Jackson Aron Lagerberg Jaewoo Kang MedIm 66 27 0 15 Apr 2021
Does Putting a Linguist in the Loop Improve NLU Data Collection? Alicia Parrish William Huang Omar Agha Soo-hwan Lee Nikita Nangia Alex Warstadt Karmanya Aggarwal Emily Allaway Tal Linzen Samuel R. Bowman 117 40 0 15 Apr 2021
TWEAC: Transformer with Extendable QA Agent Classifiers Gregor Geigle Nils Reimers Andreas Rucklé Iryna Gurevych ViT 140 27 0 14 Apr 2021
Structural analysis of an all-purpose question answering model Vincent Micheli Quentin Heinrich Franccois Fleuret Wacim Belblidia 43 3 0 13 Apr 2021
MultiModalQA: Complex Question Answering over Text, Tables and Images Alon Talmor Ori Yoran Amnon Catav Dan Lahav Yizhong Wang Akari Asai Gabriel Ilharco Hannaneh Hajishirzi Jonathan Berant LMTD 93 162 0 13 Apr 2021
SpartQA: : A Textual Question Answering Benchmark for Spatial Reasoning Roshanak Mirzaee Hossein Rajaby Faghihi Qiang Ning Parisa Kordjmashidi 54 83 0 12 Apr 2021
Achieving Model Robustness through Discrete Adversarial Training Maor Ivgi Jonathan Berant AAML 71 28 0 11 Apr 2021
Adapting Language Models for Zero-shot Learning by Meta-tuning on Dataset and Prompt Collections Ruiqi Zhong Kristy Lee Zheng Zhang Dan Klein 121 173 0 10 Apr 2021
Connecting Attributions and QA Model Behavior on Realistic Counterfactuals Xi Ye Rohan Nair Greg Durrett 58 24 0 09 Apr 2021
AmbiFC: Fact-Checking Ambiguous Claims with Evidence Max Glockner Ieva Staliunaite James Thorne Gisela Vallejo Andreas Vlachos Iryna Gurevych 118 30 0 01 Apr 2021
UNICORN on RAINBOW: A Universal Commonsense Reasoning Model on a New Multitask Benchmark Nicholas Lourie Ronan Le Bras Chandra Bhagavatula Yejin Choi LRM 102 140 0 24 Mar 2021
Improving and Simplifying Pattern Exploiting Training Derek Tam Rakesh R Menon Joey Tianyi Zhou Shashank Srivastava Colin Raffel 78 151 0 22 Mar 2021
GPT Understands, Too Xiao Liu Yanan Zheng Zhengxiao Du Ming Ding Yujie Qian Zhilin Yang Jie Tang VLM 172 1,184 0 18 Mar 2021
How Many Data Points is a Prompt Worth? Teven Le Scao Alexander M. Rush VLM 190 303 0 15 Mar 2021
DOCENT: Learning Self-Supervised Entity Representations from Large Document Collections Yury Zemlyanskiy Sudeep Gandhe Ruining He Bhargav Kanagal Anirudh Ravula Juraj Gottweis Fei Sha Ilya Eckstein SSL 56 11 0 26 Feb 2021
Muppet: Massive Multi-task Representations with Pre-Finetuning Armen Aghajanyan Anchit Gupta Akshat Shrivastava Xilun Chen Luke Zettlemoyer Sonal Gupta 100 269 0 26 Jan 2021
English Machine Reading Comprehension Datasets: A Survey Daria Dzendzik Carl Vogel Jennifer Foster RALM AIMat 86 49 0 25 Jan 2021
Unanswerable Questions about Images and Texts E. Davis 79 12 0 25 Jan 2021
Did Aristotle Use a Laptop? A Question Answering Benchmark with Implicit Reasoning Strategies Mor Geva Daniel Khashabi Elad Segal Tushar Khot Dan Roth Jonathan Berant RALM 358 742 0 06 Jan 2021
Retrieving and Reading: A Comprehensive Survey on Open-domain Question Answering Fengbin Zhu Wenqiang Lei Chao Wang Jianming Zheng Soujanya Poria Tat-Seng Chua RALM 271 257 0 04 Jan 2021
FiD-Ex: Improving Sequence-to-Sequence Models for Extractive Rationale Generation Kushal Lakhotia Bhargavi Paranjape Asish Ghoshal Wen-tau Yih Yashar Mehdad Srini Iyer 63 28 0 31 Dec 2020
Learning from Mistakes: Using Mis-predictions as Harm Alerts in Language Pre-Training Chen Xing Wenhao Liu Caiming Xiong 31 0 0 16 Dec 2020
Reference Knowledgeable Network for Machine Reading Comprehension Yilin Zhao Zhuosheng Zhang Hai Zhao 50 5 0 07 Dec 2020
Learning from Task Descriptions Orion Weller Nicholas Lourie Matt Gardner Matthew E. Peters 113 91 0 16 Nov 2020
When Do You Need Billions of Words of Pretraining Data? Yian Zhang Alex Warstadt Haau-Sing Li Samuel R. Bowman 62 141 0 10 Nov 2020
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark Tatiana Shavrina Alena Fenogenova Anton A. Emelyanov Denis Shevelev Ekaterina Artemova Valentin Malykh Vladislav Mikhailov Maria Tikhonova Andrey Chertok Andrey Evlampiev VLM ELM 89 82 0 29 Oct 2020
Measuring Association Between Labels and Free-Text Rationales Sarah Wiegreffe Ana Marasović Noah A. Smith 333 182 0 24 Oct 2020
Optimal Subarchitecture Extraction For BERT Adrian de Wynter Daniel J. Perry MQ 91 18 0 20 Oct 2020