An Analysis of Dataset Overlap on Winograd-Style Tasks

9 November 2020

Papers citing "An Analysis of Dataset Overlap on Winograd-Style Tasks"

7 / 7 papers shown

Title
Picturing Ambiguity: A Visual Twist on the Winograd Schema Challenge Brendan Park Madeline Janecek Naser Ezzati-Jivan Yifeng Li Ali Emami 40 0 0 25 May 2024
Deception Abilities Emerged in Large Language Models Thilo Hagendorff LLMAG 40 76 0 31 Jul 2023
Do We Train on Test Data? The Impact of Near-Duplicates on License Plate Recognition Rayson Laroca Valter Estevam A. Britto Rodrigo Minetto David Menotti 30 10 0 10 Apr 2023
Language models show human-like content effects on reasoning tasks Ishita Dasgupta Andrew Kyle Lampinen Stephanie C. Y. Chan Hannah R. Sheahan Antonia Creswell D. Kumaran James L. McClelland Felix Hill ReLM LRM 35 181 0 14 Jul 2022
Back to Square One: Artifact Detection, Training and Commonsense Disentanglement in the Winograd Schema Yanai Elazar Hongming Zhang Yoav Goldberg Dan Roth ReLM LRM 45 44 0 16 Apr 2021
The Sensitivity of Language Models and Humans to Winograd Schema Perturbations Mostafa Abdou Vinit Ravishankar Maria Barrett Yonatan Belinkov Desmond Elliott Anders Søgaard ReLM LRM 62 34 0 04 May 2020
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 304 7,005 0 20 Apr 2018