v1v2v3 (latest)

Neural Network Acceptability Judgments

31 May 2018

Alex Warstadt

Amanpreet Singh

Samuel R. Bowman

ArXiv (abs)PDF HTML

Papers citing "Neural Network Acceptability Judgments"

50 / 894 papers shown

Title
SoT: Delving Deeper into Classification Head for Transformer Jiangtao Xie Rui Zeng Qilong Wang Ziqi Zhou P. Li ViT 86 12 0 22 Apr 2021
Sensitivity as a Complexity Measure for Sequence Classification Tasks Michael Hahn Dan Jurafsky Richard Futrell 197 22 0 21 Apr 2021
CrossFit: A Few-shot Learning Challenge for Cross-task Generalization in NLP Qinyuan Ye Bill Yuchen Lin Xiang Ren 299 185 0 18 Apr 2021
GPT3Mix: Leveraging Large-scale Language Models for Text Augmentation Kang Min Yoo Dongju Park Jaewook Kang Sang-Woo Lee Woomyeong Park 115 243 0 18 Apr 2021
Contrastive Out-of-Distribution Detection for Pretrained Transformers Wenxuan Zhou Fangyu Liu Muhao Chen 56 101 0 18 Apr 2021
Learn Continually, Generalize Rapidly: Lifelong Knowledge Accumulation for Few-shot Learning Xisen Jin Bill Yuchen Lin Mohammad Rostami Xiang Ren BDL CLL 86 42 0 18 Apr 2021
Documenting Large Webtext Corpora: A Case Study on the Colossal Clean Crawled Corpus Jesse Dodge Maarten Sap Ana Marasović William Agnew Gabriel Ilharco Dirk Groeneveld Margaret Mitchell Matt Gardner AILaw 126 455 0 18 Apr 2021
What to Pre-Train on? Efficient Intermediate Task Selection Clifton A. Poth Jonas Pfeiffer Andreas Rucklé Iryna Gurevych 113 100 0 16 Apr 2021
Effect of Visual Extensions on Natural Language Understanding in Vision-and-Language Models Taichi Iki Akiko Aizawa VLM 60 20 0 16 Apr 2021
Probing Across Time: What Does RoBERTa Know and When? Leo Z. Liu Yizhong Wang Jungo Kasai Hannaneh Hajishirzi Noah A. Smith KELM 109 88 0 16 Apr 2021
How to Train BERT with an Academic Budget Peter Izsak Moshe Berchansky Omer Levy 135 119 0 15 Apr 2021
Annealing Knowledge Distillation A. Jafari Mehdi Rezagholizadeh Pranav Sharma A. Ghodsi 85 79 0 14 Apr 2021
Masked Language Modeling and the Distributional Hypothesis: Order Word Matters Pre-training for Little Koustuv Sinha Robin Jia Dieuwke Hupkes J. Pineau Adina Williams Douwe Kiela 132 249 0 14 Apr 2021
On the Use of Linguistic Features for the Evaluation of Generative Dialogue Systems Ian Berlot-Attwell Frank Rudzicz 19 2 0 13 Apr 2021
Understanding Transformers for Bot Detection in Twitter Andrés García-Silva Cristian Berrío José Manuél Gómez-Pérez 41 4 0 13 Apr 2021
Targeted Adversarial Training for Natural Language Understanding L. Pereira Xiaodong Liu Hao Cheng Hoifung Poon Jianfeng Gao Ichiro Kobayashi 65 12 0 12 Apr 2021
FUDGE: Controlled Text Generation With Future Discriminators Kevin Kaichuang Yang Dan Klein 109 337 0 12 Apr 2021
Adversarial Regularization as Stackelberg Game: An Unrolled Optimization Approach Simiao Zuo Chen Liang Haoming Jiang Xiaodong Liu Pengcheng He Jianfeng Gao Weizhu Chen T. Zhao 116 9 0 11 Apr 2021
Adapting Language Models for Zero-shot Learning by Meta-tuning on Dataset and Prompt Collections Ruiqi Zhong Kristy Lee Zheng Zhang Dan Klein 144 173 0 10 Apr 2021
EXPATS: A Toolkit for Explainable Automated Text Scoring Hitoshi Manabe Masato Hagiwara 35 4 0 07 Apr 2021
Exploring the Role of BERT Token Representations to Explain Sentence Probing Results Hosein Mohebbi Ali Modarressi Mohammad Taher Pilehvar MILM 67 26 0 03 Apr 2021
Evaluating the Morphosyntactic Well-formedness of Generated Texts Adithya Pratapa Antonios Anastasopoulos Shruti Rijhwani Aditi Chaudhary David R. Mortensen Graham Neubig Yulia Tsvetkov 78 8 0 30 Mar 2021
Retraining DistilBERT for a Voice Shopping Assistant by Using Universal Dependencies P. Jayarao Arpit Sharma 62 2 0 29 Mar 2021
A Practical Survey on Faster and Lighter Transformers Quentin Fournier G. Caron Daniel Aloise 137 103 0 26 Mar 2021
Approximating Instance-Dependent Noise via Instance-Confidence Embedding Yivan Zhang Masashi Sugiyama 65 8 0 25 Mar 2021
UNICORN on RAINBOW: A Universal Commonsense Reasoning Model on a New Multitask Benchmark Nicholas Lourie Ronan Le Bras Chandra Bhagavatula Yejin Choi LRM 105 140 0 24 Mar 2021
The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Architectures Sushant Singh A. Mahmood AI4TS 106 95 0 23 Mar 2021
Unsupervised Contextual Paraphrase Generation using Lexical Control and Reinforcement Learning Sonal Garg Sumanth Prabhu Hemant Misra G. Srinivasaraghavan 62 14 0 23 Mar 2021
TAG: Gradient Attack on Transformer-based Language Models Jieren Deng Yijue Wang Ji Li Chao Shang Hang Liu Sanguthevar Rajasekaran Caiwen Ding FedML PILM 89 79 0 11 Mar 2021
FairFil: Contrastive Neural Debiasing Method for Pretrained Text Encoders Pengyu Cheng Weituo Hao Siyang Yuan Shijing Si Lawrence Carin 77 105 0 11 Mar 2021
Split Computing and Early Exiting for Deep Learning Applications: Survey and Research Challenges Yoshitomo Matsubara Marco Levorato Francesco Restuccia 120 215 0 08 Mar 2021
Rissanen Data Analysis: Examining Dataset Characteristics via Description Length Ethan Perez Douwe Kiela Kyunghyun Cho 82 24 0 05 Mar 2021
Token-Modification Adversarial Attacks for Natural Language Processing: A Survey Tom Roth Yansong Gao A. Abuadbba Surya Nepal Wei Liu AAML 106 12 0 01 Mar 2021
SparseBERT: Rethinking the Importance Analysis in Self-attention Han Shi Jiahui Gao Xiaozhe Ren Hang Xu Xiaodan Liang Zhenguo Li James T. Kwok 95 54 0 25 Feb 2021
Analyzing Curriculum Learning for Sentiment Analysis along Task Difficulty, Pacing and Visualization Axes Anvesh Rao Vijjini Kaveri Anuranjana R. Mamidi 67 3 0 19 Feb 2021
COCO-LM: Correcting and Contrasting Text Sequences for Language Model Pretraining Yu Meng Chenyan Xiong Payal Bajaj Saurabh Tiwary Paul N. Bennett Jiawei Han Xia Song 182 205 0 16 Feb 2021
AutoFreeze: Automatically Freezing Model Blocks to Accelerate Fine-tuning Yuhan Liu Saurabh Agarwal Shivaram Venkataraman OffRL 80 56 0 02 Feb 2021
Explaining Natural Language Processing Classifiers with Occlusion and Language Modeling David Harbecke AAML 48 2 0 28 Jan 2021
CLiMP: A Benchmark for Chinese Language Model Evaluation Beilei Xiang Changbing Yang Yu Li Alex Warstadt Katharina Kann ALM 46 42 0 26 Jan 2021
Muppet: Massive Multi-task Representations with Pre-Finetuning Armen Aghajanyan Anchit Gupta Akshat Shrivastava Xilun Chen Luke Zettlemoyer Sonal Gupta 100 269 0 26 Jan 2021
WER-BERT: Automatic WER Estimation with BERT in a Balanced Ordinal Classification Paradigm Akshay Krishna Sheshadri Anvesh Rao Vijjini S. Kharbanda 36 8 0 14 Jan 2021
I-BERT: Integer-only BERT Quantization Sehoon Kim A. Gholami Z. Yao Michael W. Mahoney Kurt Keutzer MQ 175 354 0 05 Jan 2021
WARP: Word-level Adversarial ReProgramming Karen Hambardzumyan Hrant Khachatrian Jonathan May AAML 339 354 0 01 Jan 2021
MiniLMv2: Multi-Head Self-Attention Relation Distillation for Compressing Pretrained Transformers Wenhui Wang Hangbo Bao Shaohan Huang Li Dong Furu Wei MQ 124 274 0 31 Dec 2020
Making Pre-trained Language Models Better Few-shot Learners Tianyu Gao Adam Fisch Danqi Chen 429 1,984 0 31 Dec 2020
Out of Order: How Important Is The Sequential Order of Words in a Sentence in Natural Language Understanding Tasks? Thang M. Pham Trung Bui Long Mai Anh Totti Nguyen 286 123 0 30 Dec 2020
Accurate Word Representations with Universal Visual Guidance Zhuosheng Zhang Haojie Yu Hai Zhao Rui Wang Masao Utiyama 50 0 0 30 Dec 2020
BURT: BERT-inspired Universal Representation from Learning Meaningful Segment Yian Li Hai Zhao SSL 32 0 0 28 Dec 2020
ALP-KD: Attention-Based Layer Projection for Knowledge Distillation Peyman Passban Yimeng Wu Mehdi Rezagholizadeh Qun Liu 87 123 0 27 Dec 2020
Pre-Training Transformers as Energy-Based Cloze Models Kevin Clark Minh-Thang Luong Quoc V. Le Christopher D. Manning 72 80 0 15 Dec 2020