v1v2 (latest)

XLNet: Generalized Autoregressive Pretraining for Language Understanding

19 June 2019

Papers citing "XLNet: Generalized Autoregressive Pretraining for Language Understanding"

50 / 3,518 papers shown

Title
MUSE: Parallel Multi-Scale Attention for Sequence to Sequence Learning Guangxiang Zhao Xu Sun Jingjing Xu Zhiyuan Zhang Liangchen Luo LRM 61 49 0 17 Nov 2019
The Eighth Dialog System Technology Challenge Seokhwan Kim Michel Galley Chulaka Gunasekara Sungjin Lee Adam Atkinson ... Tim K. Marks Abhinav Rastogi Xiaoxue Zang Srinivas Sunkara Raghav Gupta VLM 71 65 0 14 Nov 2019
What do you mean, BERT? Assessing BERT as a Distributional Semantics Model Timothee Mickus Denis Paperno Mathieu Constant Kees van Deemter 86 46 0 13 Nov 2019
Unsupervised Pre-training for Natural Language Generation: A Literature Review Yuanxin Liu Zheng Lin SSL AI4CE 43 3 0 13 Nov 2019
Compressive Transformers for Long-Range Sequence Modelling Jack W. Rae Anna Potapenko Siddhant M. Jayakumar Timothy Lillicrap RALM VLM KELM 85 655 0 13 Nov 2019
KEPLER: A Unified Model for Knowledge Embedding and Pre-trained Language Representation Xiaozhi Wang Tianyu Gao Zhaocheng Zhu Zhengyan Zhang Zhiyuan Liu Juan-Zi Li Jian Tang 172 675 0 13 Nov 2019
SMILES Transformer: Pre-trained Molecular Fingerprint for Low Data Drug Discovery Shion Honda Shoi Shi H. Ueda MedIm 83 176 0 12 Nov 2019
Attending to Entities for Better Text Understanding Pengxiang Cheng K. Erk LRM 59 38 0 11 Nov 2019
CamemBERT: a Tasty French Language Model Louis Martin Benjamin Muller Pedro Ortiz Suarez Yoann Dupont Laurent Romary Eric Villemonte de la Clergerie Djamé Seddah Benoît Sagot 143 981 0 10 Nov 2019
Rethinking Self-Attention: Towards Interpretability in Neural Parsing Khalil Mrini Franck Dernoncourt Quan Tran Trung Bui W. Chang Ndapandula Nakashole MILM LRM 97 29 0 10 Nov 2019
Learning to Few-Shot Learn Across Diverse Natural Language Classification Tasks Trapit Bansal Rishikesh Jha Andrew McCallum SSL 104 121 0 10 Nov 2019
E-BERT: Efficient-Yet-Effective Entity Embeddings for BERT Nina Poerner Ulli Waltinger Hinrich Schütze 140 161 0 09 Nov 2019
Improving Machine Reading Comprehension via Adversarial Training Ziqing Yang Yiming Cui Wanxiang Che Ting Liu Shijin Wang Guoping Hu 59 17 0 09 Nov 2019
MKD: a Multi-Task Knowledge Distillation Approach for Pretrained Language Models Linqing Liu Haiquan Wang Jimmy J. Lin R. Socher Caiming Xiong 65 21 0 09 Nov 2019
How Decoding Strategies Affect the Verifiability of Generated Text Luca Massarelli Fabio Petroni Aleksandra Piktus Myle Ott Tim Rocktaschel Vassilis Plachouras Fabrizio Silvestri Sebastian Riedel 130 50 0 09 Nov 2019
On the Relationship between Self-Attention and Convolutional Layers Jean-Baptiste Cordonnier Andreas Loukas Martin Jaggi 150 535 0 08 Nov 2019
SMART: Robust and Efficient Fine-Tuning for Pre-trained Natural Language Models through Principled Regularized Optimization Haoming Jiang Pengcheng He Weizhu Chen Xiaodong Liu Jianfeng Gao T. Zhao 137 563 0 08 Nov 2019
What Would Elsa Do? Freezing Layers During Transformer Fine-Tuning Jaejun Lee Raphael Tang Jimmy J. Lin 69 127 0 08 Nov 2019
Reducing Sentiment Bias in Language Models via Counterfactual Evaluation Po-Sen Huang Huan Zhang Ray Jiang Robert Stanforth Johannes Welbl Jack W. Rae Vishal Maini Dani Yogatama Pushmeet Kohli 106 217 0 08 Nov 2019
Certified Data Removal from Machine Learning Models Chuan Guo Tom Goldstein Awni Y. Hannun Laurens van der Maaten MU 151 452 0 08 Nov 2019
Blockwise Self-Attention for Long Document Understanding J. Qiu Hao Ma Omer Levy Scott Yih Sinong Wang Jie Tang 111 254 0 07 Nov 2019
Probing Contextualized Sentence Representations with Visual Awareness Zhuosheng Zhang Rui Wang Kehai Chen Masao Utiyama Eiichiro Sumita Hai Zhao 74 2 0 07 Nov 2019
BERTs of a feather do not generalize together: Large variability in generalization across models with similar test set performance R. Thomas McCoy Junghyun Min Tal Linzen 137 151 0 07 Nov 2019
Dice Loss for Data-imbalanced NLP Tasks Xiaoya Li Xiaofei Sun Yuxian Meng Junjun Liang Leilei Gan Jiwei Li 116 592 0 07 Nov 2019
Explicit Pairwise Word Interaction Modeling Improves Pretrained Transformers for English Semantic Similarity Tasks Yinan Zhang Raphael Tang Jimmy J. Lin 26 5 0 07 Nov 2019
Enhancing Pre-trained Chinese Character Representation with Word-aligned Attention Yanzeng Li Yu Bowen Mengge Xue Tingwen Liu 79 27 0 07 Nov 2019
Towards Domain Adaptation from Limited Data for Question Answering Using Deep Neural Networks Timothy J. Hazen Shehzaad Dhuliawala Daniel Boies OOD 60 19 0 06 Nov 2019
MML: Maximal Multiverse Learning for Robust Fine-Tuning of Language Models Itzik Malkiel Lior Wolf 29 2 0 05 Nov 2019
Deepening Hidden Representations from Pre-trained Language Models Junjie Yang Hai Zhao 24 10 0 05 Nov 2019
An Algorithm for Routing Capsules in All Domains Franz A. Heinsen 24 4 0 02 Nov 2019
ZEN: Pre-training Chinese Text Encoder Enhanced by N-gram Representations Shizhe Diao Jiaxin Bai Yan Song Tong Zhang Yonggang Wang AI4CE 70 136 0 02 Nov 2019
CCNet: Extracting High Quality Monolingual Datasets from Web Crawl Data Guillaume Wenzek Marie-Anne Lachaux Alexis Conneau Vishrav Chaudhary Francisco Guzmán Armand Joulin Edouard Grave 124 658 0 01 Nov 2019
Generalization through Memorization: Nearest Neighbor Language Models Urvashi Khandelwal Omer Levy Dan Jurafsky Luke Zettlemoyer M. Lewis RALM 185 846 0 01 Nov 2019
Adversarial NLI: A New Benchmark for Natural Language Understanding Yixin Nie Adina Williams Emily Dinan Joey Tianyi Zhou Jason Weston Douwe Kiela 195 1,013 0 31 Oct 2019
What Question Answering can Learn from Trivia Nerds Jordan L. Boyd-Graber Benjamin Borschinger 80 37 0 31 Oct 2019
Transfer Learning from Transformers to Fake News Challenge Stance Detection (FNC-1) Task Valeriya Slovikovskaya 60 42 0 31 Oct 2019
A neural document language modeling framework for spoken document retrieval Li-Phen Yen Zheng-Yu Wu Kuan-Yu Chen 3DGS 44 0 0 31 Oct 2019
Ensembling Strategies for Answering Natural Questions Anthony Ferritto Lin Pan Rishav Chakravarti Salim Roukos Radu Florian J. William Murdock Avirup Sil ELM 42 0 0 30 Oct 2019
Towards Generalizable Neuro-Symbolic Systems for Commonsense Question Answering Kaixin Ma Jonathan M Francis Quanyang Lu Eric Nyberg A. Oltramari NAI 85 90 0 30 Oct 2019
BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension M. Lewis Yinhan Liu Naman Goyal Marjan Ghazvininejad Abdel-rahman Mohamed Omer Levy Veselin Stoyanov Luke Zettlemoyer AIMat VLM 268 10,913 0 29 Oct 2019
Secure Evaluation of Quantized Neural Networks Anders Dalskov Daniel E. Escudero Marcel Keller 97 143 0 28 Oct 2019
Thieves on Sesame Street! Model Extraction of BERT-based APIs Kalpesh Krishna Gaurav Singh Tomar Ankur P. Parikh Nicolas Papernot Mohit Iyyer MIACV MLAU 156 201 0 27 Oct 2019
Evaluation of Sentence Representations in Polish Slawomir Dadas Michal Perelkiewicz Rafal Poswiata 184 16 0 25 Oct 2019
Multi-Document Summarization with Determinantal Point Processes and Contextualized Representations Sangwoo Cho Chen Li Dong Yu H. Foroosh Fei Liu 66 17 0 24 Oct 2019
Emergent Properties of Finetuned Language Representation Models Alexandre Matton Luke de Oliveira SSL 40 1 0 23 Oct 2019
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer Colin Raffel Noam M. Shazeer Adam Roberts Katherine Lee Sharan Narang Michael Matena Yanqi Zhou Wei Li Peter J. Liu AIMat 706 20,418 0 23 Oct 2019
Speech-XLNet: Unsupervised Acoustic Model Pretraining For Self-Attention Networks Xingcheng Song Guangsen Wang Zhiyong Wu Yiheng Huang Dan Su Dong Yu Helen Meng SSL 101 49 0 23 Oct 2019
Improving Transformer-based Speech Recognition Using Unsupervised Pre-training Dongwei Jiang Xiaoning Lei Wubo Li Ne Luo Yuxuan Hu Wei Zou Xiangang Li 91 99 0 22 Oct 2019
Fine-grained Fact Verification with Kernel Graph Attention Network Zhenghao Liu Chenyan Xiong Maosong Sun Zhiyuan Liu 112 225 0 22 Oct 2019
MRQA 2019 Shared Task: Evaluating Generalization in Reading Comprehension Adam Fisch Alon Talmor Robin Jia Minjoon Seo Eunsol Choi Danqi Chen 101 309 0 22 Oct 2019