XLNet: Generalized Autoregressive Pretraining for Language Understanding

v1v2 (latest)

XLNet: Generalized Autoregressive Pretraining for Language Understanding

19 June 2019

Ruslan Salakhutdinov

ArXiv (abs)PDF HTML

Papers citing "XLNet: Generalized Autoregressive Pretraining for Language Understanding"

18 / 3,518 papers shown

Title
Better Long-Range Dependency By Bootstrapping A Mutual Information Regularizer Yanshuai Cao Peng Xu 26 2 0 28 May 2019
A Review of Keyphrase Extraction Eirini Papagiannopoulou Grigorios Tsoumakas 62 168 0 13 May 2019
Deep Unsupervised Cardinality Estimation Zongheng Yang Eric Liang Amog Kamsetty Chenggang Wu Yan Duan Peter Chen Pieter Abbeel J. M. Hellerstein S. Krishnan Ion Stoica 94 208 0 10 May 2019
Survey on Evaluation Methods for Dialogue Systems Jan Deriu Álvaro Rodrigo Arantxa Otegi Guillermo Echegoyen S. Rosset Eneko Agirre Mark Cieliebak 116 285 0 10 May 2019
Taming Pretrained Transformers for Extreme Multi-label Text Classification Wei-Cheng Chang Hsiang-Fu Yu Kai Zhong Yiming Yang Inderjit Dhillon 75 20 0 07 May 2019
SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems Alex Jinpeng Wang Yada Pruksachatkun Nikita Nangia Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 423 2,328 0 02 May 2019
Terminologies augmented recurrent neural network model for clinical named entity recognition Ivan Lerner N. Paris Xavier Tannier 61 37 0 25 Apr 2019
BERTScore: Evaluating Text Generation with BERT Tianyi Zhang Varsha Kishore Felix Wu Kilian Q. Weinberger Yoav Artzi 520 5,887 0 21 Apr 2019
DocBERT: BERT for Document Classification Ashutosh Adhikari Achyudh Ram Raphael Tang Jimmy J. Lin LLMAG VLM 103 299 0 17 Apr 2019
An Attentive Survey of Attention Models S. Chaudhari Varun Mithal Gungor Polatkan R. Ramanath 192 666 0 05 Apr 2019
Recent Advances in Natural Language Inference: A Survey of Benchmarks, Resources, and Approaches Shane Storks Qiaozi Gao J. Chai 98 132 0 02 Apr 2019
Contextual Word Representations: A Contextual Introduction Noah A. Smith 64 34 0 15 Feb 2019
Dual Co-Matching Network for Multi-choice Reading Comprehension Shuailiang Zhang Zhao Hai Yuwei Wu Zhuosheng Zhang Xi Zhou Xiaoping Zhou 102 131 0 27 Jan 2019
AccUDNN: A GPU Memory Efficient Accelerator for Training Ultra-deep Neural Networks Jinrong Guo Wantao Liu Wang Wang Q. Lu Songlin Hu Jizhong Han Ruixuan Li 62 9 0 21 Jan 2019
Sentence transition matrix: An efficient approach that preserves sentence semantics Myeongjun Jang Pilsung Kang 23 2 0 16 Jan 2019
Neural Abstractive Text Summarization with Sequence-to-Sequence Models Tian Shi Yaser Keneshloo Naren Ramakrishnan Chandan K. Reddy 127 234 0 05 Dec 2018
Efficient Attention: Attention with Linear Complexities Zhuoran Shen Mingyuan Zhang Haiyu Zhao Shuai Yi Hongsheng Li 136 535 0 04 Dec 2018
Compositional Coding Capsule Network with K-Means Routing for Text Classification Hao Ren Hong-wei Lu 104 53 0 22 Oct 2018