Gaussian Error Linear Units (GELUs)

27 June 2016

Papers citing "Gaussian Error Linear Units (GELUs)"

16 / 966 papers shown

Title
Cross-Lingual Natural Language Generation via Pre-Training Zewen Chi Li Dong Furu Wei Wenhui Wang Xian-Ling Mao Heyan Huang 27 136 0 23 Sep 2019
Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset Abhinav Rastogi Xiaoxue Zang Srinivas Sunkara Raghav Gupta Pranav Khaitan 27 605 0 12 Sep 2019
Multi-Task Self-Supervised Learning for Disfluency Detection Shaolei Wang Wanxiang Che Qi Liu Pengda Qin Ting Liu William Yang Wang SSL 22 56 0 15 Aug 2019
SpanBERT: Improving Pre-training by Representing and Predicting Spans Mandar Joshi Danqi Chen Yinhan Liu Daniel S. Weld Luke Zettlemoyer Omer Levy 33 1,945 0 24 Jul 2019
Adversarial Generation and Encoding of Nested Texts A. Rozental GAN 19 0 0 01 Jun 2019
A Generalized Framework of Sequence Generation with Application to Undirected Sequence Models Elman Mansimov Alex Jinpeng Wang Sean Welleck Kyunghyun Cho AIMat 28 46 0 29 May 2019
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks Mingxing Tan Quoc V. Le 3DV MedIm 11 17,783 0 28 May 2019
Language Modeling with Deep Transformers Kazuki Irie Albert Zeyer Ralf Schluter Hermann Ney KELM 43 171 0 10 May 2019
Unified Language Model Pre-training for Natural Language Understanding and Generation Li Dong Nan Yang Wenhui Wang Furu Wei Xiaodong Liu Yu-Chiang Frank Wang Jianfeng Gao M. Zhou H. Hon ELM AI4CE 80 1,551 0 08 May 2019
Generating Long Sequences with Sparse Transformers R. Child Scott Gray Alec Radford Ilya Sutskever 36 1,854 0 23 Apr 2019
Beto, Bentz, Becas: The Surprising Cross-Lingual Effectiveness of BERT Shijie Wu Mark Dredze VLM SSeg 39 670 0 19 Apr 2019
Neural Empirical Bayes Saeed Saremi Aapo Hyvarinen 12 65 0 06 Mar 2019
Activation Adaptation in Neural Networks Farnoush Farhadi V. Nia Andrea Lodi AI4CE 29 14 0 28 Jan 2019
Multi-style Generative Reading Comprehension Kyosuke Nishida Itsumi Saito Kosuke Nishida Kazutoshi Shinoda Atsushi Otsuka Hisako Asano J. Tomita 22 70 0 08 Jan 2019
NEU: A Meta-Algorithm for Universal UAP-Invariant Feature Representation Anastasis Kratsios Cody B. Hyndman OOD 30 17 0 31 Aug 2018
Using Trusted Data to Train Deep Networks on Labels Corrupted by Severe Noise Dan Hendrycks Mantas Mazeika Duncan Wilson Kevin Gimpel NoLa 70 547 0 14 Feb 2018