ZeroGen: Efficient Zero-shot Learning via Dataset Generation

16 February 2022

Jiacheng Ye

Jiahui Gao

Qintong Li

Hang Xu

Jiangtao Feng

Zhiyong Wu

Tao Yu

Lingpeng Kong

SyDa

ArXiv PDF HTML

Papers citing "ZeroGen: Efficient Zero-shot Learning via Dataset Generation"

20 / 70 papers shown

Title
TinyBERT: Distilling BERT for Natural Language Understanding Xiaoqi Jiao Yichun Yin Lifeng Shang Xin Jiang Xiao Chen Linlin Li F. Wang Qun Liu VLM 62 1,847 0 23 Sep 2019
CTRL: A Conditional Transformer Language Model for Controllable Generation N. Keskar Bryan McCann Lav Varshney Caiming Xiong R. Socher AI4CE 105 1,239 0 11 Sep 2019
Language Models as Knowledge Bases? Fabio Petroni Tim Rocktaschel Patrick Lewis A. Bakhtin Yuxiang Wu Alexander H. Miller Sebastian Riedel KELM AI4MH 533 2,639 0 03 Sep 2019
Neural Text Generation with Unlikelihood Training Sean Welleck Ilia Kulikov Stephen Roller Emily Dinan Kyunghyun Cho Jason Weston MU 35 570 0 12 Aug 2019
RoBERTa: A Robustly Optimized BERT Pretraining Approach Yinhan Liu Myle Ott Naman Goyal Jingfei Du Mandar Joshi Danqi Chen Omer Levy M. Lewis Luke Zettlemoyer Veselin Stoyanov AIMat 415 24,160 0 26 Jul 2019
A Tensorized Transformer for Language Modeling Xindian Ma Peng Zhang Shuai Zhang Nan Duan Yuexian Hou D. Song M. Zhou 45 165 0 24 Jun 2019
What do you learn from context? Probing for sentence structure in contextualized word representations Ian Tenney Patrick Xia Berlin Chen Alex Jinpeng Wang Adam Poliak ... Najoung Kim Benjamin Van Durme Samuel R. Bowman Dipanjan Das Ellie Pavlick 159 853 0 15 May 2019
The Curious Case of Neural Text Degeneration Ari Holtzman Jan Buys Li Du Maxwell Forbes Yejin Choi 150 3,133 0 22 Apr 2019
The OoO VLIW JIT Compiler for GPU Inference Paras Jain Xiangxi Mo Ajay Jain Alexey Tumanov Joseph E. Gonzalez Ion Stoica 56 17 0 28 Jan 2019
Assessing BERT's Syntactic Abilities Yoav Goldberg 55 494 0 16 Jan 2019
Hierarchical Neural Story Generation Angela Fan M. Lewis Yann N. Dauphin DiffM 134 1,604 0 13 May 2018
Texygen: A Benchmarking Platform for Text Generation Models Yaoming Zhu Sidi Lu Lei Zheng Jiaxian Guo Weinan Zhang Jun Wang Yong Yu 79 671 0 06 Feb 2018
Non-Autoregressive Neural Machine Translation Jiatao Gu James Bradbury Caiming Xiong Victor O.K. Li R. Socher 84 793 0 07 Nov 2017
A Simple, Fast Diverse Decoding Algorithm for Neural Generation Jiwei Li Will Monroe Dan Jurafsky 56 240 0 25 Nov 2016
Bidirectional Attention Flow for Machine Comprehension Minjoon Seo Aniruddha Kembhavi Ali Farhadi Hannaneh Hajishirzi 105 2,088 0 05 Nov 2016
Diverse Beam Search: Decoding Diverse Solutions from Neural Sequence Models Ashwin K. Vijayakumar Michael Cogswell Ramprasaath R. Selvaraju Q. Sun Stefan Lee David J. Crandall Dhruv Batra 62 551 0 07 Oct 2016
SQuAD: 100,000+ Questions for Machine Comprehension of Text Pranav Rajpurkar Jian Zhang Konstantin Lopyrev Percy Liang RALM 166 8,067 0 16 Jun 2016
Distilling the Knowledge in a Neural Network Geoffrey E. Hinton Oriol Vinyals J. Dean FedML 246 19,523 0 09 Mar 2015
Adam: A Method for Stochastic Optimization Diederik P. Kingma Jimmy Ba ODL 891 149,474 0 22 Dec 2014
Training Convolutional Networks with Noisy Labels Sainbayar Sukhbaatar Joan Bruna Manohar Paluri Lubomir D. Bourdev Rob Fergus NoLa 78 270 0 09 Jun 2014