DORB: Dynamically Optimizing Multiple Rewards with Bandits

15 November 2020

Papers citing "DORB: Dynamically Optimizing Multiple Rewards with Bandits"

50 / 64 papers shown

Title
Why is constrained neural language generation particularly challenging? Cristina Garbacea Qiaozhu Mei 96 15 0 11 Jun 2022
Addressing Semantic Drift in Question Generation for Semi-Supervised Question Answering Shiyue Zhang Joey Tianyi Zhou 62 139 0 13 Sep 2019
Densely Connected Graph Convolutional Networks for Graph-to-Sequence Learning Zhijiang Guo Yan Zhang Zhiyang Teng Wei Lu GNN 69 130 0 16 Aug 2019
RoBERTa: A Robustly Optimized BERT Pretraining Approach Yinhan Liu Myle Ott Naman Goyal Jingfei Du Mandar Joshi Danqi Chen Omer Levy M. Lewis Luke Zettlemoyer Veselin Stoyanov AIMat 524 24,351 0 26 Jul 2019
AutoSeM: Automatic Task Selection and Mixing in Multi-Task Learning Han Guo Ramakanth Pasunuru Joey Tianyi Zhou 120 47 0 08 Apr 2019
Learning to Generate Questions by Learning What not to Generate Bang Liu Mingjun Zhao Di Niu Kunfeng Lai Yancheng He Haojie Wei Yu-Syuan Xu OOD 70 102 0 27 Feb 2019
A Bandit Framework for Optimal Selection of Reinforcement Learning Agents A. Merentitis Kashif Rasul Roland Vollgraf Abdul-Saboor Sheikh Urs M. Bergmann 33 2 0 10 Feb 2019
Meta-Learning for Contextual Bandit Exploration Amr Sharaf Hal Daumé OffRL 21 12 0 23 Jan 2019
Evaluating the State-of-the-Art of End-to-End Natural Language Generation: The E2E NLG Challenge Ondrej Dusek Jekaterina Novikova Verena Rieser ELM 76 232 0 23 Jan 2019
Garbage In, Reward Out: Bootstrapping Exploration in Multi-Armed Bandits Branislav Kveton Csaba Szepesvári Sharan Vaswani Zheng Wen Mohammad Ghavamzadeh Tor Lattimore 125 70 0 13 Nov 2018
Deep Graph Convolutional Encoders for Structured Data to Text Generation Diego Marcheggiani Laura Perez-Beltrachini GNN 45 122 0 23 Oct 2018
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova VLM SSL SSeg 1.5K 94,511 0 11 Oct 2018
End-to-End Content and Plan Selection for Data-to-Text Generation Sebastian Gehrmann Falcon Z. Dai H. Elder Alexander M. Rush 52 71 0 10 Oct 2018
Improving Neural Question Generation using Answer Separation Yanghoon Kim Hwanhee Lee Joongbo Shin Kyomin Jung 64 170 0 07 Sep 2018
Towards a Better Metric for Evaluating Question Generation Systems Preksha Nema Mitesh M. Khapra 68 108 0 30 Aug 2018
Dynamic Multi-Level Multi-Task Learning for Sentence Simplification Han Guo Ramakanth Pasunuru Joey Tianyi Zhou 53 66 0 19 Jun 2018
Fast Abstractive Summarization with Reinforce-Selected Sentence Rewriting Yen-Chun Chen Joey Tianyi Zhou BDL 171 583 0 28 May 2018
Harvesting Paragraph-Level Question-Answer Pairs from Wikipedia Xinya Du Claire Cardie KELM 55 161 0 15 May 2018
Multi-Reward Reinforced Summarization with Saliency and Entailment Ramakanth Pasunuru Joey Tianyi Zhou 52 201 0 17 Apr 2018
End-to-End Dense Video Captioning with Masked Transformer Luowei Zhou Yingbo Zhou Jason J. Corso R. Socher Caiming Xiong 88 528 0 03 Apr 2018
Deep Communicating Agents for Abstractive Summarization Asli Celikyilmaz Antoine Bosselut Xiaodong He Yejin Choi AI4CE 70 306 0 27 Mar 2018
Video Captioning via Hierarchical Reinforcement Learning Xin Eric Wang Wenhu Chen Jiawei Wu Yuan-fang Wang William Yang Wang 73 228 0 29 Nov 2017
A Unified Query-based Generative Model for Question Generation and Question Answering Linfeng Song Zhiguo Wang Wael Hamza 66 48 0 04 Sep 2017
Reinforced Video Captioning with Entailment Rewards Ramakanth Pasunuru Joey Tianyi Zhou 56 115 0 07 Aug 2017
Regularizing and Optimizing LSTM Language Models Stephen Merity N. Keskar R. Socher 163 1,095 0 07 Aug 2017
Challenges in Data-to-Document Generation Sam Wiseman Stuart M. Shieber Alexander M. Rush 155 588 0 25 Jul 2017
A Deep Reinforced Model for Abstractive Summarization Romain Paulus Caiming Xiong R. Socher AI4TS 185 1,556 0 11 May 2017
Machine Comprehension by Text-to-Text Neural Question Generation Xingdi Yuan Tong Wang Çağlar Gülçehre Alessandro Sordoni Philip Bachman Sandeep Subramanian Saizheng Zhang Adam Trischler OOD 93 187 0 04 May 2017
Learning to Ask: Neural Question Generation for Reading Comprehension Xinya Du Junru Shao Claire Cardie 3DV 143 663 0 29 Apr 2017
Multi-Task Video Captioning with Video and Entailment Generation Ramakanth Pasunuru Joey Tianyi Zhou 54 117 0 24 Apr 2017
A Broad-Coverage Challenge Corpus for Sentence Understanding through Inference Adina Williams Nikita Nangia Samuel R. Bowman 503 4,473 0 18 Apr 2017
Get To The Point: Summarization with Pointer-Generator Networks A. See Peter J. Liu Christopher D. Manning 3DPC 259 4,014 0 14 Apr 2017
Deep Reinforcement Learning-based Image Captioning with Embedding Reward Zhou Ren Xiaoyu Wang Ning Zhang Xutao Lv Li Li 52 324 0 12 Apr 2017
Automated Curriculum Learning for Neural Networks Alex Graves Marc G. Bellemare Jacob Menick Rémi Munos Koray Kavukcuoglu 72 523 0 10 Apr 2017
Neural Question Generation from Text: A Preliminary Study Qingyu Zhou Nan Yang Furu Wei Chuanqi Tan Hangbo Bao M. Zhou 58 335 0 06 Apr 2017
Sentence Simplification with Deep Reinforcement Learning Xingxing Zhang Mirella Lapata 57 398 0 31 Mar 2017
Learning to Multi-Task by Active Sampling Sahil Sharma Ashutosh Jha Parikshit Hegde Balaraman Ravindran 107 21 0 20 Feb 2017
Trainable Greedy Decoding for Neural Machine Translation Jiatao Gu Kyunghyun Cho Victor O.K. Li 140 74 0 08 Feb 2017
Self-critical Sequence Training for Image Captioning Steven J. Rennie E. Marcheret Youssef Mroueh Jerret Ross Vaibhava Goel 105 1,886 0 02 Dec 2016
Improved Image Captioning via Policy Gradient optimization of SPIDEr Siqi Liu Zhenhai Zhu Ning Ye S. Guadarrama Kevin Patrick Murphy 120 446 0 01 Dec 2016
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation Yonghui Wu M. Schuster Zhiwen Chen Quoc V. Le Mohammad Norouzi ... Alex Rudnick Oriol Vinyals G. Corrado Macduff Hughes J. Dean AIMat 876 6,781 0 26 Sep 2016
Sequence-to-Sequence Generation for Spoken Dialogue via Deep Syntax Trees and Strings Ondrej Dusek Filip Jurcícek 52 187 0 17 Jun 2016
SQuAD: 100,000+ Questions for Machine Comprehension of Text Pranav Rajpurkar Jian Zhang Konstantin Lopyrev Percy Liang RALM 239 8,113 0 16 Jun 2016
Deep Reinforcement Learning for Dialogue Generation Jiwei Li Will Monroe Alan Ritter Michel Galley Jianfeng Gao Dan Jurafsky 270 1,331 0 05 Jun 2016
Pointing the Unknown Words Çağlar Gülçehre Sungjin Ahn Ramesh Nallapati Bowen Zhou Yoshua Bengio 55 525 0 26 Mar 2016
Hyperband: A Novel Bandit-Based Approach to Hyperparameter Optimization Lisha Li Kevin Jamieson Giulia DeSalvo Afshin Rostamizadeh Ameet Talwalkar 209 2,321 0 21 Mar 2016
Incorporating Copying Mechanism in Sequence-to-Sequence Learning Jiatao Gu Zhengdong Lu Hang Li Victor O.K. Li 171 1,539 0 21 Mar 2016
Abstractive Text Summarization Using Sequence-to-Sequence RNNs and Beyond Ramesh Nallapati Bowen Zhou Cicero Nogueira dos Santos Çağlar Gülçehre Bing Xiang AIMat 238 2,551 0 19 Feb 2016
Sequence Level Training with Recurrent Neural Networks MarcÁurelio Ranzato S. Chopra Michael Auli Wojciech Zaremba 98 1,614 0 20 Nov 2015
A Survey of Online Experiment Design with the Stochastic Multi-Armed Bandit Giuseppe Burtini Jason L. Loeppky Ramon Lawrence 58 119 0 02 Oct 2015