Deep Reinforcement Learning

15 October 2018

Papers citing "Deep Reinforcement Learning"

50 / 521 papers shown

Title
The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning A. Gruslys Will Dabney M. G. Azar Bilal Piot Marc G. Bellemare Rémi Munos 63 59 0 15 Apr 2017
Deep Reinforcement Learning-based Image Captioning with Embedding Reward Zhou Ren Xiaoyu Wang Ning Zhang Xutao Lv Li Li 60 324 0 12 Apr 2017
A Neural Representation of Sketch Drawings David R Ha Douglas Eck 121 869 0 11 Apr 2017
Data-efficient Deep Reinforcement Learning for Dexterous Manipulation I. Popov N. Heess Timothy Lillicrap Roland Hafner Gabriel Barth-Maron Matej Vecerík Thomas Lampe Yuval Tassa Tom Erez Martin Riedmiller OffRL 88 265 0 10 Apr 2017
Stochastic Neural Networks for Hierarchical Reinforcement Learning Carlos Florensa Yan Duan Pieter Abbeel BDL 103 361 0 10 Apr 2017
Dynamic Safe Interruptibility for Decentralized Multi-Agent Reinforcement Learning El-Mahdi El-Mhamdi R. Guerraoui Hadrien Hendrikx Alexandre Maurer 55 28 0 10 Apr 2017
DualGAN: Unsupervised Dual Learning for Image-to-Image Translation Zili Yi Hao Zhang P. Tan Minglun Gong GAN VLM 138 1,946 0 08 Apr 2017
Recurrent Environment Simulators Silvia Chiappa S. Racanière Daan Wierstra S. Mohamed 75 211 0 07 Apr 2017
Learning Combinatorial Optimization Algorithms over Graphs H. Dai Elias Boutros Khalil Yuyu Zhang B. Dilkina Le Song 130 1,475 0 05 Apr 2017
Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memory Hao Zhou Minlie Huang Tianyang Zhang Xiaoyan Zhu Bing-Qian Liu 111 738 0 04 Apr 2017
Improved Training of Wasserstein GANs Ishaan Gulrajani Faruk Ahmed Martín Arjovsky Vincent Dumoulin Aaron Courville GAN 227 9,564 0 31 Mar 2017
Sentence Simplification with Deep Reinforcement Learning Xingxing Zhang Mirella Lapata 67 398 0 31 Mar 2017
BEGAN: Boundary Equilibrium Generative Adversarial Networks David Berthelot Tom Schumm Luke Metz GAN 104 1,155 0 31 Mar 2017
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks Jun-Yan Zhu Taesung Park Phillip Isola Alexei A. Efros GAN 129 5,553 0 30 Mar 2017
Multiagent Bidirectionally-Coordinated Nets: Emergence of Human-level Coordination in Learning to Play StarCraft Combat Games Peng Peng Ying Wen Yaodong Yang Quan Yuan Zhenkun Tang Haitao Long Jun Wang 82 335 0 29 Mar 2017
One-Shot Imitation Learning Yan Duan Marcin Andrychowicz Bradly C. Stadie Jonathan Ho Jonas Schneider Ilya Sutskever Pieter Abbeel Wojciech Zaremba OffRL 86 689 0 21 Mar 2017
Mask R-CNN Kaiming He Georgia Gkioxari Piotr Dollár Ross B. Girshick ObjD 369 27,253 0 20 Mar 2017
Learning Cooperative Visual Dialog Agents with Deep Reinforcement Learning Abhishek Das Satwik Kottur J. M. F. Moura Stefan Lee Dhruv Batra OffRL 129 425 0 20 Mar 2017
Deep Decentralized Multi-task Multi-Agent Reinforcement Learning under Partial Observability Shayegan Omidshafiei Jason Pazis Chris Amato Jonathan P. How J. Vian 148 498 0 17 Mar 2017
Minimax Regret Bounds for Reinforcement Learning M. G. Azar Ian Osband Rémi Munos 95 778 0 16 Mar 2017
End-to-end optimization of goal-driven and visually grounded dialogue systems Florian Strub H. D. Vries Jérémie Mary Bilal Piot Aaron Courville Olivier Pietquin OffRL 61 138 0 15 Mar 2017
Prototypical Networks for Few-shot Learning Jake C. Snell Kevin Swersky R. Zemel 305 8,154 0 15 Mar 2017
Learned Optimizers that Scale and Generalize Olga Wichrowska Niru Maheswaranathan Matthew W. Hoffman Sergio Gomez Colmenarejo Misha Denil Nando de Freitas Jascha Narain Sohl-Dickstein AI4CE 76 284 0 14 Mar 2017
Task-based End-to-end Model Learning in Stochastic Optimization P. Donti Brandon Amos J. Zico Kolter 59 24 0 13 Mar 2017
A Hierarchical Framework of Cloud Resource Allocation and Power Management Using Deep Reinforcement Learning Ning Liu Zhe Li Zhiyuan Xu Jielong Xu Sheng Lin Qinru Qiu Jian Tang Yanzhi Wang 65 248 0 13 Mar 2017
Evolution Strategies as a Scalable Alternative to Reinforcement Learning Tim Salimans Jonathan Ho Xi Chen Szymon Sidor Ilya Sutskever 115 1,544 0 10 Mar 2017
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea Finn Pieter Abbeel Sergey Levine OOD 831 11,952 0 09 Mar 2017
Learning to Remember Rare Events Lukasz Kaiser Ofir Nachum Aurko Roy Samy Bengio RALM CLL 128 364 0 09 Mar 2017
Combining Model-Based and Model-Free Updates for Trajectory-Centric Reinforcement Learning Yevgen Chebotar Karol Hausman Marvin Zhang Gaurav Sukhatme S. Schaal Sergey Levine 82 160 0 08 Mar 2017
Deep Variation-structured Reinforcement Learning for Visual Relationship and Attribute Detection Xiaodan Liang Lisa Lee Eric Xing 76 252 0 08 Mar 2017
Learning Invariant Feature Spaces to Transfer Skills with Reinforcement Learning Abhishek Gupta Coline Devin YuXuan Liu Pieter Abbeel Sergey Levine 91 269 0 08 Mar 2017
Tree-Structured Reinforcement Learning for Sequential Object Localization Zequn Jie Xiaodan Liang Jiashi Feng Xiaojie Jin W. Lu Shuicheng Yan 50 126 0 08 Mar 2017
Third-Person Imitation Learning Bradly C. Stadie Pieter Abbeel Ilya Sutskever 85 235 0 06 Mar 2017
Neural Machine Translation and Sequence-to-sequence Models: A Tutorial Graham Neubig AIMat 101 173 0 05 Mar 2017
Multi-step Reinforcement Learning: A Unifying Algorithm Kristopher De Asis Fernando Hernandez-Garcia Zach Holland R. Sutton 56 121 0 03 Mar 2017
Count-Based Exploration with Neural Density Models Georg Ostrovski Marc G. Bellemare Aaron van den Oord Rémi Munos 86 625 0 03 Mar 2017
EX2: Exploration with Exemplar Models for Deep Reinforcement Learning Justin Fu John D. Co-Reyes Sergey Levine OffRL 62 155 0 03 Mar 2017
FeUdal Networks for Hierarchical Reinforcement Learning A. Vezhnevets Simon Osindero Tom Schaul N. Heess Max Jaderberg David Silver Koray Kavukcuoglu FedML 96 907 0 03 Mar 2017
Large-Scale Evolution of Image Classifiers Esteban Real Sherry Moore Andrew Selle Saurabh Saxena Y. Suematsu Jie Tan Quoc V. Le Alexey Kurakin 142 1,642 0 03 Mar 2017
End-to-End Task-Completion Neural Dialogue Systems Xiujun Li Yun-Nung Chen Lihong Li Jianfeng Gao Asli Celikyilmaz 94 370 0 03 Mar 2017
A Laplacian Framework for Option Discovery in Reinforcement Learning Marlos C. Machado Marc G. Bellemare Michael Bowling 99 263 0 02 Mar 2017
Learning to Optimize Neural Nets Ke Li Jitendra Malik 82 132 0 01 Mar 2017
Bridging the Gap Between Value and Policy Based Reinforcement Learning Ofir Nachum Mohammad Norouzi Kelvin Xu Dale Schuurmans 169 476 0 28 Feb 2017
Stabilising Experience Replay for Deep Multi-Agent Reinforcement Learning Jakob N. Foerster Nantas Nardelli Gregory Farquhar Triantafyllos Afouras Philip Torr Pushmeet Kohli Shimon Whiteson OffRL 189 599 0 28 Feb 2017
Deep Forest Zhi Zhou Ji Feng 99 1,014 0 28 Feb 2017
Towards A Rigorous Science of Interpretable Machine Learning Finale Doshi-Velez Been Kim XAI FaML 410 3,820 0 28 Feb 2017
Reinforcement Learning with Deep Energy-Based Policies Tuomas Haarnoja Haoran Tang Pieter Abbeel Sergey Levine 118 1,348 0 27 Feb 2017
Stochastic Variance Reduction Methods for Policy Evaluation S. Du Jianshu Chen Lihong Li Lin Xiao Dengyong Zhou OffRL 55 158 0 25 Feb 2017
The Game Imitation: Deep Supervised Convolutional Networks for Quick Video Game AI Zhao Chen Darvin Yi VLM SSL 68 17 0 18 Feb 2017
Collaborative Deep Reinforcement Learning for Joint Object Search Xiangyu Kong Bo Xin Yizhou Wang G. Hua 65 79 0 18 Feb 2017