Proximal Policy Optimization Algorithms

20 July 2017

Papers citing "Proximal Policy Optimization Algorithms"

50 / 7,000 papers shown

Title
Constrained Policy Improvement for Safe and Efficient Reinforcement Learning Elad Sarafian Aviv Tamar Sarit Kraus OffRL 32 11 0 20 May 2018
Deep Dynamical Modeling and Control of Unsteady Fluid Flows Jeremy Morton F. Witherden A. Jameson Mykel J. Kochenderfer AI4CE 26 162 0 18 May 2018
Policy Optimization with Second-Order Advantage Information Jiajin Li Baoxiang Wang 22 6 0 09 May 2018
Reward Estimation for Variance Reduction in Deep Reinforcement Learning Joshua Romoff Peter Henderson Alexandre Piché Vincent François-Lavet Joelle Pineau 8 42 0 09 May 2018
Vehicle Communication Strategies for Simulated Highway Driving Cinjon Resnick I. Kulikov Kyunghyun Cho Jason Weston 22 7 0 19 Apr 2018
An Adaptive Clipping Approach for Proximal Policy Optimization Gang Chen Yiming Peng Mengjie Zhang 22 22 0 17 Apr 2018
Gotta Learn Fast: A New Benchmark for Generalization in RL Alex Nichol Vicki Pfau Christopher Hesse Oleg Klimov John Schulman VLM OffRL 15 177 0 10 Apr 2018
Structured Evolution with Compact Architectures for Scalable Policy Optimization K. Choromanski Mark Rowland Vikas Sindhwani Richard Turner Adrian Weller 27 147 0 06 Apr 2018
StarCraft Micromanagement with Reinforcement Learning and Curriculum Transfer Learning Kun Shao Yuanheng Zhu Dongbin Zhao 107 170 0 03 Apr 2018
Universal Planning Networks A. Srinivas Allan Jabri Pieter Abbeel Sergey Levine Chelsea Finn SSL 30 145 0 02 Apr 2018
Learning to Run challenge solutions: Adapting reinforcement learning methods for neuromusculoskeletal environments L. Kidzinski Sharada Mohanty Carmichael F. Ong Zhewei Huang Shuchang Zhou ... Sean F. Carroll Jennifer Hicks Sergey Levine M. Salathé Scott L. Delp 40 88 0 02 Apr 2018
Learning to Run challenge: Synthesizing physiologically accurate motion using deep reinforcement learning L. Kidzinski Sharada Mohanty Carmichael F. Ong Jennifer Hicks Sean F. Carroll Sergey Levine M. Salathé Scott L. Delp 34 60 0 31 Mar 2018
Automated Curriculum Learning by Rewarding Temporally Rare Events Niels Justesen S. Risi OffRL 35 20 0 19 Mar 2018
Feedback Control For Cassie With Deep Reinforcement Learning Zhaoming Xie Glen Berseth Patrick Clary J. Hurst M. van de Panne 27 174 0 15 Mar 2018
Policy Search in Continuous Action Domains: an Overview Olivier Sigaud F. Stulp 16 72 0 13 Mar 2018
Deep Learning in Mobile and Wireless Networking: A Survey Chaoyun Zhang P. Patras Hamed Haddadi 50 1,306 0 12 Mar 2018
Accelerated Methods for Deep Reinforcement Learning Adam Stooke Pieter Abbeel OffRL OnRL 25 133 0 07 Mar 2018
Some Considerations on Learning to Explore via Meta-Reinforcement Learning Bradly C. Stadie Ge Yang Rein Houthooft Xi Chen Yan Duan Yuhuai Wu Pieter Abbeel Ilya Sutskever LRM 40 116 0 03 Mar 2018
Deep Reinforcement Learning for Join Order Enumeration Ryan Marcus Olga Papaemmanouil 27 231 0 28 Feb 2018
Computational Theories of Curiosity-Driven Learning Pierre-Yves Oudeyer 32 64 0 28 Feb 2018
The Mirage of Action-Dependent Baselines in Reinforcement Learning George Tucker Surya Bhupatiraju S. Gu Richard Turner Zoubin Ghahramani Sergey Levine OffRL 30 126 0 27 Feb 2018
Reinforcement and Imitation Learning for Diverse Visuomotor Skills Yuke Zhu Ziyun Wang J. Merel Andrei A. Rusu Tom Erez ... S. Tunyasuvunakool János Kramár R. Hadsell Nando de Freitas N. Heess SSL 34 316 0 26 Feb 2018
Multi-Goal Reinforcement Learning: Challenging Robotics Environments and Request for Research Matthias Plappert Marcin Andrychowicz Alex Ray Bob McGrew Bowen Baker ... Joshua Tobin Maciek Chociej Peter Welinder Vikash Kumar Wojciech Zaremba 33 557 0 26 Feb 2018
Verifying Controllers Against Adversarial Examples with Bayesian Optimization Shromona Ghosh Felix Berkenkamp G. Ranade S. Qadeer Ashish Kapoor AAML 33 45 0 23 Feb 2018
Structured Control Nets for Deep Reinforcement Learning Mario Srouji Jian Zhang Ruslan Salakhutdinov 33 43 0 22 Feb 2018
Clipped Action Policy Gradient Yasuhiro Fujita S. Maeda OffRL 34 37 0 21 Feb 2018
Fourier Policy Gradients M. Fellows K. Ciosek Shimon Whiteson 35 15 0 19 Feb 2018
Evolved Policy Gradients Rein Houthooft Richard Y. Chen Phillip Isola Bradly C. Stadie Filip Wolski Jonathan Ho Pieter Abbeel 49 227 0 13 Feb 2018
Hierarchical Learning for Modular Robots R. Kojcev Nora Etxezarreta Alejandro Hernández Víctor Mayoral 24 4 0 12 Feb 2018
Evaluation of Deep Reinforcement Learning Methods for Modular Robots R. Kojcev Nora Etxezarreta Alejandro Hernández Víctor Mayoral OffRL 23 4 0 07 Feb 2018
VR-Goggles for Robots: Real-to-sim Domain Adaptation for Visual Control Jingwei Zhang L. Tai Peng Yun Yufeng Xiong Ming Liu Joschka Boedecker Wolfram Burgard 21 122 0 01 Feb 2018
An Empirical Analysis of Proximal Policy Optimization with Kronecker-factored Natural Gradients Jiaming Song Yuhuai Wu 29 2 0 17 Jan 2018
Expected Policy Gradients for Reinforcement Learning K. Ciosek Shimon Whiteson 50 51 0 10 Jan 2018
Distributed Deep Reinforcement Learning: Learn how to play Atari games in 21 minutes Igor Adamski R. Adamski T. Grel Adam Jedrych Kamil Kaczmarek Henryk Michalewski OffRL 41 37 0 09 Jan 2018
Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations Xingyu Wang Diego Klabjan 32 39 0 07 Jan 2018
SBEED: Convergent Reinforcement Learning with Nonlinear Function Approximation Bo Dai Albert Eaton Shaw Lihong Li Lin Xiao Niao He Zhen Liu Jianshu Chen Le Song 34 25 0 29 Dec 2017
Boosting the Actor with Dual Critic Bo Dai Albert Eaton Shaw Niao He Lihong Li Le Song 35 46 0 29 Dec 2017
Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning F. Such Vashisht Madhavan Edoardo Conti Joel Lehman Kenneth O. Stanley Jeff Clune 47 686 0 18 Dec 2017
Time Limits in Reinforcement Learning Fabio Pardo Arash Tavakoli Vitaly Levdik Petar Kormushev CLL 44 158 0 01 Dec 2017
Comparing Deep Reinforcement Learning and Evolutionary Methods in Continuous Control Shangtong Zhang Osmar R. Zaiane 31 10 0 30 Nov 2017
Cascade Attribute Learning Network Zhuo Xu Haonan Chang Masayoshi Tomizuka 33 4 0 24 Nov 2017
Action Branching Architectures for Deep Reinforcement Learning Arash Tavakoli Fabio Pardo Petar Kormushev 22 260 0 24 Nov 2017
Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning Sergio Valcarcel Macua Aleksi Tukiainen D. Hernández David Baldazo Enrique Munoz de Cote S. Zazo 32 29 0 28 Oct 2017
Neural Optimizer Search with Reinforcement Learning Irwan Bello Barret Zoph Vijay Vasudevan Quoc V. Le ODL 29 383 0 21 Sep 2017
TensorFlow Agents: Efficient Batched Reinforcement Learning in TensorFlow Danijar Hafner James Davidson Vincent Vanhoucke OffRL 17 49 0 08 Sep 2017
A Brief Survey of Deep Reinforcement Learning Kai Arulkumaran M. Deisenroth Miles Brundage Anil Anthony Bharath OffRL 65 2,780 0 19 Aug 2017
Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation Yuhuai Wu Elman Mansimov Shun Liao Roger C. Grosse Jimmy Ba OffRL 22 622 0 17 Aug 2017
An Information-Theoretic Optimality Principle for Deep Reinforcement Learning Felix Leibfried Jordi Grau-Moya Haitham Bou-Ammar 38 24 0 06 Aug 2017
Emergence of Locomotion Behaviours in Rich Environments N. Heess TB Dhruva S. Sriram Jay Lemmon J. Merel ... Tom Erez Ziyun Wang S. M. Ali Eslami Martin Riedmiller David Silver 143 928 0 07 Jul 2017
Trust Region Policy Optimization John Schulman Sergey Levine Philipp Moritz Michael I. Jordan Pieter Abbeel 103 6,690 0 19 Feb 2015