v1v2v3v4v5 (latest)

Trust Region Policy Optimization

19 February 2015

Pieter Abbeel

Papers citing "Trust Region Policy Optimization"

50 / 2,012 papers shown

Title
Adaptive Remote Sensing Image Attribute Learning for Active Object Detection Nuo Xu Chunlei Huo Jiacheng Guo Yiwei Liu Jian Wang Chunhong Pan ObjD 57 4 0 16 Jan 2021
Independent Policy Gradient Methods for Competitive Reinforcement Learning C. Daskalakis Dylan J. Foster Noah Golowich 244 163 0 11 Jan 2021
Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for MANETs Saeed Kaviani Bo Ryu Ejaz Ahmed Kevin Larson Anh-Ngoc Le Alex Yahja Jae H. Kim 67 20 0 09 Jan 2021
Robust Maximum Entropy Behavior Cloning Mostafa Hussein Brendan Crowe Marek Petrik M. Begum 53 6 0 04 Jan 2021
Derivative-Free Policy Optimization for Linear Risk-Sensitive and Robust Control Design: Implicit Regularization and Sample Complexity Jianchao Tan Xiangyuan Zhang Bin Hu Tamer Bacsar 115 19 0 04 Jan 2021
A Survey on Deep Reinforcement Learning for Audio-Based Applications S. Latif Heriberto Cuayáhuitl Farrukh Pervez Fahad Shamshad Hafiz Shehbaz Ali Min Zhang OffRL 128 75 0 01 Jan 2021
Multi-Agent Reinforcement Learning for Unmanned Aerial Vehicle Coordination by Multi-Critic Policy Gradient Optimization Yoav Alon Huiyu Zhou 107 10 0 31 Dec 2020
Curriculum-based Deep Reinforcement Learning for Quantum Control Hailan Ma D. Dong S. Ding Chunlin Chen 82 35 0 31 Dec 2020
Learning Adversarial Markov Decision Processes with Delayed Feedback Tal Lancewicki Aviv A. Rosenberg Yishay Mansour 109 35 0 29 Dec 2020
Risk-Sensitive Deep RL: Variance-Constrained Actor-Critic Provably Finds Globally Optimal Policy Han Zhong Xun Deng Ethan X. Fang Zhuoran Yang Zhaoran Wang Runze Li 71 3 0 28 Dec 2020
A Tutorial on Sparse Gaussian Processes and Variational Inference Felix Leibfried Vincent Dutordoir S. T. John N. Durrande GP 184 52 0 27 Dec 2020
Stability-Certified Reinforcement Learning via Spectral Normalization R. Takase N. Yoshikawa T. Mariyama T. Tsuchiya 56 5 0 26 Dec 2020
Auto-Agent-Distiller: Towards Efficient Deep Reinforcement Learning Agents via Neural Architecture Search Y. Fu Zhongzhi Yu Yongan Zhang Yingyan Lin 85 4 0 24 Dec 2020
Mobile Robot Planner with Low-cost Cameras Using Deep Reinforcement Learning M. Tran N. Ly 32 1 0 21 Dec 2020
Uncertainty-Aware Policy Optimization: A Robust, Adaptive Trust Region Approach James Queeney I. Paschalidis Christos G. Cassandras 71 9 0 19 Dec 2020
High-Throughput Synchronous Deep RL Iou-Jen Liu Raymond A. Yeh Alex Schwing OffRL 69 12 0 17 Dec 2020
Model-free and Bayesian Ensembling Model-based Deep Reinforcement Learning for Particle Accelerator Control Demonstrated on the FERMI FEL Simon Hirlaender N. Bruchon 58 23 0 17 Dec 2020
Noise-Robust End-to-End Quantum Control using Deep Autoregressive Policy Networks Jiahao Yao Paul Köttering Hans Gundlach Lin Lin Marin Bukov 95 14 0 12 Dec 2020
Regularizing Action Policies for Smooth Control with Reinforcement Learning Siddharth Mysore B. Mabsout R. Mancuso Kate Saenko 81 69 0 11 Dec 2020
Emergence of Different Modes of Tool Use in a Reaching and Dragging Task K. Nguyen Yoonsuck Choe 26 0 0 08 Dec 2020
RLOC: Terrain-Aware Legged Locomotion using Reinforcement Learning and Optimal Control Siddhant Gangapurwala Mathieu Geisert Romeo Orsolino Maurice F. Fallon Ioannis Havoutis 183 119 0 05 Dec 2020
Model-Agnostic Learning to Meta-Learn A. Devos Yatin Dandi OOD 107 1 0 04 Dec 2020
Demonstration-efficient Inverse Reinforcement Learning in Procedurally Generated Environments Alessandro Sestini A. Kuhnle Andrew D. Bagdanov 51 7 0 04 Dec 2020
Autonomous Navigation with Mobile Robots using Deep Learning and the Robot Operating System A. Nguyen Quang-Dieu Tran 66 9 0 04 Dec 2020
An End-to-end Deep Reinforcement Learning Approach for the Long-term Short-term Planning on the Frenet Space Majid Moghadam Ali Alizadeh Engin Tekin G. Elkaim 97 12 0 26 Nov 2020
Diluted Near-Optimal Expert Demonstrations for Guiding Dialogue Stochastic Policy Optimisation Thibault Cordier Tanguy Urvoy L. Rojas-Barahona F. Lefèvre 128 5 0 25 Nov 2020
Policy Optimization for Markovian Jump Linear Quadratic Control: Gradient-Based Methods and Global Convergence Joao Paulo Jansch-Porto Bin Hu Geir Dullerud 63 8 0 24 Nov 2020
Distributed Deep Reinforcement Learning: An Overview Mohammad Reza Samsami Hossein Alimadad OffRL 43 27 0 22 Nov 2020
Policy Teaching in Reinforcement Learning via Environment Poisoning Attacks Amin Rakhsha Goran Radanović R. Devidze Xiaojin Zhu Adish Singla AAML OffRL 89 29 0 21 Nov 2020
Is Independent Learning All You Need in the StarCraft Multi-Agent Challenge? Christian Schroeder de Witt Tarun Gupta Denys Makoviichuk Viktor Makoviychuk Philip Torr Mingfei Sun Shimon Whiteson 94 347 0 18 Nov 2020
Counterfactual Credit Assignment in Model-Free Reinforcement Learning Thomas Mesnard T. Weber Fabio Viola S. Thakoor Alaa Saade ... A. Guez Éric Moulines Marcus Hutter Lars Buesing Rémi Munos CML OffRL 113 58 0 18 Nov 2020
A Definition and a Test for Human-Level Artificial Intelligence Deokgun Park Md Ashaduzzaman Rubel Mondol Aishwarya Pothula Mazharul Islam VLM 64 4 0 18 Nov 2020
TFPnP: Tuning-free Plug-and-Play Proximal Algorithm with Applications to Inverse Imaging Problems Kaixuan Wei Angelica Aviles-Rivero Jingwei Liang Ying Fu Hua Huang Carola-Bibiane Schönlieb 78 35 0 18 Nov 2020
ACDER: Augmented Curiosity-Driven Experience Replay Boyao Li Tao Lu Jiayi Li N. Lu Yinghao Cai Shuo Wang 60 16 0 16 Nov 2020
Meta Automatic Curriculum Learning Rémy Portelas Clément Romac Katja Hofmann Pierre-Yves Oudeyer 77 8 0 16 Nov 2020
Tonic: A Deep Reinforcement Learning Library for Fast Prototyping and Benchmarking Fabio Pardo OffRL 69 31 0 15 Nov 2020
Robust Quadruped Jumping via Deep Reinforcement Learning Guillaume Bellegarda Chuong H. Nguyen Quan Nguyen 96 65 0 13 Nov 2020
Reinforcement Learning Control of Constrained Dynamic Systems with Uniformly Ultimate Boundedness Stability Guarantee Minghao Han Yuan Tian Lixian Zhang Jun Wang Wei Pan 70 49 0 13 Nov 2020
Critic PI2: Master Continuous Planning via Policy Improvement with Path Integrals and Deep Actor-Critic Reinforcement Learning Jiajun Fan He Ba Xian Guo Jianye Hao OffRL 49 5 0 13 Nov 2020
Steady State Analysis of Episodic Reinforcement Learning Bojun Huang OffRL 54 23 0 12 Nov 2020
CRPO: A New Approach for Safe Reinforcement Learning with Convergence Guarantee Tengyu Xu Yingbin Liang Guanghui Lan 111 128 0 11 Nov 2020
Reinforcement Learning Experiments and Benchmark for Solving Robotic Reaching Tasks Pierre Aumjaud David McAuliffe Francisco J. Rodríguez-Lera P. Cardiff 67 15 0 11 Nov 2020
Perturbation-based exploration methods in deep reinforcement learning Sneha Aenugu 50 0 0 10 Nov 2020
f-IRL: Inverse Reinforcement Learning via State Marginal Matching Tianwei Ni Harshit S. Sikchi Yufei Wang Tejus Gupta Lisa Lee Benjamin Eysenbach 107 73 0 09 Nov 2020
Reinforcement Learning for Autonomous Driving with Latent State Inference and Spatial-Temporal Relationships Xiaobai Ma Jiachen Li Mykel J. Kochenderfer David Isele K. Fujimura 98 62 0 09 Nov 2020
On the role of planning in model-based deep reinforcement learning Jessica B. Hamrick A. Friesen Feryal M. P. Behbahani A. Guez Fabio Viola Sims Witherspoon Thomas W. Anthony Lars Buesing Petar Velickovic T. Weber OffRL 120 66 0 08 Nov 2020
Single and Multi-Agent Deep Reinforcement Learning for AI-Enabled Wireless Networks: A Tutorial Amal Feriani Ekram Hossain 215 245 0 06 Nov 2020
Sample-efficient Reinforcement Learning in Robotic Table Tennis Jonas Tebbe Lukas Krauch Yapeng Gao A. Zell 78 34 0 06 Nov 2020
Learning Trajectories for Visual-Inertial System Calibration via Model-based Heuristic Deep Reinforcement Learning Le Chen Yu Ao Florian Tschopp Andrei Cramariuc Michel Breyer Jen Jen Chung Roland Siegwart Cesar Cadena 51 3 0 04 Nov 2020
Control with adaptive Q-learning J. Araújo Mário A. T. Figueiredo M. Botto 92 2 0 03 Nov 2020