v1v2v3v4 (latest)

Prioritized Experience Replay

18 November 2015

David Silver

Papers citing "Prioritized Experience Replay"

50 / 1,454 papers shown

Title
High Performance Across Two Atari Paddle Games Using the Same Perceptual Control Architecture Without Training T. Gulrez W. Mansell 26 0 0 04 Aug 2021
Uniform Sampling over Episode Difficulty Sébastien M. R. Arnold Guneet Singh Dhillon Avinash Ravichandran Stefano Soatto 67 14 0 03 Aug 2021
Flip Learning: Erase to Segment Yuhao Huang Xin Yang Yuxin Zou Chaoyu Chen Jian Wang Haoran Dou Nishant Ravikumar Alejandro F Frangi Jianqiao Zhou Dong Ni 40 9 0 02 Aug 2021
Learning to Control DC Motor for Micromobility in Real Time with Reinforcement Learning Bibek Poudel Thomas Watson Weizi Li 60 14 0 31 Jul 2021
Tianshou: a Highly Modularized Deep Reinforcement Learning Library Jiayi Weng Huayu Chen Dong Yan Kaichao You Alexis Duburcq Minghao Zhang Yi Su Hang Su Jun Zhu NoLa OffRL 122 204 0 29 Jul 2021
Value-Based Reinforcement Learning for Continuous Control Robotic Manipulation in Multi-Task Sparse Reward Settings Sreehari Rammohan Shangqun Yu Bowen He Eric Hsiung Eric Rosen Stefanie Tellex George Konidaris OffRL 18 4 0 28 Jul 2021
Open-Ended Learning Leads to Generally Capable Agents Open-Ended Learning Team Adam Stooke Anuj Mahajan Catarina Barros Charlie Deck ... Nicolas Porcel Roberta Raileanu Steph Hughes-Fitt Valentin Dalibard Wojciech M. Czarnecki 137 190 0 27 Jul 2021
DR2L: Surfacing Corner Cases to Robustify Autonomous Driving via Domain Randomization Reinforcement Learning Haoyi Niu Jianming Hu Zheyu Cui Jianming Hu 122 18 0 25 Jul 2021
When does loss-based prioritization fail? Nie Hu Xinyu Hu Rosanne Liu Sara Hooker J. Yosinski 518 8 0 16 Jul 2021
Geometric Value Iteration: Dynamic Error-Aware KL Regularization for Reinforcement Learning Toshinori Kitamura Lingwei Zhu Takamitsu Matsubara 92 2 0 16 Jul 2021
A Reinforcement Learning Environment for Mathematical Reasoning via Program Synthesis Joseph Palermo Johnny Ye Alok Singh AIMat 103 2 0 15 Jul 2021
QoS-Aware Scheduling in New Radio Using Deep Reinforcement Learning Jakob Stigenberg Vidit Saxena Soma Tayamon E. Ghadimi 28 3 0 14 Jul 2021
Learning Expected Emphatic Traces for Deep RL Ray Jiang Shangtong Zhang Veronica Chelu Adam White Hado van Hasselt OffRL 67 12 0 12 Jul 2021
Attend2Pack: Bin Packing through Deep Reinforcement Learning with Attention Jingwei Zhang Bin Zi Xiaoyu Ge OffRL 79 23 0 09 Jul 2021
Fast-Learning Grasping and Pre-Grasping via Clutter Quantization and Q-map Masking Dafa Ren Xiaoqiang Ren Xiaofan Wang Sundara Tejaswi Digumarti Guodong Shi 29 9 0 06 Jul 2021
Ensemble and Auxiliary Tasks for Data-Efficient Deep Reinforcement Learning Muhammad Rizki Maulana W. Lee 55 1 0 05 Jul 2021
Cooperative Autonomous Vehicles that Sympathize with Human Drivers Behrad Toghi Rodolfo Valiente Dorsa Sadigh Ramtin Pedarsani Y. P. Fallah 65 48 0 02 Jul 2021
Stabilizing Deep Q-Learning with ConvNets and Vision Transformers under Data Augmentation Nicklas Hansen H. Su Xiaolong Wang OffRL 123 137 0 01 Jul 2021
Offline-to-Online Reinforcement Learning via Balanced Replay and Pessimistic Q-Ensemble Seunghyun Lee Younggyo Seo Kimin Lee Pieter Abbeel Jinwoo Shin OffRL OnRL 112 193 0 01 Jul 2021
Convergent and Efficient Deep Q Network Algorithm Zhikang T. Wang Masahito Ueda 94 12 0 29 Jun 2021
Autonomous Deep Quality Monitoring in Streaming Environments Andri Ashfahani Mahardhika Pratama E. Lughofer E. Yapp 120 4 0 26 Jun 2021
Auto-Pipeline: Synthesizing Complex Data Pipelines By-Target Using Reinforcement Learning and Search Junwen Yang Yeye He S. Chaudhuri AI4TS 71 27 0 25 Jun 2021
Mix and Mask Actor-Critic Methods Dom Huh 31 1 0 24 Jun 2021
Stochastic Batch Acquisition: A Simple Baseline for Deep Active Learning Andreas Kirsch Sebastian Farquhar Parmida Atighehchian Andrew Jesson Frederic Branchaud-Charron Y. Gal 106 20 0 22 Jun 2021
Hi-Phy: A Benchmark for Hierarchical Physical Reasoning Cheng Xue Vimukthini Pinto C. Gamage Peng Zhang Jochen Renz 59 0 0 17 Jun 2021
Modelling resource allocation in uncertain system environment through deep reinforcement learning Neel Gandhi Shakti Mishra 32 1 0 17 Jun 2021
CROP: Certifying Robust Policies for Reinforcement Learning through Functional Smoothing Fan Wu Linyi Li Zijian Huang Yevgeniy Vorobeychik Ding Zhao Yue Liu AAML OffRL 85 61 0 17 Jun 2021
Solving Continuous Control with Episodic Memory Igor Kuznetsov Andrey Filchenkov CLL OffRL 48 19 0 16 Jun 2021
Characterizing the Gap Between Actor-Critic and Policy Gradient Junfeng Wen Saurabh Kumar Ramki Gummadi Dale Schuurmans 92 15 0 13 Jun 2021
A Deep Reinforcement Learning Approach to Marginalized Importance Sampling with the Successor Representation Scott Fujimoto David Meger Doina Precup 80 17 0 12 Jun 2021
GDI: Rethinking What Makes Reinforcement Learning Different From Supervised Learning Jiajun Fan Changnan Xiao Yue Huang OffRL 93 10 0 11 Jun 2021
Taylor Expansion of Discount Factors Yunhao Tang Mark Rowland Rémi Munos Michal Valko OffRL 65 5 0 11 Jun 2021
Data-driven battery operation for energy arbitrage using rainbow deep reinforcement learning Daniel J. B. Harrold Jun Cao Zhong Fan 51 49 0 10 Jun 2021
Simplifying Deep Reinforcement Learning via Self-Supervision Daochen Zha Kwei-Herng Lai Kaixiong Zhou Helen Zhou SSL 94 15 0 10 Jun 2021
Reinforcement Learning for Industrial Control Network Cyber Security Orchestration John Mern Kyle Hatch Ryan Silva J. Brush Mykel J. Kochenderfer 65 4 0 09 Jun 2021
Who Is the Strongest Enemy? Towards Optimal and Efficient Evasion Attacks in Deep RL Yanchao Sun Ruijie Zheng Yongyuan Liang Furong Huang AAML 126 69 0 09 Jun 2021
Don't Get Yourself into Trouble! Risk-aware Decision-Making for Autonomous Vehicles Kasra Mokhtari Alan R. Wagner 65 5 0 08 Jun 2021
Safe Deep Q-Network for Autonomous Vehicles at Unsignalized Intersection Kasra Mokhtari Alan R. Wagner 62 9 0 08 Jun 2021
Towards robust and domain agnostic reinforcement learning competitions William H. Guss Stephanie Milani Nicholay Topin Brandon Houghton Sharada Mohanty ... Lu Liu Daichi Nishio Toi Tsuneda Karolis Ramanauskas Gabija Juceviciute OOD 66 2 0 07 Jun 2021
Causal Influence Detection for Improving Efficiency in Reinforcement Learning Maximilian Seitzer Bernhard Schölkopf Georg Martius CML 112 78 0 07 Jun 2021
Distributional Reinforcement Learning with Unconstrained Monotonic Neural Networks Thibaut Théate Antoine Wehenkel Adrien Bolland Gilles Louppe D. Ernst 64 7 0 06 Jun 2021
Differentiable Architecture Search for Reinforcement Learning Yingjie Miao Xingyou Song John D. Co-Reyes Daiyi Peng Summer Yue E. Brevdo Aleksandra Faust 71 4 0 04 Jun 2021
Hierarchical Representation Learning for Markov Decision Processes Lorenzo Steccanella Simone Totaro Anders Jonsson 62 4 0 03 Jun 2021
Towards Deeper Deep Reinforcement Learning with Spectral Normalization Johan Bjorck Carla P. Gomes Kilian Q. Weinberger 106 23 0 02 Jun 2021
Smooth Q-learning: Accelerate Convergence of Q-learning Using Similarity Wei-zhi Liao Xiaohui Wei Jizhou Lai 18 3 0 02 Jun 2021
Transferable Deep Reinforcement Learning Framework for Autonomous Vehicles with Joint Radar-Data Communications Nguyen Quang Hieu D. Hoang Dusit Niyato Ping Wang Dong In Kim Chau Yuen 61 28 0 28 May 2021
FNAS: Uncertainty-Aware Fast Neural Architecture Search Jihao Liu Ming Zhang Yangting Sun B. Liu Guanglu Song Yu Liu Hongsheng Li 96 7 0 25 May 2021
Searching Collaborative Agents for Multi-plane Localization in 3D Ultrasound Xin Yang Yuhao Huang Ruobing Huang Haoran Dou Rui Li ... Chaoyu Chen Yuanji Zhang Haixia Wang Yi Xiong Dong Ni 52 17 0 22 May 2021
Robo-Advising: Enhancing Investment with Inverse Optimization and Deep Reinforcement Learning Haoran Wang S. Yu AIFin 113 15 0 19 May 2021
Controlling an Inverted Pendulum with Policy Gradient Methods-A Tutorial Swagat Kumar 25 2 0 17 May 2021