v1v2 (latest)

Asynchronous Methods for Deep Reinforcement Learning

4 February 2016

Volodymyr Mnih

Adria Puigdomenech Badia

David Silver

Papers citing "Asynchronous Methods for Deep Reinforcement Learning"

50 / 3,591 papers shown

Title
Towards Human-Like RL: Taming Non-Naturalistic Behavior in Deep RL via Adaptive Behavioral Costs in 3D Games Kuo-Hao Ho Ping-Chun Hsieh Chiu-Chou Lin You-Ren Luo Feng-Jian Wang I-Chen Wu 60 0 0 27 Sep 2023
Evaluation of Constrained Reinforcement Learning Algorithms for Legged Locomotion Joonho Lee Lukas Schroth Victor Klemm Marko Bjelonic Alexander Reske Marco Hutter 91 17 0 27 Sep 2023
Seeing Beyond the Patch: Scale-Adaptive Semantic Segmentation of High-resolution Remote Sensing Imagery based on Reinforcement Learning Yinhe Liu Sunan Shi Junjue Wang Yanfei Zhong 68 0 0 27 Sep 2023
Gray-box Adversarial Attack of Deep Reinforcement Learning-based Trading Agents Foozhan Ataiefard Hadi Hemmati AAML 117 2 0 26 Sep 2023
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning Lukas Schneider Jonas Frey Takahiro Miki Marco Hutter 87 12 0 25 Sep 2023
Learning Actions and Control of Focus of Attention with a Log-Polar-like Sensor Robin Göransson Volker Krueger 29 0 0 22 Sep 2023
Machine Learning Meets Advanced Robotic Manipulation Saeid Nahavandi R. Alizadehsani D. Nahavandi Chee Peng Lim Kevin Kelly Fernando Bello 92 20 0 22 Sep 2023
Trip Planning for Autonomous Vehicles with Wireless Data Transfer Needs Using Reinforcement Learning Yousef AlSaqabi Bhaskar Krishnamachari 64 2 0 21 Sep 2023
Optimizing Crowd-Aware Multi-Agent Path Finding through Local Broadcasting with Graph Neural Networks Phu-Cuong Pham Aniket Bera AI4CE 66 2 0 19 Sep 2023
Deep Reinforcement Learning for Infinite Horizon Mean Field Problems in Continuous Spaces Andrea Angiuli J. Fouque Ruimeng Hu Alan Raydan 116 5 0 19 Sep 2023
Privileged to Predicted: Towards Sensorimotor Reinforcement Learning for Urban Driving Ege Onat Özsüer Barış Akgün Fatma Guney 51 0 0 18 Sep 2023
Efficient quantum recurrent reinforcement learning via quantum reservoir computing Samuel Yen-Chi Chen 91 14 0 13 Sep 2023
Characterizing Speed Performance of Multi-Agent Reinforcement Learning Samuel Wiggins Yuan Meng Rajgopal Kannan Viktor Prasanna 126 3 0 13 Sep 2023
Career Path Recommendations for Long-term Income Maximization: A Reinforcement Learning Approach S. Avlonitis Dor Lavi Masoud Mansoury David Graus 13 0 0 11 Sep 2023
What Is Near?: Room Locality Learning for Enhanced Robot Vision-Language-Navigation in Indoor Living Environments Muraleekrishna Gopinathan Jumana Abu-Khalaf David Suter Sidike Paheding N.A. Rawashdeh 61 2 0 10 Sep 2023
Advantage Actor-Critic with Reasoner: Explaining the Agent's Behavior from an Exploratory Perspective Muzhe Guo Feixu Yu Tian Lan Fang Jin OffRL LRM 45 0 0 09 Sep 2023
Compositional Learning of Visually-Grounded Concepts Using Reinforcement Zijun Lin Haidi Azaman M Ganesh Kumar Cheston Tan CoGe OffRL 74 3 0 08 Sep 2023
Hybrid of representation learning and reinforcement learning for dynamic and complex robotic motion planning Chengmin Zhou Xin Lu Jiapeng Dai Bingding Huang Xiaoxu Liu Pasi Fränti 73 2 0 07 Sep 2023
A State Representation for Diminishing Rewards Ted Moskovitz Samo Hromadka Ahmed Touati Diana Borsa M. Sahani 55 2 0 07 Sep 2023
Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes Qinbo Bai Washim Uddin Mondal Vaneet Aggarwal 59 13 0 05 Sep 2023
LoopTune: Optimizing Tensor Computations with Reinforcement Learning Dejan Grubisic Bram Wasti Chris Cummins John Mellor-Crummey A. Zlateski 67 1 0 04 Sep 2023
Neurosymbolic Reinforcement Learning and Planning: A Survey Kamal Acharya Waleed Raza Carlos Dourado Alvaro Velasquez Houbing Song NAI OffRL 90 17 0 02 Sep 2023
Deep Reinforcement Learning in Surgical Robotics: Enhancing the Automation Level Cheng Qian Hongliang Ren 83 4 0 02 Sep 2023
Efficient RLHF: Reducing the Memory Usage of PPO Michael Santacroce Yadong Lu Han Yu Yuan-Fang Li Yelong Shen 71 32 0 01 Sep 2023
Deep Inductive Logic Programming meets Reinforcement Learning Andreas Bueff Vaishak Belle AI4CE 41 4 0 30 Aug 2023
Vulnerability of Machine Learning Approaches Applied in IoT-based Smart Grid: A Review Zhenyong Zhang Mengxiang Liu Mingyang Sun Ruilong Deng Peng Cheng Dusit Niyato Mo-Yuen Chow Jiming Chen 113 47 0 30 Aug 2023
Online Overexposed Pixels Hallucination in Videos with Adaptive Reference Frame Selection Yazhou Xing Amrita Mazumdar Anjul Patney Chao Liu Hongxu Yin Qifeng Chen Jan Kautz I. Frosio 80 1 0 29 Aug 2023
Reinforcement Learning for Sampling on Temporal Medical Imaging Sequences Zhishen Huang 106 1 0 28 Aug 2023
Entropy-based Guidance of Deep Neural Networks for Accelerated Convergence and Improved Performance Mackenzie J. Meni Ryan T. White Michael L. Mayo K. Pilkiewicz BDL 78 6 0 28 Aug 2023
Target-independent XLA optimization using Reinforcement Learning Milan Ganai Haichen Li Theodore Enns Yida Wang Randy Huang 74 0 0 28 Aug 2023
Reinforcement Learning for Generative AI: A Survey Yuanjiang Cao Quan.Z Sheng Julian McAuley Lina Yao SyDa 202 13 0 28 Aug 2023
Packet Header Recognition Utilizing an All-Optical Reservoir Based on Reinforcement-Learning-Optimized Double-Ring Resonator Zheng Li Xiaoyan Zhou Zongze Li Guanju Peng Yuhao Guo Lin Zhang 94 2 0 26 Aug 2023
Go Beyond Imagination: Maximizing Episodic Reachability with World Models Yao Fu Run Peng Honglak Lee 68 1 0 25 Aug 2023
Reinforcement Learning-assisted Evolutionary Algorithm: A Survey and Research Opportunities Yanjie Song Yutong Wu Yangyang Guo Ran Yan Suganthan Yue Zhang Witold Pedrycz Swagatam Das R. Mallipeddi Solomon Ajani 88 46 0 25 Aug 2023
Learning Cyber Defence Tactics from Scratch with Multi-Agent Reinforcement Learning Jacob Wiebe Ranwa Al Mallah Li Li AAML 60 4 0 25 Aug 2023
Bayesian Exploration Networks Matt Fellows Brandon Kaplowitz Christian Schroeder de Witt Shimon Whiteson BDL 92 4 0 24 Aug 2023
Implicit Obstacle Map-driven Indoor Navigation Model for Robust Obstacle Avoidance Wei Xie Qianliang Wu Shuo Gu J. Xie 80 5 0 24 Aug 2023
Reinforcement Learning Informed Evolutionary Search for Autonomous Systems Testing D. Humeniuk Foutse Khomh G. Antoniol 59 4 0 24 Aug 2023
Careful at Estimation and Bold at Exploration Xing Chen Yijun Liu Zhaogeng Liu Hechang Chen Hengshuai Yao Yi-Ju Chang 21 0 0 22 Aug 2023
A Deep Reinforcement Learning based Algorithm for Time and Cost Optimized Scaling of Serverless Applications Anupama Mampage S. Karunasekera Rajkumar Buyya 97 4 0 22 Aug 2023
Diffusion Model as Representation Learner Xingyi Yang Xinchao Wang DiffM 86 60 0 21 Aug 2023
RL-LABEL: A Deep Reinforcement Learning Approach Intended for AR Label Placement in Dynamic Scenarios Zhutian Chen Daniele Chiappalupi Tica Lin Yalong Yang Johanna Beyer Hanspeter Pfister OffRL 97 5 0 20 Aug 2023
Towards Understanding the Generalizability of Delayed Stochastic Gradient Descent Xiaoge Deng Li Shen Shengwei Li Tao Sun Dongsheng Li Dacheng Tao 85 3 0 18 Aug 2023
Reinforced Self-Training (ReST) for Language Modeling Çağlar Gülçehre T. Paine S. Srinivasan Ksenia Konyushkova L. Weerts ... Chenjie Gu Wolfgang Macherey Arnaud Doucet Orhan Firat Nando de Freitas OffRL 129 309 0 17 Aug 2023
Heterogeneous Multi-Agent Reinforcement Learning via Mirror Descent Policy Optimization Mohammad Mehdi Nasiri M. Rezghi 115 0 0 13 Aug 2023
The Impact of Overall Optimization on Warehouse Automation H. Yoshitake Pieter Abbeel OffRL 119 1 0 11 Aug 2023
Learning Team-Based Navigation: A Review of Deep Reinforcement Learning Techniques for Multi-Agent Pathfinding Jaeho Chung Jamil Fayyad Younes Al Younes Homayoun Najjaran 80 17 0 11 Aug 2023
Scope Loss for Imbalanced Classification and RL Exploration Hasham Burhani Xiaolong Shi Jonathan Jaegerman Daniel Balicki 66 0 0 08 Aug 2023
Retroformer: Retrospective Large Language Agents with Policy Gradient Optimization Weiran Yao Shelby Heinecke Juan Carlos Niebles Zhiwei Liu Yihao Feng ... Ran Xu P. Mùi Haiquan Wang Caiming Xiong Silvio Savarese LLMAG LM&Ro 104 80 0 04 Aug 2023
Thespian: Multi-Character Text Role-Playing Game Agents Christopher Cui Xiangyu Peng Mark O. Riedl LLMAG AI4CE 82 4 0 03 Aug 2023