v1v2 (latest)

Asynchronous Methods for Deep Reinforcement Learning

4 February 2016

Volodymyr Mnih

Adria Puigdomenech Badia

David Silver

Papers citing "Asynchronous Methods for Deep Reinforcement Learning"

50 / 3,591 papers shown

Title
Neural Polar Decoders for DNA Data Storage Ziv Aharoni Henry D. Pfister 15 0 0 20 Jun 2025
CAWR: Corruption-Averse Advantage-Weighted Regression for Robust Policy Optimization Ranting Hu OffRL 29 0 0 18 Jun 2025
Sequential Policy Gradient for Adaptive Hyperparameter Optimization Zheng Li Jerry Q. Cheng Huanying Gu OffRL 26 0 0 18 Jun 2025
Active Adversarial Noise Suppression for Image Forgery Localization Rongxuan Peng Shunquan Tan Xianbo Mo Alex C. Kot Jiwu Huang AAML 26 0 0 15 Jun 2025
Resolve Highway Conflict in Multi-Autonomous Vehicle Controls with Local State Attention Xuan Duy Ta Bang Giang Le Thanh Ha Le Viet-Cuong Ta 15 0 0 13 Jun 2025
ContextBuddy: AI-Enhanced Contextual Insights for Security Alert Investigation (Applied to Intrusion Detection) Ronal Singh Mohan Baruwal Chhetri Surya Nepal Cécile Paris 60 0 0 11 Jun 2025
TooBadRL: Trigger Optimization to Boost Effectiveness of Backdoor Attacks on Deep Reinforcement Learning Songze Li Mingxuan Zhang Kang Wei Shouling Ji AAML 90 0 0 11 Jun 2025
Reinforcement Learning Teachers of Test Time Scaling Edoardo Cetin Tianyu Zhao Yujin Tang OffRL ReLM LRM 55 0 0 10 Jun 2025
TGRPO :Fine-tuning Vision-Language-Action Model via Trajectory-wise Group Relative Policy Optimization Zengjue Chen Runliang Niu He Kong Qi Wang 66 0 0 10 Jun 2025
Causal Graph Recovery in Neuroimaging through Answer Set Programming Mohammadsajad Abavisani Kseniya Solovyeva David Danks Vince D. Calhoun Sergey Plis CML 34 0 0 10 Jun 2025
Collaborative Learning in Agentic Systems: A Collective AI is Greater Than the Sum of Its Parts Saptarshi Nath Christos Peridis Eseoghene Benjamin Xinran Liu Soheil Kolouri Peter Kinnell Zexin Li Cong Liu Shirin Dora Andrea Soltoggio 38 0 0 05 Jun 2025
Simple, Good, Fast: Self-Supervised World Models Free of Baggage Jan Robine Marc Höftmann Stefan Harmeling DRL OCL 69 1 0 03 Jun 2025
NetPress: Dynamically Generated LLM Benchmarks for Network Applications Yajie Zhou Jiajun Ruan Eric S. Wang Sadjad Fouladi Francis Y. Yan Kevin Hsieh Zaoxing Liu 34 0 0 03 Jun 2025
Bidirectional Soft Actor-Critic: Leveraging Forward and Reverse KL Divergence for Efficient Reinforcement Learning Yixian Zhang Huaze Tang Changxu Wei Wenbo Ding 59 0 0 02 Jun 2025
A Hierarchical Bin Packing Framework with Dual Manipulators via Heuristic Search and Deep Reinforcement Learning Beomjoon Lee Changjoo Nam OffRL 41 0 0 02 Jun 2025
Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoning S. Wang Le Yu Chang Gao Chujie Zheng Shixuan Liu ... Yang Yue S. Song Bowen Yu Gao Huang Junyang Lin LRM 70 9 0 02 Jun 2025
Mitigating Plasticity Loss in Continual Reinforcement Learning by Reducing Churn Hongyao Tang J. Obando-Ceron Pablo Samuel Castro Aaron Courville Glen Berseth 38 0 0 31 May 2025
Adaptive Plane Reformatting for 4D Flow MRI using Deep Reinforcement Learning Javier Bisbal Julio Sotelo Maria I Valdés Pablo Irarrazaval Marcelo andía Julio García José Rodriguez-Palomarez Francesca Raimondi C. Tejos Sergio Uribe OOD 36 0 0 31 May 2025
Causal-aware Large Language Models: Enhancing Decision-Making Through Learning, Adapting and Acting Wei Chen Jiahao Zhang Haipeng Zhu Boyan Xu Zijian Li Keli Zhang Junjian Ye Ruichu Cai 41 1 0 30 May 2025
AMOR: Adaptive Character Control through Multi-Objective Reinforcement Learning Lucas N. Alegre Agon Serifi Ruben Grandia David Müller Espen Knoop Moritz Bächer 58 0 0 29 May 2025
Bigger, Regularized, Categorical: High-Capacity Value Functions are Efficient Multi-Task Learners Michal Nauman Marek Cygan Carmelo Sferrazza Aviral Kumar Pieter Abbeel OffRL 96 0 0 29 May 2025
ROTATE: Regret-driven Open-ended Training for Ad Hoc Teamwork Caroline Wang Arrasy Rahman Jiaxun Cui Yoonchang Sung Peter Stone 66 0 0 29 May 2025
The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models Ganqu Cui Yuchen Zhang Jiacheng Chen Lifan Yuan Zhi Wang ... Lei Bai Wanli Ouyang Yu Cheng Bowen Zhou Ning Ding LRM 73 5 0 28 May 2025
A Framework for Adversarial Analysis of Decision Support Systems Prior to Deployment Brett Bissey Kyle Gatesman Walker Dimon Mohammad Alam Luis Robaina Joseph Weissman AAML 45 0 0 27 May 2025
Multi-level Certified Defense Against Poisoning Attacks in Offline Reinforcement Learning Shijie Liu Andrew C. Cullen Paul Montague S. Erfani Benjamin I. P. Rubinstein OffRL AAML 46 1 0 27 May 2025
Point-RFT: Improving Multimodal Reasoning with Visually Grounded Reinforcement Finetuning Minheng Ni Zhengyuan Yang Linjie Li Chung-Ching Lin Kevin Qinghong Lin W. Zuo Lijuan Wang ReLM LRM 85 1 0 26 May 2025
Surrogate-Assisted Evolutionary Reinforcement Learning Based on Autoencoder and Hyperbolic Neural Network Bingdong Li Mei Jiang Hong Qian K. Tang W. Hong Peng Yang 141 0 0 26 May 2025
A Snapshot of Influence: A Local Data Attribution Framework for Online Reinforcement Learning Yuzheng Hu Fan Wu Haotian Ye David A. Forsyth James Y. Zou Nan Jiang Jiaqi W. Ma Han Zhao OffRL 74 0 0 25 May 2025
Reduce Computational Cost In Deep Reinforcement Learning Via Randomized Policy Learning Zhuochen Liu Rahul Jain Quan Nguyen 44 0 0 25 May 2025
Improving Value Estimation Critically Enhances Vanilla Policy Gradient Tao Wang Ruipeng Zhang Sicun Gao OffRL 53 0 0 25 May 2025
CiRL: Open-Source Environments for Reinforcement Learning in Circular Economy and Net Zero Federico Zocco Andrea Corti Monica Malvezzi AI4CE 35 0 0 24 May 2025
Enhancing Efficiency and Exploration in Reinforcement Learning for LLMs Mengqi Liao Xiangyu Xi Ruinian Chen Jia Leng Yangen Hu Ke Zeng Shuai Liu Huaiyu Wan LRM 48 0 0 24 May 2025
Hybrid Latent Reasoning via Reinforcement Learning Zhenrui Yue Bowen Jin Huimin Zeng Honglei Zhuang Zhen Qin Jinsung Yoon Lanyu Shang Jiawei Han Dong Wang OffRL BDL LRM 70 0 0 24 May 2025
Reinforcement Fine-Tuning Powers Reasoning Capability of Multimodal Large Language Models Haoyuan Sun Jiaqi Wu Bo Xia Yifu Luo Yifei Zhao Kai Qin Xufei Lv Tiantian Zhang Yongzhe Chang Xueqian Wang OffRL LRM 209 0 0 24 May 2025
Rethinking Agent Design: From Top-Down Workflows to Bottom-Up Skill Evolution Jiawei Du Jinlong Wu Yuzheng Chen Yucheng Hu Bing Li Joey Tianyi Zhou 253 0 0 23 May 2025
Bootstrapping your behavior: a new pretraining strategy for user behavior sequence data Weichang Wu Xiaolu Zhang Jun Zhou Yuchen Li Wenwen Xia 22 0 0 22 May 2025
Sequential Monte Carlo for Policy Optimization in Continuous POMDPs Hany Abdulsamad Sahel Iqbal Simo Särkkä 74 0 0 22 May 2025
A Temporal Difference Method for Stochastic Continuous Dynamics Haruki Settai Naoya Takeishi Takehisa Yairi 156 0 0 21 May 2025
Building spatial world models from sparse transitional episodic memories Zizhan He Maxime Daigle Pouya Bashivan KELM 56 0 0 19 May 2025
DisCO: Reinforcing Large Reasoning Models with Discriminative Constrained Optimization Gang Li Ming Lin Tomer Galanti Zhengzhong Tu Tianbao Yang 111 1 0 18 May 2025
Q-Policy: Quantum-Enhanced Policy Evaluation for Scalable Reinforcement Learning Kalyan Cherukuri Aarav Lala Yash Yardi 50 0 0 17 May 2025
SAINT: Attention-Based Modeling of Sub-Action Dependencies in Multi-Action Policies Matthew Landers Taylor W. Killian Thomas Hartvigsen Afsaneh Doryab 61 0 0 17 May 2025
Zero-Shot Visual Generalization in Robot Manipulation Sumeet Batra Gaurav Sukhatme 77 0 0 16 May 2025
Scalability of Reinforcement Learning Methods for Dispatching in Semiconductor Frontend Fabs: A Comparison of Open-Source Models with Real Industry Datasets Patrick Stöckermann Henning Südfeld Alessandro Immordino Thomas Altenmüller Marc Wegmann Martin Gebser Konstantin Schekotihin Georg Seidel Chew Wye Chan Fei Fei Zhang OffRL 36 0 0 16 May 2025
Sample Efficient Reinforcement Learning via Large Vision Language Model Distillation Donghoon Lee Tung M. Luu Younghwan Lee Chang D. Yoo OffRL VLM 72 0 0 16 May 2025
Modeling Unseen Environments with Language-guided Composable Causal Components in Reinforcement Learning Xinyue Wang Zhen Zhang OffRL CML 68 0 0 13 May 2025
Deep Reinforcement Learning for Power Grid Multi-Stage Cascading Failure Mitigation Bo Meng Chenghao Xu Yongli Zhu AI4CE 40 0 0 13 May 2025
Differentiable Quantum Architecture Search in Quantum-Enhanced Neural Network Parameter Generation Samuel Yen-Chi Chen Chen-Yu Liu Kuan-Cheng Chen Wei-Jia Huang Yen-Jui Chang Wei-Hao Huang 63 1 0 13 May 2025
Combining Bayesian Inference and Reinforcement Learning for Agent Decision Making: A Review Chengmin Zhou Ville Kyrki Pasi Fränti Laura Ruotsalainen BDL AI4CE 121 0 0 12 May 2025
DARLR: Dual-Agent Offline Reinforcement Learning for Recommender Systems with Dynamic Reward Yi Zhang Ruihong Qiu Xuwei Xu Jiajun Liu Sen Wang OffRL 74 0 0 12 May 2025