Deep Reinforcement Learning that Matters

19 September 2017

Papers citing "Deep Reinforcement Learning that Matters"

50 / 379 papers shown

Title
TD-MPC2: Scalable, Robust World Models for Continuous Control Nicklas Hansen Hao Su Xiaolong Wang MU 34 128 0 25 Oct 2023
Quantifying Language Models' Sensitivity to Spurious Features in Prompt Design or: How I learned to start worrying about prompt formatting Melanie Sclar Yejin Choi Yulia Tsvetkov Alane Suhr 53 308 0 17 Oct 2023
An Open-Loop Baseline for Reinforcement Learning Locomotion Tasks Antonin Raffin Olivier Sigaud Jens Kober Alin Albu-Schäffer João Silvério F. Stulp 40 2 0 09 Oct 2023
On Generating Explanations for Reinforcement Learning Policies: An Empirical Study Mikihisa Yuasa Huy T. Tran R. Sreenivas FAtt LRM 54 1 0 29 Sep 2023
Subwords as Skills: Tokenization for Sparse-Reward Reinforcement Learning David Yunis Justin Jung Falcon Z. Dai Matthew R. Walter OffRL 47 0 0 08 Sep 2023
R^3: On-device Real-Time Deep Reinforcement Learning for Autonomous Robotics Zexin Li Aritra Samanta Yufei Li Andrea Soltoggio Hyoseung Kim Cong Liu 37 6 0 29 Aug 2023
Deep Reinforcement Learning for Artificial Upwelling Energy Management Yiyuan Zhang Wei Fan 20 3 0 20 Aug 2023
Large Language Models and Foundation Models in Smart Agriculture: Basics, Opportunities, and Challenges Jiajia Li Mingle Xu Lirong Xiang Dong Chen Weichao Zhuang Xunyuan Yin Zhao Li 39 3 0 13 Aug 2023
Improving Reliable Navigation under Uncertainty via Predictions Informed by Non-Local Information Raihan Islam Arnob Gregory J. Stein 33 2 0 26 Jul 2023
PASTA: Pretrained Action-State Transformer Agents Raphael Boige Yannis Flet-Berliac Arthur Flajolet Guillaume Richard Thomas Pierrot LM&Ro OffRL 45 5 0 20 Jul 2023
Off-Policy RL Algorithms Can be Sample-Efficient for Continuous Control via Sample Multiple Reuse Jiafei Lyu Le Wan Zongqing Lu Xiu Li OffRL 36 9 0 29 May 2023
C-MCTS: Safe Planning with Monte Carlo Tree Search Dinesh Parthasarathy G. Kontes Axel Plinge Christopher Mutschler 40 3 0 25 May 2023
Deep Reinforcement Learning-Based Control for Stomach Coverage Scanning of Wireless Capsule Endoscopy Yameng Zhang Long Bai Li Liu Hongliang Ren Max Q.-H. Meng 26 9 0 18 May 2023
Goal-Conditioned Supervised Learning with Sub-Goal Prediction Tom Jurgenson Aviv Tamar 31 1 0 17 May 2023
Revisiting the Minimalist Approach to Offline Reinforcement Learning Denis Tarasov Vladislav Kurenkov Alexander Nikulin Sergey Kolesnikov OffRL 38 37 0 16 May 2023
Policy Gradient Methods in the Presence of Symmetries and State Abstractions Prakash Panangaden S. Rezaei-Shoshtari Rosie Zhao David Meger Doina Precup 38 2 0 09 May 2023
The e-Bike Motor Assembly: Towards Advanced Robotic Manipulation for Flexible Manufacturing Leonel Rozo A. Kupcsik Philipp Schillinger Meng Guo R. Krug ... Patrick Kesper Sabrina Hoppe Hanna Ziesche M. Burger Kai O. Arras 38 5 0 20 Apr 2023
PED-ANOVA: Efficiently Quantifying Hyperparameter Importance in Arbitrary Subspaces Shuhei Watanabe Archit Bansal Frank Hutter 32 12 0 20 Apr 2023
Learning policies for resource allocation in business processes J. Middelhuis R. Bianco E. Scherzer Z. A. Bukhsh I. Adan R. Dijkman 19 6 0 19 Apr 2023
Convex Dual Theory Analysis of Two-Layer Convolutional Neural Networks with Soft-Thresholding Chunyan Xiong Meng Lu Xiaotong Yu JIAN-PENG Cao Zhong Chen D. Guo X. Qu MLT 43 0 0 14 Apr 2023
Deep reinforcement learning applied to an assembly sequence planning problem with user preferences M. Neves Pedro Neto OffRL 24 17 0 13 Apr 2023
Automatic Gradient Descent: Deep Learning without Hyperparameters Jeremy Bernstein Chris Mingard Kevin Huang Navid Azizan Yisong Yue ODL 16 17 0 11 Apr 2023
HumanLight: Incentivizing Ridesharing via Human-centric Deep Reinforcement Learning in Traffic Signal Control Dimitris M. Vlachogiannis Hua Wei S. Moura Jane Macfarlane 42 7 0 05 Apr 2023
Data-Efficient Policy Selection for Navigation in Partial Maps via Subgoal-Based Abstraction Abhishek Paudel Gregory J. Stein 20 1 0 03 Apr 2023
On the Utility of Koopman Operator Theory in Learning Dexterous Manipulation Skills Yunhai Han Mandy Xie Ye Zhao Harish Ravichandar 37 17 0 23 Mar 2023
Deep Occupancy-Predictive Representations for Autonomous Driving Eivind Meyer Lars Frederik Peiss Matthias Althoff 37 3 0 07 Mar 2023
Using Automated Algorithm Configuration for Parameter Control D. Chen M. Buzdalov Carola Doerr Nguyen Dang 33 4 0 23 Feb 2023
A Reinforcement Learning Framework for Online Speaker Diarization Baihan Lin Xinxin Zhang OffRL 39 2 0 21 Feb 2023
Efficient Online Reinforcement Learning with Offline Data Philip J. Ball Laura M. Smith Ilya Kostrikov Sergey Levine OffRL OnRL 45 163 0 06 Feb 2023
A Domain-Agnostic Approach for Characterization of Lifelong Learning Systems Megan M. Baker Alexander New Mario Aguilar-Simon Ziad Al-Halah Sébastien M. R. Arnold ... Zifan Xu A. Yanguas-Gil Harel Yedidsion Shangqun Yu Gautam K. Vallabha 35 16 0 18 Jan 2023
Mutation Testing of Deep Reinforcement Learning Based on Real Faults Florian Tambon Vahid Majdinasab Amin Nikanjam Foutse Khomh G. Antoniol 36 7 0 13 Jan 2023
A Survey on Transformers in Reinforcement Learning Wenzhe Li Hao Luo Zichuan Lin Chongjie Zhang Zongqing Lu Deheng Ye OffRL MU AI4CE 37 56 0 08 Jan 2023
Offline Policy Optimization in RL with Variance Regularizaton Riashat Islam Samarth Sinha Homanga Bharadhwaj Samin Yeasar Arnob Zhuoran Yang Animesh Garg Zhaoran Wang Lihong Li Doina Precup OffRL 28 0 0 29 Dec 2022
Speeding Up Multi-Objective Hyperparameter Optimization by Task Similarity-Based Meta-Learning for the Tree-Structured Parzen Estimator Shuhei Watanabe Noor H. Awad Masaki Onishi Frank Hutter 31 9 0 13 Dec 2022
Applying Deep Reinforcement Learning to the HP Model for Protein Structure Prediction Kaiyuan Yang Houjing Huang Olafs Vandans A. Murali Fujia Tian R. Yap Liang Dai 22 10 0 27 Nov 2022
ToolFlowNet: Robotic Manipulation with Tools via Predicting Tool Flow from Point Clouds Daniel Seita Yufei Wang Sarthak J. Shetty Edward Li Zackory M. Erickson David Held 3DPC 30 49 0 16 Nov 2022
CACTO: Continuous Actor-Critic with Trajectory Optimization -- Towards global optimality Gianluigi Grandesso Elisa Alboni G. P. R. Papini Patrick M. Wensing Andrea Del Prete 30 15 0 12 Nov 2022
Control Transformer: Robot Navigation in Unknown Environments through PRM-Guided Return-Conditioned Sequence Modeling Daniel Lawson A. H. Qureshi 27 8 0 11 Nov 2022
A Survey on Graph Counterfactual Explanations: Definitions, Methods, Evaluation, and Research Challenges Mario Alfonso Prado-Romero Bardh Prenkaj Giovanni Stilo F. Giannotti CML 36 30 0 21 Oct 2022
Safe Policy Improvement in Constrained Markov Decision Processes Luigi Berducci Radu Grosu OffRL 36 2 0 20 Oct 2022
The Pump Scheduling Problem: A Real-World Scenario for Reinforcement Learning Henrique Donancio L. Vercouter H. Roclawski AI4CE 18 1 0 20 Oct 2022
Long N-step Surrogate Stage Reward to Reduce Variances of Deep Reinforcement Learning in Complex Problems Junmin Zhong Ruofan Wu J. Si LRM 30 0 0 10 Oct 2022
Deep Reinforcement Learning Based Joint Downlink Beamforming and RIS Configuration in RIS-aided MU-MISO Systems Under Hardware Impairments and Imperfect CSI Baturay Saglam Doğa Gürgünoğlu Suleyman Serdar Kozat 24 12 0 10 Oct 2022
Deep Intrinsically Motivated Exploration in Continuous Control Baturay Saglam Suleyman Serdar Kozat 26 4 0 01 Oct 2022
Scaling Laws for a Multi-Agent Reinforcement Learning Model Oren Neumann C. Gros 32 26 0 29 Sep 2022
Modern Machine Learning Tools for Monitoring and Control of Industrial Processes: A Survey R. Bhushan Gopaluni Aditya Tulsyan Benoît Chachuat Biao Huang J. M. Lee Faraz Amjad S. Damarla Jong Woo Kim Nathan P. Lawrence AI4CE 21 38 0 22 Sep 2022
Towards a Standardised Performance Evaluation Protocol for Cooperative MARL R. Gorsane Omayma Mahjoub Ruan de Kock Roland Dubb Siddarth S. Singh Arnu Pretorius OffRL 44 50 0 21 Sep 2022
Measuring Interventional Robustness in Reinforcement Learning Katherine Avery Jack Kenney Pracheta Amaranath Erica Cai David D. Jensen 21 0 0 19 Sep 2022
Learn the Time to Learn: Replay Scheduling in Continual Learning Marcus Klasson Hedvig Kjellström Chen Zhang CLL 37 9 0 18 Sep 2022
Look where you look! Saliency-guided Q-networks for generalization in visual Reinforcement Learning David Bertoin Adil Zouitine Mehdi Zouitine Emmanuel Rachelson 40 30 0 16 Sep 2022