v1v2v3 (latest)

DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning

23 February 2021

Papers citing "DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning"

25 / 25 papers shown

Title
Data Center Cooling System Optimization Using Offline Reinforcement Learning Xianyuan Zhan Xiangyu Zhu Peng Cheng Xiao Hu Ziteng He ... Chenhui Liu Tianshun Hong Huiwen Zheng Yunxin Liu Feng Zhao AI4CE 145 0 0 17 Feb 2025
Offline Reinforcement Learning with Soft Behavior Regularization Haoran Xu Xianyuan Zhan Jianxiong Li Honglei Yin OffRL 63 31 0 14 Oct 2021
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning Haoran Xu Xianyuan Zhan Xiangyu Zhu OffRL 65 91 0 19 Jul 2021
Model-Based Offline Planning with Trajectory Pruning Xianyuan Zhan Xiangyu Zhu Haoran Xu OffRL 93 37 0 16 May 2021
Model-Based Offline Planning Arthur Argenson Gabriel Dulac-Arnold OffRL 64 155 0 12 Aug 2020
Conservative Q-Learning for Offline Reinforcement Learning Aviral Kumar Aurick Zhou George Tucker Sergey Levine OffRL OnRL 140 1,824 0 08 Jun 2020
MOPO: Model-based Offline Policy Optimization Tianhe Yu G. Thomas Lantao Yu Stefano Ermon James Zou Sergey Levine Chelsea Finn Tengyu Ma OffRL 76 772 0 27 May 2020
MOReL : Model-Based Offline Reinforcement Learning Rahul Kidambi Aravind Rajeswaran Praneeth Netrapalli Thorsten Joachims OffRL 96 673 0 12 May 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 561 2,040 0 04 May 2020
D4RL: Datasets for Deep Data-Driven Reinforcement Learning Justin Fu Aviral Kumar Ofir Nachum George Tucker Sergey Levine GP OffRL 223 1,377 0 15 Apr 2020
An empirical investigation of the challenges of real-world reinforcement learning Gabriel Dulac-Arnold Nir Levine D. Mankowitz Jerry Li Cosmin Paduraru Sven Gowal Todd Hester OffRL 81 125 0 24 Mar 2020
Decision-Making with Auto-Encoding Variational Bayes Romain Lopez Pierre Boyeau Nir Yosef Michael I. Jordan Jeffrey Regier BDL 440 10,591 0 17 Feb 2020
Behavior Regularized Offline Reinforcement Learning Yifan Wu George Tucker Ofir Nachum OffRL 92 687 0 26 Nov 2019
When to Trust Your Model: Model-Based Policy Optimization Michael Janner Justin Fu Marvin Zhang Sergey Levine OffRL 98 956 0 19 Jun 2019
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction Aviral Kumar Justin Fu George Tucker Sergey Levine OffRL OnRL 132 1,066 0 03 Jun 2019
Off-Policy Deep Reinforcement Learning without Exploration Scott Fujimoto David Meger Doina Precup OffRL BDL 234 1,613 0 07 Dec 2018
Reward Constrained Policy Optimization Chen Tessler D. Mankowitz Shie Mannor 83 541 0 28 May 2018
Virtual-Taobao: Virtualizing Real-world Online Retail Environment for Reinforcement Learning Jing-Cheng Shi Yang Yu Qing Da Shi-Yong Chen Anxiang Zeng OffRL 73 187 0 25 May 2018
Addressing Function Approximation Error in Actor-Critic Methods Scott Fujimoto H. V. Hoof David Meger OffRL 180 5,204 0 26 Feb 2018
Sensitivity and Generalization in Neural Networks: an Empirical Study Roman Novak Yasaman Bahri Daniel A. Abolafia Jeffrey Pennington Jascha Narain Sohl-Dickstein AAML 93 440 0 23 Feb 2018
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor Tuomas Haarnoja Aurick Zhou Pieter Abbeel Sergey Levine 311 8,396 0 04 Jan 2018
Continuous control with deep reinforcement learning Timothy Lillicrap Jonathan J. Hunt Alexander Pritzel N. Heess Tom Erez Yuval Tassa David Silver Daan Wierstra 320 13,272 0 09 Sep 2015
Scheduled Sampling for Sequence Prediction with Recurrent Neural Networks Samy Bengio Oriol Vinyals Navdeep Jaitly Noam M. Shazeer 149 2,034 0 09 Jun 2015
End-to-End Training of Deep Visuomotor Policies Sergey Levine Chelsea Finn Trevor Darrell Pieter Abbeel BDL 315 3,442 0 02 Apr 2015
Playing Atari with Deep Reinforcement Learning Volodymyr Mnih Koray Kavukcuoglu David Silver Alex Graves Ioannis Antonoglou Daan Wierstra Martin Riedmiller 127 12,261 0 19 Dec 2013