v1v2v3 (latest)

Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion

25 October 2023

Papers citing "Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk Criterion"

1 / 1 papers shown

Title
The Benefits of Being Categorical Distributional: Uncertainty-aware Regularized Exploration in Reinforcement Learning Ke Sun Yingnan Zhao Enze Shi Yafei Wang Xiaodong Yan Bei Jiang Linglong Kong OOD OffRL UQCV 82 2 0 07 Oct 2021