Variational Bayesian Reinforcement Learning with Regret Bounds

25 July 2018

Papers citing "Variational Bayesian Reinforcement Learning with Regret Bounds"

10 / 10 papers shown

Title
Toward Efficient Exploration by Large Language Model Agents Dilip Arumugam Thomas L. Griffiths LLMAG 94 1 0 29 Apr 2025
IL-SOAR : Imitation Learning with Soft Optimistic Actor cRitic Stefano Viel Luca Viano V. Cevher 95 0 0 27 Feb 2025
Incentivize without Bonus: Provably Efficient Model-based Online Multi-agent RL for Markov Games Tong Yang Bo Dai Lin Xiao Yuejie Chi OffRL 69 2 0 13 Feb 2025
Model-Based Uncertainty in Value Functions Carlos E. Luis A. Bottero Julia Vinogradska Felix Berkenkamp Jan Peters 41 14 0 24 Feb 2023
On the Power of Pre-training for Generalization in RL: Provable Benefits and Hardness Haotian Ye Xiaoyu Chen Liwei Wang S. Du OffRL 37 6 0 19 Oct 2022
Age of Semantics in Cooperative Communications: To Expedite Simulation Towards Real via Offline Reinforcement Learning Xianfu Chen Zhifeng Zhao S. Mao Celimuge Wu Honggang Zhang M. Bennis OffRL 31 3 0 19 Sep 2022
q-Learning in Continuous Time Yanwei Jia X. Zhou OffRL 58 70 0 02 Jul 2022
Reinforcement Learning, Bit by Bit Xiuyuan Lu Benjamin Van Roy Vikranth Dwaracherla M. Ibrahimi Ian Osband Zheng Wen 30 70 0 06 Mar 2021
Making Sense of Reinforcement Learning and Probabilistic Inference Brendan O'Donoghue Ian Osband Catalin Ionescu OffRL 29 48 0 03 Jan 2020
Direct Policy Gradients: Direct Optimization of Policies in Discrete Action Spaces Guy Lorberbom Chris J. Maddison N. Heess Tamir Hazan Daniel Tarlow 34 8 0 14 Jun 2019