Convergence of a Human-in-the-Loop Policy-Gradient Algorithm With
Eligibility Trace Under Reward, Policy, and Advantage Feedback

Convergence of a Human-in-the-Loop Policy-Gradient Algorithm With Eligibility Trace Under Reward, Policy, and Advantage Feedback

15 September 2021

Michael L. Littman

Papers citing "Convergence of a Human-in-the-Loop Policy-Gradient Algorithm With Eligibility Trace Under Reward, Policy, and Advantage Feedback"

Title
No papers