Transductive Off-policy Proximal Policy Optimization

6 June 2024

Junliang Xing

Papers citing "Transductive Off-policy Proximal Policy Optimization"

1 / 1 papers shown

Title
Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning Mitsuhiko Nakamoto Yuexiang Zhai Anika Singh Max Sobol Mark Yi Ma Chelsea Finn Aviral Kumar Sergey Levine OffRL OnRL 114 110 0 09 Mar 2023