Efficient Preference-based Reinforcement Learning via Aligned Experience
Estimation

Efficient Preference-based Reinforcement Learning via Aligned Experience Estimation

29 May 2024

Bo Xu

Papers citing "Efficient Preference-based Reinforcement Learning via Aligned Experience Estimation"

8 / 8 papers shown

Title
$\beta$ -DQN: Improving Deep Q-Learning By Evolving the Behavior Hongming Zhang Fengshuo Bai Chenjun Xiao Chao Gao Bo Xu Martin Müller OffRL 35 2 0 03 Jan 2025
RAT: Adversarial Attacks on Deep Reinforcement Agents for Targeted Behaviors Fengshuo Bai Runze Liu Yali Du Ying Wen Yaodong Yang AAML 88 3 0 14 Dec 2024
Utilize the Flow before Stepping into the Same River Twice: Certainty Represented Knowledge Flow for Refusal-Aware Instruction Tuning Runchuan Zhu Zhipeng Ma Jiang Wu Junyuan Gao Jiaqi Wang Dahua Lin Conghui He 22 2 0 09 Oct 2024
PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation Runze Liu Yali Du Fengshuo Bai Jiafei Lyu Xiu Li 27 6 0 06 Jun 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 319 11,953 0 04 Mar 2022
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 214 843 0 12 Oct 2021
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020
Meta Pseudo Labels Hieu H. Pham Zihang Dai Qizhe Xie Minh-Thang Luong Quoc V. Le VLM 262 656 0 23 Mar 2020