Behavior Proximal Policy Optimization

22 February 2023

Papers citing "Behavior Proximal Policy Optimization"

27 / 27 papers shown

Title
Sample-efficient diffusion-based control of complex nonlinear systems Hongyi Chen Jingtao Ding Jianhai Shu Xinchun Yu Xiaojun Liang Yong Li Xiao-Ping Zhang 197 0 0 25 Feb 2025
TDMPBC: Self-Imitative Reinforcement Learning for Humanoid Robot Control Zifeng Zhuang Diyuan Shi Runze Suo Xiao He Hongyin Zhang Ting Wang Shangke Lyu Donglin Wang 42 0 0 24 Feb 2025
The Best Instruction-Tuning Data are Those That Fit Dylan Zhang Qirun Dai Hao Peng ALM 117 3 0 06 Feb 2025
SelfBC: Self Behavior Cloning for Offline Reinforcement Learning Shirong Liu Chenjia Bai Zixian Guo Hao Zhang Gaurav Sharma Yang Liu OffRL 35 2 0 04 Aug 2024
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning Linjiajie Fang Ruoxue Liu Jing Zhang Wenjia Wang Bing-Yi Jing OffRL 56 1 0 31 May 2024
DIDI: Diffusion-Guided Diversity for Offline Behavioral Generation Jinxin Liu Xinghong Guo Zifeng Zhuang Donglin Wang DiffM OffRL 50 2 0 23 May 2024
Exclusively Penalized Q-learning for Offline Reinforcement Learning Junghyuk Yeom Yonghyeon Jo Jungmo Kim Sanghyeon Lee Seungyul Han OffRL 40 2 0 23 May 2024
Reinformer: Max-Return Sequence Modeling for Offline RL Zifeng Zhuang Dengyun Peng Jinxin Liu Ziqi Zhang Donglin Wang OffRL AI4TS 48 13 0 14 May 2024
Scalable and Effective Arithmetic Tree Generation for Adder and Multiplier Designs Yao Lai Jinxin Liu Yao Lai Ping Luo 36 5 0 10 May 2024
A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspective Yunpeng Qing Shunyu Liu Jingyuan Cong Kaixuan Chen Yihe Zhou Mingli Song OffRL 34 1 0 12 Mar 2024
Uni-O4: Unifying Online and Offline Deep Reinforcement Learning with Multi-Step On-Policy Optimization Kun Lei Zhengmao He Chenhao Lu Kaizhe Hu Yang Gao Huazhe Xu OffRL OnRL 54 13 0 06 Nov 2023
ChiPFormer: Transferable Chip Placement via Offline Decision Transformer Yao Lai Jinxin Liu Zhentao Tang Bin Wang Jianye Hao Ping Luo OffRL 21 41 0 26 Jun 2023
CEIL: Generalized Contextual Imitation Learning Jinxin Liu Li He Yachen Kang Zifeng Zhuang Donglin Wang Huazhe Xu 36 18 0 26 Jun 2023
Design from Policies: Conservative Test-Time Adaptation for Offline Policy Optimization Jinxin Liu Hongyin Zhang Zifeng Zhuang Yachen Kang Donglin Wang Bin Wang OffRL 42 8 0 26 Jun 2023
CLUE: Calibrated Latent Guidance for Offline Reinforcement Learning Jinxin Liu Lipeng Zu Li He Donglin Wang OffRL 45 8 0 23 Jun 2023
Beyond OOD State Actions: Supported Cross-Domain Offline Reinforcement Learning Jinxin Liu Ziqi Zhang Zhenyu Wei Zifeng Zhuang Yachen Kang Sibo Gai Donglin Wang OffRL 20 16 0 22 Jun 2023
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning Siyuan Guo Yanchao Sun Jifeng Hu Sili Huang Hechang Chen Haiyin Piao Lichao Sun Yi-Ju Chang OffRL OnRL 31 7 0 13 Jun 2023
Beyond Reward: Offline Preference-guided Policy Optimization Yachen Kang Dingxu Shi Jinxin Liu Li He Donglin Wang OffRL 24 31 0 25 May 2023
PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning Jianxiong Li Xiao Hu Haoran Xu Jingjing Liu Xianyuan Zhan Ya-Qin Zhang OffRL OnRL 36 19 0 25 May 2023
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning Q. Wang Jun Yang Yunbo Wang Xin Jin Wenjun Zeng Xiaokang Yang OffRL OnRL 35 3 0 24 May 2023
OER: Offline Experience Replay for Continual Offline Reinforcement Learning Sibo Gai Donglin Wang Li He CLL OffRL 45 3 0 23 May 2023
Revisiting the Minimalist Approach to Offline Reinforcement Learning Denis Tarasov Vladislav Kurenkov Alexander Nikulin Sergey Kolesnikov OffRL 33 36 0 16 May 2023
Graph based Environment Representation for Vision-and-Language Navigation in Continuous Environments Ting Wang Zongkai Wu Feiyu Yao Donglin Wang 51 5 0 11 Jan 2023
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 214 843 0 12 Oct 2021
Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble Gaon An Seungyong Moon Jang-Hyun Kim Hyun Oh Song OffRL 105 262 0 04 Oct 2021
COMBO: Conservative Offline Model-Based Policy Optimization Tianhe Yu Aviral Kumar Rafael Rafailov Aravind Rajeswaran Sergey Levine Chelsea Finn OffRL 219 413 0 16 Feb 2021
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020