Error Bounds of Imitating Policies and Environments

22 October 2020

Ziniu Li

Papers citing "Error Bounds of Imitating Policies and Environments"

25 / 25 papers shown

Title
Curiosity-Diffuser: Curiosity Guide Diffusion Models for Reliability Zihao Liu Xing Liu Yizhai Zhang Zhengxiong Liu Panfeng Huang 74 0 0 19 Mar 2025
Policy Regularization on Globally Accessible States in Cross-Dynamics Reinforcement Learning Zhenghai Xue Lang Feng Jiacheng Xu Kang Kang Xiang Wen Jingyi Wang Shuicheng Yan OffRL 53 0 0 10 Mar 2025
On Generalization and Distributional Update for Mimicking Observations with Adequate Exploration Yirui Zhou Xiaowei Liu Xiaofeng Zhang Yangchun Zhang 39 0 0 22 Jan 2025
Learning Transparent Reward Models via Unsupervised Feature Selection Daulet Baimukashev G. Alcan K. Luck Ville Kyrki SSL OffRL 41 0 0 24 Oct 2024
Offline-to-online Reinforcement Learning for Image-based Grasping with Scarce Demonstrations Bryan Chan Anson Leung James Bergstra OffRL OnRL 67 0 0 19 Oct 2024
An Imitative Reinforcement Learning Framework for Autonomous Dogfight Siyuan Li Rongchang Zuo Peng Liu Yingnan Zhao Yingnan Zhao 43 1 0 17 Jun 2024
Efficient Recurrent Off-Policy RL Requires a Context-Encoder-Specific Learning Rate Fan Luo Zuolin Tu Zefang Huang Yang Yu OffRL 40 0 0 24 May 2024
Offline Imitation Learning by Controlling the Effective Planning Horizon Hee-Jun Ahn Seong-Woong Shim Byung-Jun Lee 26 0 0 18 Jan 2024
Exploring Gradient Explosion in Generative Adversarial Imitation Learning: A Probabilistic Perspective Wanying Wang Yichen Zhu Yirui Zhou Yaxin Peng Jian Tang Zhiyuan Xu Chaomin Shen Yangchun Zhang 34 4 0 18 Dec 2023
Aligning Human Intent from Imperfect Demonstrations with Confidence-based Inverse soft-Q Learning Xizhou Bu Wenjuan Li Zhengxiong Liu Zhiqiang Ma Panfeng Huang 22 1 0 18 Dec 2023
Reward-Consistent Dynamics Models are Strongly Generalizable for Offline Reinforcement Learning Fan Luo Tian Xu Xingchen Cao Yang Yu OffRL 32 7 0 09 Oct 2023
On Imitation in Mean-field Games Giorgia Ramponi Pavel Kolev Olivier Pietquin Niao He Mathieu Laurière M. Geist AI4CE 37 0 0 26 Jun 2023
Coherent Soft Imitation Learning Joe Watson Sandy H. Huang Nicholas Heess 36 11 0 25 May 2023
When Demonstrations Meet Generative World Models: A Maximum Likelihood Framework for Offline Inverse Reinforcement Learning Siliang Zeng Chenliang Li Alfredo García Min-Fong Hong OffRL 34 13 0 15 Feb 2023
Unlabeled Imperfect Demonstrations in Adversarial Imitation Learning Yunke Wang Bo Du Chang Xu 38 8 0 13 Feb 2023
Theoretical Analysis of Offline Imitation With Supplementary Dataset Ziniu Li Tian Xu Y. Yu Zhixun Luo OffRL 38 2 0 27 Jan 2023
Tight Performance Guarantees of Imitator Policies with Continuous Actions Davide Maran Alberto Maria Metelli Marcello Restelli OffRL 28 4 0 07 Dec 2022
RITA: Boost Driving Simulators with Realistic Interactive Traffic Flow Zhengbang Zhu Shenyu Zhang Yuzheng Zhuang Yuecheng Liu Minghuan Liu ... Bin Wang Siqi Cheng Xinyu Wang Jianye Hao Yong Yu 14 8 0 07 Nov 2022
Model-based Reinforcement Learning with Multi-step Plan Value Estimation Hao-Chu Lin Yihao Sun Jiajin Zhang Yang Yu OffRL 37 7 0 12 Sep 2022
Active Exploration for Inverse Reinforcement Learning David Lindner Andreas Krause Giorgia Ramponi 29 24 0 18 Jul 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 53 101 0 19 Jun 2022
Model-based Offline Imitation Learning with Non-expert Data Jeongwon Park Lin F. Yang OffRL 37 1 0 11 Jun 2022
A Ranking Game for Imitation Learning Harshit S. Sikchi Akanksha Saran Wonjoon Goo S. Niekum OffRL 27 22 0 07 Feb 2022
NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning Rongjun Qin Songyi Gao Xingyuan Zhang Zhen Xu Shengkai Huang Zewen Li Weinan Zhang Yang Yu OffRL 140 80 0 01 Feb 2021
Generative Adversarial Imitation Learning with Neural Networks: Global Optimality and Convergence Rate Yufeng Zhang Qi Cai Zhuoran Yang Zhaoran Wang 116 12 0 08 Mar 2020