v1v2 (latest)

Discriminator-Actor-Critic: Addressing Sample Inefficiency and Reward Bias in Adversarial Imitation Learning

9 September 2018

Ilya Kostrikov

Kumar Krishna Agrawal

Papers citing "Discriminator-Actor-Critic: Addressing Sample Inefficiency and Reward Bias in Adversarial Imitation Learning"

50 / 187 papers shown

Title
Multi-Level Compositional Reasoning for Interactive Instruction Following Suvaansh Bhambri Byeonghwi Kim Jonghyun Choi LM&Ro 121 11 0 18 Aug 2023
Regularizing Adversarial Imitation Learning Using Causal Invariance Ivan Ovinnikov J. M. Buhmann CML 80 0 0 17 Aug 2023
SeMAIL: Eliminating Distractors in Visual Imitation via Separated Models Shenghua Wan Yucen Wang Minghao Shao Ruying Chen De-Chuan Zhan 91 8 0 19 Jun 2023
Mimicking Better by Matching the Approximate Action Distribution Joao A. Candido Ramos Lionel Blondé Naoya Takeishi Alexandros Kalousis 71 2 0 16 Jun 2023
Curricular Subgoals for Inverse Reinforcement Learning Shunyu Liu Yunpeng Qing Shuqi Xu Hongyan Wu Jiangtao Zhang Jingyuan Cong Tianhao Chen Yunfu Liu Mingli Song 104 2 0 14 Jun 2023
Provably Efficient Adversarial Imitation Learning with Unknown Transitions Tian Xu Ziniu Li Yang Yu Zhimin Luo 66 10 0 11 Jun 2023
Coherent Soft Imitation Learning Joe Watson Sandy H. Huang Nicholas Heess 101 12 0 25 May 2023
An Offline Time-aware Apprenticeship Learning Framework for Evolving Reward Functions Xi Yang Ge Gao Min Chi OffRL 92 2 0 15 May 2023
Get Back Here: Robust Imitation by Return-to-Distribution Planning Geoffrey Cideron B. Tabanpour Sebastian Curi Sertan Girgin Léonard Hussenot Gabriel Dulac-Arnold Matthieu Geist Olivier Pietquin Robert Dadashi OOD 155 2 0 02 May 2023
A Coupled Flow Approach to Imitation Learning G. Freund Elad Sarafian Sarit Kraus OOD 83 13 0 29 Apr 2023
Learning Representative Trajectories of Dynamical Systems via Domain-Adaptive Imitation Edgardo Solano-Carrillo Jannis Stoppe 61 0 0 19 Apr 2023
CRISP: Curriculum inducing Primitive Informed Subgoal Prediction Utsav Singh Vinay P. Namboodiri 98 3 0 07 Apr 2023
Optimal Transport for Offline Imitation Learning Yicheng Luo Zhengyao Jiang Samuel N. Cohen Edward Grefenstette M. Deisenroth OffRL 106 28 0 24 Mar 2023
Boosting Reinforcement Learning and Planning with Demonstrations: A Survey Tongzhou Mu H. Su OffRL 88 1 0 23 Mar 2023
Offline Imitation Learning with Suboptimal Demonstrations via Relaxed Distribution Matching Lantao Yu Tianhe Yu Jiaming Song Willie Neiswanger Stefano Ermon OffRL 103 18 0 05 Mar 2023
Learning Stabilization Control from Observations by Learning Lyapunov-like Proxy Models Milan Ganai Chiaki Hirayama Ya-Chien Chang Sicun Gao 84 7 0 03 Mar 2023
How To Guide Your Learner: Imitation Learning with Active Adaptive Expert Involvement Xu-Hui Liu Feng Xu Xinyu Zhang Tianyuan Liu Shengyi Jiang Rui Chen Zongzhang Zhang Yang Yu 123 12 0 03 Mar 2023
Teach a Robot to FISH: Versatile Imitation from One Minute of Demonstrations Siddhant Haldar Jyothish Pari A. Rai Lerrel Pinto 110 74 0 02 Mar 2023
Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement Learning Archit Sharma Ahmed M. Ahmed Rehaan Ahmad Chelsea Finn SSL 137 18 0 02 Mar 2023
LS-IQ: Implicit Reward Regularization for Inverse Reinforcement Learning Firas Al-Hafez Davide Tateo Oleg Arenz Guoping Zhao Jan Peters 71 24 0 01 Mar 2023
Diffusion Model-Augmented Behavioral Cloning Shangcheng Chen Hsiang-Chun Wang Ming-Hao Hsu Chun-Mao Lai Shao-Hua Sun DiffM 158 31 0 26 Feb 2023
Demonstration-Guided Reinforcement Learning with Efficient Exploration for Task Automation of Surgical Robot Tao Huang Kai-xiang Chen Bin Li Yunhui Liu Qingxu Dou 80 23 0 20 Feb 2023
Dual RL: Unification and New Methods for Reinforcement and Imitation Learning Harshit S. Sikchi Qinqing Zheng Amy Zhang S. Niekum OffRL 103 29 0 16 Feb 2023
Visual Imitation Learning with Patch Rewards Minghuan Liu Tairan He Weinan Zhang Shuicheng Yan Zhongwen Xu SSL 109 14 0 02 Feb 2023
Theoretical Analysis of Offline Imitation With Supplementary Dataset Ziniu Li Tian Xu Y. Yu Zhixun Luo OffRL 64 2 0 27 Jan 2023
DIRECT: Learning from Sparse and Shifting Rewards using Discriminative Reward Co-Training Philipp Altmann Thomy Phan Fabian Ritz Thomas Gabor Claudia Linnhoff-Popien OffRL 70 1 0 18 Jan 2023
Learning from Guided Play: Improving Exploration for Adversarial Imitation Learning with Simple Auxiliary Tasks Trevor Ablett Bryan Chan Jonathan Kelly 150 10 0 30 Dec 2022
Accelerating Self-Imitation Learning from Demonstrations via Policy Constraints and Q-Ensemble Chong Li OffRL 77 1 0 07 Dec 2022
imitation: Clean Imitation Learning Implementations Adam Gleave Mohammad Taufeeque Juan Rocamonde Erik Jenner Steven H. Wang Sam Toyer M. Ernestus Nora Belrose Scott Emmons Stuart J. Russell MLAU 138 32 0 22 Nov 2022
Learning Reward Functions for Robotic Manipulation by Observing Humans Minttu Alakuijala Gabriel Dulac-Arnold Julien Mairal Jean Ponce Cordelia Schmid OffRL 88 27 0 16 Nov 2022
Leveraging Sequentiality in Reinforcement Learning from a Single Demonstration Alexandre Chenu Olivier Serris Olivier Sigaud Nicolas Perrin-Gilbert 77 5 0 09 Nov 2022
ABC: Adversarial Behavioral Cloning for Offline Mode-Seeking Imitation Learning Eddy Hudson Ishan Durugkar Garrett A. Warnell Peter Stone OffRL 29 1 0 08 Nov 2022
Robust Imitation via Mirror Descent Inverse Reinforcement Learning Dong-Sig Han Hyunseok Kim Hyun-Dong Lee Je-hwan Ryu Byoung-Tak Zhang 82 3 0 20 Oct 2022
Task Phasing: Automated Curriculum Learning from Demonstrations Vaibhav Bajaj Guni Sharon Peter Stone 87 8 0 20 Oct 2022
Planning for Sample Efficient Imitation Learning Zhao-Heng Yin Weirui Ye Qifeng Chen Yang Gao OffRL 93 21 0 18 Oct 2022
You Only Live Once: Single-Life Reinforcement Learning Annie S. Chen Archit Sharma Sergey Levine Chelsea Finn OffRL 67 20 0 17 Oct 2022
Maximum-Likelihood Inverse Reinforcement Learning with Finite-Time Guarantees Siliang Zeng Chenliang Li Alfredo García Min-Fong Hong 126 43 0 04 Oct 2022
Learn what matters: cross-domain imitation learning with task-relevant embeddings Tim Franzmeyer Philip Torr João F. Henriques OOD 96 22 0 24 Sep 2022
Proximal Point Imitation Learning Luca Viano Angeliki Kamoutsi Gergely Neu Igor Krawczuk Volkan Cevher 123 16 0 22 Sep 2022
TarGF: Learning Target Gradient Field to Rearrange Objects without Explicit Goal Specification Min-Yu Wu Fangwei Zhong Yulong Xia Hao Dong OOD 117 18 0 02 Sep 2022
Basis for Intentions: Efficient Inverse Reinforcement Learning using Past Experience Marwa Abdulhai Natasha Jaques Sergey Levine OffRL 65 6 0 09 Aug 2022
Exploring the trade off between human driving imitation and safety for traffic simulation Yann Koeberle S. Sabatini D. Tsishkou C. Sabourin 58 4 0 09 Aug 2022
Understanding Adversarial Imitation Learning in Small Sample Regime: A Stage-coupled Analysis Tian Xu Ziniu Li Yang Yu Zhimin Luo 67 8 0 03 Aug 2022
Target-absent Human Attention Zhibo Yang Sounak Mondal Seoyoung Ahn G. Zelinsky Minh Hoai Dimitris Samaras 56 19 0 04 Jul 2022
Discriminator-Guided Model-Based Offline Imitation Learning Wenjia Zhang Haoran Xu Haoyi Niu Peng Cheng Ming Li Heming Zhang Guyue Zhou Xianyuan Zhan OffRL 126 19 0 01 Jul 2022
Watch and Match: Supercharging Imitation with Regularized Optimal Transport Siddhant Haldar Vaibhav Mathur Denis Yarats Lerrel Pinto 122 67 0 30 Jun 2022
Latent Policies for Adversarial Imitation Learning Tianyu Wang Nikhil Karnwal Nikolay Atanasov 54 5 0 22 Jun 2022
Auto-Encoding Adversarial Imitation Learning Kaifeng Zhang Rui Zhao Ziming Zhang Yang Gao 102 1 0 22 Jun 2022
Model-Based Imitation Learning Using Entropy Regularization of Model and Policy E. Uchibe 62 4 0 21 Jun 2022
Robust Imitation Learning against Variations in Environment Dynamics Jongseong Chae Seungyul Han Whiyoung Jung Myungsik Cho Sungho Choi Young-Jin Sung OOD 72 21 0 19 Jun 2022