Reward learning from human preferences and demonstrations in Atari

15 November 2018

Papers citing "Reward learning from human preferences and demonstrations in Atari"

40 / 90 papers shown

Title
Reward Uncertainty for Exploration in Preference-based Reinforcement Learning Xinran Liang Katherine Shu Kimin Lee Pieter Abbeel 21 58 0 24 May 2022
Graph Neural Networks Designed for Different Graph Types: A Survey J. M. Thomas Alice Moallemy-Oureh Silvia Beddar-Wiesing Clara Holzhuter 26 29 0 06 Apr 2022
Adversarial Motion Priors Make Good Substitutes for Complex Reward Functions Alejandro Escontrela Xue Bin Peng Wenhao Yu Tingnan Zhang Atil Iscen Ken Goldberg Pieter Abbeel 20 112 0 28 Mar 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 372 12,081 0 04 Mar 2022
A Ranking Game for Imitation Learning Harshit S. Sikchi Akanksha Saran Wonjoon Goo S. Niekum OffRL 25 22 0 07 Feb 2022
Safe Deep RL in 3D Environments using Human Feedback Matthew Rahtz Vikrant Varma Ramana Kumar Zachary Kenton Shane Legg Jan Leike 32 4 0 20 Jan 2022
Inducing Structure in Reward Learning by Learning Features Andreea Bobu Marius Wiggert Claire Tomlin Anca Dragan 27 30 0 18 Jan 2022
The Effects of Reward Misspecification: Mapping and Mitigating Misaligned Models Alexander Pan Kush S. Bhatia Jacob Steinhardt 53 172 0 10 Jan 2022
Dueling RL: Reinforcement Learning with Trajectory Preferences Aldo Pacchiano Aadirupa Saha Jonathan Lee 33 82 0 08 Nov 2021
B-Pref: Benchmarking Preference-Based Reinforcement Learning Kimin Lee Laura M. Smith Anca Dragan Pieter Abbeel OffRL 40 93 0 04 Nov 2021
Collaborating with Humans without Human Data D. Strouse Kevin R. McKee M. Botvinick Edward Hughes Richard Everett 124 161 0 15 Oct 2021
Prioritized Experience-based Reinforcement Learning with Human Guidance for Autonomous Driving Jingda Wu Zhiyu Huang Wenhui Huang Chen Lv 52 74 0 26 Sep 2021
Recursively Summarizing Books with Human Feedback Jeff Wu Long Ouyang Daniel M. Ziegler Nissan Stiennon Ryan J. Lowe Jan Leike Paul Christiano ALM 35 296 0 22 Sep 2021
ThriftyDAgger: Budget-Aware Novelty and Risk Gating for Interactive Imitation Learning Ryan Hoque Ashwin Balakrishna Ellen R. Novoseller Albert Wilcox Daniel S. Brown Ken Goldberg 35 84 0 17 Sep 2021
Skill Preferences: Learning to Extract and Execute Robotic Skills from Human Feedback Xiaofei Wang Kimin Lee Kourosh Hakhamaneshi Pieter Abbeel Michael Laskin 34 42 0 11 Aug 2021
Imitation Learning by Reinforcement Learning K. Ciosek 30 18 0 10 Aug 2021
Risk Averse Bayesian Reward Learning for Autonomous Navigation from Human Demonstration Christian Ellis Maggie B. Wigness J. Rogers Craig T. Lennon L. Fiondella 90 6 0 31 Jul 2021
The Reasonable Crowd: Towards evidence-based and interpretable models of driving behavior Bassam Helou Aditya Dusi Anne-Sophie Collin N. Mehdipour Zhiliang Chen Cristhian G. Lizarazo C. Belta Tichakorn Wongpiromsarn R. D. Tebbens Oscar Beijbom 29 21 0 28 Jul 2021
Recent Advances in Leveraging Human Guidance for Sequential Decision-Making Tasks Ruohan Zhang F. Torabi Garrett A. Warnell Peter Stone 81 28 0 13 Jul 2021
Goal Misgeneralization in Deep Reinforcement Learning L. Langosco Jack Koch Lee D. Sharkey J. Pfau Laurent Orseau David M. Krueger 30 78 0 28 May 2021
Human-in-the-Loop Deep Reinforcement Learning with Application to Autonomous Driving Jingda Wu Zhiyu Huang Chao Huang Zhongxu Hu Peng Hang Yang Xing Chen Lv 39 40 0 15 Apr 2021
SkiffOS: Minimal Cross-compiled Linux for Embedded Containers Christian Stewart 36 49 0 31 Mar 2021
Self-Supervised Online Reward Shaping in Sparse-Reward Environments F. Memarian Wonjoon Goo Rudolf Lioutikov S. Niekum Ufuk Topcu OffRL 34 48 0 08 Mar 2021
Preference-based Learning of Reward Function Features Sydney M. Katz Amir Maleki Erdem Biyik Mykel J. Kochenderfer 33 11 0 03 Mar 2021
Open Problems in Cooperative AI Allan Dafoe Edward Hughes Yoram Bachrach Tantum Collins Kevin R. McKee Joel Z. Leibo Kate Larson T. Graepel 42 200 0 15 Dec 2020
Understanding Learned Reward Functions Eric J. Michaud Adam Gleave Stuart J. Russell XAI OffRL 27 33 0 10 Dec 2020
Learning to summarize from human feedback Nisan Stiennon Long Ouyang Jeff Wu Daniel M. Ziegler Ryan J. Lowe Chelsea Voss Alec Radford Dario Amodei Paul Christiano ALM 56 1,994 0 02 Sep 2020
Feature Expansive Reward Learning: Rethinking Human Input Andreea Bobu Marius Wiggert Claire Tomlin Anca Dragan 24 44 0 23 Jun 2020
AI Research Considerations for Human Existential Safety (ARCHES) Andrew Critch David M. Krueger 30 50 0 30 May 2020
Safe Imitation Learning via Fast Bayesian Reward Inference from Preferences Daniel S. Brown Russell Coleman R. Srinivasan S. Niekum BDL 30 101 0 21 Feb 2020
Reward-rational (implicit) choice: A unifying formalism for reward learning Hong Jun Jeon S. Milli Anca Dragan 17 176 0 12 Feb 2020
Scaling data-driven robotics with reward sketching and batch reinforcement learning Serkan Cabi Sergio Gomez Colmenarejo Alexander Novikov Ksenia Konyushkova Scott E. Reed ... David Barker Jonathan Scholz Misha Denil Nando de Freitas Ziyun Wang OffRL 28 29 0 26 Sep 2019
Leveraging Human Guidance for Deep Reinforcement Learning Tasks Ruohan Zhang F. Torabi L. Guan D. Ballard Peter Stone 19 87 0 21 Sep 2019
Fine-Tuning Language Models from Human Preferences Daniel M. Ziegler Nisan Stiennon Jeff Wu Tom B. Brown Alec Radford Dario Amodei Paul Christiano G. Irving ALM 301 1,616 0 18 Sep 2019
Learning to Interactively Learn and Assist Mark P. Woodward Chelsea Finn Karol Hausman 27 33 0 24 Jun 2019
Risks from Learned Optimization in Advanced Machine Learning Systems Evan Hubinger Chris van Merwijk Vladimir Mikulik Joar Skalse Scott Garrabrant 45 146 0 05 Jun 2019
Design of Artificial Intelligence Agents for Games using Deep Reinforcement Learning A. Roibu 27 1 0 10 May 2019
Learning to Generalize from Sparse and Underspecified Rewards Rishabh Agarwal Chen Liang Dale Schuurmans Mohammad Norouzi OffRL 54 97 0 19 Feb 2019
Scalable agent alignment via reward modeling: a research direction Jan Leike David M. Krueger Tom Everitt Miljan Martic Vishal Maini Shane Legg 34 397 0 19 Nov 2018
Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results Antti Tarvainen Harri Valpola OOD MoMe 273 1,275 0 06 Mar 2017