Distilling Policy Distillation

6 February 2019

Wojciech M. Czarnecki

Razvan Pascanu

Simon Osindero

Siddhant M. Jayakumar

G. Swirszcz

Max Jaderberg

ArXiv PDF HTML

Papers citing "Distilling Policy Distillation"

33 / 33 papers shown

Title
Advantage-Guided Distillation for Preference Alignment in Small Language Models Shiping Gao Fanqi Wan Jiajian Guo Xiaojun Quan Qifan Wang ALM 58 0 0 25 Feb 2025
MiniPLM: Knowledge Distillation for Pre-Training Language Models Yuxian Gu Hao Zhou Fandong Meng Jie Zhou Minlie Huang 73 5 0 22 Oct 2024
Online Control-Informed Learning Zihao Liang Tianyu Zhou Zehui Lu Shaoshuai Mou 33 1 0 04 Oct 2024
TacSL: A Library for Visuotactile Sensor Simulation and Learning Iretiayo Akinola Jie Xu Jan Carius Dieter Fox Yashraj S. Narang 46 6 0 12 Aug 2024
Proximal Policy Distillation Giacomo Spigler OffRL 28 1 0 21 Jul 2024
Shared learning of powertrain control policies for vehicle fleets Lindsey Kerbel B. Ayalew Andrej Ivanco 31 0 0 27 Apr 2024
A Dual Perspective of Reinforcement Learning for Imposing Policy Constraints Bram De Cooman Johan A. K. Suykens 40 0 0 25 Apr 2024
Distilling Morphology-Conditioned Hypernetworks for Efficient Universal Morphology Control Zheng Xiong Risto Vuorio Jacob Beck Matthieu Zimmer Kun Shao Shimon Whiteson 41 1 0 09 Feb 2024
Augmenting Unsupervised Reinforcement Learning with Self-Reference Andrew Zhao Erle Zhu Rui Lu Matthieu Lin Yong-Jin Liu Gao Huang SSL 34 1 0 16 Nov 2023
Adaptive Policy Learning to Additional Tasks Wenjian Hao Zehui Lu Zihao Liang Tianyu Zhou Shaoshuai Mou 32 0 0 24 May 2023
Human-Timescale Adaptation in an Open-Ended Task Space Adaptive Agent Team Jakob Bauer Kate Baumli Satinder Baveja Feryal M. P. Behbahani ... Jakub Sygnowski K. Tuyls Sarah York Alexander Zacherl Lei Zhang LM&Ro OffRL AI4CE LRM 40 109 0 18 Jan 2023
Robotic Assembly Control Reconfiguration Based on Transfer Reinforcement Learning for Objects with Different Geometric Features Yuhang Gai Bin Wang Jiwen Zhang Dan Wu Ken Chen 28 0 0 04 Nov 2022
Honor of Kings Arena: an Environment for Generalization in Competitive Reinforcement Learning Hua Wei Jingxiao Chen Xiyang Ji Hongyang Qin Minwen Deng ... Lin Liu Lanxiao Huang Deheng Ye Qiang Fu Wei Yang 43 28 0 18 Sep 2022
Learning Dynamics and Generalization in Reinforcement Learning Clare Lyle Mark Rowland Will Dabney Marta Z. Kwiatkowska Y. Gal OOD OffRL 30 12 0 05 Jun 2022
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress Rishabh Agarwal Max Schwarzer Pablo Samuel Castro Rameswar Panda Marc G. Bellemare OffRL OnRL 37 63 0 03 Jun 2022
Multi-Source Transfer Learning for Deep Model-Based Reinforcement Learning Remo Sasso M. Sabatelli M. Wiering 49 9 0 28 May 2022
Reinforcement Learning in Practice: Opportunities and Challenges Yuxi Li OffRL 38 9 0 23 Feb 2022
Retrieval-Augmented Reinforcement Learning Anirudh Goyal A. Friesen Andrea Banino T. Weber Nan Rosemary Ke ... Michal Valko Simon Osindero Timothy Lillicrap N. Heess Charles Blundell OffRL 32 53 0 17 Feb 2022
Offline RL With Resource Constrained Online Deployment Jayanth Reddy Regatti A. Deshmukh Frank Cheng Young Hun Jung Abhishek Gupta Ürün Dogan OffRL 13 2 0 07 Oct 2021
Open-Ended Learning Leads to Generally Capable Agents Open-Ended Learning Team Adam Stooke Anuj Mahajan Catarina Barros Charlie Deck ... Nicolas Porcel Roberta Raileanu Steph Hughes-Fitt Valentin Dalibard Wojciech M. Czarnecki 55 181 0 27 Jul 2021
SECANT: Self-Expert Cloning for Zero-Shot Generalization of Visual Policies Linxi Fan Guanzhi Wang De-An Huang Zhiding Yu Li Fei-Fei Yuke Zhu Anima Anandkumar OffRL 30 63 0 17 Jun 2021
Spectral Normalisation for Deep Reinforcement Learning: an Optimisation Perspective Florin Gogianu Tudor Berariu Mihaela Rosca Claudia Clopath L. Buşoniu Razvan Pascanu 24 54 0 11 May 2021
Human-Inspired Multi-Agent Navigation using Knowledge Distillation Pei Xu Ioannis Karamouzas 27 19 0 18 Mar 2021
Auto-Agent-Distiller: Towards Efficient Deep Reinforcement Learning Agents via Neural Architecture Search Y. Fu Zhongzhi Yu Yongan Zhang Yingyan Lin 22 4 0 24 Dec 2020
Supervised Learning Achieves Human-Level Performance in MOBA Games: A Case Study of Honor of Kings Deheng Ye Guibin Chen P. Zhao Fuhao Qiu Bo Yuan ... Liang Wang Tengfei Shi Qiang Fu Wei Yang Lanxiao Huang 40 49 0 25 Nov 2020
Meta Automatic Curriculum Learning Rémy Portelas Clément Romac Katja Hofmann Pierre-Yves Oudeyer 35 8 0 16 Nov 2020
Transient Non-Stationarity and Generalisation in Deep Reinforcement Learning Maximilian Igl Gregory Farquhar Jelena Luketina Wendelin Boehmer Shimon Whiteson 27 84 0 10 Jun 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 343 1,968 0 04 May 2020
Adaptive Partial Scanning Transmission Electron Microscopy with Reinforcement Learning Jeffrey M. Ede 26 12 0 06 Apr 2020
Automatic Curriculum Learning For Deep RL: A Short Survey Rémy Portelas Cédric Colas Lilian Weng Katja Hofmann Pierre-Yves Oudeyer ODL 24 169 0 10 Mar 2020
Gradient Surgery for Multi-Task Learning Tianhe Yu Saurabh Kumar Abhishek Gupta Sergey Levine Karol Hausman Chelsea Finn 41 1,174 0 19 Jan 2020
Joint Goal and Strategy Inference across Heterogeneous Demonstrators via Reward Network Distillation Letian Chen Rohan R. Paleja Muyleng Ghuy Matthew C. Gombolay 21 38 0 02 Jan 2020
Discrete and Continuous Action Representation for Practical RL in Video Games Olivier Delalleau Maxim Peter Eloi Alonso Adrien Logut 25 52 0 23 Dec 2019