Offline Q-Learning on Diverse Multi-Task Data Both Scales And
Generalizes

v1v2 (latest)

Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes

28 November 2022

Rishabh Agarwal

ArXiv (abs)PDF HTML

Papers citing "Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes"

15 / 15 papers shown

Title
Horizon Reduction Makes RL Scalable Seohong Park Kevin Frans Deepinder Mann Benjamin Eysenbach Aviral Kumar Sergey Levine OffRL 92 0 0 04 Jun 2025
Bigger, Regularized, Categorical: High-Capacity Value Functions are Efficient Multi-Task Learners Michal Nauman Marek Cygan Carmelo Sferrazza Aviral Kumar Pieter Abbeel OffRL 96 0 0 29 May 2025
Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers Jake Grigsby Yuqi Xie Justin Sasek Steven Zheng Yuke Zhu OffRL 89 1 0 06 Apr 2025
1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities Kevin Wang Ishaan Javali Michał Bortkiewicz Tomasz Trzciñski Benjamin Eysenbach SSL OffRL 124 2 0 19 Mar 2025
Digi-Q: Learning Q-Value Functions for Training Device-Control Agents Hao Bai Yifei Zhou Li Erran Li Sergey Levine Aviral Kumar OffRL 75 6 0 13 Feb 2025
Don't flatten, tokenize! Unlocking the key to SoftMoE's efficacy in deep RL Ghada Sokar J. Obando-Ceron Rameswar Panda Hugo Larochelle Pablo Samuel Castro MoE 338 7 0 02 Oct 2024
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining Jie Cheng Ruixi Qiao Gang Xiong Binhua Li Yingwei Ma Binhua Li Yongbin Li Yisheng Lv OffRL OnRL LM&Ro 133 4 0 01 Oct 2024
UniZero: Generalized and Efficient Planning with Scalable Latent World Models Yuan Pu Yazhe Niu Jiyuan Ren Zhenjie Yang Hongsheng Li Yu Liu OffRL 227 2 0 15 Jun 2024
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? Denis Tarasov Kirill Brilliantov Dmitrii Kharlapenko OffRL 78 2 0 10 Jun 2024
Searching for High-Value Molecules Using Reinforcement Learning and Transformers Raj Ghugare Santiago Miret Adriana Hugessen Mariano Phielipp Glen Berseth 97 17 0 04 Oct 2023
Zero-Shot Reinforcement Learning from Low Quality Data Scott Jeen Tom Bewley Jonathan M. Cullen OffRL OnRL 90 4 0 26 Sep 2023
Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning Marcel Hussing Jorge Armando Mendez Mendez Anisha Singrodia Cassandra Kent Eric Eaton OffRL 107 7 0 13 Jul 2023
Katakomba: Tools and Benchmarks for Data-Driven NetHack Vladislav Kurenkov Alexander Nikulin Denis Tarasov Sergey Kolesnikov OffRL 92 5 0 14 Jun 2023
Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data Chongyi Zheng Benjamin Eysenbach Homer Walke Patrick Yin Kuan Fang Ruslan Salakhutdinov Sergey Levine OffRL SSL 90 6 0 06 Jun 2023
Learning Universal Policies via Text-Guided Video Generation Yilun Du Mengjiao Yang Bo Dai H. Dai Ofir Nachum J. Tenenbaum Dale Schuurmans Pieter Abbeel PINN LM&Ro 135 264 0 31 Jan 2023