Mastering Diverse Domains through World Models

10 January 2023

Jimmy Ba

Papers citing "Mastering Diverse Domains through World Models"

50 / 91 papers shown

Title
Modeling Unseen Environments with Language-guided Composable Causal Components in Reinforcement Learning Xinyue Wang Biwei Huang OffRL CML 29 0 0 13 May 2025
Drive Fast, Learn Faster: On-Board RL for High Performance Autonomous Racing Benedict Hildisch Edoardo Ghignone Nicolas Baumann Cheng Hu Andrea Carron Michele Magno 29 0 0 12 May 2025
Benchmarking Vision, Language, & Action Models in Procedurally Generated, Open Ended Action Environments Pranav Guruprasad Yangyue Wang Sudipta Chowdhury Harshvardhan Sikka LM&Ro VLM 148 0 0 08 May 2025
Coupled Distributional Random Expert Distillation for World Model Online Imitation Learning Shangzhe Li Zhiao Huang Hao Su 61 0 0 04 May 2025
A Survey of Interactive Generative Video Jiwen Yu Yiran Qin Haoxuan Che Quande Liu X. Wang Pengfei Wan Di Zhang Kun Gai Hao Chen Xihui Liu VGen 63 0 0 30 Apr 2025
CaRL: Learning Scalable Planning Policies with Simple Rewards Bernhard Jaeger D. Dauner Jens Beißwenger Simon Gerstenecker Kashyap Chitta Andreas Geiger 54 0 0 24 Apr 2025
Looking beyond the next token Abitha Thankaraj Yiding Jiang J. Zico Kolter Yonatan Bisk LRM 57 1 0 15 Apr 2025
Cognitive Science-Inspired Evaluation of Core Capabilities for Object Understanding in AI Danaja Rutar Alva Markelius Konstantinos Voudouris José Hernández Orallo Lucy G. Cheke OCL ELM 58 0 0 27 Mar 2025
World Model Agents with Change-Based Intrinsic Motivation Jeremias Ferrao Rafael Cunha OffRL MoE 52 0 0 26 Mar 2025
AdaWorld: Learning Adaptable World Models with Latent Actions Shenyuan Gao Siyuan Zhou Yilun Du Jun Zhang Chuang Gan VGen 62 3 0 24 Mar 2025
PRISM: Preference Refinement via Implicit Scene Modeling for 3D Vision-Language Preference-Based Reinforcement Learning Yirong Sun Yanjun Chen OffRL 51 0 0 13 Mar 2025
Object-Centric World Model for Language-Guided Manipulation Youngjoon Jeong Junha Chun S. Cha Taesup Kim OCL VGen 144 1 0 08 Mar 2025
Multi-Task Reinforcement Learning Enables Parameter Scaling Reginald McLean Evangelos Chataroulas Jordan Terry Isaac Woungang Nariman Farsad P. S. Castro LRM 44 0 0 07 Mar 2025
Generative Artificial Intelligence in Robotic Manipulation: A Survey Kun Zhang Peng Yun Jun Cen Junhao Cai DiDi Zhu ... Qifeng Chen Jia Pan Wei K. Zhang Bo Yang Hua Chen 59 1 0 05 Mar 2025
Learning Actionable World Models for Industrial Process Control Peng Yan Ahmed Abdulkadir Gerrit A. Schatte Giulia Anguzzi Joonsu Gha Nikola Pascher Matthias Rosenthal Yunlong Gao Benjamin Grewe Thilo Stadelmann DRL AI4CE 49 0 0 03 Mar 2025
Hyperspherical Normalization for Scalable Deep Reinforcement Learning Hojoon Lee Youngdo Lee Takuma Seno Donghu Kim Peter Stone Jaegul Choo 63 1 0 24 Feb 2025
Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability Carlos E. Luis A. Bottero Julia Vinogradska Felix Berkenkamp Jan Peters 78 1 0 20 Feb 2025
Task Aware Dreamer for Task Generalization in Reinforcement Learning Chengyang Ying Zhongkai Hao Xinning Zhou Hang Su Songming Liu Dong Yan Jun Zhu 64 3 0 17 Feb 2025
Sliding Puzzles Gym: A Scalable Benchmark for State Representation in Visual Reinforcement Learning Bryan L. M. de Oliveira Murilo L. da Luz Bruno Brandão Luana G. B. Martins Telma W. de L. Soares L. Melo OffRL 65 1 0 17 Feb 2025
DMWM: Dual-Mind World Model with Long-Term Imagination Lingyi Wang Rashed Shelim Walid Saad Naren Ramakrishnan LRM 145 1 0 11 Feb 2025
ABPT: Amended Backpropagation through Time with Partially Differentiable Rewards Fanxing Li Fangyu Sun Tianbao Zhang Danping Zou 37 0 0 24 Jan 2025
Dream to Fly: Model-Based Reinforcement Learning for Vision-Based Drone Flight Angel Romero Ashwin Shenai Ismail Geles Elie Aljalbout Davide Scaramuzza 74 1 0 24 Jan 2025
GLAM: Global-Local Variation Awareness in Mamba-based World Model Qian He Wenqi Liang Chunhui Hao Gan Sun Jiandong Tian 46 0 0 21 Jan 2025
FutureDepth: Learning to Predict the Future Improves Video Depth Estimation R. Yasarla Manish Kumar Singh Hong Cai Yunxiao Shi Jisoo Jeong Yinhao Zhu Shizhong Han Risheek Garrepalli Fatih Porikli MDE 88 6 0 17 Jan 2025
Sample-efficient Unsupervised Policy Cloning from Ensemble Self-supervised Labeled Videos Xin Liu Yaran Chen Haoran Li SSL 94 0 0 14 Dec 2024
State Chrono Representation for Enhancing Generalization in Reinforcement Learning Jianda Chen Wen Zheng Terence Ng Zichen Chen Sinno Jialin Pan Tianwei Zhang OffRL 35 0 0 09 Nov 2024
Transformer-Based Fault-Tolerant Control for Fixed-Wing UAVs Using Knowledge Distillation and In-Context Adaptation Francisco Giral Ignacio Gómez Ricardo Vinuesa S. L. Clainche 32 2 0 05 Nov 2024
FACTS: A Factored State-Space Framework For World Modelling Li Nanbo Firas Laakom Yucheng Xu Wenyi Wang Jürgen Schmidhuber AI4TS 136 0 0 28 Oct 2024
Prioritized Generative Replay Renhao Wang Kevin Frans Pieter Abbeel Sergey Levine Alexei A. Efros OnRL DiffM 114 2 0 23 Oct 2024
Uncovering RL Integration in SSL Loss: Objective-Specific Implications for Data-Efficient RL Ömer Veysel Çağatan Barış Akgün OffRL 34 0 0 22 Oct 2024
Reward-free World Models for Online Imitation Learning Shangzhe Li Zhiao Huang H. Su OffRL 63 1 0 17 Oct 2024
Diffusing States and Matching Scores: A New Framework for Imitation Learning Runzhe Wu Yiding Chen Gokul Swamy Kianté Brantley Wen Sun DiffM 39 3 0 17 Oct 2024
Web Agents with World Models: Learning and Leveraging Environment Dynamics in Web Navigation Hyungjoo Chae Namyoung Kim Kai Tzu-iunn Ong Minju Gwak Gwanwoo Song Jihoon Kim S. Kim Dongha Lee Jinyoung Yeo LLMAG 33 14 0 17 Oct 2024
Reinforcement Learning with Euclidean Data Augmentation for State-Based Continuous Control Jinzhu Luo Dingyang Chen Qi Zhang OffRL 26 0 0 16 Oct 2024
DEL: Discrete Element Learner for Learning 3D Particle Dynamics with Neural Rendering Jiaxu Wang Jingkai Sun Junhao He Ziyi Zhang Qiang Zhang Mingyuan Sun Renjing Xu AI4CE 32 0 0 11 Oct 2024
Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient Wenlong Wang Ivana Dusparic Yucheng Shi Ke Zhang V. Cahill Mamba 133 0 0 11 Oct 2024
Masked Generative Priors Improve World Models Sequence Modelling Capabilities Cristian Meo Mircea Lica Zarif Ikram Akihiro Nakano Vedant Shah Aniket Didolkar Dianbo Liu Anirudh Goyal Justin Dauwels OffRL 90 0 0 10 Oct 2024
Efficient Model-Based Reinforcement Learning Through Optimistic Thompson Sampling Jasmine Bayrooti Carl Henrik Ek Amanda Prorok 42 0 0 07 Oct 2024
Open-World Reinforcement Learning over Long Short-Term Imagination Jiajian Li Q. Wang Yunbo Wang Xin Jin Yang Li Wenjun Zeng Xiaokang Yang OCL VLM 54 1 0 04 Oct 2024
Efficient Exploration and Discriminative World Model Learning with an Object-Centric Abstraction Anthony GX-Chen Kenneth Marino Rob Fergus OCL 50 1 0 21 Aug 2024
MuJoCo MPC for Humanoid Control: Evaluation on HumanoidBench Moritz Meser Aditya Bhatt Boris Belousov Jan Peters 16 2 0 01 Aug 2024
ARCLE: The Abstraction and Reasoning Corpus Learning Environment for Reinforcement Learning Hosung Lee Sejin Kim Seungpil Lee Sanha Hwang Jihwan Lee Byung-Jun Lee Sundong Kim LRM 37 8 0 30 Jul 2024
Towards Generalizable Reinforcement Learning via Causality-Guided Self-Adaptive Representations Yupei Yang Biwei Huang Fan Feng Xinyue Wang Shikui Tu Lei Xu CML OOD TTA 38 1 0 30 Jul 2024
Reinforcement Learning for Sustainable Energy: A Survey Koen Ponse Felix Kleuker Márton Fejér Álvaro Serra-Gómez Aske Plaat Thomas M. Moerland OffRL AI4CE 40 1 0 26 Jul 2024
FOSP: Fine-tuning Offline Safe Policy through World Models Chenyang Cao Yucheng Xin Silang Wu Longxiang He Zichen Yan Junbo Tan Xueqian Wang OffRL 51 0 0 06 Jul 2024
Meta-Gradient Search Control: A Method for Improving the Efficiency of Dyna-style Planning Bradley Burega John D. Martin Luke Kapeluck Michael H. Bowling 32 0 0 27 Jun 2024
UniZero: Generalized and Efficient Planning with Scalable Latent World Models Yuan Pu Yazhe Niu Jiyuan Ren Zhenjie Yang Hongsheng Li Yu Liu OffRL 41 1 0 15 Jun 2024
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? Denis Tarasov Kirill Brilliantov Dmitrii Kharlapenko OffRL 30 2 0 10 Jun 2024
Looking Backward: Retrospective Backward Synthesis for Goal-Conditioned GFlowNets Haoran He C. Chang Huazhe Xu Ling Pan 86 6 0 03 Jun 2024
Trust the Model Where It Trusts Itself -- Model-Based Actor-Critic with Uncertainty-Aware Rollout Adaption Bernd Frauenknecht Artur Eisele Devdutt Subhasish Friedrich Solowjow Sebastian Trimpe 44 5 0 29 May 2024