Mastering Diverse Domains through World Models

10 January 2023

Jimmy Ba

Papers citing "Mastering Diverse Domains through World Models"

44 / 94 papers shown

Title
Trust the Model Where It Trusts Itself -- Model-Based Actor-Critic with Uncertainty-Aware Rollout Adaption Bernd Frauenknecht Artur Eisele Devdutt Subhasish Friedrich Solowjow Sebastian Trimpe 49 5 0 29 May 2024
Hierarchical World Models as Visual Whole-Body Humanoid Controllers Nicklas Hansen V. JyothirS Vlad Sobal Yann LeCun Xiaolong Wang Hao Su VGen 52 10 0 28 May 2024
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability Shenyuan Gao Jiazhi Yang Li Chen Kashyap Chitta Yihang Qiu Andreas Geiger Jun Zhang Hongyang Li 71 75 0 27 May 2024
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control Michal Nauman M. Ostaszewski Krzysztof Jankowski Piotr Milo's Marek Cygan OffRL 45 16 0 25 May 2024
Pausing Policy Learning in Non-stationary Reinforcement Learning Hyunin Lee Ming Jin Javad Lavaei Somayeh Sojoudi OffRL 37 2 0 25 May 2024
iVideoGPT: Interactive VideoGPTs are Scalable World Models Jialong Wu Shaofeng Yin Ningya Feng Xu He Dong Li Jianye Hao Mingsheng Long VGen 46 22 0 24 May 2024
A Survey on Vision-Language-Action Models for Embodied AI Yueen Ma Zixing Song Yuzheng Zhuang Jianye Hao Irwin King LM&Ro 82 42 0 23 May 2024
Learning Future Representation with Synthetic Observations for Sample-efficient Reinforcement Learning Xin Liu Yaran Chen Dong Zhao 43 1 0 20 May 2024
Model-based Reinforcement Learning for Parameterized Action Spaces Renhao Zhang Haotian Fu Yilin Miao George Konidaris 31 3 0 03 Apr 2024
Entity-Centric Reinforcement Learning for Object Manipulation from Pixels Dan Haramati Tal Daniel Aviv Tamar LM&Ro OffRL OCL 40 10 0 01 Apr 2024
Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning Michal Nauman Michal Bortkiewicz Piotr Milo's Tomasz Trzciñski M. Ostaszewski Marek Cygan OffRL 30 17 0 01 Mar 2024
Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLA-v2) Qifeng Li Xiaosong Jia Shaobo Wang Junchi Yan 33 27 0 26 Feb 2024
Counterfactual Influence in Markov Decision Processes M. Kazemi Jessica Lally Ekaterina Tishchenko Hana Chockler Nicola Paoletti 23 1 0 13 Feb 2024
DiffTORI: Differentiable Trajectory Optimization for Deep Reinforcement and Imitation Learning Weikang Wan Ziyu Wang Zackory M. Erickson David Held David Held 31 4 0 08 Feb 2024
Leveraging Approximate Model-based Shielding for Probabilistic Safety Guarantees in Continuous Environments Alexander W. Goodall Francesco Belardinelli OffRL 33 1 0 01 Feb 2024
Bridging State and History Representations: Understanding Self-Predictive RL Tianwei Ni Benjamin Eysenbach Erfan Seyedsalehi Michel Ma Clement Gehring Aditya Mahajan Pierre-Luc Bacon AI4TS AI4CE 22 20 0 17 Jan 2024
An Invitation to Deep Reinforcement Learning Bernhard Jaeger Andreas Geiger OffRL OOD 78 5 0 13 Dec 2023
MP5: A Multi-modal Open-ended Embodied System in Minecraft via Active Perception Yiran Qin Enshen Zhou Qichang Liu Zhen-fei Yin Lu Sheng Ruimao Zhang Yu Qiao Jing Shao LM&Ro 32 39 0 12 Dec 2023
Backward Learning for Goal-Conditioned Policies Marc Höftmann Jan Robine Stefan Harmeling 31 1 0 08 Dec 2023
BEDD: The MineRL BASALT Evaluation and Demonstrations Dataset for Training and Benchmarking Agents that Solve Fuzzy Tasks Stephanie Milani Anssi Kanervisto Karolis Ramanauskas Sander Schulhoff Brandon Houghton Rohin Shah 23 6 0 05 Dec 2023
Copilot4D: Learning Unsupervised World Models for Autonomous Driving via Discrete Diffusion Lunjun Zhang Yuwen Xiong Ze Yang Sergio Casas Rui Hu R. Urtasun 41 50 0 02 Nov 2023
On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics Michal Nauman Marek Cygan 35 1 0 30 Oct 2023
Boosting Continuous Control with Consistency Policy Yuhui Chen Haoran Li Dongbin Zhao OffRL 41 20 0 10 Oct 2023
Hieros: Hierarchical Imagination on Structured State Space Sequence World Models Paul Mattes Rainer Schlosser R. Herbrich 21 4 0 08 Oct 2023
Amortized Network Intervention to Steer the Excitatory Point Processes Zitao Song Wendi Ren Sourav Garg 21 1 0 06 Oct 2023
DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving Xiaofeng Wang Zheng Hua Zhu Guan Huang Xinze Chen Jiagang Zhu Jiwen Lu VGen 22 148 0 18 Sep 2023
Simplified Temporal Consistency Reinforcement Learning Yi Zhao Wenshuai Zhao Rinu Boney Arno Solin Joni Pajarinen OffRL 30 12 0 15 Jun 2023
Large Language Models as Tax Attorneys: A Case Study in Legal Capabilities Emergence John J. Nay David Karamardian Sarah Lawsky Wenting Tao Meghana Moorthy Bhat Raghav Jain Aaron Travis Lee Jonathan H. Choi Jungo Kasai ELM AILaw 24 57 0 12 Jun 2023
Bigger, Better, Faster: Human-level Atari with human-level efficiency Max Schwarzer J. Obando-Ceron Aaron C. Courville Marc G. Bellemare Rishabh Agarwal Pablo Samuel Castro OffRL 48 82 0 30 May 2023
Pre-training Contextualized World Models with In-the-wild Videos for Reinforcement Learning Jialong Wu Haoyu Ma Chao Deng Mingsheng Long OffRL 28 24 0 29 May 2023
Learning Better with Less: Effective Augmentation for Sample-Efficient Visual Reinforcement Learning Guozheng Ma Linrui Zhang Haoyu Wang Lu Li Zilin Wang Zhen Wang Li Shen Xueqian Wang Dacheng Tao 42 10 0 25 May 2023
Augmenting Autotelic Agents with Large Language Models Cédric Colas Laetitia Teodorescu Pierre-Yves Oudeyer Xingdi Yuan Marc-Alexandre Côté LLMAG LM&Ro 28 22 0 21 May 2023
Approximate Shielding of Atari Agents for Safe Exploration Alexander W. Goodall Francesco Belardinelli 27 2 0 21 Apr 2023
Accelerating exploration and representation learning with offline pre-training Bogdan Mazoure Jake Bruce Doina Precup Rob Fergus Ankit Anand OffRL 31 5 0 31 Mar 2023
A Dynamic Multi-Scale Voxel Flow Network for Video Prediction Xiaotao Hu Zhewei Huang Ailin Huang Jun Xu Shuchang Zhou VGen 38 69 0 17 Mar 2023
Distributional GFlowNets with Quantile Flows Dinghuai Zhang L. Pan Ricky T. Q. Chen Aaron Courville Yoshua Bengio 29 25 0 11 Feb 2023
Investigating the role of model-based learning in exploration and transfer Jacob Walker Eszter Vértes Yazhe Li Gabriel Dulac-Arnold Ankesh Anand T. Weber Jessica B. Hamrick OffRL 36 7 0 08 Feb 2023
Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents Zihao Wang Shaofei Cai Guanzhou Chen Anji Liu Xiaojian Ma Yitao Liang LM&Ro LLMAG 60 315 0 03 Feb 2023
Do Embodied Agents Dream of Pixelated Sheep: Embodied Decision Making using Language Guided World Modelling Kolby Nottingham Prithviraj Ammanabrolu Alane Suhr Yejin Choi Hannaneh Hajishirzi Sameer Singh Roy Fox LLMAG LM&Ro 44 77 0 28 Jan 2023
A Survey on Transformers in Reinforcement Learning Wenzhe Li Hao Luo Zichuan Lin Chongjie Zhang Zongqing Lu Deheng Ye OffRL MU AI4CE 37 55 0 08 Jan 2023
CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning Hung Le Yue Wang Akhilesh Deepak Gotmare Silvio Savarese S. Hoi SyDa ALM 129 240 0 05 Jul 2022
Towards biologically plausible Dreaming and Planning in recurrent spiking networks C. Capone P. Paolucci CLL 28 7 0 20 May 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 319 11,953 0 04 Mar 2022
High-Performance Large-Scale Image Recognition Without Normalization Andrew Brock Soham De Samuel L. Smith Karen Simonyan VLM 223 512 0 11 Feb 2021