Title
NeoRL: Efficient Exploration for Nonepisodic RL Bhavya Sukhija Lenart Treven Florian Dorfler Stelian Coros Andreas Krause OffRL 134 0 0 03 Jun 2024
Value Improved Actor Critic Algorithms Yaniv Oren Moritz A. Zanger Pascal R. van der Vaart M. Spaan Wendelin Bohmer Wendelin Bohmer OffRL 91 0 0 03 Jun 2024
Do's and Don'ts: Learning Desirable Skills with Instruction Videos Hyunseung Kim ByungKun Lee Hojoon Lee Dongyoon Hwang Donghu Kim Jaegul Choo 147 1 0 01 Jun 2024
Intrinsic Dynamics-Driven Generalizable Scene Representations for Vision-Oriented Decision-Making Applications Dayang Liang Jinyang Lai Yunlong Liu 90 0 0 30 May 2024
Efficient Preference-based Reinforcement Learning via Aligned Experience Estimation Fengshuo Bai Rui Zhao Hongming Zhang Sijia Cui Ying Wen Yaodong Yang Bo Xu Lei Han OffRL 95 8 0 29 May 2024
Offline-Boosted Actor-Critic: Adaptively Blending Optimal Historical Behaviors in Deep Off-Policy RL Yu-Juan Luo Tianying Ji Gang Hua Jianwei Zhang Huazhe Xu Xianyuan Zhan OffRL OnRL 110 3 0 28 May 2024
Adaptive Horizon Actor-Critic for Policy Learning in Contact-Rich Differentiable Simulation Ignat Georgiev K. Srinivasan Jie Xu Eric Heiden Animesh Garg 93 14 0 28 May 2024
A Recipe for Unbounded Data Augmentation in Visual Reinforcement Learning Abdulaziz Almuzairee Nicklas Hansen Henrik I. Christensen 81 7 0 27 May 2024
Position: Foundation Agents as the Paradigm Shift for Decision Making Xiaoqian Liu Xingzhou Lou Jianbin Jiao Junge Zhang OffRL LLMAG 105 7 0 27 May 2024
Partial Models for Building Adaptive Model-Based Reinforcement Learning Agents Safa Alver Ali Rahimi-Kalahroudi Doina Precup 100 1 0 27 May 2024
Safe and Balanced: A Framework for Constrained Multi-Objective Reinforcement Learning Shangding Gu Bilgehan Sel Yuhao Ding Lu Wang Qingwei Lin Alois Knoll Ming Jin 82 3 0 26 May 2024
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control Michal Nauman M. Ostaszewski Krzysztof Jankowski Piotr Milo's Marek Cygan OffRL 123 36 0 25 May 2024
Constrained Ensemble Exploration for Unsupervised Skill Discovery Chenjia Bai Rushuai Yang Qiaosheng Zhang Kang Xu Yi Chen Ting Xiao Xuelong Li OffRL 128 4 0 25 May 2024
MuDreamer: Learning Predictive World Models without Reconstruction Maxime Burchi Radu Timofte 75 4 0 23 May 2024
PEAC: Unsupervised Pre-training for Cross-Embodiment Reinforcement Learning Chengyang Ying Zhongkai Hao Xinning Zhou Xuezhou Xu Hang Su Xingxing Zhang Jun Zhu 132 5 0 23 May 2024
AndroidWorld: A Dynamic Benchmarking Environment for Autonomous Agents Christopher Rawles Sarah Clinckemaillie Yifan Chang Jonathan Waltz Gabrielle Lau ... Daniel Toyama Robert Berry Divya Tyamagundlu Timothy Lillicrap Oriana Riva LLMAG 177 74 0 23 May 2024
A Survey on Vision-Language-Action Models for Embodied AI Yueen Ma Zixing Song Yuzheng Zhuang Jianye Hao Irwin King LM&Ro 337 54 0 23 May 2024
Learning Future Representation with Synthetic Observations for Sample-efficient Reinforcement Learning Xin Liu Yaran Chen Dong Zhao 82 2 0 20 May 2024
Deep Dive into Model-free Reinforcement Learning for Biological and Robotic Systems: Theory and Practice Yusheng Jiao Feng Ling Sina Heydari N. Heess J. Merel Eva Kanso 64 1 0 19 May 2024
PDE Control Gym: A Benchmark for Data-Driven Boundary Control of Partial Differential Equations Luke Bhan Yuexin Bian Miroslav Krstic Yuanyuan Shi OOD AI4CE 72 6 0 18 May 2024
Adaptive Exploration for Data-Efficient General Value Function Evaluations Arushi Jain Josiah P. Hanna Doina Precup 61 2 0 13 May 2024
Learning Latent Dynamic Robust Representations for World Models Ruixiang Sun Hongyu Zang Xin-hui Li Riashat Islam 75 5 0 10 May 2024
Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond Zheng Zhu Xiaofeng Wang Wangbo Zhao Chen Min Nianchen Deng ... Dawei Zhao Liang Xiao Jian-jun Zhao Jiwen Lu Guan Huang VGen LM&Ro 179 48 0 06 May 2024
CTD4 -- A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics David Valencia Henry Williams Trevor Gee Bruce A MacDonaland Minas V. Liarokapis Minas Liarokapis OffRL 176 2 0 04 May 2024
Imitation Learning: A Survey of Learning Methods, Environments and Metrics Nathan Gavenski Odinaldo Rodrigues Michael Luck 79 167 0 30 Apr 2024
Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learning Chenjia Bai Lingxiao Wang Jianye Hao Zhuoran Yang Bin Zhao Zhen Wang Xuelong Li OffRL 84 9 0 30 Apr 2024
Leveraging Sub-Optimal Data for Human-in-the-Loop Reinforcement Learning Calarina Muslimani Matthew E. Taylor OffRL 138 2 0 30 Apr 2024
What Foundation Models can Bring for Robot Learning in Manipulation : A Survey Dingzhe Li Yixiang Jin A. Yong Yong A Hongze Yu ... Huaping Liu Gang Hua F. Sun Jianwei Zhang Bin Fang AI4CE LM&Ro 226 15 0 28 Apr 2024
Knowledge Transfer for Cross-Domain Reinforcement Learning: A Systematic Review Sergio A. Serrano J. Martínez-Carranza L. Sucar 94 1 0 26 Apr 2024
Continuous Control Reinforcement Learning: Distributed Distributional DrQ Algorithms Zehao Zhou OffRL 38 0 0 16 Apr 2024
Adversarial Imitation Learning via Boosting Jonathan D. Chang Dhruv Sreenivas Yingbing Huang Kianté Brantley Wen Sun 56 3 0 12 Apr 2024
AI-MOLE: Autonomous Iterative Motion Learning for Unknown Nonlinear Dynamics with Extensive Experimental Validation Michael Meindl Simon Bachhuber Thomas Seel 45 5 0 09 Apr 2024
SENSOR: Imitate Third-Person Expert's Behaviors via Active Sensoring Kaichen Huang Minghao Shao Shenghua Wan Hai-Hang Sun Shuai Feng Le Gan De-Chuan Zhan 82 0 0 04 Apr 2024
Decision Transformer as a Foundation Model for Partially Observable Continuous Control Xiangyuan Zhang Weichao Mao Haoran Qiu Tamer Basar OffRL AI4CE 99 6 0 03 Apr 2024
Learning Off-policy with Model-based Intrinsic Motivation For Active Online Exploration Yibo Wang Jiang Zhao OffRL OnRL 92 0 0 31 Mar 2024
Simple Ingredients for Offline Reinforcement Learning Edoardo Cetin Andrea Tirinzoni Matteo Pirotta A. Lazaric Yann Ollivier Ahmed Touati OffRL 106 2 0 19 Mar 2024
Dreaming of Many Worlds: Learning Contextual World Models Aids Zero-Shot Generalization Sai Prasanna Karim Farid Raghu Rajan André Biedenkapp 123 6 0 16 Mar 2024
HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation Carmelo Sferrazza Dun-Ming Huang Xingyu Lin Youngwoon Lee Pieter Abbeel 133 48 0 15 Mar 2024
AD3: Implicit Action is the Key for World Models to Distinguish the Diverse Visual Distractors Yucen Wang Shenghua Wan Le Gan Shuai Feng De-Chuan Zhan VGen 74 6 0 15 Mar 2024
BEHAVIOR-1K: A Human-Centered, Embodied AI Benchmark with 1,000 Everyday Activities and Realistic Simulation Chengshu Li Ruohan Zhang J. Wong Cem Gokmen S. Srivastava ... Silvio Savarese H. Gweon Chenxi Liu Jiajun Wu Fei-Fei Li VGen LM&Ro VLM 77 40 0 14 Mar 2024
Spatiotemporal Predictive Pre-training for Robotic Motor Control Jiange Yang Bei Liu Jianlong Fu Bocheng Pan Gangshan Wu Limin Wang 117 12 0 08 Mar 2024
Reset & Distill: A Recipe for Overcoming Negative Transfer in Continual Reinforcement Learning Hongjoon Ahn Jinu Hyeon Youngmin Oh Bosun Hwang Taesup Moon CLL OnRL 64 2 0 08 Mar 2024
Mastering Memory Tasks with World Models Mohammad Reza Samsami Artem Zholus Janarthanan Rajendran Sarath Chandar CLL OffRL 104 28 0 07 Mar 2024
World Models for Autonomous Driving: An Initial Survey Yanchen Guan Haicheng Liao Zhenning Li Jia Hu Runze Yuan Yunjian Li Guohui Zhang Chengzhong Xu 160 43 0 05 Mar 2024
A Case for Validation Buffer in Pessimistic Actor-Critic Michal Nauman M. Ostaszewski Marek Cygan 68 0 0 01 Mar 2024
EfficientZero V2: Mastering Discrete and Continuous Control with Limited Data Shengjie Wang Shaohuai Liu Weirui Ye Jiacheng You Yang Gao OffRL 107 15 0 01 Mar 2024
Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning Michal Nauman Michal Bortkiewicz Piotr Milo's Tomasz Trzciñski M. Ostaszewski Marek Cygan OffRL 98 23 0 01 Mar 2024
A Model-Based Approach for Improving Reinforcement Learning Efficiency Leveraging Expert Observations E. C. Ozcan Vittorio Giammarino James Queeney I. Paschalidis OffRL 84 1 0 29 Feb 2024
Sample-Efficient Preference-based Reinforcement Learning with Dynamics Aware Rewards Katherine Metcalf Miguel Sarabia Natalie Mackraz B. Theobald 78 6 0 28 Feb 2024
RIME: Robust Preference-based Reinforcement Learning with Noisy Preferences Jie Cheng Gang Xiong Xingyuan Dai Qinghai Miao Yisheng Lv Fei-Yue Wang 116 19 0 27 Feb 2024