Title
BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset Jiaming Ji Mickel Liu Juntao Dai Xuehai Pan Chi Zhang Ce Bian Chi Zhang Ruiyang Sun Yizhou Wang Yaodong Yang ALM 98 506 0 10 Jul 2023
SAR: Generalization of Physiological Agility and Dexterity via Synergistic Action Representation C. Berg Vittorio Caggiano Vikash Kumar 54 15 0 07 Jul 2023
Sample-Efficient Learning of POMDPs with Multiple Observations In Hindsight Jiacheng Guo Minshuo Chen Haiquan Wang Caiming Xiong Mengdi Wang Yu Bai 90 5 0 06 Jul 2023
FOCUS: Object-Centric World Models for Robotics Manipulation Stefano Ferraro Pietro Mazzaglia Tim Verbelen Bart Dhoedt OCL LM&Ro 95 13 0 05 Jul 2023
First-Explore, then Exploit: Meta-Learning Intelligent Exploration Ben Norman Jeff Clune 50 0 0 05 Jul 2023
Causal Reinforcement Learning: A Survey Zhi-Hong Deng Jing Jiang Guodong Long Chen Zhang CML LRM 117 17 0 04 Jul 2023
Provably Efficient UCB-type Algorithms For Learning Predictive State Representations Ruiquan Huang Yitao Liang J. Yang OffRL 118 5 0 01 Jul 2023
Would I have gotten that reward? Long-term credit assignment by counterfactual contribution analysis Alexander Meulemans Simon Schug Seijin Kobayashi Nathaniel D. Daw Gregory Wayne 98 3 0 29 Jun 2023
A Population-Level Analysis of Neural Dynamics in Robust Legged Robots Eugene R. Rush Christoffer Heckman Kaushik Jayaram J. Humbert 75 0 0 27 Jun 2023
Length Generalization in Arithmetic Transformers Samy Jelassi Stéphane dÁscoli Carles Domingo-Enrich Yuhuai Wu Yuan-Fang Li Franccois Charton 110 43 0 27 Jun 2023
Physics-Informed Machine Learning for Modeling and Control of Dynamical Systems Truong X. Nghiem Ján Drgoňa Colin N. Jones Zoltán Nagy Roland Schwan ... J. Paulson Andrea Carron Melanie Zeilinger Wenceslao Shaw-Cortez D. Vrabie PINN AI4CE 117 31 0 24 Jun 2023
Reward-Free Curricula for Training Robust World Models Marc Rigter Minqi Jiang Ingmar Posner VLM OffRL 86 9 0 15 Jun 2023
Online Learning for Obstacle Avoidance David Snyder Meghan Booker Nathaniel Simon Wenhan Xia Daniel Suo Elad Hazan Anirudha Majumdar 80 2 0 14 Jun 2023
Theoretical Hardness and Tractability of POMDPs in RL with Partial Online State Information Ming Shi Yingbin Liang Ness B. Shroff 76 2 0 14 Jun 2023
VIBR: Learning View-Invariant Value Functions for Robust Visual Control Tom Dupuis Jaonary Rabarisoa Q. C. Pham David Filliat 105 0 0 14 Jun 2023
Learning to Do or Learning While Doing: Reinforcement Learning and Bayesian Optimisation for Online Continuous Tuning Jan Kaiser Chenran Xu Annika Eichler Andrea Santamaria Garcia O. Stein ... H. Dinter F. Mayet T. Vinatier F. Burkart H. Schlarb OffRL 53 4 0 06 Jun 2023
RLtools: A Fast, Portable Deep Reinforcement Learning Library for Continuous Control Jonas Eschmann Dario Albani Giuseppe Loianno OffRL 109 5 0 06 Jun 2023
OMNI: Open-endedness via Models of human Notions of Interestingness Jenny Zhang Joel Lehman Kenneth O. Stanley Jeff Clune LRM 121 36 0 02 Jun 2023
Active Vision Reinforcement Learning under Limited Visual Observability Jinghuan Shang Michael S. Ryoo 88 0 0 01 Jun 2023
Identifiability and Generalizability in Constrained Inverse Reinforcement Learning Andreas Schlaginhaufen Maryam Kamgarpour 104 12 0 01 Jun 2023
TorchRL: A data-driven decision-making library for PyTorch Albert Bou Matteo Bettini Sebastian Dittert Vikash Kumar Shagun Sodhani Xiaomeng Yang Gianni De Fabritiis Vincent Moens OffRL AI4CE 126 41 0 01 Jun 2023
Cross-Domain Policy Adaptation via Value-Guided Data Filtering Kang Xu Chenjia Bai Xiaoteng Ma Dong Wang Bingyan Zhao Zhen Wang Xuelong Li Wei Li 94 18 0 28 May 2023
On the Value of Myopic Behavior in Policy Reuse Kang Xu Chenjia Bai Shuang Qiu Haoran He Bin Zhao Zhen Wang Wei Li Xuelong Li 89 1 0 28 May 2023
Online Nonstochastic Model-Free Reinforcement Learning Udaya Ghai Arushi Gupta Wenhan Xia Karan Singh Elad Hazan OffRL 96 6 0 27 May 2023
IndustReal: Transferring Contact-Rich Assembly Tasks from Simulation to Reality Bingjie Tang Michael A. Lin Iretiayo Akinola Ankur Handa Gaurav Sukhatme Fabio Ramos Dieter Fox Yashraj S. Narang OffRL 88 55 0 26 May 2023
Uncertain Pose Estimation during Contact Tasks using Differentiable Contact Features Jeongmin Lee Minji Lee Dongjun Lee 80 9 0 26 May 2023
Imitating Task and Motion Planning with Visuomotor Transformers Murtaza Dalal Ajay Mandlekar Caelan Reed Garrett Ankur Handa Ruslan Salakhutdinov Dieter Fox 161 57 0 25 May 2023
Adaptive Policy Learning to Additional Tasks Wenjian Hao Zehui Lu Zihao Liang Tianyu Zhou Shaoshuai Mou 64 0 0 24 May 2023
FurnitureBench: Reproducible Real-World Benchmark for Long-Horizon Complex Manipulation Minho Heo Youngwoon Lee Doohyun Lee Joseph J. Lim 100 96 0 22 May 2023
Unsupervised Discovery of Continuous Skills on a Sphere Takahisa Imagawa Takuya Hiraoka Yoshimasa Tsuruoka 87 0 0 21 May 2023
DexPBT: Scaling up Dexterous Manipulation for Hand-Arm Systems with Population Based Training Aleksei Petrenko Arthur Allshire Gavriel State Ankur Handa Viktor Makoviychuk 93 24 0 20 May 2023
Bayesian Reparameterization of Reward-Conditioned Reinforcement Learning with Energy-based Models Wenhao Ding Tong Che Ding Zhao Marco Pavone BDL OffRL 35 2 0 18 May 2023
Reducing the Cost of Cycle-Time Tuning for Real-World Policy Optimization Homayoon Farrahi Rupam Mahmood 68 5 0 09 May 2023
Synthesize Dexterous Nonprehensile Pregrasp for Ungraspable Objects Sirui Chen A. Wu C.Karen Liu 92 18 0 08 May 2023
Deep RL at Scale: Sorting Waste in Office Buildings with a Fleet of Mobile Manipulators Alexander Herzog Kanishka Rao Karol Hausman Yao Lu Paul Wohlhart ... Noah Brown Mrinal Kalakrishnan Julian Ibarz P. Pastor Sergey Levine OffRL 93 27 0 05 May 2023
Sim2Rec: A Simulator-based Decision-making Approach to Optimize Real-World Long-term User Engagement in Sequential Recommender Systems Xiong-Hui Chen Bowei He Yangze Yu Qingyang Li Zhiwei Qin Wenjie Shang Jieping Ye Chen Ma OffRL 83 12 0 03 May 2023
X-RLflow: Graph Reinforcement Learning for Neural Network Subgraphs Transformation Guoliang He Sean Parker Eiko Yoneki 56 4 0 28 Apr 2023
Quality-Diversity Optimisation on a Physical Robot Through Dynamics-Aware and Reset-Free Learning Simón C. Smith Bryan Lim Hannah Janmohamed Antoine Cully 82 0 0 24 Apr 2023
Learning Sim-to-Real Dense Object Descriptors for Robotic Manipulation Hoang-Giang Cao Weihao Zeng I-Chen Wu 64 3 0 18 Apr 2023
Tool Learning with Foundation Models Yujia Qin Shengding Hu Yankai Lin Weize Chen Ning Ding ... Cheng Yang Tongshuang Wu Heng Ji Zhiyuan Liu Maosong Sun 150 222 0 17 Apr 2023
Contact Models in Robotics: a Comparative Analysis Quentin Le Lidec Wilson Jallet Louis Montaut Ivan Laptev Cordelia Schmid Justin Carpentier 102 30 0 13 Apr 2023
Learning a Universal Human Prior for Dexterous Manipulation from Human Preference Zihan Ding Yuanpei Chen Allen Z. Ren S. Gu Qianxu Wang Hao Dong Chi Jin 84 10 0 10 Apr 2023
RoboPianist: Dexterous Piano Playing with Deep Reinforcement Learning Kevin Zakka Philipp Wu Laura M. Smith Nimrod Gileadi Taylor A. Howell ... Sumeet Singh Yuval Tassa Pete Florence Andy Zeng Pieter Abbeel 111 32 0 09 Apr 2023
GINA-3D: Learning to Generate Implicit Neural Assets in the Wild Bokui Shen Xinchen Yan C. Qi Mahyar Najibi Boyang Deng Leonidas Guibas Yin Zhou Drago Anguelov 3DV 98 21 0 04 Apr 2023
DribbleBot: Dynamic Legged Manipulation in the Wild Yandong Ji G. Margolis Pulkit Agrawal 84 63 0 03 Apr 2023
TacGNN:Learning Tactile-based In-hand Manipulation with a Blind Robot Linhan Yang Bidan Huang Qingbiao Li Ya-Yen Tsai Wang Wei Lee Chaoyang Song Jia Pan 51 23 0 03 Apr 2023
UniDexGrasp++: Improving Dexterous Grasping Policy Learning via Geometry-aware Curriculum and Iterative Generalist-Specialist Learning Weikang Wan Haoran Geng Yun-Hai Liu Zikang Shan Yaodong Yang Li Yi He Wang 162 101 0 02 Apr 2023
PartManip: Learning Cross-Category Generalizable Part Manipulation Policy from Point Cloud Observations Haoran Geng Ziming Li Yiran Geng Jiayi Chen Hao Dong He Wang 3DPC 113 44 0 29 Mar 2023
DexDeform: Dexterous Deformable Object Manipulation with Human Demonstrations and Differentiable Physics Sizhe Li Zhiao Huang Tao Chen Tao Du Hao Su J. Tenenbaum Chuang Gan 128 21 0 27 Mar 2023
Bi-Manual Block Assembly via Sim-to-Real Reinforcement Learning Satoshi Kataoka Youngseog Chung Seyed Kamyar Seyed Ghasemipour Pannag R Sanketi S. Gu Igor Mordatch 86 6 0 27 Mar 2023