Title
DexWild: Dexterous Human Interactions for In-the-Wild Robot Policies Tony Tao Mohan Kumar Srirama Jason Jingzhou Liu Kenneth Shaw Deepak Pathak 31 0 0 12 May 2025
Instrumentation for Better Demonstrations: A Case Study Remko Proesmans Thomas Lips Francis Wyffels 26 0 0 25 Apr 2025
Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models Chen Wang Fei Xia Wenhao Yu Tingnan Zhang Ruohan Zhang Ce Liu Li Fei-Fei Jie Tan Jacky Liang 36 0 0 17 Apr 2025
RayFronts: Open-Set Semantic Ray Frontiers for Online Scene Understanding and Exploration Omar Alama A. Bhattacharya Haoyang He Seungchan Kim Yuheng Qiu Wenshan Wang Cherie Ho Nikhil Varma Keetha Sebastian A. Scherer 31 0 0 09 Apr 2025
FLAM: Foundation Model-Based Body Stabilization for Humanoid Locomotion and Manipulation Xianqi Zhang Hongliang Wei Wenrui Wang Xingtao Wang Xiaopeng Fan Debin Zhao 34 0 0 28 Mar 2025
EgoDTM: Towards 3D-Aware Egocentric Video-Language Pretraining Boshen Xu Yuting Mei Xinbi Liu Sipeng Zheng Qin Jin VLM MDE 68 0 0 19 Mar 2025
Being-0: A Humanoid Robotic Agent with Vision-Language Models and Modular Skills Haoqi Yuan Yu Bai Yuhui Fu Bohan Zhou Yicheng Feng Xinrun Xu Yi Zhan Börje F. Karlsson Zongqing Lu LM&Ro 88 0 0 16 Mar 2025
VISO-Grasp: Vision-Language Informed Spatial Object-centric 6-DoF Active View Planning and Grasping in Clutter and Invisibility Yitian Shi Di Wen Guanqi Chen Edgar Welte Sheng Liu Kunyu Peng Rainer Stiefelhagen Rania Rayyes 63 1 0 16 Mar 2025
IMPACT: Intelligent Motion Planning with Acceptable Contact Trajectories via Vision-Language Models Yiyang Ling Karan Owalekar Oluwatobiloba Adesanya Erdem Bıyık Daniel Seita 44 1 0 13 Mar 2025
MetaFold: Language-Guided Multi-Category Garment Folding Framework via Trajectory Generation and Foundation Model Haonan Chen Junxiao Li Ruihai Wu Yiwei Liu Yiwen Hou ... Chongkai Gao Zhenyu Wei Shensi Xu Jiaqi Huang Lin Shao AI4CE 49 1 0 11 Mar 2025
Generative Artificial Intelligence in Robotic Manipulation: A Survey Anton van den Hengel Peng Yun Jun Cen Junhao Cai DiDi Zhu ... Qifeng Chen Jia Pan Wei Zhang Bo Yang Hua Chen 59 1 0 05 Mar 2025
KineSoft: Learning Proprioceptive Manipulation Policies with Soft Robot Hands Uksang Yoo Jonathan M Francis Jean Oh Jeffrey Ichnowski 77 1 0 03 Mar 2025
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks Thomas Schmied Thomas Adler Vihang Patil M. Beck Korbinian Poppel Johannes Brandstetter G. Klambauer Razvan Pascanu Sepp Hochreiter 75 5 0 21 Feb 2025
Generative Multi-Agent Collaboration in Embodied AI: A Systematic Review Di Wu Xian Wei Guang Chen Hao Shen Xiangfeng Wang Wenhao Li Bo Jin 65 2 0 17 Feb 2025
Visual Large Language Models for Generalized and Specialized Applications Yifan Li Zhixin Lai Wentao Bao Zhen Tan Anh Dao Kewei Sui Jiayi Shen Dong Liu Huan Liu Yu Kong VLM 88 11 0 06 Jan 2025
TalkWithMachines: Enhancing Human-Robot Interaction for Interpretable Industrial Robotics Through Large/Vision Language Models Ammar N. Abbas Csaba Beleznai LM&Ro 86 2 0 19 Dec 2024
GEM: A Generalizable Ego-Vision Multimodal World Model for Fine-Grained Ego-Motion, Object Dynamics, and Scene Composition Control Mariam Hassan Sebastian Stapf Ahmad Rahimi Pedro M B Rezende Yasaman Haghighi ... Mathieu Salzmann Davide Scaramuzza Marc Pollefeys Paolo Favaro Alexandre Alahi VLM VGen 77 5 0 15 Dec 2024
InfinityDrive: Breaking Time Limits in Driving World Models Xi Guo C. Ding Haoxuan Dou Xin Zhang Weixuan Tang Wei Yu Wu VGen 86 5 0 02 Dec 2024
Are Transformers Truly Foundational for Robotics? James A. R. Marshall Andrew B. Barron AI4CE 73 0 0 25 Nov 2024
CLIMB: Language-Guided Continual Learning for Task Planning with Iterative Model Building Walker Byrnes Miroslav Bogdanovic Avi Balakirsky Stephen Balakirsky Animesh Garg LM&Ro 26 0 0 17 Oct 2024
AHA: A Vision-Language-Model for Detecting and Reasoning Over Failures in Robotic Manipulation Jiafei Duan Wilbert Pumacay Nishanth Kumar Yi Ru Wang Shulin Tian Wentao Yuan Ranjay Krishna Dieter Fox Ajay Mandlekar Yijie Guo VLM LRM 23 19 0 01 Oct 2024
GravMAD: Grounded Spatial Value Maps Guided Action Diffusion for Generalized 3D Manipulation Yangtao Chen Zixuan Chen Junhui Yin Jing Huo Pinzhuo Tian Jieqi Shi Yang Gao LM&Ro 54 2 0 30 Sep 2024
Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation Quanting Xie So Yeon Min Tianyi Zhang Kedi Xu Aarav Bajaj Ruslan Salakhutdinov Matthew Johnson-Roberson Yonatan Bisk Matthew Johnson-Roberson Yonatan Bisk LM&Ro 55 7 0 26 Sep 2024
FLaRe: Achieving Masterful and Adaptive Robot Policies with Large-Scale Reinforcement Learning Fine-Tuning Jiaheng Hu Rose Hendrix Ali Farhadi Aniruddha Kembhavi Roberto Martín-Martín Peter Stone Kuo-Hao Zeng Kiana Ehsani 40 7 0 25 Sep 2024
HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers Jianke Zhang Yanjiang Guo Xiaoyu Chen Yen-Jen Wang Yucheng Hu Chengming Shi Jianyu Chen 29 5 0 12 Sep 2024
ReKep: Spatio-Temporal Reasoning of Relational Keypoint Constraints for Robotic Manipulation Wenlong Huang Chen Wang Yongqian Li Ruohan Zhang Li Fei-Fei 49 88 0 03 Sep 2024
SafeEmbodAI: a Safety Framework for Mobile Robots in Embodied AI Systems Wenxiao Zhang Xiangrui Kong Thomas Braunl Jin B. Hong 36 2 0 03 Sep 2024
DM2RM: Dual-Mode Multimodal Ranking for Target Objects and Receptacles Based on Open-Vocabulary Instructions Ryosuke Korekata Kanta Kaneda Shunya Nagashima Yuto Imai Komei Sugiura ObjD LM&Ro 53 2 0 15 Aug 2024
RoPotter: Toward Robotic Pottery and Deformable Object Manipulation with Structural Priors Uksang Yoo Adam Hung Jonathan M Francis Jean Oh Jeffrey Ichnowski 42 2 0 05 Aug 2024
Foundation Models for Autonomous Robots in Unstructured Environments Hossein Naderi Alireza Shojaei Lifu Huang LM&Ro 47 0 0 19 Jul 2024
Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge Sriram Yenamandra Arun Ramachandran Mukul Khanna Karmesh Yadav Jay Vakil ... Z. Kira Dhruv Batra Roozbeh Mottaghi Yonatan Bisk Chris Paxton LM&Ro 62 6 0 09 Jul 2024
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI Yang Liu Weixing Chen Yongjie Bai Xiaodan Liang Guanbin Li Wen Gao Liang Lin LM&Ro SyDa AI4CE 51 50 0 09 Jul 2024
Corki: Enabling Real-time Embodied AI Robots via Algorithm-Architecture Co-Design Yiyang Huang Yuhui Hao Bo Yu Feng Yan Yuxin Yang ... Yinhe Han Lin Ma Shaoshan Liu Qiang Liu Yiming Gan LM&Ro 49 0 0 05 Jul 2024
VoxAct-B: Voxel-Based Acting and Stabilizing Policy for Bimanual Manipulation I-Chun Arthur Liu Sicheng He Daniel Seita Gaurav Sukhatme LM&Ro 43 11 0 04 Jul 2024
GPT-Fabric: Folding and Smoothing Fabric by Leveraging Pre-Trained Foundation Models Vedant Raval Enyu Zhao Hejia Zhang Stefanos Nikolaidis Daniel Seita AI4CE 44 5 0 14 Jun 2024
Learning-based legged locomotion; state of the art and future perspectives Sehoon Ha Joonho Lee M. van de Panne Zhaoming Xie Wenhao Yu Majid Khadiv 47 16 0 03 Jun 2024
FuRL: Visual-Language Models as Fuzzy Rewards for Reinforcement Learning Yuwei Fu Haichao Zhang Di Wu Wei-ping Xu Benoit Boulet VLM 24 12 0 02 Jun 2024
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability Shenyuan Gao Jiazhi Yang Li Chen Kashyap Chitta Yihang Qiu Andreas Geiger Jun Zhang Hongyang Li 71 75 0 27 May 2024
A Survey on Vision-Language-Action Models for Embodied AI Yueen Ma Zixing Song Yuzheng Zhuang Jianye Hao Irwin King LM&Ro 82 42 0 23 May 2024
BlenderAlchemy: Editing 3D Graphics with Vision-Language Models Ian Huang Guandao Yang Leonidas J. Guibas 34 3 0 26 Apr 2024
Deep Reinforcement Learning for Bipedal Locomotion: A Brief Survey Lingfan Bao Josephine N. Humphreys Tianhu Peng Chengxu Zhou 73 5 0 25 Apr 2024
A Survey of Optimization-based Task and Motion Planning: From Classical To Learning Approaches Zhigen Zhao Shuo Cheng Yan Ding Ziyi Zhou Shiqi Zhang Danfei Xu Ye Zhao 46 22 0 03 Apr 2024
CoPa: General Robotic Manipulation through Spatial Constraints of Parts with Foundation Models Haoxu Huang Fanqi Lin Yingdong Hu Shengjie Wang Yang Gao 38 49 0 13 Mar 2024
Verifiably Following Complex Robot Instructions with Foundation Models Benedict Quartey Eric Rosen Stefanie Tellex George Konidaris LM&Ro 47 11 0 18 Feb 2024
PIVOT: Iterative Visual Prompting Elicits Actionable Knowledge for VLMs Soroush Nasiriany Fei Xia Wenhao Yu Ted Xiao Jacky Liang ... Karol Hausman N. Heess Chelsea Finn Sergey Levine Brian Ichter LM&Ro LRM 30 92 0 12 Feb 2024
Real-World Robot Applications of Foundation Models: A Review Kento Kawaharazuka T. Matsushima Andrew Gambardella Jiaxian Guo Chris Paxton Andy Zeng OffRL VLM LM&Ro 48 45 0 08 Feb 2024
General-purpose foundation models for increased autonomy in robot-assisted surgery Samuel Schmidgall Ji Woong Kim Alan Kuntz A. Ghazi Axel Krieger MedIm 46 9 0 01 Jan 2024
Sample Efficient Preference Alignment in LLMs via Active Exploration Viraj Mehta Vikramjeet Das Ojash Neopane Yijia Dai Ilija Bogunovic Ilija Bogunovic W. Neiswanger Stefano Ermon Jeff Schneider Willie Neiswanger OffRL 30 12 0 01 Dec 2023
Video Language Planning Yilun Du Mengjiao Yang Peter R. Florence Fei Xia Ayzaan Wahid ... Pieter Abbeel Josh Tenenbaum L. Kaelbling Andy Zeng Jonathan Tompson PINN LM&Ro 96 85 0 16 Oct 2023
Q-Transformer: Scalable Offline Reinforcement Learning via Autoregressive Q-Functions Yevgen Chebotar Q. Vuong A. Irpan Karol Hausman F. Xia ... Brianna Zitkovich Tomas Jackson Kanishka Rao Chelsea Finn Sergey Levine OffRL 129 81 0 18 Sep 2023