Real-World Robot Applications of Foundation Models: A Review

Real-World Robot Applications of Foundation Models: A Review

8 February 2024

Kento Kawaharazuka

Andrew Gambardella

ArXiv (abs)PDF HTML

Papers citing "Real-World Robot Applications of Foundation Models: A Review"

13 / 13 papers shown

Title
CodeDiffuser: Attention-Enhanced Diffusion Policy via VLM-Generated Code for Instruction Ambiguity Guang Yin Yitong Li Yixuan Wang D. Mcconachie Paarth Shah Kunimatsu Hashimoto Huan Zhang Katherine Liu Yunzhu Li LM&Ro 10 0 0 19 Jun 2025
UAD: Unsupervised Affordance Distillation for Generalization in Robotic Manipulation Yihe Tang Wenlong Huang Yingke Wang Chengshu Li Roy Yuan Ruohan Zhang Jiajun Wu Li Fei-Fei 50 0 0 10 Jun 2025
Grounded Vision-Language Interpreter for Integrated Task and Motion Planning Jeremy Siburian Keisuke Shirai C. C. Beltran-Hernandez Masashi Hamaya Michael Görner Atsushi Hashimoto 27 0 0 03 Jun 2025
Variational Adaptive Noise and Dropout towards Stable Recurrent Neural Networks Taisuke Kobayashi Shingo Murata 52 0 0 02 Jun 2025
Robo-Troj: Attacking LLM-based Task Planners Mohaiminul Al Nahian Zainab Altaweel David Reitano Sabbir Ahmed Saumitra Lohokare Shiqi Zhang AAML 146 0 0 23 Apr 2025
System 0/1/2/3: Quad-process theory for multi-timescale embodied collective cognitive systems Tadahiro Taniguchi Yasushi Hirai Masahiro Suzuki Shingo Murata Takato Horii Kazutoshi Tanaka AI4CE 112 0 0 08 Mar 2025
Large Language Models for Multi-Robot Systems: A Survey Peihan Li Zijian An Shams Abrar Lifeng Zhou LM&Ro LRM 131 10 0 06 Feb 2025
Tonguescape: Exploring Language Models Understanding of Vowel Articulation Haruki Sakajo Yusuke Sakai Hidetaka Kamigaito Taro Watanabe 68 0 0 29 Jan 2025
OmniManip: Towards General Robotic Manipulation via Object-Centric Interaction Primitives as Spatial Constraints Mingjie Pan Jiyao Zhang Tianshu Wu Yinghao Zhao Wenlong Gao Hao Dong LM&Ro 117 13 0 08 Jan 2025
Visual Large Language Models for Generalized and Specialized Applications Yifan Li Zhixin Lai Wentao Bao Zhen Tan Anh Dao Kewei Sui Jiayi Shen Dong Liu Huan Liu Yu Kong VLM 171 15 0 06 Jan 2025
Do large language vision models understand 3D shapes? Sagi Eppel 3DV 252 2 0 14 Dec 2024
EVA: An Embodied World Model for Future Video Anticipation Xiaowei Chi Hengyuan Zhang Chun-Kai Fan Xingqun Qi Rongyu Zhang ... Chi-Min Chan Wei Xue Wenhan Luo Shanghang Zhang Yike Guo VGen 91 8 0 20 Oct 2024
A Survey on Vision-Language-Action Models for Embodied AI Yueen Ma Zixing Song Yuzheng Zhuang Jianye Hao Irwin King LM&Ro 335 54 0 23 May 2024