NaturalVLM: Leveraging Fine-grained Natural Language for
Affordance-Guided Visual Manipulation

NaturalVLM: Leveraging Fine-grained Natural Language for Affordance-Guided Visual Manipulation

13 March 2024

ArXiv (abs)PDF HTML

Papers citing "NaturalVLM: Leveraging Fine-grained Natural Language for Affordance-Guided Visual Manipulation"

17 / 17 papers shown

Title
HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model Jiaming Liu Hao Chen Pengju An Zhuoyang Liu Renrui Zhang ... Chengkai Hou Mengdi Zhao KC alex Zhou Pheng-Ann Heng Shanghang Zhang 147 16 0 13 Mar 2025
VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models Wenlong Huang Chen Wang Ruohan Zhang Yunzhu Li Jiajun Wu Li Fei-Fei LM&Ro 109 510 0 12 Jul 2023
AlphaBlock: Embodied Finetuning for Vision-Language Reasoning in Robot Manipulation Chuhao Jin Wenhui Tan Jiange Yang Bei Liu Ruihua Song Limin Wang Jianlong Fu LM&Ro LRM 48 24 0 30 May 2023
VIMA: General Robot Manipulation with Multimodal Prompts Yunfan Jiang Agrim Gupta Zichen Zhang Guanzhi Wang Yongqiang Dou Yanjun Chen Li Fei-Fei Anima Anandkumar Yuke Zhu Linxi Fan LM&Ro 101 351 0 06 Oct 2022
ADAPT: Vision-Language Navigation with Modality-Aligned Action Prompts Bingqian Lin Yi Zhu Zicong Chen Xiwen Liang Jian-zhuo Liu Xiaodan Liang LM&Ro 89 51 0 31 May 2022
BC-Z: Zero-Shot Task Generalization with Robotic Imitation Learning Eric Jang A. Irpan Mohi Khansari Daniel Kappler F. Ebert Corey Lynch Sergey Levine Chelsea Finn LM&Ro 260 542 0 04 Feb 2022
CALVIN: A Benchmark for Language-Conditioned Policy Learning for Long-Horizon Robot Manipulation Tasks Oier Mees Lukás Hermann Erick Rosete-Beas Wolfram Burgard LM&Ro 102 258 0 06 Dec 2021
FabricFlowNet: Bimanual Cloth Manipulation with a Flow-based Policy Thomas Weng Sujay Bajracharya Yufei Wang Khush Agrawal David Held 60 84 0 10 Nov 2021
CLIPort: What and Where Pathways for Robotic Manipulation Mohit Shridhar Lucas Manuelli Dieter Fox LM&Ro 109 653 0 24 Sep 2021
BEHAVIOR: Benchmark for Everyday Household Activities in Virtual, Interactive, and Ecological Environments S. Srivastava Chengshu Li Michael Lingelbach Roberto Martín-Martín Fei Xia ... Chenxi Liu Silvio Savarese H. Gweon Jiajun Wu Li Fei-Fei LM&Ro 231 164 0 06 Aug 2021
Perceiver IO: A General Architecture for Structured Inputs & Outputs Andrew Jaegle Sebastian Borgeaud Jean-Baptiste Alayrac Carl Doersch Catalin Ionescu ... Olivier J. Hénaff M. Botvinick Andrew Zisserman Oriol Vinyals João Carreira MLLM VLM GNN 70 583 0 30 Jul 2021
Coarse-to-Fine Imitation Learning: Robot Manipulation from a Single Demonstration Edward Johns SSL 61 128 0 13 May 2021
ManipulaTHOR: A Framework for Visual Object Manipulation Kiana Ehsani Winson Han Alvaro Herrasti Eli VanderBilt Luca Weihs Eric Kolve Aniruddha Kembhavi Roozbeh Mottaghi LM&Ro 237 130 0 22 Apr 2021
ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks Mohit Shridhar Jesse Thomason Daniel Gordon Yonatan Bisk Winson Han Roozbeh Mottaghi Luke Zettlemoyer Dieter Fox LM&Ro 109 770 0 03 Dec 2019
Momentum Contrast for Unsupervised Visual Representation Learning Kaiming He Haoqi Fan Yuxin Wu Saining Xie Ross B. Girshick SSL 204 12,085 0 13 Nov 2019
RLBench: The Robot Learning Benchmark & Learning Environment Stephen James Z. Ma David Rovick Arrojo Andrew J. Davison SSL VLM OffRL 109 553 0 26 Sep 2019
PyRep: Bringing V-REP to Deep Robot Learning Stephen James M. Freese Andrew J. Davison 84 117 0 26 Jun 2019