Vision-Language Models Provide Promptable Representations for
Reinforcement Learning

Vision-Language Models Provide Promptable Representations for Reinforcement Learning

5 February 2024

Papers citing "Vision-Language Models Provide Promptable Representations for Reinforcement Learning"

13 / 13 papers shown

Title
Sample Efficient Reinforcement Learning via Large Vision Language Model Distillation Donghoon Lee Tung M. Luu Younghwan Lee Chang D. Yoo OffRL VLM 14 0 0 16 May 2025
Training Strategies for Efficient Embodied Reasoning William Chen Suneel Belkhale Suvir Mirchandani Oier Mees Danny Driess Karl Pertsch Sergey Levine OffRL LRM 28 0 0 13 May 2025
VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making Jake Grigsby Yuke Zhu Michael S Ryoo Juan Carlos Niebles OffRL VLM 43 0 0 06 May 2025
Less is More: Adaptive Program Repair with Bug Localization and Preference Learning Zhenlong Dai Bingrui Chen Zhuoluo Zhao Xiu Tang Sai Wu Chang Yao Zhipeng Gao Jingyuan Chen KELM 59 2 0 09 Mar 2025
OLiVia-Nav: An Online Lifelong Vision Language Approach for Mobile Robot Social Navigation Siddarth Narasimhan Aaron Hao Tan Daniel Choi G. Nejat LM&Ro 41 3 0 20 Sep 2024
Robotic Control via Embodied Chain-of-Thought Reasoning Michał Zawalski William Chen Karl Pertsch Oier Mees Chelsea Finn Sergey Levine LRM LM&Ro 44 58 0 11 Jul 2024
A Survey of Language-Based Communication in Robotics William Hunt Sarvapali D. Ramchurn Mohammad D. Soorati LM&Ro 67 12 0 06 Jun 2024
Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models Siddharth Karamcheti Suraj Nair Ashwin Balakrishna Percy Liang Thomas Kollar Dorsa Sadigh MLLM VLM 59 101 0 12 Feb 2024
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 320 4,279 0 30 Jan 2023
Visual Language Maps for Robot Navigation Chen Huang Oier Mees Andy Zeng Wolfram Burgard LM&Ro 162 346 0 11 Oct 2022
Grounding Language with Visual Affordances over Unstructured Data Oier Mees Jessica Borja-Diaz Wolfram Burgard LM&Ro 121 108 0 04 Oct 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 384 12,081 0 04 Mar 2022
Emerging Properties in Self-Supervised Vision Transformers Mathilde Caron Hugo Touvron Ishan Misra Hervé Jégou Julien Mairal Piotr Bojanowski Armand Joulin 383 5,818 0 29 Apr 2021