Vision-and-Dialog Navigation

10 July 2019

Luke Zettlemoyer

Papers citing "Vision-and-Dialog Navigation"

50 / 230 papers shown

Title
A Survey of Robotic Navigation and Manipulation with Physics Simulators in the Era of Embodied AI Lik Hang Kenny Wong Xueyang Kang Kaixin Bai Jianwei Zhang 59 0 0 01 May 2025
UAV-VLN: End-to-End Vision Language guided Navigation for UAVs Pranav Saxena Nishant Raghuvanshi Neena Goveas 77 0 0 30 Apr 2025
ADAPT: Actively Discovering and Adapting to Preferences for any Task Maithili Patel Xavier Puig Ruta Desai Roozbeh Mottaghi Sonia Chernova Joanne Truong Akshara Rai 41 0 0 05 Apr 2025
Multimodal Fusion and Vision-Language Models: A Survey for Robot Vision Xiaofeng Han Shunpeng Chen Zenghuang Fu Zhe Feng Lue Fan ... Li Guo Weiliang Meng Xiaopeng Zhang Rongtao Xu Shibiao Xu 74 1 0 03 Apr 2025
Grounding Multimodal LLMs to Embodied Agents that Ask for Help with Reinforcement Learning Ram Ramrakhya Matthew Chang Xavier Puig Ruta Desai Z. Kira Roozbeh Mottaghi LLMAG LM&Ro 66 0 0 01 Apr 2025
HomeEmergency -- Using Audio to Find and Respond to Emergencies in the Home James F. Mullen Jr Dhruva Kumar Xuewei Qi R. Madhivanan Arnie Sen Dinesh Manocha Richard Kim 38 0 0 01 Apr 2025
COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation Siqi Zhang Yanyuan Qiao Qunbo Wang Zike Yan Qi Wu Zhihua Wei Jiaheng Liu 59 0 0 31 Mar 2025
Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation Ziming Wei Bingqian Lin Yunshuang Nie Jiaqi Chen Shikui Ma Hang Xu Xiaodan Liang 56 0 0 23 Mar 2025
FlexVLN: Flexible Adaptation for Diverse Vision-and-Language Navigation Tasks Siqi Zhang Yanyuan Qiao Qunbo Wang Longteng Guo Zhihua Wei Jiaheng Liu LM&Ro 78 1 0 18 Mar 2025
HA-VLN: A Benchmark for Human-Aware Navigation in Discrete-Continuous Environments with Dynamic Multi-Human Interactions, Real-World Validation, and an Open Leaderboard Yifei Dong Fengyi Wu Qi He Heng Li Minghan Li ... Yuxuan Zhou Jingdong Sun Qi Dai Zhi-Qi Cheng Alexander G. Hauptmann LM&Ro 50 0 0 18 Mar 2025
SmartWay: Enhanced Waypoint Prediction and Backtracking for Zero-Shot Vision-and-Language Navigation Xiangyu Shi Zerui Li Wenqi Lyu Jiatong Xia Feras Dayoub Yanyuan Qiao Qi Wu 57 1 0 13 Mar 2025
PanoGen++: Domain-Adapted Text-Guided Panoramic Environment Generation for Vision-and-Language Navigation Sen Wang Dongliang Zhou Liang Xie Chao Xu Ye Yan Erwei Yin DiffM 75 2 0 13 Mar 2025
Ground-level Viewpoint Vision-and-Language Navigation in Continuous Environments Zerui Li Gengze Zhou Haodong Hong Yanyan Shao Wenqi Lyu Yanyuan Qiao Qi Wu 68 1 0 26 Feb 2025
OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation Yunpeng Gao C. Li Zhongrui You Xiaozhong Liu Zhen Li ... Yan Ding Dong Wang Zihan Wang Bin Zhao Xiaomeng Li 47 4 0 25 Feb 2025
REGNav: Room Expert Guided Image-Goal Navigation Pengna Li Kangyi Wu Jingwen Fu Sanping Zhou 54 0 0 15 Feb 2025
Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models Yue Zhang Ziqiao Ma Jialu Li Yanyuan Qiao Zun Wang J. Chai Qi Wu Joey Tianyi Zhou Parisa Kordjamshidi LRM 63 19 0 31 Dec 2024
Towards Long-Horizon Vision-Language Navigation: Platform, Benchmark and Method Xinshuai Song Weixing Chen Yong-Jin Liu Weikai Chen Guanbin Li Liang Lin 123 3 0 12 Dec 2024
AdaVLN: Towards Visual Language Navigation in Continuous Indoor Environments with Moving Humans Dillon Loh Tomasz Bednarz Xinxing Xia Frank Guan 78 0 0 27 Nov 2024
SCOUT: A Situated and Multi-Modal Human-Robot Dialogue Corpus S. Lukin C. Bonial M. Marge Taylor Hudson C. Hayes ... Lucia Donatelli Anton Leuski S. Hill David Traum Clare R. Voss LM&Ro 87 0 0 19 Nov 2024
To Ask or Not to Ask? Detecting Absence of Information in Vision and Language Navigation Savitha Sam Abraham Sourav Garg Feras Dayoub 48 0 0 06 Nov 2024
CLIP-RT: Learning Language-Conditioned Robotic Policies from Natural Language Supervision Gi-Cheon Kang Junghyun Kim Kyuhwan Shim Jun Ki Lee Byoung-Tak Zhang LM&Ro 107 1 1 01 Nov 2024
Simulating User Agents for Embodied Conversational-AI Daniel Philipov Vardhan Dongre Gokhan Tur Dilek Hakkani-Tür LM&Ro 33 1 0 31 Oct 2024
EgoOops: A Dataset for Mistake Action Detection from Egocentric Videos Referring to Procedural Texts Yuto Haneji Taichi Nishimura Hirotaka Kameko Keisuke Shirai Tomoya Yoshida Keiya Kajimura Koki Yamamoto Taiyu Cui Tomohiro Nishimoto Shinsuke Mori EgoV 49 2 0 07 Oct 2024
Navigating the Nuances: A Fine-grained Evaluation of Vision-Language Navigation Zehao Wang Minye Wu Yixin Cao Yubo Ma Meiqi Chen Tinne Tuytelaars 38 1 0 25 Sep 2024
SYNERGAI: Perception Alignment for Human-Robot Collaboration Yixin Chen Guoxi Zhang Yaowei Zhang Hongming Xu Peiyuan Zhi Qing Li Siyuan Huang 37 0 0 24 Sep 2024
ReMEmbR: Building and Reasoning Over Long-Horizon Spatio-Temporal Memory for Robot Navigation Abrar Anwar John Welsh Joydeep Biswas Soha Pouya Yan Chang LM&Ro 37 9 0 20 Sep 2024
Robots that Suggest Safe Alternatives Hyun Joe Jeong Andrea V. Bajcsy Andrea Bajcsy OffRL 46 1 0 15 Sep 2024
Vision-Language Navigation with Continual Learning Zhiyuan Li Yanfeng Lv Ziqin Tu Di Shang Hong Qiao 42 2 0 04 Sep 2024
Narrowing the Gap between Vision and Action in Navigation Yue Zhang Parisa Kordjamshidi 31 2 0 19 Aug 2024
UNMuTe: Unifying Navigation and Multimodal Dialogue-like Text Generation Niyati Rawal Roberto Bigazzi Lorenzo Baraldi Rita Cucchiara LM&Ro 37 1 0 08 Aug 2024
Navigating Beyond Instructions: Vision-and-Language Navigation in Obstructed Environments Haodong Hong Sen Wang Zi Huang Qi Wu Jiajun Liu 46 2 0 31 Jul 2024
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models Gengze Zhou Yicong Hong Zun Wang Xin Eric Wang Qi Wu LM&Ro 45 19 0 17 Jul 2024
PRET: Planning with Directed Fidelity Trajectory for Vision and Language Navigation Renjie Lu Jingke Meng Wei-Shi Zheng 39 3 0 16 Jul 2024
GRUtopia: Dream General Robots in a City at Scale Hanqing Wang Jiahe Chen Wensi Huang Qingwei Ben Tai Wang ... Ying Zhao Zhongying Tu Yu Qiao Dahua Lin Jiangmiao Pang LM&Ro VGen 57 16 0 15 Jul 2024
IDAT: A Multi-Modal Dataset and Toolkit for Building and Evaluating Interactive Task-Solving Agents Shrestha Mohanty Negar Arabzadeh Andrea Tupini Yuxuan Sun Alexey Skrynnik Artem Zholus Marc-Alexandre Côté Julia Kiseleva 41 0 0 12 Jul 2024
Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs Hao-Tien Lewis Chiang Zhuo Xu Zipeng Fu M. Jacob Tingnan Zhang ... Carolina Parada Chelsea Finn Peng Xu Sergey Levine Jie Tan LM&Ro 51 20 0 10 Jul 2024
Controllable Navigation Instruction Generation with Chain of Thought Prompting Xianghao Kong Jinyu Chen Wenguan Wang Hang Su Xiaolin Hu Yi Yang Si Liu LRM 45 4 0 10 Jul 2024
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI Yang Liu Weixing Chen Yongjie Bai Xiaodan Liang Guanbin Li Wen Gao Liang Lin LM&Ro SyDa AI4CE 51 50 0 09 Jul 2024
Investigating the Role of Instruction Variety and Task Difficulty in Robotic Manipulation Tasks Amit Parekh Nikolas Vitsakis Alessandro Suglia Ioannis Konstas AAML 38 5 0 04 Jul 2024
Into the Unknown: Generating Geospatial Descriptions for New Environments Tzuf Paz-Argaman John Palowitch Sayali Kulkarni Reut Tsarfaty Jason Baldridge 34 1 0 28 Jun 2024
Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions Minghan Li Heng Li Zhi-Qi Cheng Yifei Dong Yuxuan Zhou Jun-Yan He Qi Dai Teruko Mitamura Alexander G. Hauptmann LM&Ro 43 4 0 27 Jun 2024
CityNav: Language-Goal Aerial Navigation Dataset with Geographic Information Jungdae Lee Taiki Miyanishi Shuhei Kurita Koya Sakamoto Daichi Azuma Yutaka Matsuo Nakamasa Inoue 47 14 0 20 Jun 2024
I2EDL: Interactive Instruction Error Detection and Localization Francesco Taioli Stefano Rosa A. Castellini Lorenzo Natale Alessio Del Bue Alessandro Farinelli Marco Cristani Yiming Wang 45 2 0 07 Jun 2024
DriVLMe: Enhancing LLM-based Autonomous Driving Agents with Embodied and Social Experiences Yidong Huang Jacob Sansom Ziqiao Ma Felix Gervits Joyce Chai 44 17 0 05 Jun 2024
Why Only Text: Empowering Vision-and-Language Navigation with Multi-modal Prompts Haodong Hong Sen Wang Zi Huang Qi Wu Jiajun Liu 38 3 0 04 Jun 2024
Memory-Maze: Scenario Driven Benchmark and Visual Language Navigation Model for Guiding Blind People Masaki Kuribayashi Kohei Uehara Allan Wang Daisuke Sato Simon Chu Shigeo Morishima 35 1 0 11 May 2024
Vision-and-Language Navigation via Causal Learning Liuyi Wang Zongtao He Ronghao Dang Mengjiao Shen Chengju Liu Qijun Chen CML 52 14 0 16 Apr 2024
"Don't forget to put the milk back!" Dataset for Enabling Embodied Agents to Detect Anomalous Situations James F. Mullen Prasoon Goyal Robinson Piramuthu Michael Johnston Dinesh Manocha R. Ghanadan LM&Ro 28 5 0 12 Apr 2024
DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning Mengfei Du Binhao Wu Jiwen Zhang Zhihao Fan Zejun Li Ruipu Luo Xuanjing Huang Zhongyu Wei 33 3 0 02 Apr 2024
Lookahead Exploration with Neural Radiance Representation for Continuous Vision-Language Navigation Zihan Wang Xiangyang Li Jiahao Yang Yeqi Liu Junjie Hu Ming Jiang Shuqiang Jiang 47 16 0 02 Apr 2024