Diagnosing Vision-and-Language Navigation: What Really Matters

30 March 2021

Qi Wu

Papers citing "Diagnosing Vision-and-Language Navigation: What Really Matters"

36 / 36 papers shown

Title
Think Hierarchically, Act Dynamically: Hierarchical Multi-modal Fusion and Reasoning for Vision-and-Language Navigation Junrong Yue Y. Zhang Chuan Qin Bo Li Xiaomin Lie Xinlei Yu Wenxin Zhang Zhendong Zhao 54 0 0 23 Apr 2025
Do Visual Imaginations Improve Vision-and-Language Navigation Agents? Akhil Perincherry Jacob Krantz Stefan Lee LM&Ro 41 1 0 20 Mar 2025
FlexVLN: Flexible Adaptation for Diverse Vision-and-Language Navigation Tasks Siqi Zhang Yanyuan Qiao Qunbo Wang Longteng Guo Zhihua Wei J. Liu LM&Ro 74 0 0 18 Mar 2025
TRAVEL: Training-Free Retrieval and Alignment for Vision-and-Language Navigation Navid Rajabi Jana Kosecka LM&Ro 3DV 58 0 0 11 Feb 2025
I2EDL: Interactive Instruction Error Detection and Localization Francesco Taioli Stefano Rosa A. Castellini Lorenzo Natale Alessio Del Bue Alessandro Farinelli Marco Cristani Yiming Wang 37 2 0 07 Jun 2024
Vision-and-Language Navigation via Causal Learning Liuyi Wang Zongtao He Ronghao Dang Mengjiao Shen Chengju Liu Qijun Chen CML 52 14 0 16 Apr 2024
Temporal-Spatial Object Relations Modeling for Vision-and-Language Navigation Bowen Huang Yanwei Zheng Chuanlin Lan Xinpeng Zhao Yifei Zou Dongxiao Yu 36 0 0 23 Mar 2024
Mind the Error! Detection and Localization of Instruction Errors in Vision-and-Language Navigation Francesco Taioli Stefano Rosa A. Castellini Lorenzo Natale Alessio Del Bue Alessandro Farinelli Marco Cristani Yiming Wang 35 5 0 15 Mar 2024
Vision-Language Navigation with Embodied Intelligence: A Survey Peng Gao Peng Wang Feng Gao Fei-Yue Wang Ruyue Yuan LM&Ro 37 2 0 22 Feb 2024
Which way is `right'?: Uncovering limitations of Vision-and-Language Navigation model Meera Hahn Amit Raj James M. Rehg 30 3 0 30 Nov 2023
Does VLN Pretraining Work with Nonsensical or Irrelevant Instructions? Wang Zhu Ishika Singh Yuan Huang Robin Jia Jesse Thomason 34 2 0 28 Nov 2023
Omnidirectional Information Gathering for Knowledge Transfer-based Audio-Visual Navigation Jinyu Chen Wenguan Wang Siying Liu Hongsheng Li Yi Yang 20 8 0 20 Aug 2023
DREAMWALKER: Mental Planning for Continuous Vision-Language Navigation Hanqing Wang Wei Liang Luc Van Gool Wenguan Wang LM&Ro 30 28 0 14 Aug 2023
Bird's-Eye-View Scene Graph for Vision-Language Navigation Ruitao Liu Xiaohan Wang Wenguan Wang Yi Yang 15 50 0 09 Aug 2023
Behavioral Analysis of Vision-and-Language Navigation Agents Zijiao Yang Arjun Majumdar Stefan Lee LM&Ro LLMAG 11 9 0 20 Jul 2023
NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large Language Models Gengze Zhou Yicong Hong Qi Wu ELM LM&Ro LLMAG LRM 25 141 0 26 May 2023
KERM: Knowledge Enhanced Reasoning for Vision-and-Language Navigation Xiangyang Li Zihan Wang Jiahao Yang Yaowei Wang Shuqiang Jiang LM&Ro 13 38 0 28 Mar 2023
BEVBert: Multimodal Map Pre-training for Language-guided Navigation Dongyan An Yuankai Qi Yangguang Li Yan Huang Liangsheng Wang T. Tan Jing Shao 33 58 0 08 Dec 2022
Learning to Dub Movies via Hierarchical Prosody Models Gaoxiang Cong Liang Li Yuankai Qi Zhengjun Zha Qi Wu Wen-yu Wang Bin Jiang Ming Yang Qin Huang 64 25 0 08 Dec 2022
ULN: Towards Underspecified Vision-and-Language Navigation Weixi Feng Tsu-jui Fu Yujie Lu William Yang Wang 46 5 0 18 Oct 2022
A New Path: Scaling Vision-and-Language Navigation with Synthetic Instructions and Imitation Learning Aishwarya Kamath Peter Anderson Su Wang Jing Yu Koh Alexander Ku Austin Waters Yinfei Yang Jason Baldridge Zarana Parekh LM&Ro 22 45 0 06 Oct 2022
Learning More May Not Be Better: Knowledge Transferability in Vision and Language Tasks Tianwei Chen Noa Garcia Mayu Otani Chenhui Chu Yuta Nakashima Hajime Nagahara VLM 38 0 0 23 Aug 2022
A Priority Map for Vision-and-Language Navigation with Trajectory Plans and Feature-Location Cues Jason Armitage L. Impett Rico Sennrich 16 5 0 24 Jul 2022
Target-Driven Structured Transformer Planner for Vision-Language Navigation Yusheng Zhao Jinyu Chen Chen Gao Wenguan Wang Lirong Yang Haibing Ren Huaxia Xia Si Liu LM&Ro 24 57 0 19 Jul 2022
On the Importance of Karaka Framework in Multi-modal Grounding Sai Kiran Gorthi R. Mamidi 19 1 0 09 Apr 2022
FedVLN: Privacy-preserving Federated Vision-and-Language Navigation Kaiwen Zhou X. Wang FedML 20 8 0 28 Mar 2022
Analyzing Generalization of Vision and Language Navigation to Unseen Outdoor Areas Raphael Schumann Stefan Riezler 11 26 0 25 Mar 2022
Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions Jing Gu Eliana Stefani Qi Wu Jesse Thomason X. Wang LM&Ro 30 103 0 22 Mar 2022
Rethinking the Spatial Route Prior in Vision-and-Language Navigation Xinzhe Zhou Wei Liu Yadong Mu 16 6 0 12 Oct 2021
Vision-Language Navigation: A Survey and Taxonomy Wansen Wu Tao Chang Xinmeng Li LM&Ro 13 19 0 26 Aug 2021
How Much Can CLIP Benefit Vision-and-Language Tasks? Sheng Shen Liunian Harold Li Hao Tan Mohit Bansal Anna Rohrbach Kai-Wei Chang Z. Yao Kurt Keutzer CLIP VLM MLLM 196 405 0 13 Jul 2021
Core Challenges in Embodied Vision-Language Planning Jonathan M Francis Nariaki Kitamura Felix Labelle Xiaopeng Lu Ingrid Navarro Jean Oh LM&Ro 44 45 0 26 Jun 2021
Language and Visual Entity Relationship Graph for Agent Navigation Yicong Hong Cristian Rodriguez-Opazo Yuankai Qi Qi Wu Stephen Gould LM&Ro 176 132 0 19 Oct 2020
Stanza: A Python Natural Language Processing Toolkit for Many Human Languages Peng Qi Yuhao Zhang Yuhui Zhang Jason Bolton Christopher D. Manning AI4TS 204 1,653 0 16 Mar 2020
Help, Anna! Visual Navigation with Natural Multimodal Assistance via Retrospective Curiosity-Encouraging Imitation Learning Khanh Nguyen Hal Daumé LM&Ro EgoV 180 150 0 04 Sep 2019
Speaker-Follower Models for Vision-and-Language Navigation Daniel Fried Ronghang Hu Volkan Cirik Anna Rohrbach Jacob Andreas Louis-Philippe Morency Taylor Berg-Kirkpatrick Kate Saenko Dan Klein Trevor Darrell LM&Ro LRM 257 496 0 07 Jun 2018