Room-Across-Room: Multilingual Vision-and-Language Navigation with Dense Spatiotemporal Grounding

15 October 2020

Papers citing "Room-Across-Room: Multilingual Vision-and-Language Navigation with Dense Spatiotemporal Grounding"

50 / 223 papers shown

Title
CityNavAgent: Aerial Vision-and-Language Navigation with Hierarchical Semantic Planning and Global Memory Weichen Zhang Chen Gao Shiquan Yu Ruiying Peng Baining Zhao Qian Zhang Jinqiang Cui Xinlei Chen Yongqian Li LLMAG LM&Ro 49 0 0 08 May 2025
ReLI: A Language-Agnostic Approach to Human-Robot Interaction Linus Nwankwo Bjoern Ellensohn Ozan Özdenizci Elmar Rueckert LM&Ro 58 0 0 03 May 2025
PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications Trisanth Srinivasan Santosh Patapati 36 0 0 03 May 2025
A Survey of Robotic Navigation and Manipulation with Physics Simulators in the Era of Embodied AI Lik Hang Kenny Wong Xueyang Kang Kaixin Bai Jianwei Zhang 56 0 0 01 May 2025
UAV-VLN: End-to-End Vision Language guided Navigation for UAVs Pranav Saxena Nishant Raghuvanshi Neena Goveas 74 0 0 30 Apr 2025
mrCAD: Multimodal Refinement of Computer-aided Designs William P. McCarthy Saujas Vaduguru K. Willis Justin Matejka Judith E. Fan Daniel Fried Yewen Pu 41 0 0 28 Apr 2025
RoboVerse: Towards a Unified Platform, Dataset and Benchmark for Scalable and Generalizable Robot Learning Haoran Geng Feishi Wang Songlin Wei Y. Li Bangjun Wang ... Hao Dong Siyuan Huang Yue Wang Jitendra Malik Pieter Abbeel 85 4 0 26 Apr 2025
Think Hierarchically, Act Dynamically: Hierarchical Multi-modal Fusion and Reasoning for Vision-and-Language Navigation Junrong Yue Yuhang Zhang Chuan Qin Jing Chen Xiaomin Lie Xinlei Yu Wenxin Zhang Zhendong Zhao 54 0 0 23 Apr 2025
Endowing Embodied Agents with Spatial Reasoning Capabilities for Vision-and-Language Navigation Luo Ling Bai Qianqian LM&Ro 39 0 0 09 Apr 2025
COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation Siqi Zhang Yanyuan Qiao Qunbo Wang Zike Yan Qi Wu Zhihua Wei Jiaheng Liu 59 0 0 31 Mar 2025
From Flatland to Space: Teaching Vision-Language Models to Perceive and Reason in 3D Jiahui Zhang Yurui Chen Yanpeng Zhou Yueming Xu Ze Huang ... Xinyue Cai G. Huang Xingyue Quan Hang Xu Li Zhang LRM 94 0 0 29 Mar 2025
P3Nav: A Unified Framework for Embodied Navigation Integrating Perception, Planning, and Prediction Yufeng Zhong Chengjian Feng Feng Yan Fanfan Liu Liming Zheng Lin Ma 54 0 0 24 Mar 2025
Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation Ziming Wei Bingqian Lin Yunshuang Nie Jiaqi Chen Shikui Ma Hang Xu Xiaodan Liang 56 0 0 23 Mar 2025
IRef-VLA: A Benchmark for Interactive Referential Grounding with Imperfect Language in 3D Scenes Haochen Zhang Nader Zantout Pujith Kachana Ji Zhang Wenshan Wang VGen 51 0 0 20 Mar 2025
HA-VLN: A Benchmark for Human-Aware Navigation in Discrete-Continuous Environments with Dynamic Multi-Human Interactions, Real-World Validation, and an Open Leaderboard Yifei Dong Fengyi Wu Qi He Heng Li Minghan Li ... Yuxuan Zhou Jingdong Sun Qi Dai Zhi-Qi Cheng Alexander G. Hauptmann LM&Ro 50 0 0 18 Mar 2025
FlexVLN: Flexible Adaptation for Diverse Vision-and-Language Navigation Tasks Siqi Zhang Yanyuan Qiao Qunbo Wang Longteng Guo Zhihua Wei Jiaheng Liu LM&Ro 76 0 0 18 Mar 2025
MoMa-Kitchen: A 100K+ Benchmark for Affordance-Grounded Last-Mile Navigation in Mobile Manipulation P. Zhang Xianqiang Gao Yuhan Wu Kehui Liu Dong Wang Z. Wang Bin Zhao Yan Ding X. Li LM&Ro 53 1 0 14 Mar 2025
Observation-Graph Interaction and Key-Detail Guidance for Vision and Language Navigation Yifan Xie Binkai Ou Fei Ma Yaohua Liu 52 0 0 14 Mar 2025
Aerial Vision-and-Language Navigation with Grid-based View Selection and Map Construction Ganlong Zhao Guanbin Li Jia-Yu Pan Yizhou Yu 42 1 0 14 Mar 2025
SmartWay: Enhanced Waypoint Prediction and Backtracking for Zero-Shot Vision-and-Language Navigation Xiangyu Shi Zerui Li Wenqi Lyu Jiatong Xia Feras Dayoub Yanyuan Qiao Qi Wu 57 0 0 13 Mar 2025
Ground-level Viewpoint Vision-and-Language Navigation in Continuous Environments Zerui Li Gengze Zhou Haodong Hong Yanyan Shao Wenqi Lyu Yanyuan Qiao Qi Wu 68 1 0 26 Feb 2025
OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation Yunpeng Gao C. Li Zhongrui You Xiaozhong Liu Zhen Li ... Yan Ding Dong Wang Zhilin Wang Bin Zhao Xiaomeng Li 47 4 0 25 Feb 2025
TRAVEL: Training-Free Retrieval and Alignment for Vision-and-Language Navigation Navid Rajabi Jana Kosecka LM&Ro 3DV 58 0 0 11 Feb 2025
Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models Malak Mansour Ahmed Aly Bahey Tharwat Sarim Hashmi Dong An Ian Reid LM&Ro ELM LRM 56 0 0 07 Jan 2025
Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models Yue Zhang Ziqiao Ma Jialu Li Yanyuan Qiao Zun Wang J. Chai Qi Wu Joey Tianyi Zhou Parisa Kordjamshidi LRM 63 18 0 31 Dec 2024
Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks Zijiao Yang Xiangxi Shi Eric Slyman Stefan Lee AAML 76 0 0 03 Dec 2024
AdaVLN: Towards Visual Language Navigation in Continuous Indoor Environments with Moving Humans Dillon Loh Tomasz Bednarz Xinxing Xia Frank Guan 78 0 0 27 Nov 2024
NavAgent: Multi-scale Urban Street View Fusion For UAV Embodied Vision-and-Language Navigation Youzhi Liu Fanglong Yao Yuanchang Yue Guangluan Xu Xian Sun Kun Fu LM&Ro 37 3 0 13 Nov 2024
VLA-3D: A Dataset for 3D Semantic Scene Understanding and Navigation Haochen Zhang Nader Zantout Pujith Kachana Zongyuan Wu Ji Zhang Wenshan Wang 3DV LM&Ro 41 5 0 05 Nov 2024
CLIP-RT: Learning Language-Conditioned Robotic Policies from Natural Language Supervision Gi-Cheon Kang Junghyun Kim Kyuhwan Shim Jun Ki Lee Byoung-Tak Zhang LM&Ro 102 1 1 01 Nov 2024
Vision-Language Navigation with Energy-Based Policy Rui Liu Wenguan Wang Yuqing Yang 40 3 0 18 Oct 2024
Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology Xinyu Wang Donglin Yang Ziqin Wang Hohin Kwan Jinyu Chen Wenjun Wu Hongsheng Li Yue Liao Si Liu 29 14 0 09 Oct 2024
The Wallpaper is Ugly: Indoor Localization using Vision and Language Seth Pate Lawson L. S. Wong 33 0 0 04 Oct 2024
MiniVLN: Efficient Vision-and-Language Navigation by Progressive Knowledge Distillation Junyou Zhu Yanyuan Qiao Siqi Zhang Xingjian He Qi Wu Jing Liu VLM 26 1 0 27 Sep 2024
Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation Quanting Xie So Yeon Min Tianyi Zhang Kedi Xu Aarav Bajaj Ruslan Salakhutdinov Matthew Johnson-Roberson Yonatan Bisk Matthew Johnson-Roberson Yonatan Bisk LM&Ro 55 7 0 26 Sep 2024
Navigating the Nuances: A Fine-grained Evaluation of Vision-Language Navigation Zehao Wang Minye Wu Yixin Cao Yubo Ma Meiqi Chen Tinne Tuytelaars 33 1 0 25 Sep 2024
Vision-Language Navigation with Continual Learning Zhiyuan Li Yanfeng Lv Ziqin Tu Di Shang Hong Qiao 42 2 0 04 Sep 2024
AeroVerse: UAV-Agent Benchmark Suite for Simulating, Pre-training, Finetuning, and Evaluating Aerospace Embodied World Models Fanglong Yao Yuanchang Yue Youzhi Liu Xian Sun Kun Fu VGen EgoV 29 6 0 28 Aug 2024
Narrowing the Gap between Vision and Action in Navigation Yue Zhang Parisa Kordjamshidi 28 2 0 19 Aug 2024
Navigating Beyond Instructions: Vision-and-Language Navigation in Obstructed Environments Haodong Hong Sen Wang Zi Huang Qi Wu Jiajun Liu 43 1 0 31 Jul 2024
ReALFRED: An Embodied Instruction Following Benchmark in Photo-Realistic Environments Taewoong Kim Cheolhong Min Byeonghwi Kim Jinyeon Kim Wonje Jeung Jonghyun Choi LM&Ro 40 4 0 26 Jul 2024
DISCO: Embodied Navigation and Interaction via Differentiable Scene Semantics and Dual-level Control Xinyu Xu Shengcheng Luo Yanchao Yang Yong-Lu Li Cewu Lu LM&Ro 48 1 0 20 Jul 2024
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models Gengze Zhou Yicong Hong Zun Wang Xin Eric Wang Qi Wu LM&Ro 45 19 0 17 Jul 2024
PRET: Planning with Directed Fidelity Trajectory for Vision and Language Navigation Renjie Lu Jingke Meng Wei-Shi Zheng 33 3 0 16 Jul 2024
Situated Instruction Following So Yeon Min Xavi Puig Devendra Singh Chaplot Tsung-Yen Yang Akshara Rai Priyam Parashar Ruslan Salakhutdinov Yonatan Bisk Roozbeh Mottaghi 38 1 0 15 Jul 2024
Position: Measure Dataset Diversity, Don't Just Claim It Dora Zhao Jerone T. A. Andrews Orestis Papakyriakopoulos Alice Xiang 64 14 0 11 Jul 2024
WorldAPIs: The World Is Worth How Many APIs? A Thought Experiment Jiefu Ou Arda Uzunoglu Benjamin Van Durme Daniel Khashabi LM&Ro VGen 30 3 0 10 Jul 2024
Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs Hao-Tien Lewis Chiang Zhuo Xu Zipeng Fu M. Jacob Tingnan Zhang ... Carolina Parada Chelsea Finn Peng Xu Sergey Levine Jie Tan LM&Ro 51 20 0 10 Jul 2024
Controllable Navigation Instruction Generation with Chain of Thought Prompting Xianghao Kong Jinyu Chen Wenguan Wang Hang Su Xiaolin Hu Yi Yang Si Liu LRM 45 4 0 10 Jul 2024
Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation Jiaqi Chen Bingqian Lin Xinmin Liu Lin Ma Xiaodan Liang Kwan-Yee K. Wong LM&Ro 49 10 0 08 Jul 2024