OVER-NAV: Elevating Iterative Vision-and-Language Navigation with Open-Vocabulary Detection and StructurEd Representation

26 March 2024

Papers citing "OVER-NAV: Elevating Iterative Vision-and-Language Navigation with Open-Vocabulary Detection and StructurEd Representation"

32 / 32 papers shown

Title
REGNav: Room Expert Guided Image-Goal Navigation Pengna Li Kangyi Wu Jingwen Fu Sanping Zhou 215 0 0 15 Feb 2025
Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum Grounding Minyoung Hwang Jaeyeon Jeong Minsoo Kim Yoonseon Oh Songhwai Oh 81 21 0 07 Mar 2023
Renderable Neural Radiance Map for Visual Navigation Obin Kwon Jeongho Park Songhwai Oh 97 55 0 01 Mar 2023
A New Path: Scaling Vision-and-Language Navigation with Synthetic Instructions and Imitation Learning Aishwarya Kamath Peter Anderson Su Wang Jing Yu Koh Alexander Ku Austin Waters Yinfei Yang Jason Baldridge Zarana Parekh LM&Ro 95 48 0 06 Oct 2022
Iterative Vision-and-Language Navigation Jacob Krantz Shurjo Banerjee Wang Zhu Jason J. Corso Peter Anderson Stefan Lee Jesse Thomason LM&Ro 106 20 0 06 Oct 2022
Simple Open-Vocabulary Object Detection with Vision Transformers Matthias Minderer A. Gritsenko Austin Stone Maxim Neumann Dirk Weissenborn ... Zhuoran Shen Tianlin Li Xiaohua Zhai Thomas Kipf N. Houlsby ObjD CLIP VLM ViT OCL 94 314 0 12 May 2022
Detecting Twenty-thousand Classes using Image-level Supervision Xingyi Zhou Rohit Girdhar Armand Joulin Phillip Krahenbuhl Ishan Misra CLIP VLM 113 618 0 07 Jan 2022
RegionCLIP: Region-based Language-Image Pretraining Yiwu Zhong Jianwei Yang Pengchuan Zhang Chunyuan Li Noel Codella ... Luowei Zhou Xiyang Dai Lu Yuan Yin Li Jianfeng Gao VLM CLIP 151 582 0 16 Dec 2021
Grounded Language-Image Pre-training Liunian Harold Li Pengchuan Zhang Haotian Zhang Jianwei Yang Chunyuan Li ... Lu Yuan Lei Zhang Lei Li Kai-Wei Chang Jianfeng Gao ObjD VLM 146 1,069 0 07 Dec 2021
LiT: Zero-Shot Transfer with Locked-image text Tuning Xiaohua Zhai Tianlin Li Basil Mustafa Andreas Steiner Daniel Keysers Alexander Kolesnikov Lucas Beyer VLM 120 560 0 15 Nov 2021
Habitat-Matterport 3D Dataset (HM3D): 1000 Large-scale 3D Environments for Embodied AI Santhosh Kumar Ramakrishnan Aaron Gokaslan Erik Wijmans Oleksandr Maksymets Alexander Clegg ... Andrew Westbury Angel X. Chang Manolis Savva Yili Zhao Dhruv Batra 92 393 0 16 Sep 2021
Isaac Gym: High Performance GPU-Based Physics Simulation For Robot Learning Viktor Makoviychuk Lukasz Wawrzyniak Yunrong Guo Michelle Lu Kier Storey ... David Hoeller Nikita Rudin Arthur Allshire Ankur Handa Gavriel State 182 1,092 0 24 Aug 2021
Learning to Map for Active Semantic Goal Navigation G. Georgakis Bernadette Bucher Karl Schmeckpeper Siddharth Singh Kostas Daniilidis 80 78 0 29 Jun 2021
Open-vocabulary Object Detection via Vision and Language Knowledge Distillation Xiuye Gu Nayeon Lee Weicheng Kuo Huayu Chen VLM ObjD 300 921 0 28 Apr 2021
MDETR -- Modulated Detection for End-to-End Multi-Modal Understanding Aishwarya Kamath Mannat Singh Yann LeCun Gabriel Synnaeve Ishan Misra Nicolas Carion ObjD VLM 190 895 0 26 Apr 2021
Visual Room Rearrangement Luca Weihs Matt Deitke Aniruddha Kembhavi Roozbeh Mottaghi LM&Ro 64 139 0 30 Mar 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 476 3,906 0 11 Feb 2021
MultiON: Benchmarking Semantic Map Memory using Multi-Object Navigation Saim Wani Shivansh Patel Unnat Jain Angel X. Chang Manolis Savva 96 107 0 07 Dec 2020
Open-Vocabulary Object Detection Using Captions Alireza Zareian Kevin Dela Rosa Derek Hao Hu Shih-Fu Chang VLM ObjD 143 435 0 20 Nov 2020
Room-Across-Room: Multilingual Vision-and-Language Navigation with Dense Spatiotemporal Grounding Alexander Ku Peter Anderson Roma Patel Eugene Ie Jason Baldridge 104 315 0 15 Oct 2020
Semantic MapNet: Building Allocentric Semantic Maps and Representations from Egocentric Views Vincent Cartillier Zhile Ren Neha Jain Stefan Lee Irfan Essa Dhruv Batra 3DPC 114 74 0 02 Oct 2020
Occupancy Anticipation for Efficient Exploration and Navigation Santhosh Kumar Ramakrishnan Ziad Al-Halah Kristen Grauman EgoV 3DPC 80 167 0 21 Aug 2020
Beyond the Nav-Graph: Vision-and-Language Navigation in Continuous Environments Jacob Krantz Erik Wijmans Arjun Majumdar Dhruv Batra Stefan Lee 88 280 0 06 Apr 2020
REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments Yuankai Qi Qi Wu Peter Anderson Xinze Wang Wenjie Wang Chunhua Shen Anton Van Den Hengel LM&Ro 117 330 0 23 Apr 2019
Habitat: A Platform for Embodied AI Research Manolis Savva Abhishek Kadian Oleksandr Maksymets Yili Zhao Erik Wijmans ... Jia-Wei Liu V. Koltun Jitendra Malik Devi Parikh Dhruv Batra LM&Ro 131 1,423 0 02 Apr 2019
Scene Memory Transformer for Embodied Agents in Long-Horizon Tasks Kuan Fang Alexander Toshev Li Fei-Fei Silvio Savarese OffRL 134 202 0 09 Mar 2019
Learning Exploration Policies for Navigation Tao Chen Saurabh Gupta Abhinav Gupta EgoV 80 239 0 05 Mar 2019
Speaker-Follower Models for Vision-and-Language Navigation Daniel Fried Ronghang Hu Volkan Cirik Anna Rohrbach Jacob Andreas Louis-Philippe Morency Taylor Berg-Kirkpatrick Kate Saenko Dan Klein Trevor Darrell LM&Ro LRM 321 505 0 07 Jun 2018
RedNet: Residual Encoder-Decoder Network for indoor RGB-D Semantic Segmentation Jindong Jiang Lunan Zheng Fei Luo Zhijun Zhang 3DPC SSeg 85 217 0 04 Jun 2018
Learning to Navigate in Cities Without a Map Piotr Wojciech Mirowski Matthew Koichi Grimes Mateusz Malinowski Karl Moritz Hermann Keith Anderson Denis Teplyashin Karen Simonyan Koray Kavukcuoglu Andrew Zisserman R. Hadsell SSL HAI 101 320 0 31 Mar 2018
AI2-THOR: An Interactive 3D Environment for Visual AI Eric Kolve Roozbeh Mottaghi Winson Han Eli VanderBilt Luca Weihs ... Daniel Gordon Yuke Zhu Aniruddha Kembhavi Abhinav Gupta Ali Farhadi LM&Ro 88 1,112 0 14 Dec 2017
Matterport3D: Learning from RGB-D Data in Indoor Environments Angel X. Chang Angela Dai Thomas Funkhouser Maciej Halber Matthias Nießner Manolis Savva Shuran Song Andy Zeng Yinda Zhang 3DV 3DPC 211 1,918 0 18 Sep 2017