Embodied Question Answering

30 November 2017

Devi Parikh

Papers citing "Embodied Question Answering"

50 / 151 papers shown

Title
A Survey of Robotic Navigation and Manipulation with Physics Simulators in the Era of Embodied AI Lik Hang Kenny Wong Xueyang Kang Kaixin Bai Jianwei Zhang 56 0 0 01 May 2025
Visual Environment-Interactive Planning for Embodied Complex-Question Answering Ning Lan Baoshan Ou Xuemei Xie G. Shi LM&Ro 69 1 0 01 Apr 2025
HA-VLN: A Benchmark for Human-Aware Navigation in Discrete-Continuous Environments with Dynamic Multi-Human Interactions, Real-World Validation, and an Open Leaderboard Yifei Dong Fengyi Wu Qi He Heng Li Minghan Li ... Yuxuan Zhou Jingdong Sun Qi Dai Zhi-Qi Cheng Alexander G. Hauptmann LM&Ro 50 0 0 18 Mar 2025
Beyond the Destination: A Novel Benchmark for Exploration-Aware Embodied Question Answering Kaixuan Jiang Yong-Jin Liu Weixing Chen Jingzhou Luo Ziliang Chen Ling Pan G. Li Liang Lin 57 2 0 14 Mar 2025
EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments Dongping Li Tielong Cai Tianci Tang Wenhao Chai Katherine Rose Driggs-Campbell Gaoang Wang LM&Ro 61 0 0 11 Mar 2025
SwimVG: Step-wise Multimodal Fusion and Adaption for Visual Grounding Liangtao Shi Ting Liu Xiantao Hu Yue Hu Quanjun Yin Richang Hong ObjD 51 0 0 24 Feb 2025
CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos Xinhao Liu J. Li Yichen Jiang Niranjan Sujay Z. Yang Juexiao Zhang John Abanes Jing Zhang Chen Feng 114 1 0 26 Nov 2024
CLIP-RT: Learning Language-Conditioned Robotic Policies from Natural Language Supervision Gi-Cheon Kang Junghyun Kim Kyuhwan Shim Jun Ki Lee Byoung-Tak Zhang LM&Ro 99 1 1 01 Nov 2024
Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation Quanting Xie So Yeon Min Tianyi Zhang Kedi Xu Aarav Bajaj Ruslan Salakhutdinov Matthew Johnson-Roberson Yonatan Bisk Matthew Johnson-Roberson Yonatan Bisk LM&Ro 55 7 0 26 Sep 2024
Answerability Fields: Answerable Location Estimation via Diffusion Models Daich Azuma Taiki Miyanishi Shuhei Kurita Koya Sakamoto M. Kawanabe DiffM 48 0 0 26 Jul 2024
Model Adaptation for Time Constrained Embodied Control Jaehyun Song Minjong Yoo Honguk Woo 42 0 0 17 Jun 2024
HELPER-X: A Unified Instructable Embodied Agent to Tackle Four Interactive Vision-Language Domains with Memory-Augmented Language Models Gabriel H. Sarch Sahil Somani Raghav Kapoor Michael J. Tarr Katerina Fragkiadaki LM&Ro LLMAG 34 3 0 29 Apr 2024
Closed Loop Interactive Embodied Reasoning for Robot Manipulation Michal Nazarczuk Jan Kristof Behrens Karla Stepanova Matej Hoffmann K. Mikolajczyk LM&Ro LRM 52 1 0 23 Apr 2024
Adversarial Testing for Visual Grounding via Image-Aware Property Reduction Zhiyuan Chang Mingyang Li Junjie Wang Cheng Li Boyu Wu Fanjiang Xu Qing Wang AAML 36 0 0 02 Mar 2024
A Landmark-Aware Visual Navigation Dataset Faith Johnson Bryan Bo Cao Kristin J. Dana Shubham Jain Ashwin Ashok 3DV 34 0 0 22 Feb 2024
Which way is `right'?: Uncovering limitations of Vision-and-Language Navigation model Meera Hahn Amit Raj James M. Rehg 30 3 0 30 Nov 2023
3D-Aware Visual Question Answering about Parts, Poses and Occlusions Xingrui Wang Wufei Ma Zhuowan Li Adam Kortylewski Alan L. Yuille CoGe 27 12 0 27 Oct 2023
Explore and Tell: Embodied Visual Captioning in 3D Environments Anwen Hu Shizhe Chen Liang Zhang Qin Jin LM&Ro 30 2 0 21 Aug 2023
Multi-Level Compositional Reasoning for Interactive Instruction Following Suvaansh Bhambri Byeonghwi Kim Jonghyun Choi LM&Ro 35 11 0 18 Aug 2023
An Outlook into the Future of Egocentric Vision Chiara Plizzari Gabriele Goletto Antonino Furnari Siddhant Bansal Francesco Ragusa G. Farinella Dima Damen Tatiana Tommasi EgoV 40 38 0 14 Aug 2023
3D Multi-Robot Exploration with a Two-Level Coordination Strategy and Prioritization L. Freda T. Novo David Portugal R. Rocha 15 2 0 05 Jul 2023
Towards AGI in Computer Vision: Lessons Learned from GPT and Large Language Models Lingxi Xie Longhui Wei Xiaopeng Zhang Kaifeng Bi Xiaotao Gu Jianlong Chang Qi Tian 33 7 0 14 Jun 2023
Enabling Intelligent Interactions between an Agent and an LLM: A Reinforcement Learning Approach Bin-Bin Hu Chenyang Zhao Pushi Zhang Zihao Zhou Yuanhang Yang Zenglin Xu Bin Liu LM&Ro LLMAG 25 22 0 06 Jun 2023
Embodied Concept Learner: Self-supervised Learning of Concepts and Mapping through Instruction Following Mingyu Ding Yan Xu Zhenfang Chen David D. Cox Ping Luo J. Tenenbaum Chuang Gan LM&Ro 56 21 0 07 Apr 2023
Data-Efficient Learning of Natural Language to Linear Temporal Logic Translators for Robot Task Specification Jiayi Pan Glen Chou Dmitry Berenson 23 35 0 09 Mar 2023
Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum Grounding Minyoung Hwang Jaeyeon Jeong Minsoo Kim Yoonseon Oh Songhwai Oh 22 19 0 07 Mar 2023
Do Embodied Agents Dream of Pixelated Sheep: Embodied Decision Making using Language Guided World Modelling Kolby Nottingham Prithviraj Ammanabrolu Alane Suhr Yejin Choi Hannaneh Hajishirzi Sameer Singh Roy Fox LLMAG LM&Ro 44 77 0 28 Jan 2023
What You Say Is What You Show: Visual Narration Detection in Instructional Videos Kumar Ashutosh Rohit Girdhar Lorenzo Torresani Kristen Grauman 24 4 0 05 Jan 2023
EgoLoc: Revisiting 3D Object Localization from Egocentric Videos with Visual Queries Jinjie Mai Abdullah Hamdi Silvio Giancola Chen Zhao Guohao Li EgoV 38 14 0 14 Dec 2022
PEANUT: Predicting and Navigating to Unseen Targets Albert J. Zhai Shenlong Wang 24 19 0 05 Dec 2022
A General Purpose Supervisory Signal for Embodied Agents Kunal Pratap Singh Jordi Salvador Luca Weihs Aniruddha Kembhavi SSL 26 3 0 01 Dec 2022
A Short Survey of Systematic Generalization Yuanpeng Li AI4CE 38 1 0 22 Nov 2022
Ask4Help: Learning to Leverage an Expert for Embodied Tasks Kunal Pratap Singh Luca Weihs Alvaro Herrasti Jonghyun Choi Aniruddha Kemhavi Roozbeh Mottaghi 13 19 0 18 Nov 2022
Prompter: Utilizing Large Language Model Prompting for a Data Efficient Embodied Instruction Following Y. Inoue Hiroki Ohashi LM&Ro 30 43 0 07 Nov 2022
Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object Transport S. Narayanan Dinesh Jayaraman Manmohan Chandraker 21 1 0 28 Oct 2022
HUMANISE: Language-conditioned Human Motion Generation in 3D Scenes Zan Wang Yixin Chen Tengyu Liu Yixin Zhu Wei Liang Siyuan Huang 43 103 0 18 Oct 2022
AVLEN: Audio-Visual-Language Embodied Navigation in 3D Environments Sudipta Paul A. Roy-Chowdhury A. Cherian 30 23 0 14 Oct 2022
AVE-CLIP: AudioCLIP-based Multi-window Temporal Transformer for Audio Visual Event Localization Tanvir Mahmud Diana Marculescu CLIP 11 31 0 11 Oct 2022
Learning a Visually Grounded Memory Assistant Meera Hahn Kevin Carlberg Ruta Desai James M. Hillis 25 1 0 07 Oct 2022
Towards Explainable 3D Grounded Visual Question Answering: A New Benchmark and Strong Baseline Lichen Zhao Daigang Cai Jing Zhang Lu Sheng Dong Xu Ruizhi Zheng Yinjie Zhao Lipeng Wang Xibo Fan 6 23 0 24 Sep 2022
Visual Recognition by Request Chufeng Tang Lingxi Xie Xiaopeng Zhang Xiaolin Hu Qi Tian VLM 16 15 0 28 Jul 2022
TIDEE: Tidying Up Novel Rooms using Visuo-Semantic Commonsense Priors Gabriel H. Sarch Zhaoyuan Fang Adam W. Harley Paul Schydlo Michael J. Tarr Saurabh Gupta Katerina Fragkiadaki LM&Ro 21 45 0 21 Jul 2022
DALL-E for Detection: Language-driven Compositional Image Synthesis for Object Detection Yunhao Ge Lyne Tchapmi Brian Nlong Zhao Neel Joshi Laurent Itti Vibhav Vineet DiffM ObjD 28 16 0 20 Jun 2022
VLMbench: A Compositional Benchmark for Vision-and-Language Manipulation Kai Zheng Xiaotong Chen Odest Chadwicke Jenkins Qing Guo LM&Ro CoGe 21 54 0 17 Jun 2022
Unsupervised Kinematic Motion Detection for Part-segmented 3D Shape Collections Xianghao Xu Yifan Ruan Srinath Sridhar Daniel E. Ritchie 3DPC 18 14 0 17 Jun 2022
GraphWalks: Efficient Shape Agnostic Geodesic Shortest Path Estimation Rolandos Alexandros Potamias Alexandros Neofytou Kyriaki-Margarita Bintsi S. Zafeiriou 33 13 0 30 May 2022
An Empirical Investigation of Commonsense Self-Supervision with Knowledge Graphs Jiarui Zhang Filip Ilievski Kaixin Ma Jonathan M Francis A. Oltramari SSL 16 5 0 21 May 2022
HandoverSim: A Simulation Framework and Benchmark for Human-to-Robot Object Handovers Yu-Wei Chao Chris Paxton Yu Xiang Wei Yang Balakumar Sundaralingam Tao Chen Adithyavairavan Murali Maya Cakmak D. Fox 62 17 0 19 May 2022
Episodic Memory Question Answering Samyak Datta Sameer Dharur Vincent Cartillier Ruta Desai Mukul Khanna Dhruv Batra Devi Parikh EgoV 13 31 0 03 May 2022
Embodied Navigation at the Art Gallery Roberto Bigazzi Federico Landi S. Cascianelli Marcella Cornia Lorenzo Baraldi Rita Cucchiara LM&Ro 21 3 0 19 Apr 2022