Embodied Question Answering

30 November 2017

Devi Parikh

Papers citing "Embodied Question Answering"

50 / 151 papers shown

Title
Brainish: Formalizing A Multimodal Language for Intelligence and Consciousness Paul Pu Liang 22 4 0 14 Apr 2022
Habitat-Web: Learning Embodied Object-Search Strategies from Human Demonstrations at Scale Ram Ramrakhya Eric Undersander Dhruv Batra Abhishek Das LM&Ro 29 109 0 07 Apr 2022
Continuous Scene Representations for Embodied AI S. Gadre Kiana Ehsani Shuran Song Roozbeh Mottaghi 31 46 0 31 Mar 2022
Single-Stream Multi-Level Alignment for Vision-Language Pretraining Zaid Khan B. Vijaykumar Xiang Yu S. Schulter Manmohan Chandraker Y. Fu CLIP VLM 25 16 0 27 Mar 2022
Object Manipulation via Visual Target Localization Kiana Ehsani Ali Farhadi Aniruddha Kembhavi Roozbeh Mottaghi LM&Ro 26 9 0 15 Mar 2022
AssistQ: Affordance-centric Question-driven Task Completion for Egocentric Assistant B. Wong Joya Chen You Wu Stan Weixian Lei Dongxing Mao Difei Gao Mike Zheng Shou EgoV 32 27 0 08 Mar 2022
Bridging the Gap Between Learning in Discrete and Continuous Environments for Vision-and-Language Navigation Yicong Hong Zun Wang Qi Wu Stephen Gould 3DV 29 64 0 05 Mar 2022
Online Learning of Reusable Abstract Models for Object Goal Navigation Tommaso Campari Leonardo Lamanna P. Traverso Luciano Serafini Lamberto Ballan EgoV 15 19 0 04 Mar 2022
DialFRED: Dialogue-Enabled Agents for Embodied Instruction Following Xiaofeng Gao Qiaozi Gao Ran Gong Kaixiang Lin Govind Thattai Gaurav Sukhatme LM&Ro 89 70 0 27 Feb 2022
Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigation Shizhe Chen Pierre-Louis Guhur Makarand Tapaswi Cordelia Schmid Ivan Laptev LM&Ro 28 139 0 23 Feb 2022
Image-based Navigation in Real-World Environments via Multiple Mid-level Representations: Fusion Models, Benchmark and Efficient Evaluation Marco Rosano Antonino Furnari Luigi Gulino C. Santoro G. Farinella EgoV 44 5 0 02 Feb 2022
IFOR: Iterative Flow Minimization for Robotic Object Rearrangement Ankit Goyal Arsalan Mousavian Chris Paxton Yu-Wei Chao Brian Okorn Jia Deng D. Fox 32 55 0 01 Feb 2022
Learning to Act with Affordance-Aware Multimodal Neural SLAM Zhiwei Jia Kaixiang Lin Yizhou Zhao Qiaozi Gao Govind Thattai Gaurav Sukhatme LM&Ro 31 15 0 24 Jan 2022
3D Question Answering Shuquan Ye Dongdong Chen Songfang Han Jing Liao ViT 26 46 0 15 Dec 2021
Creating Multimodal Interactive Agents with Imitation and Self-Supervised Learning DeepMind Interactive Agents Team Josh Abramson Josh Abramson Arun Ahuja Arthur Brussee Federico Carnevale ... Tamara von Glehn Greg Wayne Nathaniel Wong Chen Yan Rui Zhu LM&Ro 37 46 0 07 Dec 2021
Shaping embodied agent behavior with activity-context priors from egocentric video Tushar Nagarajan Kristen Grauman EgoV LM&Ro 43 13 0 14 Oct 2021
$Pano-AVQA: Grounded Audio-Visual Question Answering on 360$^\circ$ Videos$ Pano-AVQA: Grounded Audio-Visual Question Answering on 360 $^\circ$ Videos Heeseung Yun Youngjae Yu Wonsuk Yang Kangil Lee Gunhee Kim 25 78 0 11 Oct 2021
Knowledge-based Embodied Question Answering Sinan Tan Mengmeng Ge Di Guo Huaping Liu F. Sun 30 20 0 16 Sep 2021
Tiered Reasoning for Intuitive Physics: Toward Verifiable Commonsense Language Understanding Shane Storks Qiaozi Gao Yichi Zhang J. Chai ReLM LRM 44 22 0 10 Sep 2021
SASRA: Semantically-aware Spatio-temporal Reasoning Agent for Vision-and-Language Navigation in Continuous Environments Muhammad Zubair Irshad Niluthpol Chowdhury Mithun Zachary Seymour Han-Pang Chiu S. Samarasekera Rakesh Kumar LM&Ro 26 49 0 26 Aug 2021
The Surprising Effectiveness of Visual Odometry Techniques for Embodied PointGoal Navigation Xiaoming Zhao Harsh Agrawal Dhruv Batra A. Schwing 36 40 0 26 Aug 2021
BEHAVIOR: Benchmark for Everyday Household Activities in Virtual, Interactive, and Ecological Environments S. Srivastava Chengshu Li Michael Lingelbach Roberto Martín-Martín Fei Xia ... C. Karen Liu Silvio Savarese H. Gweon Jiajun Wu Li Fei-Fei LM&Ro 151 157 0 06 Aug 2021
Communicative Learning with Natural Gestures for Embodied Navigation Agents with Human-in-the-Scene Qi Wu Cheng-Ju Wu Yixin Zhu Jungseock Joo 43 14 0 05 Aug 2021
Adversarial Reinforced Instruction Attacker for Robust Vision-Language Navigation Bingqian Lin Yi Zhu Yanxin Long Xiaodan Liang QiXiang Ye Liang Lin AAML 39 16 0 23 Jul 2021
MultiBench: Multiscale Benchmarks for Multimodal Representation Learning Paul Pu Liang Yiwei Lyu Xiang Fan Zetian Wu Yun Cheng ... Peter Wu Michelle A. Lee Yuke Zhu Ruslan Salakhutdinov Louis-Philippe Morency VLM 32 159 0 15 Jul 2021
LanguageRefer: Spatial-Language Model for 3D Visual Grounding Junha Roh Karthik Desingh Ali Farhadi D. Fox 22 95 0 07 Jul 2021
SocialAI: Benchmarking Socio-Cognitive Abilities in Deep Reinforcement Learning Agents Grgur Kovač Rémy Portelas Katja Hofmann Pierre-Yves Oudeyer ALM 27 6 0 02 Jul 2021
Learning to Map for Active Semantic Goal Navigation G. Georgakis Bernadette Bucher Karl Schmeckpeper Siddharth Singh Kostas Daniilidis 32 73 0 29 Jun 2021
Core Challenges in Embodied Vision-Language Planning Jonathan M Francis Nariaki Kitamura Felix Labelle Xiaopeng Lu Ingrid Navarro Jean Oh LM&Ro 47 45 0 26 Jun 2021
A Survey on Human-aware Robot Navigation Ronja Möller Antonino Furnari Sebastiano Battiato Aki Härmä G. Farinella 41 87 0 22 Jun 2021
RobustNav: Towards Benchmarking Robustness in Embodied Navigation Prithvijit Chattopadhyay Judy Hoffman Roozbeh Mottaghi Aniruddha Kembhavi 25 55 0 08 Jun 2021
Hierarchical Task Learning from Language Instructions with Unified Transformers and Self-Monitoring Yichi Zhang J. Chai 25 78 0 07 Jun 2021
PIGLeT: Language Grounding Through Neuro-Symbolic Interaction in a 3D World Rowan Zellers Ari Holtzman Matthew E. Peters Roozbeh Mottaghi Aniruddha Kembhavi Ali Farhadi Yejin Choi 19 68 0 01 Jun 2021
gComm: An environment for investigating generalization in Grounded Language Acquisition Rishi Hazra Sonu Dixit 23 0 0 09 May 2021
SOON: Scenario Oriented Object Navigation with Graph-based Exploration Fengda Zhu Xiwen Liang Yi Zhu Xiaojun Chang Xiaodan Liang 24 122 0 31 Mar 2021
Scene-Intuitive Agent for Remote Embodied Visual Grounding Xiangru Lin Guanbin Li Yizhou Yu LM&Ro 22 52 0 24 Mar 2021
Refer-it-in-RGBD: A Bottom-up Approach for 3D Visual Grounding in RGBD Images Haolin Liu Anran Lin Xiaoguang Han Lei Yang Yizhou Yu Shuguang Cui 27 39 0 14 Mar 2021
Exploiting Multimodal Reinforcement Learning for Simultaneous Machine Translation Julia Ive A. Li Yishu Miao Ozan Caglayan Pranava Madhyastha Lucia Specia 26 10 0 22 Feb 2021
Memory-Augmented Reinforcement Learning for Image-Goal Navigation Lina Mezghani Sainbayar Sukhbaatar Thibaut Lavril Oleksandr Maksymets Dhruv Batra Piotr Bojanowski Alahari Karteek 24 69 0 13 Jan 2021
Are We There Yet? Learning to Localize in Embodied Instruction Following Shane Storks Qiaozi Gao Govind Thattai Gokhan Tur LM&Ro 45 11 0 09 Jan 2021
Embodied Visual Active Learning for Semantic Segmentation David Nilsson Aleksis Pirinen Erik Gartner C. Sminchisescu 36 35 0 17 Dec 2020
MELINDA: A Multimodal Dataset for Biomedical Experiment Method Classification Te-Lin Wu Shikhar Singh S. Paul Gully A. Burns Nanyun Peng 24 18 0 16 Dec 2020
How to Train PointGoal Navigation Agents on a (Sample and Compute) Budget Erik Wijmans Irfan Essa Dhruv Batra 3DPC 30 10 0 11 Dec 2020
Intrinsically Motivated Compositional Language Emergence Rishi Hazra Sonu Dixit Sayambhu Sen 11 1 0 09 Dec 2020
MultiON: Benchmarking Semantic Map Memory using Multi-Object Navigation Saim Wani Shivansh Patel Unnat Jain Angel X. Chang Manolis Savva 34 104 0 07 Dec 2020
Language-guided Navigation via Cross-Modal Grounding and Alternate Adversarial Learning Weixia Zhang Chao Ma Qi Wu Xiaokang Yang 39 44 0 22 Nov 2020
Where Are You? Localization from Embodied Dialog Meera Hahn Jacob Krantz Dhruv Batra Devi Parikh James M. Rehg Stefan Lee Peter Anderson LM&Ro 22 27 0 16 Nov 2020
Utilizing Every Image Object for Semi-supervised Phrase Grounding Haidong Zhu Arka Sadhu Zhao-Heng Zheng Ram Nevatia ObjD 17 7 0 05 Nov 2020
Language and Visual Entity Relationship Graph for Agent Navigation Yicong Hong Cristian Rodriguez-Opazo Yuankai Qi Qi Wu Stephen Gould LM&Ro 179 132 0 19 Oct 2020
Efficient Robotic Object Search via HIEM: Hierarchical Policy Learning with Intrinsic-Extrinsic Modeling Xin Ye Yezhou Yang 22 14 0 16 Oct 2020