RSVQA: Visual Question Answering for Remote Sensing Data

16 March 2020

Papers citing "RSVQA: Visual Question Answering for Remote Sensing Data"

21 / 21 papers shown

Title
LISAT: Language-Instructed Segmentation Assistant for Satellite Imagery Jerome Quenum Wen-Han Hsieh Tsung-Han Wu Ritwik Gupta Trevor Darrell David M. Chan MLLM VLM 54 0 0 05 May 2025
A Vision Centric Remote Sensing Benchmark Abduljaleel Adejumo Faegheh Yeganli Clifford Broni-Bediako Aoran Xiao Naoto Yokoya Mennatullah Siam 64 0 0 20 Mar 2025
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning Junwei Luo Yingying Zhang X. J. Yang Kang Wu Qi Zhu Lei Liang Jingdong Chen Yansheng Li 67 0 0 10 Mar 2025
TEOChat: A Large Vision-Language Assistant for Temporal Earth Observation Data Jeremy Irvin Emily Ruoyu Liu Joyce Chuyi Chen Ines Dormoy Jinyoung Kim Samar Khanna Zhuo Zheng Stefano Ermon MLLM VLM 52 4 0 28 Jan 2025
Advancements in Visual Language Models for Remote Sensing: Datasets, Capabilities, and Enhancement Techniques Lijie Tao H. Zhang Haizhao Jing Yu Liu Kelu Yao Guoting Wei Xizhe Xue 35 0 0 03 Jan 2025
Text-Guided Coarse-to-Fine Fusion Network for Robust Remote Sensing Visual Question Answering Zhicheng Zhao Changfu Zhou Yu Zhang Chenglong Li Xiaoliang Ma Jin Tang 81 0 0 24 Nov 2024
GeoGround: A Unified Large Vision-Language Model for Remote Sensing Visual Grounding Y. Zhou Mengcheng Lan Xiang Li Yiping Ke Xue Jiang Litong Feng Qingyun Li Xue Yang Wayne Zhang ObjD VLM 116 4 0 16 Nov 2024
UrBench: A Comprehensive Benchmark for Evaluating Large Multimodal Models in Multi-View Urban Scenarios Baichuan Zhou Haote Yang Dairong Chen Junyan Ye Tianyi Bai Jinhua Yu Songyang Zhang Dahua Lin Conghui He Weijia Li VLM 58 3 0 30 Aug 2024
SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding Junwei Luo Zhen Pang Yongjun Zhang Tingzhu Wang Linlin Wang ... Jiangwei Lao Jian Wang Jingdong Chen Yihua Tan Yansheng Li 42 21 0 14 Jun 2024
Stable Rivers: A Case Study in the Application of Text-to-Image Generative Models for Earth Sciences C. Kupferschmidt A. Binns K. L. Kupferschmidt G. W. Taylor DiffM 16 0 0 13 Dec 2023
The curse of language biases in remote sensing VQA: the role of spatial attributes, language diversity, and the need for clear evaluation Christel Chappuis Eliot Walt Vincent Mendez Sylvain Lobry B. L. Saux D. Tuia 23 3 0 28 Nov 2023
Detecting Cloud Presence in Satellite Images Using the RGB-based CLIP Vision-Language Model Mikolaj Czerkawski Robert C. Atkinson Christos Tachtatzis VLM 22 2 0 01 Aug 2023
The Potential of Visual ChatGPT For Remote Sensing L. Osco Eduardo Lopes de Lemos W. Gonçalves A. P. Ramos J. M. Junior 22 30 0 25 Apr 2023
AI Security for Geoscience and Remote Sensing: Challenges and Future Trends Yonghao Xu Tao Bai Weikang Yu Shizhen Chang P. M. Atkinson Pedram Ghamisi AAML 35 47 0 19 Dec 2022
RSVG: Exploring Data and Models for Visual Grounding on Remote Sensing Data Yangfan Zhan Zhitong Xiong Yuan. Yuan 68 106 0 23 Oct 2022
3D Question Answering Shuquan Ye Dongdong Chen Songfang Han Jing Liao ViT 24 46 0 15 Dec 2021
How to find a good image-text embedding for remote sensing visual question answering? Christel Chappuis Sylvain Lobry B. Kellenberger Bertrand Le Saux D. Tuia 34 20 0 24 Sep 2021
Geographic Question Answering: Challenges, Uniqueness, Classification, and Future Directions Gengchen Mai K. Janowicz Rui Zhu Ling Cai Ni Lao 27 57 0 19 May 2021
Towards a Collective Agenda on AI for Earth Science Data Analysis D. Tuia R. Roscher Jan Dirk Wegner Nathan Jacobs Xiaoxiang Zhu Gustau Camps-Valls AI4CE 39 68 0 11 Apr 2021
Bounding Boxes Are All We Need: Street View Image Classification via Context Encoding of Detected Buildings Kun Zhao Yongkun Liu Siyuan Hao Shaoxing Lu Hongbin Liu Lijian Zhou 22 20 0 03 Oct 2020
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 152 1,465 0 06 Jun 2016