GeoGround: A Unified Large Vision-Language Model for Remote Sensing Visual Grounding

16 November 2024

Papers citing "GeoGround: A Unified Large Vision-Language Model for Remote Sensing Visual Grounding"

40 / 40 papers shown

Title
RemoteSAM: Towards Segment Anything for Earth Observation Liang Yao Fan Liu Delong Chen Chuanyi Zhang Yijun Wang Ziyun Chen Wei Xu Shimin Di Yuhui Zheng 65 0 0 23 May 2025
REOBench: Benchmarking Robustness of Earth Observation Foundation Models Xiang Li Yong Tao Siyuan Zhang Siwei Liu Zhitong Xiong Chunbo Luo L. J. Liu Mykola Pechenizkiy Xiao Xiang Zhu T. Huang 27 0 0 22 May 2025
SegEarth-R1: Geospatial Pixel Reasoning via Large Language Model Kaiyu Li Zepeng Xin Li Pang Chao Pang Yupeng Deng Jing Yao Guisong Xia Deyu Meng Zhi Wang Xiangyong Cao VLM LRM 49 1 0 13 Apr 2025
LRSCLIP: A Vision-Language Foundation Model for Aligning Remote Sensing Image with Longer Text Weizhi Chen Jingbo Chen Yupeng Deng Jiansheng Chen Yuman Feng Zhihao Xi Diyou Liu Kai Li Yu Meng VLM 63 1 0 25 Mar 2025
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks Jiannan Wu Muyan Zhong Sen Xing Zeqiang Lai Zhaoyang Liu ... Lewei Lu Tong Lu Ping Luo Yu Qiao Jifeng Dai MLLM VLM LRM 147 51 0 03 Jan 2025
Towards Visual Grounding: A Survey Linhui Xiao Xiaoshan Yang X. Lan Yaowei Wang Changsheng Xu ObjD 111 4 0 31 Dec 2024
Exploring Fine-Grained Image-Text Alignment for Referring Remote Sensing Image Segmentation Sen Lei Xinyu Xiao Heng-Chao Li Z. Shi Qing Zhu 66 13 0 20 Sep 2024
SWIFT:A Scalable lightWeight Infrastructure for Fine-Tuning Yuze Zhao Jintao Huang Jinghan Hu Xingjun Wang Yunlin Mao ... Zhikai Wu Baole Ai Ang Wang Wenmeng Zhou Yingda Chen 59 36 0 10 Aug 2024
SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding Weitai Kang Gaowen Liu Mubarak Shah Yan Yan ObjD 61 9 0 03 Jul 2024
VRSBench: A Versatile Vision-Language Benchmark Dataset for Remote Sensing Image Understanding Xiang Li Jian Ding Mohamed Elhoseiny CoGe 53 27 0 18 Jun 2024
LHRS-Bot: Empowering Remote Sensing with VGI-Enhanced Large Multimodal Language Model Dilxat Muhtar Zhenshi Li Feng-Xue Gu Xue-liang Zhang Pengfeng Xiao 110 55 0 04 Feb 2024
EarthGPT: A Universal Multi-modal Large Language Model for Multi-sensor Image Comprehension in Remote Sensing Domain Wei Zhang Miaoxin Cai Tong Zhang Zhuang Yin Xuerui Mao 59 94 0 30 Jan 2024
InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks Zhe Chen Jiannan Wu Wenhai Wang Weijie Su Guo Chen ... Bin Li Ping Luo Tong Lu Yu Qiao Jifeng Dai VLM MLLM 185 1,036 0 21 Dec 2023
SkyScript: A Large and Semantically Diverse Vision-Language Dataset for Remote Sensing Zhecheng Wang R. Prabha Tianyuan Huang Jiajun Wu Ram Rajagopal 41 60 0 20 Dec 2023
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation Sihan Liu Yiwei Ma Xiaoqing Zhang Haowei Wang Jiayi Ji Xiaoshuai Sun Rongrong Ji 63 42 0 19 Dec 2023
PixelLM: Pixel Reasoning with Large Multimodal Model Zhongwei Ren Zhicheng Huang Yunchao Wei Yao-Min Zhao Dongmei Fu Jiashi Feng Xiaojie Jin VLM MLLM LRM 43 93 0 04 Dec 2023
GeoChat: Grounded Large Vision-Language Model for Remote Sensing Kartik Kuckreja M. S. Danish Muzammal Naseer Abhijit Das Salman Khan Fahad Shahbaz Khan 51 145 0 24 Nov 2023
NExT-Chat: An LMM for Chat, Detection and Segmentation Ao Zhang Yuan Yao Wei Ji Zhiyuan Liu Tat-Seng Chua MLLM VLM 56 54 0 08 Nov 2023
MiniGPT-v2: large language model as a unified interface for vision-language multi-task learning Jun Chen Deyao Zhu Xiaoqian Shen Xiang Li Zechun Liu Pengchuan Zhang Raghuraman Krishnamoorthi Vikas Chandra Yunyang Xiong Mohamed Elhoseiny MLLM 199 457 0 14 Oct 2023
LISA: Reasoning Segmentation via Large Language Model Xin Lai Zhuotao Tian Yukang Chen Yanwei Li Yuhui Yuan Shu Liu Jiaya Jia LM&Ro VLM MLLM LRM 74 424 0 01 Aug 2023
Shikra: Unleashing Multimodal LLM's Referential Dialogue Magic Ke Chen Zhao Zhang Weili Zeng Richong Zhang Feng Zhu Rui Zhao ObjD 49 622 0 27 Jun 2023
Kosmos-2: Grounding Multimodal Large Language Models to the World Zhiliang Peng Wenhui Wang Li Dong Y. Hao Shaohan Huang Shuming Ma Furu Wei MLLM ObjD VLM 62 724 0 26 Jun 2023
RS5M and GeoRSCLIP: A Large Scale Vision-Language Dataset and A Large Vision-Language Model for Remote Sensing Zilun Zhang Tiancheng Zhao Yulong Guo Yuxiang Cai DiffM VLM 41 61 0 20 Jun 2023
RRSIS: Referring Remote Sensing Image Segmentation Zhenghang Yuan Lichao Mou Yuansheng Hua Xiao Xiang Zhu 62 35 0 14 Jun 2023
Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena Lianmin Zheng Wei-Lin Chiang Ying Sheng Siyuan Zhuang Zhanghao Wu ... Dacheng Li Eric Xing Haotong Zhang Joseph E. Gonzalez Ion Stoica ALM OSLM ELM 176 4,085 0 09 Jun 2023
VisionLLM: Large Language Model is also an Open-Ended Decoder for Vision-Centric Tasks Wen Wang Zhe Chen Xiaokang Chen Jiannan Wu Xizhou Zhu ... Ping Luo Tong Lu Jie Zhou Yu Qiao Jifeng Dai MLLM VLM 45 474 0 18 May 2023
Visual Instruction Tuning Haotian Liu Chunyuan Li Qingyang Wu Yong Jae Lee SyDa VLM MLLM 298 4,506 0 17 Apr 2023
Segment Anything A. Kirillov Eric Mintun Nikhila Ravi Hanzi Mao Chloe Rolland ... Spencer Whitehead Alexander C. Berg Wan-Yen Lo Piotr Dollár Ross B. Girshick MLLM VLM 218 7,047 0 05 Apr 2023
RSVG: Exploring Data and Models for Visual Grounding on Remote Sensing Data Yangfan Zhan Zhitong Xiong Yuan. Yuan 102 114 0 23 Oct 2022
Detecting Rotated Objects as Gaussian Distributions and Its 3-D Generalization Xue Yang Gefan Zhang Xiaojiang Yang Yue Zhou Wentao Wang Jin Tang Tao He Junchi Yan 41 90 0 22 Sep 2022
MMRotate: A Rotated Object Detection Benchmark using PyTorch Yue Zhou Xue Yang Gefan Zhang Jiabao Wang Yanyi Liu ... Xingzhao Liu Junchi Yan Chengqi Lyu Wenwei Zhang Kai Chen 61 297 0 28 Apr 2022
Deep Unsupervised Contrastive Hashing for Large-Scale Cross-Modal Text-Image Retrieval in Remote Sensing Georgii Mikriukov Mahdyar Ravanbakhsh Begüm Demir 36 41 0 20 Jan 2022
Pix2seq: A Language Modeling Framework for Object Detection Ting-Li Chen Saurabh Saxena Lala Li David J. Fleet Geoffrey E. Hinton MLLM ViT VLM 254 346 0 22 Sep 2021
FAIR1M: A Benchmark Dataset for Fine-grained Object Recognition in High-Resolution Remote Sensing Imagery Xian Sun Peijin Wang Zhiyuan Yan F. Xu Ruiping Wang ... Tao Xu M. Weinmann Stefan Hinz Cheng Wang Kun Fu ObjD AI4TS 25 363 0 09 Mar 2021
Learning Transferable Visual Models From Natural Language Supervision Alec Radford Jong Wook Kim Chris Hallacy Aditya A. Ramesh Gabriel Goh ... Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger Ilya Sutskever CLIP VLM 510 28,659 0 26 Feb 2021
PhraseCut: Language-based Image Segmentation in the Wild Chenyun Wu Zhe Lin Scott D. Cohen Trung Bui Subhransu Maji VLM 25 113 0 03 Aug 2020
RSVQA: Visual Question Answering for Remote Sensing Data Sylvain Lobry Diego Marcos J. Murray D. Tuia 83 211 0 16 Mar 2020
Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark Ke Li G. Wan Gong Cheng L. Meng Junwei Han 24 1,433 0 31 Aug 2019
Deep multi-task learning for a geographically-regularized semantic segmentation of aerial images Michele Volpi D. Tuia 39 84 0 23 Aug 2018
DOTA: A Large-scale Dataset for Object Detection in Aerial Images Gui-Song Xia X. Bai Jian Ding Zhen Zhu Serge J. Belongie Jiebo Luo Mihai Datcu Marcello Pelillo Liangpei Zhang ObjD 98 2,154 0 28 Nov 2017