Turning a CLIP Model into a Scene Text Detector

Turning a CLIP Model into a Scene Text Detector

28 February 2023

Yuliang Liu

Papers citing "Turning a CLIP Model into a Scene Text Detector"

8 / 8 papers shown

Title
WeCromCL: Weakly Supervised Cross-Modality Contrastive Learning for Transcription-only Supervised Text Spotting Jingjing Wu Zhengyao Fang Pengyuan Lyu Chengquan Zhang Fanglin Chen Guangming Lu Wenjie Pei 50 2 0 28 Jul 2024
Domain-Agnostic Mutual Prompting for Unsupervised Domain Adaptation Zhekai Du Xinyao Li Fengling Li Ke Lu Lei Zhu Jingjing Li 40 15 0 05 Mar 2024
Visual Information Extraction in the Wild: Practical Dataset and End-to-end Solution Jianfeng Kuang Wei Hua Dingkang Liang Mingkun Yang Deqiang Jiang Bo Ren Xiang Bai 27 39 0 12 May 2023
Learning to Prompt for Vision-Language Models Kaiyang Zhou Jingkang Yang Chen Change Loy Ziwei Liu VPVLM CLIP VLM 325 2,263 0 02 Sep 2021
Open-vocabulary Object Detection via Vision and Language Knowledge Distillation Xiuye Gu Tsung-Yi Lin Weicheng Kuo Yin Cui VLM ObjD 225 898 0 28 Apr 2021
Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection Shi-Xue Zhang Xiaobin Zhu Jie-Bo Hou Chang-rui Liu Chun Yang Hongfa Wang Xu-Cheng Yin GNN 67 182 0 17 Mar 2020
Convolutional Character Networks Linjie Xing Zhi Tian Weilin Huang Matthew R. Scott 52 157 0 17 Oct 2019
Language Models as Knowledge Bases? Fabio Petroni Tim Rocktaschel Patrick Lewis A. Bakhtin Yuxiang Wu Alexander H. Miller Sebastian Riedel KELM AI4MH 415 2,584 0 03 Sep 2019