v1v2 (latest)

Towards Weakly-Supervised Text Spotting using a Multi-Task Transformer

11 February 2022

Papers citing "Towards Weakly-Supervised Text Spotting using a Multi-Task Transformer"

36 / 36 papers shown

Title
Hyper-Local Deformable Transformers for Text Spotting on Historical Maps Yijun Lin Yao-Yi Chiang 30 3 0 17 Jun 2025
Text-Aware Image Restoration with Diffusion Models Jaewon Min J. Kim Paul Hyunbin Cho J. Lee Jihye Park Minkyu Park S. Kim Hyunhee Park Seungryong Kim 58 0 0 11 Jun 2025
SemiETS: Integrating Spatial and Content Consistencies for Semi-Supervised End-to-end Text Spotting Dongliang Luo Hanshen Zhu Ziyang Zhang Dingkang Liang Xudong Xie Yunxing Liu Xiang Bai VLM 83 0 0 14 Apr 2025
A Context-Driven Training-Free Network for Lightweight Scene Text Segmentation and Recognition Ritabrata Chakraborty Shivakumara Palaiahnakote Umapada Pal Cheng-Lin Liu VLM 117 0 0 19 Mar 2025
OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models Wenwen Yu Zhibo Yang Jianqiang Wan Sibo Song J. Tang Wenqing Cheng Yunxing Liu Xiang Bai 113 5 0 22 Feb 2025
HIP: Hierarchical Point Modeling and Pre-training for Visual Information Extraction Rujiao Long Pengfei Wang Zhibo Yang Cong Yao 77 0 0 02 Nov 2024
DNTextSpotter: Arbitrary-Shaped Scene Text Spotting via Improved Denoising Training Xi Chen Qian Qiao Jun Gao Tianxiang Wu Rahul Bhadani Jiaqing Fan Ziqiang Cao Larry Head DiffM 120 9 0 01 Aug 2024
WeCromCL: Weakly Supervised Cross-Modality Contrastive Learning for Transcription-only Supervised Text Spotting Jingjing Wu Zhengyao Fang Pengyuan Lyu Chengquan Zhang Fanglin Chen Guangming Lu Wenjie Pei 151 3 0 28 Jul 2024
VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization Yuliang Liu Mingxin Huang Hao Yan Linger Deng Weijia Wu Hao Lu Chunhua Shen Lianwen Jin Xiang Bai 86 0 0 30 Apr 2024
Bridging the Gap Between End-to-End and Two-Step Text Spotting Mingxin Huang Hongliang Li Yuliang Liu Xiang Bai Lianwen Jin 111 5 0 06 Apr 2024
OmniParser: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition Jianqiang Wan Sibo Song Wenwen Yu Yuliang Liu Wenqing Cheng Fei Huang Xiang Bai Cong Yao Zhibo Yang 99 37 0 28 Mar 2024
TextMonkey: An OCR-Free Large Multimodal Model for Understanding Document Yuliang Liu Biao Yang Qiang Liu Zhang Li Zhiyin Ma Shuo Zhang Xiang Bai MLLM VLM 126 109 0 07 Mar 2024
Efficiently Leveraging Linguistic Priors for Scene Text Spotting Nguyen Nguyen Yapeng Tian Chenliang Xu 83 1 0 27 Feb 2024
Hi-SAM: Marrying Segment Anything Model for Hierarchical Text Segmentation Maoyuan Ye Jing Zhang Juhua Liu Chenyu Liu Baocai Yin Cong Liu Bo Du Dacheng Tao VLM 111 15 0 31 Jan 2024
SwinTextSpotter v2: Towards Better Synergy for Scene Text Spotting Mingxin Huang Dezhi Peng Hongliang Li Zhenghao Peng Chongyu Liu Dahua Lin Yuliang Liu Xiang Bai Lianwen Jin 194 1 0 15 Jan 2024
GoMatching: A Simple Baseline for Video Text Spotting via Long and Short Term Matching Haibin He Maoyuan Ye Jing Zhang Juhua Liu Dacheng Tao VLM 83 4 0 13 Jan 2024
Inverse-like Antagonistic Scene Text Spotting via Reading-Order Estimation and Dynamic Sampling Shi-Xue Zhang Chun Yang Xiaobin Zhu Hongyang Zhou Hongfa Wang Xu-Cheng Yin 106 7 0 08 Jan 2024
Word length-aware text spotting: Enhancing detection and recognition in dense text image Hao Wang Huabing Zhou Yanduo Zhang Tao Lu Jiayi Ma 80 1 0 25 Dec 2023
Progressive Evolution from Single-Point to Polygon for Scene Text Linger Deng Mingxin Huang Xudong Xie Yuliang Liu Lianwen Jin Xiang Bai 65 1 0 21 Dec 2023
Hierarchical Text Spotter for Joint Text Spotting and Layout Analysis Shangbang Long Siyang Qin Yasuhisa Fujii Alessandro Bissacco Michalis Raptis 84 5 0 25 Oct 2023
SCOB: Universal Text Understanding via Character-wise Supervised Contrastive Learning with Online Text Rendering for Bridging Domain Gap Daehee Kim Yoon Kim Donghyun Kim Yumin Lim Geewook Kim Taeho Kil 79 4 0 21 Sep 2023
STEP -- Towards Structured Scene-Text Spotting Sergi Garcia-Bordils Dimosthenis Karatzas Marccal Rusinol 87 2 0 05 Sep 2023
Turning a CLIP Model into a Scene Text Spotter Wenwen Yu Yuliang Liu Xingkui Zhu H. Cao Xing Sun Xiang Bai VLM CLIP 84 12 0 21 Aug 2023
ESTextSpotter: Towards Better Scene Text Spotting with Explicit Synergy in Transformer Mingxin Huang Jiaxin Zhang Dezhi Peng Hao Lu Can Huang Yuliang Liu Xiang Bai Lianwen Jin 108 29 0 20 Aug 2023
Weakly supervised information extraction from inscrutable handwritten document images S. Paul Gagan Madan Akankshya Mishra N. Hegde Pradeep Kumar Gaurav Aggarwal MedIm 52 4 0 12 Jun 2023
DeepSolo++: Let Transformer Decoder with Explicit Points Solo for Multilingual Text Spotting Maoyuan Ye Jing Zhang Shanshan Zhao Juhua Liu Tongliang Liu Bo Du Dacheng Tao 73 3 0 31 May 2023
ICDAR 2023 Competition on Hierarchical Text Detection and Recognition Shangbang Long Siyang Qin Dmitry Panteleev Alessandro Bissacco Yasuhisa Fujii Michalis Raptis VLM 115 20 0 16 May 2023
Towards Unified Scene Text Spotting based on Sequence Generation Taeho Kil Seonghyeon Kim Sukmin Seo Yoon Kim Daehee Kim 117 20 0 07 Apr 2023
CLIPTER: Looking at the Bigger Picture in Scene Text Recognition Aviad Aberdam David Bensaid Alona Golts Roy Ganz Oren Nuriel Royee Tichauer Shai Mazor Ron Litman VLM CLIP 92 13 0 18 Jan 2023
Towards Models that Can See and Read Roy Ganz Oren Nuriel Aviad Aberdam Yair Kittenplon Shai Mazor Ron Litman 75 13 0 18 Jan 2023
SPTS v2: Single-Point Scene Text Spotting Yuliang Liu Jiaxin Zhang Dezhi Peng Mingxin Huang Xinyu Wang ... Can Huang Dahua Lin Chunhua Shen Xiang Bai Lianwen Jin VLM 127 52 0 04 Jan 2023
DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting Maoyuan Ye Jing Zhang Shanshan Zhao Juhua Liu Tongliang Liu Bo Du Dacheng Tao 164 77 0 19 Nov 2022
Out-of-Vocabulary Challenge Report Sergi Garcia-Bordils Andrés Mafla Ali Furkan Biten Oren Nuriel Aviad Aberdam Shai Mazor Ron Litman Dimosthenis Karatzas 62 16 0 14 Sep 2022
Single Shot Self-Reliant Scene Text Spotter by Decoupled yet Collaborative Detection and Recognition Jingjing Wu Pengyuan Lyu Guangming Lu Chengquan Zhang Wenjie Pei 70 3 0 15 Jul 2022
Text Detection & Recognition in the Wild for Robot Localization Z. Raisi John S. Zelek 72 0 0 17 May 2022
Language Matters: A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting Chuhui Xue Wenqing Zhang Yu Hao Shijian Lu Philip Torr Song Bai VLM 89 33 0 08 Mar 2022