Scene Text Visual Question Answering

31 May 2019

Papers citing "Scene Text Visual Question Answering"

26 / 76 papers shown

Title
Multimodal Semi-Supervised Learning for Text Recognition Aviad Aberdam Roy Ganz Shai Mazor Ron Litman VLM 24 19 0 08 May 2022
ViSTA: Vision and Scene Text Aggregation for Cross-Modal Retrieval Mengjun Cheng Yipeng Sun Long Wang Xiongwei Zhu Kun Yao ... Guoli Song Junyu Han Jingtuo Liu Errui Ding Jingdong Wang 24 60 0 31 Mar 2022
Knowledge Mining with Scene Text for Fine-Grained Recognition Hao Wang Junchao Liao Tianheng Cheng Zewen Gao Hao Liu Bo Ren X. Bai Wenyu Liu 25 14 0 27 Mar 2022
REX: Reasoning-aware and Grounded Explanation Shi Chen Qi Zhao 25 18 0 11 Mar 2022
Self-supervised Implicit Glyph Attention for Text Recognition Tongkun Guan Chaochen Gu Jingzheng Tu Xuehang Yang Qi Feng Yudi Zhao Xiaokang Yang Wei Shen 29 25 0 07 Mar 2022
OCR-IDL: OCR Annotations for Industry Document Library Dataset Ali Furkan Biten Rubèn Pérez Tito Lluís Gómez Ernest Valveny Dimosthenis Karatzas 25 26 0 25 Feb 2022
LaTr: Layout-Aware Transformer for Scene-Text VQA Ali Furkan Biten Ron Litman Yusheng Xie Srikar Appalaraju R. Manmatha ViT 32 100 0 23 Dec 2021
3D Question Answering Shuquan Ye Dongdong Chen Songfang Han Jing Liao ViT 26 46 0 15 Dec 2021
A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer Weijia Wu Yuanqiang Cai Debing Zhang Sibo Wang Zhuang Li Jiahong Li Yejun Tang Hong Zhou 30 29 0 09 Dec 2021
Utilizing Resource-Rich Language Datasets for End-to-End Scene Text Recognition in Resource-Poor Languages Shota Orihashi Yoshihiro Yamazaki Naoki Makishima Mana Ihori Akihiko Takashima Tomohiro Tanaka Ryo Masumura 30 1 0 24 Nov 2021
Achieving Human Parity on Visual Question Answering Ming Yan Haiyang Xu Chenliang Li Junfeng Tian Bin Bi ... Ji Zhang Songfang Huang Fei Huang Luo Si Rong Jin 26 12 0 17 Nov 2021
ICDAR 2021 Competition on Document VisualQuestion Answering Rubèn Pérez Tito Minesh Mathew C. V. Jawahar Ernest Valveny Dimosthenis Karatzas 35 23 0 10 Nov 2021
Asking questions on handwritten document collections Minesh Mathew Lluís Gómez Dimosthenis Karatzas C. V. Jawahar RALM 20 11 0 02 Oct 2021
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling Xiaopeng Lu Zhenhua Fan Yansen Wang Jean Oh Carolyn Rose 27 27 0 20 Aug 2021
Joint Visual Semantic Reasoning: Multi-Stage Decoder for Text Recognition A. Bhunia Aneeshan Sain Amandeep Kumar S. Ghose Pinaki Nath Chowdhury Yi-Zhe Song 21 56 0 26 Jul 2021
Towards the Unseen: Iterative Text Recognition by Distilling from Errors A. Bhunia Pinaki Nath Chowdhury Aneeshan Sain Yi-Zhe Song 38 16 0 26 Jul 2021
TextOCR: Towards large-scale end-to-end reasoning for arbitrary-shaped scene text Amanpreet Singh Guan Pang Mandy Toh Jing Huang Wojciech Galuba Tal Hassner 12 163 0 12 May 2021
A First Look: Towards Explainable TextVQA Models via Visual and Textual Explanations Varun Nagaraj Rao Xingjian Zhen K. Hovsepian Mingwei Shen 29 17 0 29 Apr 2021
InfographicVQA Minesh Mathew Viraj Bagal Rubèn Pérez Tito Dimosthenis Karatzas Ernest Valveny C. V. Jawahar 24 206 0 26 Apr 2021
Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCaps Qi Zhu Chenyu Gao Peng Wang Qi Wu 30 54 0 09 Dec 2020
Label or Message: A Large-Scale Experimental Survey of Texts and Objects Co-Occurrence Koki Takeshita Juntaro Shioyama S. Uchida 12 1 0 30 Jul 2020
RobustScanner: Dynamically Enhancing Positional Clues for Robust Text Recognition Xiaoyu Yue Zhanghui Kuang Chenhao Lin Hongbin Sun Wayne Zhang 28 160 0 15 Jul 2020
Text Recognition in the Wild: A Survey Xiaoxue Chen Lianwen Jin Yuanzhi Zhu Canjie Luo Tianwei Wang 3DV 27 102 0 07 May 2020
TextCaps: a Dataset for Image Captioning with Reading Comprehension Oleksii Sidorov Ronghang Hu Marcus Rohrbach Amanpreet Singh 25 388 0 24 Mar 2020
On the General Value of Evidence, and Bilingual Scene-Text Visual Question Answering Xinyu Wang Yuliang Liu Chunhua Shen Chun Chet Ng Canjie Luo Lianwen Jin C. Chan Anton Van Den Hengel Liangwei Wang 31 91 0 24 Feb 2020
COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images Andreas Veit Tomas Matera Lukás Neumann Jirí Matas Serge J. Belongie 188 515 0 26 Jan 2016