Reading Order Matters: Information Extraction from Visually-rich
Documents by Token Path Prediction

Reading Order Matters: Information Extraction from Visually-rich Documents by Token Path Prediction

17 October 2023

Papers citing "Reading Order Matters: Information Extraction from Visually-rich Documents by Token Path Prediction"

11 / 11 papers shown

Title
Where is this coming from? Making groundedness count in the evaluation of Document VQA models Armineh Nourbakhsh Siddharth Parekh Pranav Shetty Zhao Jin Sameena Shah Carolyn Rose 48 0 0 24 Mar 2025
Problem Solved? Information Extraction Design Space for Layout-Rich Documents using LLMs Gaye Colakoglu Gürkan Solmaz Jonathan Fürst 53 1 0 25 Feb 2025
OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models Wenwen Yu Zhibo Yang Jianqiang Wan Sibo Song J. Tang Wenqing Cheng Y. Liu Xiang Bai 53 2 0 22 Feb 2025
Modeling Layout Reading Order as Ordering Relations for Visually-rich Document Understanding Chong Zhang Yi Tu Yixi Zhao Chenshu Yuan Huan Chen ... Mingxu Chai Ya Guo Huijia Zhu Qi Zhang Tao Gui 43 2 0 29 Sep 2024
UNER: A Unified Prediction Head for Named Entity Recognition in Visually-rich Documents Yi Tu Chong Zhang Ya Guo Huan Chen Jinyang Tang Huijia Zhu Qi Zhang 45 3 0 02 Aug 2024
VRDSynth: Synthesizing Programs for Multilingual Visually Rich Document Information Extraction Thanh-Dat Nguyen Tung Do-Viet Hung Nguyen-Duy Tuan-Hai Luu Hung Le Bach Le Patanamon Thongtanunam SyDa 39 1 0 09 Jul 2024
Reading Order Independent Metrics for Information Extraction in Handwritten Documents David Villanova-Aparisi Solène Tarride Carlos David Martínez Hinarejos Verónica Romero Christopher Kermorvant Moisés Pastor 18 0 0 29 Apr 2024
OmniParser: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition Jianqiang Wan Sibo Song Wenwen Yu Yuliang Liu Wenqing Cheng Fei Huang Xiang Bai Cong Yao Zhibo Yang 51 27 0 28 Mar 2024
PEneo: Unifying Line Extraction, Line Grouping, and Entity Linking for End-to-end Document Pair Extraction Zening Lin Jiapeng Wang Teng Li Wenhui Liao Dayi Huang Longfei Xiong Lianwen Jin 24 2 0 07 Jan 2024
LayoutLMv2: Multi-modal Pre-training for Visually-Rich Document Understanding Yang Xu Yiheng Xu Tengchao Lv Lei Cui Furu Wei ... D. Florêncio Cha Zhang Wanxiang Che Min Zhang Lidong Zhou ViT MLLM 153 498 0 29 Dec 2020
FUNSD: A Dataset for Form Understanding in Noisy Scanned Documents Guillaume Jaume H. K. Ekenel Jean-Philippe Thiran 140 355 0 27 May 2019