MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing
Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech,
OCR, and Visual Features

MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech, OCR, and Visual Features

25 September 2024

Katharina Anderer

Matthias Wölfel

Papers citing "MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech, OCR, and Visual Features"

Title
No papers