Video Summarization: Towards Entity-Aware Captions

1 December 2023

Papers citing "Video Summarization: Towards Entity-Aware Captions"

5 / 5 papers shown

Title
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 270 4,244 0 30 Jan 2023
Semantics-Consistent Cross-domain Summarization via Optimal Transport Alignment Jielin Qiu Jiacheng Zhu Mengdi Xu Franck Dernoncourt Trung Bui Zhaowen Wang Bo-wen Li Ding Zhao Hailin Jin 43 11 0 10 Oct 2022
Retrieval Augmented Visual Question Answering with Outside Knowledge Weizhe Lin Bill Byrne RALM 74 69 0 07 Oct 2022
Language Models with Image Descriptors are Strong Few-Shot Video-Language Learners Zhenhailong Wang Manling Li Ruochen Xu Luowei Zhou Jie Lei ... Chenguang Zhu Derek Hoiem Shih-Fu Chang Joey Tianyi Zhou Heng Ji MLLM VLM 170 137 0 22 May 2022
Joint Multimedia Event Extraction from Video and Article Brian Chen Xudong Lin Christopher Thomas Manling Li Shoya Yoshida Lovish Chum Heng Ji Shih-Fu Chang VGen 47 26 0 27 Sep 2021