D$^2$TV: Dual Knowledge Distillation and Target-oriented Vision Modeling
for Many-to-Many Multimodal Summarization

v1v2 (latest)

D $^2$ TV: Dual Knowledge Distillation and Target-oriented Vision Modeling for Many-to-Many Multimodal Summarization

22 May 2023

Jie Zhou

ArXiv (abs)PDF HTML

Papers citing "D$^2$TV: Dual Knowledge Distillation and Target-oriented Vision Modeling for Many-to-Many Multimodal Summarization"

13 / 13 papers shown

Title
Towards Understanding and Improving Knowledge Distillation for Neural Machine Translation Songming Zhang Yunlong Liang Shuaibo Wang Wenjuan Han Jian Liu Jinan Xu Jinan Xu 57 10 0 14 May 2023
Summary-Oriented Vision Modeling for Multimodal Abstractive Summarization Yunlong Liang Fandong Meng Jinan Xu Jiaan Wang Jinan Xu Jie Zhou 70 22 0 15 Dec 2022
Understanding Translationese in Cross-Lingual Summarization Jiaan Wang Fandong Meng Yunlong Liang Tingyi Zhang Jiarong Xu Zhixu Li Jie Zhou 61 16 0 14 Dec 2022
A Survey on Cross-Lingual Summarization Jiaan Wang Fandong Meng Duo Zheng Yunlong Liang Zhixu Li Jianfeng Qu Jie Zhou AILaw 62 62 0 23 Mar 2022
A Variational Hierarchical Model for Neural Cross-Lingual Summarization Yunlong Liang Fandong Meng Chulun Zhou Jinan Xu Jinan Xu Jinsong Su Jie Zhou BDL 63 34 0 08 Mar 2022
Hierarchical Cross-Modality Semantic Correlation Learning Model for Multimodal Summarization Litian Zhang Xiaoming Zhang Junshu Pan Feiran Huang 62 48 0 16 Dec 2021
CLIFF: Contrastive Learning for Improving Faithfulness and Factuality in Abstractive Summarization Shuyang Cao Lu Wang HILM 64 181 0 19 Sep 2021
UniMS: A Unified Framework for Multimodal Summarization with Knowledge Distillation Zhengkun Zhang Xiaojun Meng Yasheng Wang Xin Jiang Qun Liu Zhenglu Yang 70 47 0 13 Sep 2021
Sequence Level Contrastive Learning for Text Summarization Shusheng Xu Xingxing Zhang Yi Wu Furu Wei 71 97 0 08 Sep 2021
Vision Guided Generative Pre-trained Language Models for Multimodal Abstractive Summarization Tiezheng Yu Wenliang Dai Zihan Liu Pascale Fung 72 74 0 06 Sep 2021
VMSMO: Learning to Generate Multimodal Summary for Video-based News Articles Li Mingzhe Preslav Nakov Shen Gao Zhangming Chan Dongyan Zhao Rui Yan 96 84 0 12 Oct 2020
BERTScore: Evaluating Text Generation with BERT Tianyi Zhang Varsha Kishore Felix Wu Kilian Q. Weinberger Yoav Artzi 352 5,860 0 21 Apr 2019
How2: A Large-scale Dataset for Multimodal Language Understanding Ramon Sanabria Ozan Caglayan Shruti Palaskar Desmond Elliott Loïc Barrault Lucia Specia Florian Metze VGen MLLM 86 291 0 01 Nov 2018

We use cookies and other tracking technologies to improve your browsing experience on our website, to show you personalized content and targeted ads, to analyze our website traffic, and to understand where our visitors are coming from. See our policy.