Mutual Information Divergence: A Unified Metric for Multimodal
Generative Models

Mutual Information Divergence: A Unified Metric for Multimodal Generative Models

25 May 2022

ArXiv (abs)PDF HTML

Papers citing "Mutual Information Divergence: A Unified Metric for Multimodal Generative Models"

12 / 12 papers shown

Title
A Conformal Risk Control Framework for Granular Word Assessment and Uncertainty Calibration of CLIPScore Quality Estimates Gonçalo Gomes Bruno Martins Chrysoula Zerva 88 0 0 01 Apr 2025
Image Captioning Evaluation in the Age of Multimodal LLMs: Challenges and Future Perspectives Sara Sarto Marcella Cornia Rita Cucchiara 86 1 0 18 Mar 2025
Distributional Vision-Language Alignment by Cauchy-Schwarz Divergence Wenzhe Yin Zehao Xiao Pan Zhou Shujian Yu Jiayi Shen Jan-Jakob Sonke E. Gavves 177 1 0 24 Feb 2025
An Online Learning Approach to Prompt-based Selection of Generative Models and LLMs Xiaoyan Hu Ho-fung Leung Farzan Farnia 271 3 0 17 Oct 2024
Information-Theoretic Distillation for Reference-less Summarization Jaehun Jung Ximing Lu Liwei Jiang Faeze Brahman Peter West Pang Wei Koh Yejin Choi 87 6 0 20 Mar 2024
Text-to-Image Cross-Modal Generation: A Systematic Review Maciej Żelaszczyk Jacek Mańdziuk 97 4 0 21 Jan 2024
Human Motion Generation: A Survey Wentao Zhu Xiaoxuan Ma Dongwoo Ro Hai Ci Jinlu Zhang Jiaxin Shi Feng Gao Qi Tian Yizhou Wang VGen 152 60 0 20 Jul 2023
Linear Alignment of Vision-language Models for Image Captioning Fabian Paischer M. Hofmarcher Sepp Hochreiter Thomas Adler CLIP VLM 175 0 0 10 Jul 2023
Are Diffusion Models Vision-And-Language Reasoners? Benno Krojer Elinor Poole-Dayan Vikram S. Voleti Christopher Pal Siva Reddy 105 14 0 25 May 2023
Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models Jaewoong Lee Sang-Sub Jang Jaehyeong Jo Jaehong Yoon Yunji Kim Jin-Hwa Kim Jung-Woo Ha Sung Ju Hwang DiffM 77 4 0 04 Apr 2023
FLAME: Free-form Language-based Motion Synthesis & Editing Jihoon Kim Jiseob Kim Sungjoon Choi VGen 125 213 0 01 Sep 2022
Semantic Object Accuracy for Generative Text-to-Image Synthesis Tobias Hinz Stefan Heinrich S. Wermter EGVM 143 159 0 29 Oct 2019