L-Verse: Bidirectional Generation Between Image and Text

L-Verse: Bidirectional Generation Between Image and Text

22 November 2021

Papers citing "L-Verse: Bidirectional Generation Between Image and Text"

16 / 16 papers shown

Title
Video-GPT via Next Clip Diffusion Shaobin Zhuang Zhipeng Huang Ying Zhang Fangyikang Wang Canmiao Fu Binxin Yang Chong Sun Chen Li Yali Wang DiffM VGen 18 0 0 18 May 2025
TiBiX: Leveraging Temporal Information for Bidirectional X-ray and Report Generation Santosh Sanjeev F. Maani Arsen Abzhanov Vijay Ram Papineni Ibrahim Almakky Bartlomiej W. Papie.z Mohammad Yaqub MedIm 58 0 0 20 Mar 2024
ToViLaG: Your Visual-Language Generative Model is Also An Evildoer Xinpeng Wang Xiaoyuan Yi Han Jiang Shanlin Zhou Zhihua Wei Xing Xie 33 13 0 13 Dec 2023
Generating Realistic Images from In-the-wild Sounds Taegyeong Lee Jeonghun Kang Hyeonyu Kim Taehwan Kim DiffM 32 3 0 05 Sep 2023
Story Visualization by Online Text Augmentation with Context Memory Daechul Ahn Daneul Kim Gwangmo Song Seung Wook Kim Honglak Lee Dongyeop Kang Jonghyun Choi DiffM 19 5 0 15 Aug 2023
Vision + Language Applications: A Survey Yutong Zhou N. Shimada VLM 35 6 0 24 May 2023
CoBIT: A Contrastive Bi-directional Image-Text Generation Model Haoxuan You Mandy Guo Zhecan Wang Kai-Wei Chang Jason Baldridge Jiahui Yu DiffM 54 13 0 23 Mar 2023
MAGVLT: Masked Generative Vision-and-Language Transformer Sungwoong Kim DaeJin Jo Donghoon Lee Jongmin Kim VLM 47 12 0 21 Mar 2023
MOSO: Decomposing MOtion, Scene and Object for Video Prediction M. Sun Weining Wang Xinxin Zhu Jing Liu 21 14 0 07 Mar 2023
Vector Quantized Wasserstein Auto-Encoder Tung-Long Vuong Trung Le He Zhao Chuanxia Zheng Mehrtash Harandi Jianfei Cai Dinh Q. Phung DRL 45 17 0 12 Feb 2023
Do DALL-E and Flamingo Understand Each Other? Hang Li Jindong Gu Rajat Koner Sahand Sharifzadeh Volker Tresp MLLM 21 12 0 23 Dec 2022
Unified Discrete Diffusion for Simultaneous Vision-Language Generation Minghui Hu Chuanxia Zheng Heliang Zheng Tat-Jen Cham Chaoyue Wang Zuopeng Yang Dacheng Tao Ponnuthurai Nagaratnam Suganthan DiffM 25 23 0 27 Nov 2022
Large-Scale Bidirectional Training for Zero-Shot Image Captioning Taehoon Kim Mark A Marsden Pyunghwan Ahn Sangyun Kim Sihaeng Lee Alessandra Sala S. Kim VLM 32 4 0 13 Nov 2022
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 255 4,805 0 24 Feb 2021
A Style-Based Generator Architecture for Generative Adversarial Networks Tero Karras S. Laine Timo Aila 306 10,378 0 12 Dec 2018
Deep Reinforcement Learning for Dialogue Generation Jiwei Li Will Monroe Alan Ritter Michel Galley Jianfeng Gao Dan Jurafsky 220 1,328 0 05 Jun 2016