Structure and Content-Guided Video Synthesis with Diffusion Models

6 February 2023

Papers citing "Structure and Content-Guided Video Synthesis with Diffusion Models"

24 / 424 papers shown

Title
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models A. Blattmann Robin Rombach Huan Ling Tim Dockhorn Seung Wook Kim Sanja Fidler Karsten Kreis 3DGS VGen 109 1,016 0 18 Apr 2023
Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation Jie An Songyang Zhang Harry Yang Sonal Gupta Jia-Bin Huang Jiebo Luo Xiaoyue Yin DiffM VGen 38 107 0 17 Apr 2023
Follow Your Pose: Pose-Guided Text-to-Video Generation using Pose-Free Videos Yue Ma Yin-Yin He Xiaodong Cun Xintao Wang Siran Chen Ying Shan Xiu Li Qifeng Chen DiffM VGen 37 177 0 03 Apr 2023
Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models Wen Wang Yan Jiang K. Xie Zide Liu Hao Chen Yue Cao Xinlong Wang Chunhua Shen DiffM VGen 34 112 0 30 Mar 2023
Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators Levon Khachatryan A. Movsisyan Vahram Tadevosyan Roberto Henschel Zhangyang Wang Shant Navasardyan Humphrey Shi VGen 29 542 0 23 Mar 2023
The Shaky Foundations of Clinical Foundation Models: A Survey of Large Language Models and Foundation Models for EMRs Michael Wornow Yizhe Xu Rahul Thapa Birju S. Patel E. Steinberg Scott L. Fleming M. Pfeffer Jason Alan Fries N. Shah LM&MA 28 32 0 22 Mar 2023
Pix2Video: Video Editing using Image Diffusion Duygu Ceylan C. Huang Niloy J. Mitra DiffM VGen 40 245 0 22 Mar 2023
Feature-Conditioned Cascaded Video Diffusion Models for Precise Echocardiogram Synthesis Hadrien Reynaud Mengyun Qiao Mischa Dombrowski Thomas Day Reza Razavi Alberto Gómez Paul Leeson Bernhard Kainz DiffM VGen MedIm 40 22 0 22 Mar 2023
Zero-1-to-3: Zero-shot One Image to 3D Object Ruoshi Liu Rundi Wu Basile Van Hoorick P. Tokmakov Sergey Zakharov Carl Vondrick DiffM 29 1,049 0 20 Mar 2023
FateZero: Fusing Attentions for Zero-shot Text-based Video Editing Chenyang Qi Xiaodong Cun Yong Zhang Chenyang Lei Xintao Wang Ying Shan Qifeng Chen VGen 42 331 0 16 Mar 2023
Edit-A-Video: Single Video Editing with Object-Aware Consistency Chaehun Shin Heeseung Kim Che Hyun Lee Sang-gil Lee Sung-Hoon Yoon DiffM VGen 111 51 0 14 Mar 2023
Video-P2P: Video Editing with Cross-attention Control Shaoteng Liu Yuechen Zhang Wenbo Li Zhe-nan Lin Jiaya Jia DiffM VGen 147 202 0 08 Mar 2023
PRedItOR: Text Guided Image Editing with Diffusion Prior Hareesh Ravi Sachin Kelkar Midhun Harikumar Ajinkya Kale DiffM 60 10 0 15 Feb 2023
SceneScape: Text-Driven Consistent Scene Generation Rafail Fridman Amit Abecasis Yoni Kasten Tali Dekel VGen 45 110 0 02 Feb 2023
Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation Jay Zhangjie Wu Yixiao Ge Xintao Wang Weixian Lei Yuchao Gu Yufei Shi W. Hsu Ying Shan Xiaohu Qie Mike Zheng Shou VGen 56 692 0 22 Dec 2022
Human Motion Diffusion Model Guy Tevet Sigal Raab Brian Gordon Yonatan Shafir Daniel Cohen-Or Amit H. Bermano DiffM VGen 223 724 0 29 Sep 2022
CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers Wenyi Hong Ming Ding Wendi Zheng Xinghan Liu Jie Tang DiffM 256 567 0 29 May 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong Guosheng Lin MLLM BDL VLM CLIP 392 4,154 0 28 Jan 2022
RePaint: Inpainting using Denoising Diffusion Probabilistic Models Andreas Lugmayr Martin Danelljan Andrés Romero Feng Yu Radu Timofte Luc Van Gool DiffM 233 1,355 0 24 Jan 2022
Palette: Image-to-Image Diffusion Models Chitwan Saharia William Chan Huiwen Chang Chris A. Lee Jonathan Ho Tim Salimans David J. Fleet Mohammad Norouzi DiffM VLM 342 1,593 0 10 Nov 2021
Layered Neural Atlases for Consistent Video Editing Yoni Kasten Dolev Ofri-Amar Oliver Wang Tali Dekel VGen 200 160 0 23 Sep 2021
VideoGPT: Video Generation using VQ-VAE and Transformers Wilson Yan Yunzhi Zhang Pieter Abbeel A. Srinivas ViT VGen 245 484 0 20 Apr 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 255 4,796 0 24 Feb 2021
Image-to-Image Translation with Conditional Adversarial Networks Phillip Isola Jun-Yan Zhu Tinghui Zhou Alexei A. Efros SSeg 212 19,455 0 21 Nov 2016