Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation

22 December 2022

Ying Shan

Papers citing "Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation"

50 / 565 papers shown

Title
Blended Latent Diffusion under Attention Control for Real-World Video Editing Deyin Liu Lin Yuanbo Wu Xianghua Xie DiffM 46 0 0 05 Sep 2024
SVP: Style-Enhanced Vivid Portrait Talking Head Diffusion Model Weipeng Tan Chuming Lin Chengming Xu Xiaozhong Ji Junwei Zhu Chengjie Wang Yanwei Fu DiffM 41 0 0 05 Sep 2024
Efficient Image Restoration through Low-Rank Adaptation and Stable Diffusion XL Haiyang Zhao DiffM 26 0 0 30 Aug 2024
One-Shot Learning Meets Depth Diffusion in Multi-Object Videos Anisha Jain VGen DiffM MDE 29 1 0 29 Aug 2024
Alignment is All You Need: A Training-free Augmentation Strategy for Pose-guided Video Generation Xiaoyu Jin Zunnan Xu Mingwen Ou Wenming Yang DiffM 43 7 0 29 Aug 2024
Merging and Splitting Diffusion Paths for Semantically Coherent Panoramas Fabio Quattrini Vittorio Pippi Silvia Cascianelli Rita Cucchiara 45 3 0 28 Aug 2024
GenRec: Unifying Video Generation and Recognition with Diffusion Models Zejia Weng Xitong Yang Zhen Xing Zuxuan Wu Yu-Gang Jiang VGen DiffM 45 5 0 27 Aug 2024
Generative Inbetweening: Adapting Image-to-Video Models for Keyframe Interpolation Xiaojuan Wang Boyang Zhou Brian L. Curless Ira Kemelmacher-Shlizerman Aleksander Holynski Steven M. Seitz DiffM 61 10 0 27 Aug 2024
ConceptMix: A Compositional Image Generation Benchmark with Controllable Difficulty Xindi Wu Dingli Yu Yangsibo Huang Olga Russakovsky Sanjeev Arora CoGe EGVM 51 12 0 26 Aug 2024
Task-Oriented Diffusion Inversion for High-Fidelity Text-based Editing Yangyang Xu Wenqi Shao Yong Du Haiming Zhu Yang Zhou Ping Luo Shengfeng He DiffM 44 2 0 23 Aug 2024
Show-o: One Single Transformer to Unify Multimodal Understanding and Generation Jinheng Xie Weijia Mao Zechen Bai David Junhao Zhang Weihao Wang Kevin Qinghong Lin Yuchao Gu Zhijie Chen Zhenheng Yang Mike Zheng Shou 57 164 0 22 Aug 2024
Real-Time Video Generation with Pyramid Attention Broadcast Xuanlei Zhao Xiaolong Jin Kai Wang Yang You VGen DiffM 77 32 0 22 Aug 2024
Factorized-Dreamer: Training A High-Quality Video Generator with Limited and Low-Quality Data Tao Yang Yangming Shi Yunwen Huang Feng Chen Yin Zheng Lei Zhang DiffM VGen 64 0 0 19 Aug 2024
The Dawn of KAN in Image-to-Image (I2I) Translation: Integrating Kolmogorov-Arnold Networks with GANs for Unpaired I2I Translation Arpan Mahara N. Rishe Liangdong Deng VLM GAN 45 2 0 15 Aug 2024
DeCo: Decoupled Human-Centered Diffusion Video Editing with Motion Consistency Xiaojing Zhong Xinyi Huang Xiaofeng Yang Guosheng Lin Qingyao Wu DiffM 43 3 0 14 Aug 2024
High-fidelity and Lip-synced Talking Face Synthesis via Landmark-based Diffusion Model Weizhi Zhong Junfan Lin Peixin Chen Liang Lin Guanbin Li 39 1 0 10 Aug 2024
Explainable and Controllable Motion Curve Guided Cardiac Ultrasound Video Generation Junxuan Yu Rusi Chen Yongsong Zhou Yanlin Chen Yaofei Duan Yuhao Huang Han Zhou Tan Tao Xin Yang Dong Ni MedIm DiffM VGen 29 2 0 31 Jul 2024
Fine-gained Zero-shot Video Sampling Dengsheng Chen Jie Hu Javier Segovia-Aguas Enhua Wu VGen DiffM 29 0 0 31 Jul 2024
Benchmarking AIGC Video Quality Assessment: A Dataset and Unified Model Zhichao Zhang Xinyue Li Wei Sun Jun Jia Xiongkuo Min ... Puyi Wang Zhongpeng Ji Fengyu Sun Shangling Jui Guangtao Zhai EGVM 53 5 0 31 Jul 2024
Segment Anything for Videos: A Systematic Survey Chunhui Zhang Yawen Cui Weilin Lin Guanjie Huang Yan Rong Li Liu Shiguang Shan VLM 47 6 0 31 Jul 2024
Text2LiDAR: Text-guided LiDAR Point Cloud Generation via Equirectangular Transformer Yang Wu Kaihua Zhang Jianjun Qian Jin Xie Jian Yang DiffM 47 4 0 29 Jul 2024
Faster Image2Video Generation: A Closer Look at CLIP Image Embedding's Impact on Spatio-Temporal Cross-Attentions Ashkan Taghipour Morteza Ghahremani Bennamoun Aref Miri Rekavandi Zinuo Li Hamid Laga F. Boussaïd VGen 79 2 0 27 Jul 2024
Assessing Sample Quality via the Latent Space of Generative Models Jingyi Xu Hieu M. Le Dimitris Samaras MedIm 39 2 0 21 Jul 2024
DiffuX2CT: Diffusion Learning to Reconstruct CT Images from Biplanar X-Rays Xuhui Liu Zhi Qiao Runkun Liu Hong Li Juan Zhang Xiantong Zhen Zhen Qian Baochang Zhang MedIm 45 2 0 18 Jul 2024
InVi: Object Insertion In Videos Using Off-the-Shelf Diffusion Models Nirat Saini Navaneeth Bodla Ashish Shrivastava Avinash Ravichandran Xiao Zhang Abhinav Shrivastava Bharat Singh DiffM 29 1 0 15 Jul 2024
Live2Diff: Live Stream Translation via Uni-directional Attention in Video Diffusion Models Zhening Xing Gereon Fox Yanhong Zeng Xingang Pan Mohamed A. Elgharib Christian Theobalt Kai Chen VGen 27 3 0 11 Jul 2024
ConceptExpress: Harnessing Diffusion Models for Single-image Unsupervised Concept Extraction Shaozhe Hao Kai Han Zhengyao Lv Shihao Zhao Kwan-Yee K. Wong DiffM CoGe 36 5 0 09 Jul 2024
Mobius: A High Efficient Spatial-Temporal Parallel Training Paradigm for Text-to-Video Generation Task Yiran Yang Jinchao Zhang Ying Deng Jie Zhou DiffM 31 0 0 09 Jul 2024
GVDIFF: Grounded Text-to-Video Generation with Diffusion Models Huanzhang Dou Ruixiang Li Wei Su Xi Li DiffM 42 1 0 02 Jul 2024
Zero-Shot Video Restoration and Enhancement Using Pre-Trained Image Diffusion Model Cong Cao Huanjing Yue Xin Liu Jingyu Yang DiffM VGen 54 1 0 02 Jul 2024
MIGC++: Advanced Multi-Instance Generation Controller for Image Synthesis Dewei Zhou Y. Li Fan Ma Zongxin Yang Yi Yang 101 11 0 02 Jul 2024
DiffIR2VR-Zero: Zero-Shot Video Restoration with Diffusion-based Image Restoration Models Chang-Han Yeh Chin-Yang Lin Zhixiang Wang Chi-Wei Hsiao Ting-Hsuan Chen Hau-Shiang Shiu Yu-Lun Liu VGen DiffM 57 5 0 01 Jul 2024
SVG: 3D Stereoscopic Video Generation via Denoising Frame Matrix Peng Dai Feitong Tan Qiangeng Xu David Futschik Ruofei Du S. Fanello Xiaojuan Qi Yinda Zhang VGen 25 4 0 29 Jun 2024
OccFusion: Rendering Occluded Humans with Generative Diffusion Priors Adam Sun Tiange Xiang Scott Delp Li Fei-Fei Ehsan Adeli 36 2 0 29 Jun 2024
MimicMotion: High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance Yuang Zhang Jiaxi Gu Li-Wen Wang Han Wang Junqi Cheng Yuefeng Zhu Fangyuan Zou VGen 64 66 0 28 Jun 2024
ScoreFusion: Fusing Score-based Generative Models via Kullback-Leibler Barycenters Hao Liu Junze Tony Ye Ye Jose H. Blanchet DiffM FedML 36 1 0 28 Jun 2024
Diffusion Model-Based Video Editing: A Survey Wenhao Sun Rong-Cheng Tu Jingyi Liao Dacheng Tao VGen 66 22 0 26 Jun 2024
Text-Animator: Controllable Visual Text Video Generation Lin Liu Quande Liu Shengju Qian Yuan Zhou Wengang Zhou Houqiang Li Lingxi Xie Qi Tian VGen 33 1 0 25 Jun 2024
MotionBooth: Motion-Aware Customized Text-to-Video Generation Jianzong Wu Xiangtai Li Yanhong Zeng J. J. Zhang Qianyu Zhou Yining Li Yunhai Tong Kai Chen DiffM VGen 78 40 0 25 Jun 2024
SyncNoise: Geometrically Consistent Noise Prediction for Text-based 3D Scene Editing Ruihuang Li Liyi Chen Zhengqiang Zhang Varun Jampani Vishal M. Patel Lei Zhang DiffM 42 0 0 25 Jun 2024
FreeTraj: Tuning-Free Trajectory Control in Video Diffusion Models Haonan Qiu Zhaoxi Chen Zhouxia Wang Yingqing He Menghan Xia Ziwei Liu VGen DiffM 39 17 0 24 Jun 2024
GenAI-Bench: Evaluating and Improving Compositional Text-to-Visual Generation Baiqi Li Zhiqiu Lin Deepak Pathak Jiayao Li Yixin Fei ... Tiffany Ling Xide Xia Pengchuan Zhang Graham Neubig Deva Ramanan EGVM 52 25 0 19 Jun 2024
4K4DGen: Panoramic 4D Generation at 4K Resolution Renjie Li Panwang Pan Bangbang Yang Dejia Xu Shijie Zhou Xuanyang Zhang Zeming Li A. Kadambi Zhangyang Wang Zhiwen Fan VGen 59 16 0 19 Jun 2024
VIA: Unified Spatiotemporal Video Adaptation Framework for Global and Local Video Editing Jing Gu Yuwei Fang Ivan Skorokhodov Peter Wonka Xinya Du Sergey Tulyakov Xin Eric Wang 45 1 0 18 Jun 2024
A Comprehensive Taxonomy and Analysis of Talking Head Synthesis: Techniques for Portrait Generation, Driving Mechanisms, and Editing Ming Meng Yufei Zhao Bo Zhang Yonggui Zhu Weimin Shi Maxwell Wen Zhaoxin Fan VGen 42 1 0 15 Jun 2024
L4GM: Large 4D Gaussian Reconstruction Model Jiawei Ren Kevin Xie Ashkan Mirzaei Hanxue Liang Xiaohui Zeng ... Ziwei Liu Antonio Torralba Sanja Fidler Seung Wook Kim Huan Ling 3DGS 27 37 0 14 Jun 2024
Training-free Camera Control for Video Generation Chen Hou Guoqiang Wei VGen DiffM 78 31 0 14 Jun 2024
Instruct 4D-to-4D: Editing 4D Scenes as Pseudo-3D Scenes Using 2D Diffusion Linzhan Mou Jun-Kun Chen Yu-Xiong Wang VGen DiffM 38 10 0 13 Jun 2024
COVE: Unleashing the Diffusion Feature Correspondence for Consistent Video Editing Jiangshan Wang Yue Ma Jiayi Guo Yicheng Xiao Gao Huang Xiu Li DiffM 31 17 0 13 Jun 2024
Rethinking Human Evaluation Protocol for Text-to-Video Models: Enhancing Reliability,Reproducibility, and Practicality Tianle Zhang Langtian Ma Yuchen Yan Yuchen Zhang Kai Wang ... Wenqi Shao Yang You Yu Qiao Ping Luo Kaipeng Zhang VGen 72 2 0 13 Jun 2024