Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation

22 December 2022

Ying Shan

Papers citing "Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation"

50 / 564 papers shown

Title
DiCo: Revitalizing ConvNets for Scalable and Efficient Diffusion Modeling Yuang Ai Qihang Fan Xuefeng Hu Zhenheng Yang Ran He Huaibo Huang DiffM 14 0 0 16 May 2025
ACT-R: Adaptive Camera Trajectories for 3D Reconstruction from Single Image Yishuo Wang Mingrui Zhao Ali Mahdavi Amiri Hao Zhang 23 0 0 13 May 2025
TT-DF: A Large-Scale Diffusion-Based Dataset and Benchmark for Human Body Forgery Detection Wenkui Yang Zhida Zhang Xiaoqiang Zhou Junxian Duan Jie Cao DiffM 28 0 0 13 May 2025
ShotAdapter: Text-to-Multi-Shot Video Generation with Diffusion Models Ozgur Kara Krishna Kumar Singh Feng Liu Duygu Ceylan James M. Rehg Tobias Hinz DiffM VGen 41 0 0 12 May 2025
ProFashion: Prototype-guided Fashion Video Generation with Multiple Reference Images Xianghao Kong Qiaosong Qi Yuanbin Wang Anyi Rao Biaolong Chen Aixi Zhang Si Liu Hao Jiang DiffM VGen 25 0 0 10 May 2025
T2VTextBench: A Human Evaluation Benchmark for Textual Control in Video Generation Models Xuyang Guo Jiayan Huo Zhenmei Shi Zhao-quan Song Jiahao Zhang Jiale Zhao VGen 165 0 0 08 May 2025
DualReal: Adaptive Joint Training for Lossless Identity-Motion Fusion in Video Customization Wenchuan Wang Mengqi Huang Yijing Tu Zhendong Mao VGen 69 0 0 04 May 2025
FreePCA: Integrating Consistency Information across Long-short Frames in Training-free Long Video Generation via Principal Component Analysis Jiangtong Tan Hu Yu Jie Huang Jie Xiao Feng Zhao 72 1 0 02 May 2025
Multi-Modal Language Models as Text-to-Image Model Evaluators Jiahui Chen Candace Ross Reyhane Askari Hemmat Koustuv Sinha Melissa Hall M. Drozdzal Adriana Romero-Soriano EGVM 60 0 0 01 May 2025
T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation Xuyang Guo Jiayan Huo Zhenmei Shi Zhao-quan Song Jiahao Zhang Jiale Zhao EGVM VGen PINN 82 1 0 01 May 2025
Controllable Weather Synthesis and Removal with Video Diffusion Models Chih-Hao Lin Zhilin Wang Ruofan Liang Yuxuan Zhang Sanja Fidler Shenlong Wang Zan Gojcic DiffM VGen 48 0 0 01 May 2025
Direct Motion Models for Assessing Generated Videos Kelsey R. Allen Carl Doersch Guangyao Zhou Mohammed Suhail Danny Driess ... Thomas Kipf Mehdi S. M. Sajjadi Kevin P. Murphy João Carreira Sjoerd van Steenkiste EGVM DiffM VGen 78 0 0 30 Apr 2025
NoiseController: Towards Consistent Multi-view Video Generation via Noise Decomposition and Collaboration Haotian Dong Qing Guo Dahua Lin Yipeng Wu Qin Chen R. Liu Kairui Yang Ping Li Qing-Wu Guo VGen 47 0 0 25 Apr 2025
T2VShield: Model-Agnostic Jailbreak Defense for Text-to-Video Models Siyuan Liang Jiayang Liu Jiecheng Zhai Tianmeng Fang Rongcheng Tu A. Liu Xiaochun Cao Dacheng Tao VGen 61 0 0 22 Apr 2025
Efficient Temporal Consistency in Diffusion-Based Video Editing with Adaptor Modules: A Theoretical Framework Xinyuan Song Yangfan He Sida Li Jun Wang Hongyang He ... Keqin Li Kuan Lu Menghao Huo Binxu Li Pei Liu DiffM 37 0 0 22 Apr 2025
Satellite to GroundScape -- Large-scale Consistent Ground View Generation from Satellite Views Ningli Xu R. Qin DiffM 29 0 0 22 Apr 2025
Visual Prompting for One-shot Controllable Video Editing without Inversion Zhengbo Zhang Yuxi Zhou Duo Peng Joo-Hwee Lim Zhigang Tu De Wen Soh Lin Geng Foo DiffM 47 1 0 19 Apr 2025
Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification Xiao Jin Zihan Wang Zhenhua Yu Changrak Choi Kalind Carpenter T. Nanayakkara 40 0 0 17 Apr 2025
EgoExo-Gen: Ego-centric Video Prediction by Watching Exo-centric Videos J. Xu Y. Huang Baoqi Pei Junlin Hou Qingqiu Li Guo Chen Y. Zhang Rui Feng Weidi Xie DiffM 51 1 0 16 Apr 2025
Understanding Attention Mechanism in Video Diffusion Models Bingyan Liu Chengyu Wang Tongtong Su Huan Ten Jun Huang K. Guo Kui Jia VGen 64 0 0 16 Apr 2025
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation Yukang Lin Y. Hong Zunnan Xu X. Li Chao Xu ... Jun Lan Huijia Zhu Weiqiang Wang Jianfu Zhang Xiu Li VGen 48 0 0 15 Apr 2025
Taming Consistency Distillation for Accelerated Human Image Animation Xinyu Wang Shiwei Zhang Hangjie Yuan Yujie Wei Yang Zhang Changxin Gao Yuehuan Wang Nong Sang VGen 32 0 0 15 Apr 2025
OmniVDiff: Omni Controllable Video Diffusion for Generation and Understanding Dianbing Xi J. Wang Yuanzhi Liang Xi Qiu Yuchi Huo R. Wang Chi Zhang Xuzhao Li DiffM VGen 65 0 0 15 Apr 2025
CamMimic: Zero-Shot Image To Camera Motion Personalized Video Generation Using Diffusion Models P. Guhan D. Kothandaraman Tsung-Wei Huang Guan-Ming Su Dinesh Manocha DiffM VGen 36 0 0 13 Apr 2025
In-2-4D: Inbetweening from Two Single-View Images to 4D Generation Sauradip Nag Daniel Cohen-Or Hao Zhang Ali Mahdavi-Amiri DiffM VGen 41 0 0 11 Apr 2025
Video-Bench: Human-Aligned Video Generation Benchmark Hui Han Siyuan Li Jiaqi Chen Yiwen Yuan Yuling Wu ... Y. Li Jingyang Zhang Chi Zhang Li Li Yongxin Ni EGVM VGen 73 0 0 07 Apr 2025
Can You Count to Nine? A Human Evaluation Benchmark for Counting Limits in Modern Text-to-Video Models Xuyang Guo Zekai Huang Jiayan Huo Yingyu Liang Zhenmei Shi Zhao-quan Song Jiahao Zhang ALM VGen 96 2 0 05 Apr 2025
ConMo: Controllable Motion Disentanglement and Recomposition for Zero-Shot Motion Transfer Jiayi Gao Zijin Yin Changcheng Hua Yuxin Peng Kongming Liang Zhanyu Ma J. Guo Yang Liu VGen DiffM 38 0 0 03 Apr 2025
FreSca: Unveiling the Scaling Space in Diffusion Models Chao Huang Susan Liang Yunlong Tang Li Ma Yapeng Tian Chenliang Xu DiffM 48 0 0 02 Apr 2025
IntrinsiX: High-Quality PBR Generation using Image Priors Peter Kocsis Lukas Höllein Matthias Nießner 39 0 0 01 Apr 2025
Beyond Wide-Angle Images: Unsupervised Video Portrait Correction via Spatiotemporal Diffusion Adaptation Wenbo Nie Lang Nie Chunyu Lin Jianfei Chen Ke Xing Jiyuan Wang Yao Zhao DiffM VGen 53 0 0 01 Apr 2025
JointTuner: Appearance-Motion Adaptive Joint Training for Customized Video Generation Fangda Chen Shanshan Zhao Chuanfu Xu Long Lan VGen 46 0 0 31 Mar 2025
Follow Your Motion: A Generic Temporal Consistency Portrait Editing Framework with Trajectory Guidance Haijie Yang Z. Zhang Hao Tang Jianjun Qian Jian Yang DiffM VGen 54 0 0 28 Mar 2025
Exploring the Evolution of Physics Cognition in Video Generation: A Survey Minghui Lin Xiang Wang Yixuan Wang Shu Wang Fengqi Dai ... Cunxiang Wang Zhengrong Zuo Nong Sang Siteng Huang Donglin Wang EGVM VGen 87 3 0 27 Mar 2025
Can Video Diffusion Model Reconstruct 4D Geometry? Jinjie Mai Wenxuan Zhu Haozhe Liu Bing Li Cheng Zheng Jürgen Schmidhuber Bernard Ghanem VGen MDE 74 0 0 27 Mar 2025
EfficientMT: Efficient Temporal Adaptation for Motion Transfer in Text-to-Video Diffusion Models Yufei Cai Hu Han Yuxiang Wei Shiguang Shan Xilin Chen DiffM VGen 65 0 0 25 Mar 2025
ICE: Intrinsic Concept Extraction from a Single Image via Diffusion Models Fernando Julio Cendra Kai Han VLM 58 0 0 25 Mar 2025
Resource-Efficient Motion Control for Video Generation via Dynamic Mask Guidance Sicong Feng Jielong Yang Li Peng DiffM VGen 51 0 0 24 Mar 2025
InstructVEdit: A Holistic Approach for Instructional Video Editing Chi Zhang C. Feng Feng Yan Qiming Zhang Mingjin Zhang Yujie Zhong Jing Zhang Lin Ma DiffM VGen 44 0 0 22 Mar 2025
Re-HOLD: Video Hand Object Interaction Reenactment via adaptive Layout-instructed Diffusion Model Yingying Fan Quanwei Yang Kaisiyuan Wang Hang Zhou Yingying Li Haocheng Feng Errui Ding Y. Wu J. Wang DiffM 49 0 0 21 Mar 2025
Decouple and Track: Benchmarking and Improving Video Diffusion Transformers for Motion Transfer Qingyu Shi Jianzong Wu Jinbin Bai Jingyang Zhang Lu Qi Xiaomeng Li Yunhai Tong 48 0 0 21 Mar 2025
BlockDance: Reuse Structurally Similar Spatio-Temporal Features to Accelerate Diffusion Transformers Hui Zhang Tingwei Gao Jie Shao Zuxuan Wu 69 0 0 20 Mar 2025
MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance Quanhao Li Zhen Xing Rui Wang Hui Zhang Qi Dai Zuxuan Wu VGen 66 0 0 20 Mar 2025
How to Train Your Dragon: Automatic Diffusion-Based Rigging for Characters with Diverse Topologies Zeqi Gu Difan Liu Timothy Langlois Matthew Fisher Abe Davis DiffM 3DH 62 0 0 19 Mar 2025
Impossible Videos Zechen Bai Hai Ci Mike Zheng Shou EGVM VGen 72 0 0 18 Mar 2025
FiVE: A Fine-grained Video Editing Benchmark for Evaluating Emerging Diffusion and Rectified Flow Models Minghan Li C. Xie Yongpeng Wu Lei Zhang Hao Wu DiffM VGen 59 0 0 17 Mar 2025
VTON 360: High-Fidelity Virtual Try-On from Any Viewing Direction Zijian He Yuwei Ning Yipeng Qin Wangrun Wang Sibei Yang Liang Lin G. Li 66 1 0 15 Mar 2025
PSF-4D: A Progressive Sampling Framework for View Consistent 4D Editing H. Iqbal Nazmul Karim Umar Khalid Azib Farooq Z. Zhong Jing Hua Chen Chen DiffM 3DGS VGen 47 0 0 14 Mar 2025
DreamInsert: Zero-Shot Image-to-Video Object Insertion from A Single Image Qi Zhao Zhan Ma Pan Zhou VGen 75 0 0 13 Mar 2025
On the Generalization Properties of Diffusion Models Puheng Li Zhong Li Huishuai Zhang Jiang Bian 74 29 0 13 Mar 2025