v1v2 (latest)

Video Diffusion Models

7 April 2022

David J. Fleet

Papers citing "Video Diffusion Models"

50 / 1,256 papers shown

Title
The Role of Video Generation in Enhancing Data-Limited Action Understanding Wei Li Dezhao Luo Dongbao Yang Zhenhang Li Weiping Wang Yu Zhou DiffM VGen 285 0 0 26 May 2025
HunyuanVideo-Avatar: High-Fidelity Audio-Driven Human Animation for Multiple Characters Yi Chen Sen Liang Zixiang Zhou Ziyao Huang Yifeng Ma Junshu Tang Qin Lin Yuan Zhou Qinglin Lu VGen 54 0 0 26 May 2025
AniCrafter: Customizing Realistic Human-Centric Animation via Avatar-Background Conditioning in Video Diffusion Models Muyao Niu Mingdeng Cao Yifan Zhan Qingtian Zhu Mingze Ma Jiancheng Zhao Yanhong Zeng Zhihang Zhong Xiao Sun Yinqiang Zheng DiffM VGen 66 0 0 26 May 2025
Long-Context State-Space Video World Models Ryan Po Yotam Nitzan Richard Zhang Berlin Chen Tri Dao Eli Shechtman Gordon Wetzstein Xun Huang 64 2 0 26 May 2025
Adaptive Diffusion Guidance via Stochastic Optimal Control Iskander Azangulov Peter Potaptchik Qinyu Li Eddie Aamari George Deligiannidis Judith Rousseau 25 0 0 25 May 2025
From Single Images to Motion Policies via Video-Generation Environment Representations Weiming Zhi Ziyong Ma Tianyi Zhang Matthew Johnson-Roberson VGen 3DV 120 0 0 25 May 2025
DiffusionRL: Efficient Training of Diffusion Policies for Robotic Grasping Using RL-Adapted Large-Scale Datasets Maria Makarova Qian Liu Dzmitry Tsetserukou 35 0 0 24 May 2025
One Policy but Many Worlds: A Scalable Unified Policy for Versatile Humanoid Locomotion Yahao Fan Tianxiang Gui Kaiyang Ji Shutong Ding C. Zhang Jiayuan Gu Jingyi Yu Jingya Wang Ye-ling Shi VGen 95 0 0 24 May 2025
FLEX: A Backbone for Diffusion-Based Modeling of Spatio-temporal Physical Systems N. Benjamin Erichson Vinicius Mikuni Dongwei Lyu Yang Gao Omri Azencot Soon Hoe Lim Michael W. Mahoney AI4CE 898 0 0 23 May 2025
Scaling Image and Video Generation via Test-Time Evolutionary Search Haoran He Jiajun Liang X. Wang Pengfei Wan Di Zhang Kun Gai Ling Pan DiffM 242 0 0 23 May 2025
Variational Autoencoding Discrete Diffusion with Enhanced Dimensional Correlations Modeling Tianyu Xie Shuchen Xue Zijin Feng Tianyang Hu Jiacheng Sun Zhenguo Li Cheng Zhang DiffM 779 0 0 23 May 2025
A Minimalist Method for Fine-tuning Text-to-Image Diffusion Models Yanting Miao William Loh Suraj Kothawade Pacal Poupart 45 0 0 23 May 2025
DanceTogether! Identity-Preserving Multi-Person Interactive Video Generation Junhao Chen Mingjin Chen Jianjin Xu Xiang Li Junting Dong ... Hongxiang Li Yuhang Yang Hao Zhao Xiaoxiao Long Ruqi Huang DiffM VGen 77 0 0 23 May 2025
UniDB++: Fast Sampling of Unified Diffusion Bridge Mokai Pan Kaizhen Zhu Yuexin Ma Yanwei Fu Jingyi Yu Jingya Wang Ye Shi 55 0 0 23 May 2025
T2VUnlearning: A Concept Erasing Method for Text-to-Video Diffusion Models Xiaoyu Ye Songjie Cheng Yongtao Wang Yajiao Xiong Yishen Li DiffM 192 0 0 23 May 2025
Flow Matching based Sequential Recommender Model Feng Liu Lixin Zou Xiangyu Zhao Min Tang Liming Dong Dan Luo Xiangyang Luo Chenliang Li DiffM 84 0 0 22 May 2025
Bigger Isn't Always Memorizing: Early Stopping Overparameterized Diffusion Models Alessandro Favero Antonio Sclocchi Matthieu Wyart DiffM 81 0 0 22 May 2025
Temporal Differential Fields for 4D Motion Modeling via Image-to-Video Synthesis Xin You Minghui Zhang Hanxiao Zhang J. Yang Nassir Navab DiffM VGen MedIm 236 0 0 22 May 2025
Consistent World Models via Foresight Diffusion Yu Zhang Xingzhuo Guo Haoran Xu Mingsheng Long 57 0 0 22 May 2025
REPA Works Until It Doesn't: Early-Stopped, Holistic Alignment Supercharges Diffusion Training Ziqiao Wang Wangbo Zhao Yuhao Zhou Zekai Li Zhiyuan Liang ... Pengfei Zhou Kai Zhang Zhangyang Wang Kai Wang Yang You 92 0 0 22 May 2025
Programmatic Video Prediction Using Large Language Models Hao Tang Kevin Ellis Suhas Lohit Michael J. Jones Moitreya Chatterjee VGen 104 0 0 20 May 2025
Vid2World: Crafting Video Diffusion Models to Interactive World Models Siqiao Huang Jialong Wu Qixing Zhou Shangchen Miao Mingsheng Long VGen 62 0 0 20 May 2025
Learning to Integrate Diffusion ODEs by Averaging the Derivatives Wenze Liu Xiangyu Yue 82 0 0 20 May 2025
Constraint-Aware Diffusion Guidance for Robotics: Real-Time Obstacle Avoidance for Autonomous Racing Hao Ma Sabrina Bodmer Andrea Carron Melanie Zeilinger Michael Muehlebach 69 0 0 19 May 2025
One-Step Offline Distillation of Diffusion-based Models via Koopman Modeling Nimrod Berman Ilan Naiman Moshe Eliasof Hedi Zisling Omri Azencot DiffM OffRL 82 0 0 19 May 2025
Seeing the Unseen: How EMoE Unveils Bias in Text-to-Image Diffusion Models Lucas Berry Axel Brando Wei-Di Chang Juan Camilo Gamboa Higuera David Meger DiffM 58 0 0 19 May 2025
RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers Ahmet Berke Gokmen Yigit Ekin Bahri Batuhan Bilecen Aysegül Dündar 164 0 0 19 May 2025
Video-GPT via Next Clip Diffusion Shaobin Zhuang Zhipeng Huang Ying Zhang Fangyikang Wang Canmiao Fu Binxin Yang Chong Sun Chen Li Yali Wang DiffM VGen 243 0 0 18 May 2025
Robust Planning for Autonomous Driving via Mixed Adversarial Diffusion Predictions Albert Zhao Stefano Soatto DiffM 138 0 0 18 May 2025
Bootstrapping Diffusion: Diffusion Model Training Leveraging Partial and Corrupted Data Xudong Ma 76 0 0 17 May 2025
DiCo: Revitalizing ConvNets for Scalable and Efficient Diffusion Modeling Yuang Ai Qihang Fan Xuefeng Hu Zhenheng Yang Ran He Huaibo Huang DiffM 90 0 0 16 May 2025
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation Yanbo Ding Xirui Hu Zhizhi Guo Yansen Wang Yali Wang DiffM VGen 153 0 0 15 May 2025
EventDiff: A Unified and Efficient Diffusion Model Framework for Event-based Video Frame Interpolation Hanle Zheng Xujie Han Zegang Peng Shangbin Zhang Guangxun Du Zhuo Zou Xiang Wang Jibin Wu Hao Guo Lei Deng DiffM VGen 85 0 0 13 May 2025
CHD: Coupled Hierarchical Diffusion for Long-Horizon Tasks Ce Hao Anxing Xiao Zhiwei Xue Harold Soh 180 0 0 12 May 2025
Pixel Motion as Universal Representation for Robot Control Kanchana Ranasinghe Xiang Li Cristina Mata J. Park Michael S. Ryoo VGen 79 0 0 12 May 2025
Generative Pre-trained Autoregressive Diffusion Transformer Yuan Zhang Jiacheng Jiang Guoqing Ma Zhiying Lu Haoyang Huang Jianlong Yuan Nan Duan VGen 138 2 0 12 May 2025
You Only Look One Step: Accelerating Backpropagation in Diffusion Sampling with Gradient Shortcuts Hongkun Dou Zeyu Li Xingyu Jiang Haoyang Li Lijun Yang Wen Yao Yue Deng DiffM 236 0 0 12 May 2025
ProFashion: Prototype-guided Fashion Video Generation with Multiple Reference Images Xianghao Kong Qiaosong Qi Yuanbin Wang Anyi Rao Biaolong Chen Aixi Zhang Si Liu Hao Jiang DiffM VGen 67 1 0 10 May 2025
T2VTextBench: A Human Evaluation Benchmark for Textual Control in Video Generation Models Xuyang Guo Jiayan Huo Zhenmei Shi Zhao Song Jiahao Zhang Jiale Zhao VGen 503 2 0 08 May 2025
SVAD: From Single Image to 3D Avatar via Synthetic Data Generation with Video Diffusion and Data Augmentation Yonwoo Choi 3DGS VGen 119 0 0 08 May 2025
DualReal: Adaptive Joint Training for Lossless Identity-Motion Fusion in Video Customization Wenchuan Wang Mengqi Huang Yijing Tu Zhendong Mao VGen 128 0 0 04 May 2025
FreePCA: Integrating Consistency Information across Long-short Frames in Training-free Long Video Generation via Principal Component Analysis Jiangtong Tan Hu Yu Jie Huang Jie Xiao Feng Zhao 138 1 0 02 May 2025
VIDSTAMP: A Temporally-Aware Watermark for Ownership and Integrity in Video Diffusion Models Mohammadreza Teymoorianfard Shiqing Ma Amir Houmansadr WIGM 132 0 0 02 May 2025
KeySync: A Robust Approach for Leakage-free Lip Synchronization in High Resolution Antoni Bigata Rodrigo Mira Stella Bounareli Michał Stypułkowski Konstantinos Vougioukas Stavros Petridis Maja Pantic 105 1 0 01 May 2025
T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation Xuyang Guo Jiayan Huo Zhenmei Shi Zhao Song Jiahao Zhang Jiale Zhao EGVM VGen PINN 193 5 0 01 May 2025
A Survey of Interactive Generative Video Jiwen Yu Yiran Qin Haoxuan Che Quande Liu Xinyu Wang Pengfei Wan Di Zhang Kun Gai Hao Chen Xihui Liu VGen 109 3 0 30 Apr 2025
Direct Motion Models for Assessing Generated Videos Kelsey R. Allen Carl Doersch Guangyao Zhou Mohammed Suhail Danny Driess ... Thomas Kipf Mehdi S. M. Sajjadi Kevin P. Murphy João Carreira Sjoerd van Steenkiste EGVM DiffM VGen 163 0 0 30 Apr 2025
ReVision: High-Quality, Low-Cost Video Generation with Explicit 3D Physics Modeling for Complex Motion and Interaction Qihao Liu Ju He Qihang Yu Liang-Chieh Chen Alan Yuille DiffM VGen 166 1 0 30 Apr 2025
ADiff4TPP: Asynchronous Diffusion Models for Temporal Point Processes Amartya Mukherjee Ruizhi Deng He Zhao Yuzhen Mao Leonid Sigal Frederick Tung DiffM AI4TS 111 0 0 29 Apr 2025
Global Stress Generation and Spatiotemporal Super-Resolution Physics-Informed Operator under Dynamic Loading for Two-Phase Random Materials Tengfei Xing Xiaodan Ren Jie Li DiffM 81 0 0 26 Apr 2025