v1v2 (latest)

Video Diffusion Models

7 April 2022

David J. Fleet

Papers citing "Video Diffusion Models"

50 / 1,256 papers shown

Title
Global Stress Generation and Spatiotemporal Super-Resolution Physics-Informed Operator under Dynamic Loading for Two-Phase Random Materials Tengfei Xing Xiaodan Ren Jie Li DiffM 81 0 0 26 Apr 2025
We'll Fix it in Post: Improving Text-to-Video Generation with Neuro-Symbolic Feedback Minkyu Choi S P Sharan Harsh Goel Sahil Shah Sandeep Chinchali DiffM VGen 152 1 0 24 Apr 2025
DIVE: Inverting Conditional Diffusion Models for Discriminative Tasks Yinqi Li Hong Chang Ruibing Hou Shiguang Shan Xilin Chen DiffM 96 0 0 24 Apr 2025
Synthetic Power Flow Data Generation Using Physics-Informed Denoising Diffusion Probabilistic Models Junfei Wang Darshana Upadhyay Marzia Zaman Pirathayini Srikantha DiffM 82 0 0 24 Apr 2025
VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models Xuming Hu Haoyang Li Jiajun Li Yu Huang Aiwei Liu WIGM VGen 149 3 0 23 Apr 2025
DriVerse: Navigation World Model for Driving Simulation via Multimodal Trajectory Prompting and Motion Alignment Xuzhao Li Chenming Wu Zhao Yang Zhihao Xu Dingkang Liang Yanzhe Zhang Ji Wan Jiadong Wang VGen 128 2 0 22 Apr 2025
T2VShield: Model-Agnostic Jailbreak Defense for Text-to-Video Models Siyuan Liang Jiayang Liu Jiecheng Zhai Tianmeng Fang Rongcheng Tu A. Liu Xiaochun Cao Dacheng Tao VGen 101 2 0 22 Apr 2025
DRAGON: Distributional Rewards Optimize Diffusion Generative Models Yatong Bai Jonah Casebeer Somayeh Sojoudi Nicholas J. Bryan DiffM VLM 113 1 0 21 Apr 2025
Solving New Tasks by Adapting Internet Video Knowledge Calvin Luo Zilai Zeng Yilun Du Chen Sun 113 6 0 21 Apr 2025
MirrorVerse: Pushing Diffusion Models to Realistically Reflect the World Ankit Dhiman Manan Shah R. V. Babu 66 0 0 21 Apr 2025
DC4CR: When Cloud Removal Meets Diffusion Control in Remote Sensing Zhenyu Yu Mohd Yamani Idna Idris Pei Wang DiffM 101 0 0 21 Apr 2025
Emergence and Evolution of Interpretable Concepts in Diffusion Models Berk Tinaz Zalan Fabian Mahdi Soltanolkotabi DiffM 62 0 0 21 Apr 2025
FlowLoss: Dynamic Flow-Conditioned Loss Strategy for Video Diffusion Models Kuanting Wu Kei Ota Asako Kanezaki DiffM VGen 118 0 0 20 Apr 2025
Entropic Time Schedulers for Generative Diffusion Models Dejan Stancevic Luca Ambrogioni L. Ambrogioni DiffM OOD 88 0 0 18 Apr 2025
SkyReels-V2: Infinite-length Film Generative Model Guibin Chen D. Lin Jiangping Yang Chunze Lin J. Zhu ... Di Qiu Debang Li Zhengcong Fei Yang Li Yahui Zhou DiffM VGen 121 10 0 17 Apr 2025
The Devil is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation Bingjie Gao Xinyu Gao Xiaoxue Wu Yujie Zhou Yu Qiao Li Niu Xinyuan Chen Yaohui Wang 182 1 0 16 Apr 2025
OmniVDiff: Omni Controllable Video Diffusion for Generation and Understanding Dianbing Xi Jiadong Wang Yuanzhi Liang Xi Qiu Yuchi Huo Ruiqi Wang Fangqiu Yi Xuzhao Li DiffM VGen 122 1 0 15 Apr 2025
LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation Wei-Jer Chang Weidong Zhan Masayoshi Tomizuka Manmohan Chandraker Francesco Pittaluga 81 0 0 15 Apr 2025
Analysis of Attention in Video Diffusion Transformers Yuxin Wen Jim Wu Ajay Jain Tom Goldstein Ashwinee Panda 109 1 0 14 Apr 2025
EquiVDM: Equivariant Video Diffusion Models with Temporally Consistent Noise Chao Liu Arash Vahdat DiffM VGen 97 2 0 14 Apr 2025
KeyVID: Keyframe-Aware Video Diffusion for Audio-Synchronized Visual Animation Xingrui Wang Jiang-Long Liu Ziyi Wang Xiaodong Yu Jialian Wu Xingwu Sun Yusheng Su Alan Yuille Zicheng Liu Emad Barsoum DiffM VGen 72 0 0 13 Apr 2025
Scalable Motion In-betweening via Diffusion and Physics-Based Character Adaptation Jia Qin DiffM VGen 68 0 0 13 Apr 2025
Discriminator-Free Direct Preference Optimization for Video Diffusion Haoran Cheng Qide Dong Liang Peng Zhizhou Sha Weiguo Feng Jinghui Xie Zhao Song Shilei Wen Xiaofei He Boxi Wu VGen 409 0 0 11 Apr 2025
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model Team Seawead Ceyuan Yang Zhijie Lin Yang Zhao Shanchuan Lin ... Zuquan Song Zhenheng Yang Jiashi Feng Jianchao Yang Lu Jiang DiffM 184 22 0 11 Apr 2025
TokenMotion: Decoupled Motion Control via Token Disentanglement for Human-centric Video Generation Ruineng Li Daitao Xing Huiming Sun Yuanzhou Ha Jinglin Shen C. Ho DiffM VGen 88 1 0 11 Apr 2025
Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos Rundong Luo Matthew Wallingford Ali Farhadi Noah Snavely Wei-Chiu Ma VGen 148 1 0 10 Apr 2025
Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction Zeren Jiang Chuanxia Zheng Iro Laina Diane Larlus Andrea Vedaldi VGen 89 2 0 10 Apr 2025
IGG: Image Generation Informed by Geodesic Dynamics in Deformation Spaces Nian Wu Nivetha Jayakumar Jiarui Xing Miaomiao Zhang 102 0 0 09 Apr 2025
EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation Diljeet Jagpal Xi Chen Vinay P. Namboodiri DiffM VGen 60 0 0 09 Apr 2025
Human Activity Recognition using RGB-Event based Sensors: A Multi-modal Heat Conduction Model and A Benchmark Dataset Shiao Wang Xinyu Wang Bo Jiang Lin Zhu G. Li Yansen Wang Yonghong Tian Jin Tang 347 0 0 08 Apr 2025
Can You Count to Nine? A Human Evaluation Benchmark for Counting Limits in Modern Text-to-Video Models Xuyang Guo Zekai Huang Jiayan Huo Yingyu Liang Zhenmei Shi Zhao Song Jiahao Zhang ALM VGen 206 6 0 05 Apr 2025
Multi-identity Human Image Animation with Structural Video Diffusion Zhenzhi Wang Yongqian Li Yanhong Zeng Yuwei Guo Dahua Lin Tianfan Xue Bo Dai VGen 75 2 0 05 Apr 2025
Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets Chuning Zhu Raymond Yu S. Feng Benjamin Burchfiel Paarth Shah Abhishek Gupta VGen 165 7 0 03 Apr 2025
Comprehensive Relighting: Generalizable and Consistent Monocular Human Relighting and Harmonization Jiadong Wang Jingyuan Liu Xin Sun Krishna Kumar Singh Zhixin Shu ... Nanxuan Zhao Tuanfeng Y. Wang Simon Chen Ulrich Neumann Jae Shin Yoon 74 0 0 03 Apr 2025
OmniCam: Unified Multimodal Video Generation via Camera Control Xiaoda Yang Jiayang Xu Kaixuan Luan Xinyu Zhan Hongshun Qiu ... Shuai Yang Li Zhang Checheng Yu Cewu Lu Lixin Yang DiffM VGen 101 1 0 03 Apr 2025
MG-Gen: Single Image to Motion Graphics Generation with Layer Decomposition Takahiro Shirakawa Tomoyuki Suzuki Daichi Haraguchi VGen 132 0 0 03 Apr 2025
Autonomous Human-Robot Interaction via Operator Imitation Sammy Christen David Müller Agon Serifi Ruben Grandia Georg Wiedebach Michael A. Hopkins Espen Knoop Moritz Bächer LM&Ro 94 0 0 03 Apr 2025
Random Conditioning with Distillation for Data-Efficient Diffusion Model Compression Dohyun Kim S. Park Geonhee Han Seung Wook Kim Paul Hongsuck Seo DiffM 108 0 0 02 Apr 2025
Enhanced Diffusion Sampling via Extrapolation with Multiple ODE Solutions Jinyoung Choi Junoh Kang Bohyung Han 79 0 0 02 Apr 2025
Domain Guidance: A Simple Transfer Approach for a Pre-trained Diffusion Model Jincheng Zhong Xiangcheng Zhang Jianmin Wang Mingsheng Long 84 1 0 02 Apr 2025
Hyperbolic Diffusion Recommender Model Meng Yuan Yutian Xiao Wei Chen Chu Zhao Deqing Wang Fuzhen Zhuang 156 2 0 02 Apr 2025
Can Test-Time Scaling Improve World Foundation Model? Wenyan Cong Hanqing Zhu Peihao Wang Bangya Liu Dejia Xu Kevin Wang David Z. Pan Yan Wang Zhiwen Fan Ziyi Wang 139 1 0 31 Mar 2025
MoCha: Towards Movie-Grade Talking Character Synthesis Cong Wei Bo Sun Haoyu Ma Ji Hou F. Xu ... Kunpeng Li Tingbo Hou Animesh Sinha Peter Vajda Wenhu Chen VGen 412 2 0 30 Mar 2025
Learning Coordinated Bimanual Manipulation Policies using State Diffusion and Inverse Dynamics Models Haonan Chen Jiaming Xu Lily Sheng Tianchen Ji Shuijing Liu Yunzhu Li Katherine Driggs-Campbell 109 1 0 30 Mar 2025
CoGen: 3D Consistent Video Generation via Adaptive Conditioning for Autonomous Driving Yishen Ji Ziyue Zhu Zhenxin Zhu Kaixin Xiong Ming Lu Zhiqi Li Lijun Zhou Haiyang Sun Bing Wang Tong Lu VGen 108 4 0 28 Mar 2025
Mono2Stereo: A Benchmark and Empirical Study for Stereo Conversion S. Yu Yuxin Chen Zhongang Qi Zeke Xie Yifan Wang Lijun Wang Ying Shan Huchuan Lu 75 0 0 28 Mar 2025
EchoFlow: A Foundation Model for Cardiac Ultrasound Image and Video Generation Hadrien Reynaud Alberto Gomez Paul Leeson Qingjie Meng Bernhard Kainz MedIm 84 2 0 28 Mar 2025
SyncSDE: A Probabilistic Framework for Diffusion Synchronization Hyunjun Lee Hyunsoo Lee Sookwan Han DiffM 141 0 0 27 Mar 2025
VideoMage: Multi-Subject and Motion Customization of Text-to-Video Diffusion Models Chi-Pin Huang Yen-Siang Wu Hung-Kai Chung Kai-Po Chang Fu-En Yang Yu-Jie Wang DiffM VGen 102 1 0 27 Mar 2025
VPO: Aligning Text-to-Video Generation Models with Prompt Optimization Jiale Cheng Ruiliang Lyu Xiaotao Gu Xiao-Chang Liu Jiazheng Xu ... Zhuoyi Yang Yuxiao Dong Jie Tang Han Wang Minlie Huang VGen 122 2 0 26 Mar 2025