v1v2 (latest)

Video Diffusion Models

7 April 2022

David J. Fleet

Papers citing "Video Diffusion Models"

50 / 1,256 papers shown

Title
AKiRa: Augmentation Kit on Rays for optical video generation Xi Wang Robin Courant Marc Christie Vicky Kalogeiton VGen 209 4 0 31 Dec 2024
AdaDiff: Adaptive Step Selection for Fast Diffusion Models Hui Zhang Zuxuan Wu Zhen Xing Jie Shao Yu-Gang Jiang 149 13 0 31 Dec 2024
JADE: Joint-aware Latent Diffusion for 3D Human Generative Modeling Haorui Ji Rong Wang Taojun Lin Hongdong Li 3DH 92 1 0 31 Dec 2024
Edicho: Consistent Image Editing in the Wild Qingyan Bai Hao Ouyang Yinghao Xu Qiuyu Wang Ceyuan Yang Ka Leong Cheng Yujun Shen Qifeng Chen DiffM 176 1 0 30 Dec 2024
DPBridge: Latent Diffusion Bridge for Dense Prediction Haorui Ji Taojun Lin Hongdong Li DiffM 299 1 0 29 Dec 2024
Bridging Interpretability and Robustness Using LIME-Guided Model Refinement Navid Nayyem Abdullah Rakin Longwei Wang AAML FAtt 110 2 0 25 Dec 2024
MRI Reconstruction with Regularized 3D Diffusion Model (R3DM) Arya Bangun Zhuo Cao Alessio Quercia Hanno Scharr Elisabeth Pfaehler MedIm 79 1 0 25 Dec 2024
Singular Value Scaling: Efficient Generative Model Compression via Pruned Weights Refinement H. Kim Jaejun Yoo 150 1 0 23 Dec 2024
Enhancing Long Video Generation Consistency without Tuning Xingyao Li Fengzhuo Zhang Jiachun Pan Yunlong Hou Vincent Y. F. Tan Zhuoran Yang DiffM VGen 82 0 0 23 Dec 2024
Label-Efficient Data Augmentation with Video Diffusion Models for Guidewire Segmentation in Cardiac Fluoroscopy Shaoyan Pan Yikang Liu Lin Zhao Eric Z. Chen Xiao Chen Terrence Chen Shanhui Sun VGen MedIm 189 0 0 20 Dec 2024
SCENIC: Scene-aware Semantic Navigation with Instruction-guided Control Xiaohan Zhang Sebastian Starke Vladimir Guzov Zhensong Zhang Eduardo Pérez-Pellitero Gerard Pons-Moll DiffM VGen 153 4 0 20 Dec 2024
$$\texttt{DINO-Foresight}$: Looking into the Future with DINO$ $\texttt{DINO-Foresight}$ : Looking into the Future with DINO Efstathios Karypidis Ioannis Kakogeorgiou Spyros Gidaris N. Komodakis AI4CE 150 3 0 16 Dec 2024
UIBDiffusion: Universal Imperceptible Backdoor Attack for Diffusion Models Yuning Han Bingyin Zhao Rui Chu Feng Luo Biplab Sikdar Yingjie Lao DiffM AAML 205 1 0 16 Dec 2024
AsymRnR: Video Diffusion Transformers Acceleration with Asymmetric Reduction and Restoration Wenhao Sun Rong-Cheng Tu Jingyi Liao Zhao Jin Dacheng Tao VGen 256 1 0 16 Dec 2024
InterDyn: Controllable Interactive Dynamics with Video Diffusion Models Rick Akkerman Haiwen Feng M. Black Dimitrios Tzionas Victoria Fernandez-Abrevaya VGen AI4CE 202 3 0 16 Dec 2024
SoftVQ-VAE: Efficient 1-Dimensional Continuous Tokenizer Hong Chen Zihan Wang Xianrui Li Xingwu Sun Fangyi Chen Jiang Liu Jiadong Wang Bhiksha Raj Zicheng Liu Emad Barsoum VLM 288 10 0 14 Dec 2024
FreeScale: Unleashing the Resolution of Diffusion Models via Tuning-Free Scale Fusion Haonan Qiu Shiwei Zhang Yujie Wei Ruihang Chu Hangjie Yuan Xinyu Wang Yize Zhang Ziwei Liu 165 4 0 12 Dec 2024
T-SVG: Text-Driven Stereoscopic Video Generation Qiao Jin Xiaodong Chen Wu Liu Tao Mei Yongdong Zhang DiffM VGen 144 2 0 12 Dec 2024
Olympus: A Universal Task Router for Computer Vision Tasks Yuanze Lin Yunsheng Li Dongdong Chen Weijian Xu Ronald Clark Philip Torr VLM ObjD 548 1 0 12 Dec 2024
SVGFusion: Scalable Text-to-SVG Generation via Vector Space Diffusion Ximing Xing Juncheng Hu Jing Zhang Dong Xu Qian Yu 218 4 0 11 Dec 2024
From Slow Bidirectional to Fast Autoregressive Video Diffusion Models Tianwei Yin Qiang Zhang Richard Zhang William T. Freeman F. Durand Eli Shechtman Xun Huang VGen DiffM 188 11 0 10 Dec 2024
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets Zhen Liu Tim Z. Xiao Weiyang Liu Yoshua Bengio Dinghuai Zhang 258 6 0 10 Dec 2024
On Diffusion Posterior Sampling via Sequential Monte Carlo for Zero-Shot Scaffolding of Protein Motifs James Matthew Young O. Deniz Akyildiz DiffM 126 1 0 08 Dec 2024
Combining Genre Classification and Harmonic-Percussive Features with Diffusion Models for Music-Video Generation Leonardo Pina Yongmin Li VGen DiffM 95 0 0 07 Dec 2024
DiCoDe: Diffusion-Compressed Deep Tokens for Autoregressive Video Generation with Language Models Yizhuo Li Yuying Ge Yixiao Ge Ping Luo Ying Shan DiffM VGen 186 0 0 05 Dec 2024
SceneDiffuser: Efficient and Controllable Driving Simulation Initialization and Rollout C. Jiang Yijing Bai Andre Cornman Christopher Davis Xiukun Huang ... Carlos Fuertes Chang Yuan Mingxing Tan Yin Zhou Dragomir Anguelov 137 19 0 05 Dec 2024
DIVE: Taming DINO for Subject-Driven Video Editing Yi Huang Wei Xiong He Zhang Chaoqi Chen Jianzhuang Liu Mingfu Yan Shifeng Chen VGen DiffM 119 1 0 04 Dec 2024
Diffusion-VLA: Generalizable and Interpretable Robot Foundation Model via Self-Generated Reasoning Junjie Wen Minjie Zhu Yinlin Zhu Zhibin Tang Jinming Li ... Chengmeng Li Xiaoyu Liu Chaomin Shen Yaxin Peng Feifei Feng 149 13 0 04 Dec 2024
World-consistent Video Diffusion with Explicit 3D Modeling Qihang Zhang Shuangfei Zhai Miguel Angel Bautista Kevin Miao Alexander Toshev J. Susskind Jiatao Gu VGen 139 9 0 02 Dec 2024
LoyalDiffusion: A Diffusion Model Guarding Against Data Replication Chenghao Li Yuke Zhang Dake Chen Jingqi Xu Peter A. Beerel 141 1 0 02 Dec 2024
Schedule On the Fly: Diffusion Time Prediction for Faster and Better Image Generation Zilyu Ye Zhiyang Chen Tiancheng Li Zemin Huang Weijian Luo Guo-Jun Qi DiffM 132 6 0 02 Dec 2024
DreamDance: Animating Human Images by Enriching 3D Geometry Cues from 2D Poses Yatian Pang Bin Zhu Bin Lin Mingzhe Zheng Francis E. H. Tay Ser-Nam Lim Harry Yang Li Yuan VGen 3DH 124 7 0 30 Nov 2024
ReconDreamer: Crafting World Models for Driving Scene Reconstruction via Online Restoration Chaojun Ni Guosheng Zhao Xiaofeng Wang Zheng Hua Zhu Wenkang Qin ... Kun Zhan Peng Jia Xianpeng Lang Xingang Wang Wenjun Mei VGen 398 11 0 29 Nov 2024
Deepfake Media Generation and Detection in the Generative AI Era: A Survey and Outlook Florinel-Alin Croitoru Andrei Iulian Hiji Vlad Hondru Nicolae-Cătălin Ristea Paul Irofti Marius Popescu Cristian Rusu Radu Tudor Ionescu Fahad Shahbaz Khan Mubarak Shah 135 5 0 29 Nov 2024
AerialGo: Walking-through City View Generation from Aerial Perspectives Fuqiang Zhao Yijing Guo Siyuan Yang Xi Chen Luo Wang Lan Xu Yize Zhang Yujiao Shi Jingyi Yu 106 0 0 29 Nov 2024
Motion Modes: What Could Happen Next? Karran Pandey Matheus Gadelha Yannick Hold-Geoffroy Karan Singh Niloy J. Mitra Paul Guerrero VGen DiffM 143 2 0 29 Nov 2024
Pretrained Reversible Generation as Unsupervised Visual Representation Learning Rongkun Xue Jinouwen Zhang Yazhe Niu Dazhong Shen Bingqi Ma Yu Liu Jing Yang 192 0 0 29 Nov 2024
Track Anything Behind Everything: Zero-Shot Amodal Video Object Segmentation Finlay G. C. Hudson W. Smith VOS VLM 129 0 0 28 Nov 2024
SPAgent: Adaptive Task Decomposition and Model Selection for General Video Generation and Editing Rong-Cheng Tu Wenhao Sun Zhao Jin Jingyi Liao Jiaxing Huang Dacheng Tao VGen DiffM 171 7 0 28 Nov 2024
OpenHumanVid: A Large-Scale High-Quality Dataset for Enhancing Human-Centric Video Generation Hui Li Mingwang Xu Yun Zhan Shan Mu Jiaye Li ... Yukang Chen Tan Chen Mao Ye Jingdong Wang Siyu Zhu VGen 210 7 0 28 Nov 2024
Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model Feng Liu Shiwei Zhang Xiaofeng Wang Yujie Wei Haonan Qiu Yuzhong Zhao Yingya Zhang Qixiang Ye Fang Wan VGen AI4TS 216 30 0 28 Nov 2024
Spatiotemporal Skip Guidance for Enhanced Video Diffusion Sampling J. Hyung Kinam Kim Susung Hong M. Kim Jaegul Choo VGen 156 4 0 27 Nov 2024
Individual Content and Motion Dynamics Preserved Pruning for Video Diffusion Models Yiming Wu Huan Wang Zhenghao Chen Dong Xu DiffM VGen 123 1 0 27 Nov 2024
MotionCharacter: Identity-Preserving and Motion Controllable Human Video Generation Haopeng Fang Di Qiu Binjie Mao Pengfei Yan He Tang VGen DiffM 118 6 0 27 Nov 2024
Scene Co-pilot: Procedural Text to Video Generation with Human in the Loop Zhaofang Qian Abolfazl Sharifi Tucker Carroll Ser-Nam Lim VGen 138 0 0 26 Nov 2024
Privacy Protection in Personalized Diffusion Models via Targeted Cross-Attention Adversarial Attack Xide Xu Muhammad Atif Butt Sandesh Kamath Bogdan Raducanu DiffM AAML 140 1 0 25 Nov 2024
Sonic: Shifting Focus to Global Audio Perception in Portrait Animation Xiaozhong Ji Xiaobin Hu Zhihong Xu Junwei Zhu Chuming Lin ... Donghao Luo Yi Chen Qin Lin Qinglin Lu Chengjie Wang VGen 156 11 0 25 Nov 2024
MVGenMaster: Scaling Multi-View Generation from Any Image via 3D Priors Enhanced Diffusion Model Chenjie Cao Chaohui Yu Shang Liu Fan Wang Xiangyang Xue Yanwei Fu 150 2 0 25 Nov 2024
Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric Zhichao Zhang Wei Sun Xinyue Li Yunhao Li Qihang Ge ... Zhongpeng Ji Fengyu Sun Shangling Jui Xiongkuo Min Guangtao Zhai EGVM 250 1 0 25 Nov 2024
Frequency-Guided Posterior Sampling for Diffusion-Based Image Restoration D. Thaker Abhishek Goyal René Vidal DiffM 107 1 0 22 Nov 2024