Title
Make-A-Protagonist: Generic Video Editing with An Ensemble of Experts Yuyang Zhao Enze Xie Lanqing Hong Zhenguo Li G. Lee DiffM VGen 35 32 0 15 May 2023
Null-text Guidance in Diffusion Models is Secretly a Cartoon-style Creator Jing Zhao Heliang Zheng Chaoyue Wang Long Lan Wanrong Huang Wenjing Yang DiffM 41 10 0 11 May 2023
Text-guided High-definition Consistency Texture Model Zhibin Tang Tiantong He DiffM 20 6 0 10 May 2023
Style-A-Video: Agile Diffusion for Arbitrary Text-based Video Style Transfer Nisha Huang Yu-xin Zhang Weiming Dong DiffM VGen 29 16 0 09 May 2023
AADiff: Audio-Aligned Video Synthesis with Text-to-Image Diffusion Seungwoo Lee Chaerin Kong D. Jeon Nojun Kwak DiffM 23 19 0 06 May 2023
LEO: Generative Latent Image Animator for Human Video Synthesis Yaohui Wang Xin Ma Xinyuan Chen A. Dantcheva Bo Dai Yu Qiao DiffM 67 30 0 06 May 2023
Improved Techniques for Maximum Likelihood Estimation for Diffusion ODEs Kaiwen Zheng Cheng Lu Jianfei Chen Jun Zhu DiffM 31 26 0 06 May 2023
Controllable Visual-Tactile Synthesis Ruihan Gao Wenzhen Yuan Jun-Yan Zhu DiffM 22 5 0 04 May 2023
Multimodal-driven Talking Face Generation via a Unified Diffusion-based Generator Chao Xu Shaoting Zhu Junwei Zhu Alexander I. Rudnicky Jiangning Zhang Ying Tai Yong Liu DiffM 52 14 0 04 May 2023
Shap-E: Generating Conditional 3D Implicit Functions Heewoo Jun Alex Nichol DiffM 197 309 0 03 May 2023
Unpaired Downscaling of Fluid Flows with Diffusion Bridges Tobias Bischoff Katherine Deck 26 14 0 02 May 2023
Putting People in Their Place: Affordance-Aware Human Insertion into Scenes Sumith Kulal Tim Brooks A. Aiken Jiajun Wu Jimei Yang Jingwan Lu Alexei A. Efros Krishna Kumar Singh DiffM 46 42 0 27 Apr 2023
Motion-Conditioned Diffusion Model for Controllable Video Synthesis Tsai-Shien Chen C. Lin Hung-Yu Tseng Nayeon Lee Ming Yang DiffM VGen 76 62 0 27 Apr 2023
Score-based Generative Modeling Through Backward Stochastic Differential Equations: Inversion and Generation Zihao Wang DiffM 38 4 0 26 Apr 2023
Seeing is not always believing: Benchmarking Human and Model Perception of AI-Generated Images Zeyu Lu Di Huang Lei Bai Jingjing Qu Chengzhi Wu Xihui Liu Wanli Ouyang 24 51 0 25 Apr 2023
Contrastive Energy Prediction for Exact Energy-Guided Diffusion Sampling in Offline Reinforcement Learning Cheng Lu Huayu Chen Jianfei Chen Hang Su Chongxuan Li Jun Zhu DiffM OffRL 25 58 0 25 Apr 2023
GlyphDiffusion: Text Generation as Image Generation Junyi Li Wayne Xin Zhao J. Nie Ji-Rong Wen DiffM 28 2 0 25 Apr 2023
Evolving Three Dimension (3D) Abstract Art: Fitting Concepts by Language Yingtao Tian 13 1 0 24 Apr 2023
DiffESM: Conditional Emulation of Earth System Models with Diffusion Models Seth Bassetti Brian Hutchinson Claudia Tebaldi Ben Kravitz DiffM 23 11 0 23 Apr 2023
Inducing anxiety in large language models increases exploration and bias Julian Coda-Forno Kristin Witte A. Jagadish Marcel Binz Zeynep Akata Eric Schulz AI4CE 33 41 0 21 Apr 2023
Collaborative Diffusion for Multi-Modal Face Generation and Editing Ziqi Huang Kelvin C. K. Chan Yuming Jiang Ziwei Liu DiffM 49 103 0 20 Apr 2023
Deep Dynamic Cloud Lighting Pinar Satilmis Thomas Bashford-Rogers 11 4 0 18 Apr 2023
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models A. Blattmann Robin Rombach Huan Ling Tim Dockhorn Seung Wook Kim Sanja Fidler Karsten Kreis 3DGS VGen 91 1,013 0 18 Apr 2023
Text2Performer: Text-Driven Human Video Generation Yuming Jiang Shuai Yang Tong Liang Koh Wayne Wu Chen Change Loy Ziwei Liu DiffM VGen 45 48 0 17 Apr 2023
Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation Jie An Songyang Zhang Harry Yang Sonal Gupta Jia-Bin Huang Jiebo Luo Xiaoyue Yin DiffM VGen 32 106 0 17 Apr 2023
Synthetic Data from Diffusion Models Improves ImageNet Classification Shekoofeh Azizi Simon Kornblith Chitwan Saharia Mohammad Norouzi David J. Fleet VLM DiffM 40 292 0 17 Apr 2023
Video Generation Beyond a Single Clip Hsin-Ping Huang Yu-Chuan Su Ming Yang VLM DiffM VGen 22 3 0 15 Apr 2023
Control3Diff: Learning Controllable 3D Diffusion Models from Single-view Images Jiatao Gu Qingzhe Gao Shuangfei Zhai Baoquan Chen Lingjie Liu J. Susskind 36 29 0 13 Apr 2023
DiffFit: Unlocking Transferability of Large Diffusion Models via Simple Parameter-Efficient Fine-Tuning Enze Xie Lewei Yao Han Shi Zhili Liu Daquan Zhou Zhaoqiang Liu Jiawei Li Zhenguo Li 28 76 0 13 Apr 2023
AGI for Agriculture Guoyu Lu Sheng Li Gengchen Mai Jin Sun Dajiang Zhu ... R. Xu Daniel Petti Changying Li Tianming Liu Changying Li AI4CE 48 17 0 12 Apr 2023
DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion J. Karras Aleksander Holynski Ting-Chun Wang Ira Kemelmacher-Shlizerman DiffM VGen 32 138 0 12 Apr 2023
Harnessing the Spatial-Temporal Attention of Diffusion Models for High-Fidelity Text-to-Image Synthesis Qiucheng Wu Yujian Liu Handong Zhao T. Bui Zhe-nan Lin Yang Zhang Shiyu Chang DiffM 42 44 0 07 Apr 2023
Diffusion Models as Masked Autoencoders Chen Wei K. Mangalam Po-Yao (Bernie) Huang Yanghao Li Haoqi Fan Hu Xu Huiyu Wang Cihang Xie Alan Yuille Christoph Feichtenhofer DiffM SyDa 36 48 0 06 Apr 2023
Trace and Pace: Controllable Pedestrian Animation via Guided Trajectory Diffusion Davis Rempe Zhengyi Luo Xue Bin Peng Ye Yuan Kris M. Kitani Karsten Kreis Sanja Fidler Or Litany 30 110 0 04 Apr 2023
One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era Chaoning Zhang Chenshuang Zhang Chenghao Li Yu Qiao Sheng Zheng ... Sung-Ho Bae Lik-Hang Lee Pan Hui In So Kweon Choong Seon Hong LM&MA AI4MH LRM ELM 36 130 0 04 Apr 2023
Scientists' Perspectives on the Potential for Generative AI in their Fields Meredith Ringel Morris AI4CE 27 38 0 04 Apr 2023
Follow Your Pose: Pose-Guided Text-to-Video Generation using Pose-Free Videos Yue Ma Yin-Yin He Xiaodong Cun Xintao Wang Siran Chen Ying Shan Xiu Li Qifeng Chen DiffM VGen 37 176 0 03 Apr 2023
TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles Yifeng Ma Suzhe Wang Yu-qiong Ding Lincheng Li Bowen Ma Tangjie Lv Changjie Fan Zhipeng Hu Zhidong Deng Xin Yu CLIP 34 21 0 01 Apr 2023
AvatarCraft: Transforming Text into Neural Human Avatars with Parameterized Shape and Pose Control Ruixia Jiang Can Wang Jingbo Zhang Menglei Chai Mingming He Dongdong Chen Jing Liao DiffM 28 77 0 30 Mar 2023
Consistent View Synthesis with Pose-Guided Diffusion Models Hung-Yu Tseng Qinbo Li Changil Kim Suhib Alsisan Jia-Bin Huang Johannes Kopf DiffM 37 101 0 30 Mar 2023
DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder Chenpeng Du Qi Chen Xie Chen K. Yu DiffM 29 50 0 30 Mar 2023
Sound to Visual Scene Generation by Audio-to-Visual Latent Alignment Kim Sung-Bin Arda Senocak H. Ha Andrew Owens Tae-Hyun Oh DiffM VGen 38 36 0 30 Mar 2023
Hierarchical Fine-Grained Image Forgery Detection and Localization Xiao Guo Xiaohong Liu Zhiyuan Ren Steven A. Grosz I. Masi Xiaoming Liu 22 104 0 30 Mar 2023
4D Facial Expression Diffusion Model K. Zou S. Faisan Boyang Yu S. Valette Hyewon Seo 26 11 0 29 Mar 2023
HoloDiffusion: Training a 3D Diffusion Model using 2D Images Animesh Karnewar Andrea Vedaldi David Novotny Niloy Mitra 37 109 0 29 Mar 2023
Your Diffusion Model is Secretly a Zero-Shot Classifier Alexander C. Li Mihir Prabhudesai Shivam Duggal Ellis L Brown Deepak Pathak DiffM VLM 55 225 0 28 Mar 2023
Instruct 3D-to-3D: Text Instruction Guided 3D-to-3D conversion Hiromichi Kamata Yuiko Sakuma Akio Hayakawa Masato Ishii T. Narihira DiffM 37 37 0 28 Mar 2023
Fine-grained Audible Video Description Xuyang Shen Dong Li Jinxing Zhou Zhen Qin Bowen He ... Yuchao Dai Lingpeng Kong Meng Wang Yu Qiao Yiran Zhong VGen 38 11 0 27 Mar 2023
The Stable Signature: Rooting Watermarks in Latent Diffusion Models Pierre Fernandez Guillaume Couairon Hervé Jégou Matthijs Douze Teddy Furon WIGM 17 177 0 27 Mar 2023
Seer: Language Instructed Video Prediction with Latent Diffusion Models Xianfan Gu Chuan Wen Weirui Ye Jiaming Song Yang Gao DiffM VGen 21 40 0 27 Mar 2023