Title
The Surprising Effectiveness of Diffusion Models for Optical Flow and Monocular Depth Estimation Saurabh Saxena Charles Herrmann Junhwa Hur Abhishek Kar Mohammad Norouzi Deqing Sun David J. Fleet DiffM 114 85 0 02 Jun 2023
StyleDrop: Text-to-Image Generation in Any Style Kihyuk Sohn Nataniel Ruiz Kimin Lee Daniel Castro Chin Irina Blok ... Yuanzhen Li Yuan Hao Irfan Essa Michael Rubinstein Dilip Krishnan 70 152 0 01 Jun 2023
Discovering Failure Modes of Text-guided Diffusion Models via Adversarial Search Qihao Liu Adam Kortylewski Yutong Bai Song Bai Alan Yuille DiffM 125 12 0 01 Jun 2023
Intelligent Grimm -- Open-ended Visual Storytelling via Latent Diffusion Models Chang-rui Liu Haoning Wu Yujie Zhong Xiaoyu Zhang Yanfeng Wang Weidi Xie DiffM VLM 154 44 0 01 Jun 2023
Inserting Anybody in Diffusion Models via Celeb Basis Genlan Yuan Xiaodong Cun Yong Zhang Maomao Li Chenyang Qi Xintao Wang Ying Shan Huicheng Zheng DiffM 85 53 0 01 Jun 2023
ReFACT: Updating Text-to-Image Models by Editing the Text Encoder Dana Arad Hadas Orgad Yonatan Belinkov KELM 135 19 0 01 Jun 2023
Interactive Character Control with Auto-Regressive Motion Diffusion Models Yi Shi Jingbo Wang Xuekun Jiang Bingkun Lin Bo Dai Xue Bin Peng DiffM AI4CE 120 25 0 01 Jun 2023
MetaDiffuser: Diffusion Model as Conditional Planner for Offline Meta-RL Fei Ni Jianye Hao Yao Mu Yifu Yuan Yan Zheng Bin Wang Zhixuan Liang DiffM OffRL 116 50 0 31 May 2023
Improving Handwritten OCR with Training Samples Generated by Glyph Conditional Denoising Diffusion Probabilistic Model Haisong Ding Bozhi Luan Dongnan Gui Kai Chen Qiang Huo DiffM 45 7 0 31 May 2023
Cones 2: Customizable Image Synthesis with Multiple Subjects Zhiheng Liu Yifei Zhang Yujun Shen Kecheng Zheng Kai Zhu Ruili Feng Yu Liu Deli Zhao Jingren Zhou Yang Cao DiffM 104 81 0 30 May 2023
Ambient Diffusion: Learning Clean Distributions from Corrupted Data Giannis Daras Kulin Shah Y. Dagan Aravind Gollakota A. Dimakis Adam R. Klivans DiffM 124 75 0 30 May 2023
Translation-Enhanced Multilingual Text-to-Image Generation Yaoyiran Li Ching-Yun Chang Stephen Rawls Ivan Vulić Anna Korhonen 57 8 0 30 May 2023
PanoGen: Text-Conditioned Panoramic Environment Generation for Vision-and-Language Navigation Jialu Li Joey Tianyi Zhou DiffM 101 55 0 30 May 2023
Video ControlNet: Towards Temporally Consistent Synthetic-to-Real Video Translation Using Conditional Image Diffusion Models Ernie Chu Shuohao Lin Jun-Cheng Chen DiffM 64 21 0 30 May 2023
StyleAvatar3D: Leveraging Image-Text Diffusion Models for High-Fidelity 3D Avatar Generation Chi Zhang Yiwen Chen Yijun Fu Zheng-Yang Zhou YU Gang Billzb Wang Bin-Bin Fu Tao Chen Guosheng Lin Chunhua Shen DiffM 102 29 0 30 May 2023
DiffSketching: Sketch Control Image Synthesis with Diffusion Models Qiang Wang Di Kong Fengyin Lin Yonggang Qi DiffM 78 14 0 30 May 2023
Controllable Text-to-Image Generation with GPT-4 Tianjun Zhang Yi Zhang Vibhav Vineet Neel Joshi Xin Eric Wang DiffM 150 44 0 29 May 2023
Mix-of-Show: Decentralized Low-Rank Adaptation for Multi-Concept Customization of Diffusion Models Yuchao Gu Xintao Wang Jay Zhangjie Wu Yujun Shi Yunpeng Chen ... Shuning Chang Wei Wu Yixiao Ge Ying Shan Mike Zheng Shou DiffM 144 177 0 29 May 2023
Photoswap: Personalized Subject Swapping in Images Jing Gu Yilin Wang Nanxuan Zhao Tsu-Jui Fu Wei Xiong ... Zhifei Zhang He Zhang Jianming Zhang Hyun-Sun Jung Xin Eric Wang DiffM 99 43 0 29 May 2023
GlyphControl: Glyph Conditional Control for Visual Text Generation Yukang Yang Dongnan Gui Yuhui Yuan Weicong Liang Haisong Ding Hang-Rui Hu Kai Chen DiffM 90 85 0 29 May 2023
AIMS: All-Inclusive Multi-Level Segmentation Lu Qi Jason Kuen Weidong Guo Jiuxiang Gu Zhe Lin Bo Du Yu-Syuan Xu Ming-Hsuan Yang VLM 103 6 0 28 May 2023
Accelerating Text-to-Image Editing via Cache-Enabled Sparse Diffusion Inference Zihao Yu Haoyang Li Fangcheng Fu Xupeng Miao Tengjiao Wang DiffM 93 8 0 27 May 2023
Im-Promptu: In-Context Composition from Image Prompts Bhishma Dedhia Michael Chang Jake C. Snell Thomas Griffiths N. Jha LRM MLLM 103 2 0 26 May 2023
Contrast, Attend and Diffuse to Decode High-Resolution Images from Brain Activities Jingyuan Sun Mingxiao Li Zijiao Chen Yunhao Zhang Shaonan Wang Marie-Francine Moens DiffM 114 33 0 26 May 2023
Functional Flow Matching Gavin Kerrigan Giosue Migliorini Padhraic Smyth 98 18 0 26 May 2023
High-Fidelity Image Compression with Score-based Generative Models Emiel Hoogeboom E. Agustsson Fabian Mentzer Luca Versari G. Toderici Lucas Theis DiffM 93 44 0 26 May 2023
CRoSS: Diffusion Model Makes Controllable, Robust and Secure Image Steganography Jiwen Yu Xuanyu Zhang You-song Xu Jian Zhang DiffM 99 53 0 26 May 2023
Negative-prompt Inversion: Fast Image Inversion for Editing with Text-guided Diffusion Models Daiki Miyake Akihiro Iohara Yuriko Saito Toshiyuki Tanaka DiffM 100 120 0 26 May 2023
Diffusion-Based Adversarial Sample Generation for Improved Stealthiness and Controllability Haotian Xue Alexandre Araujo Bin Hu Yongxin Chen DiffM 145 48 0 25 May 2023
Are Diffusion Models Vision-And-Language Reasoners? Benno Krojer Elinor Poole-Dayan Vikram S. Voleti Christopher Pal Siva Reddy 107 14 0 25 May 2023
Imitating Task and Motion Planning with Visuomotor Transformers Murtaza Dalal Ajay Mandlekar Caelan Reed Garrett Ankur Handa Ruslan Salakhutdinov Dieter Fox 159 57 0 25 May 2023
Trans-Dimensional Generative Modeling via Jump Diffusion Models Andrew Campbell William Harvey Christian D. Weilbach Valentin De Bortoli Tom Rainforth Arnaud Doucet DiffM 122 13 0 25 May 2023
ProSpect: Prompt Spectrum for Attribute-Aware Personalization of Diffusion Models Yuxin Zhang Weiming Dong Fan Tang Nisha Huang Haibin Huang Chongyang Ma Tong-Yee Lee Oliver Deussen Changsheng Xu DiffM 99 81 0 25 May 2023
Prompt-Free Diffusion: Taking "Text" out of Text-to-Image Diffusion Models Xingqian Xu Jiayi Guo Zhangyang Wang Gao Huang Irfan Essa Humphrey Shi VLM DiffM 127 61 0 25 May 2023
DiffCLIP: Leveraging Stable Diffusion for Language Grounded 3D Classification Sitian Shen Zilin Zhu Linqian Fan Harry Zhang Xinxiao Wu DiffM 150 28 0 25 May 2023
DDDM-VC: Decoupled Denoising Diffusion Models with Disentangled Representation and Prior Mixup for Verified Robust Voice Conversion Haram Choi Sang-Hoon Lee Seong-Whan Lee DiffM 80 35 0 25 May 2023
Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic Contrast Sets Brandon Smith Miguel Farinha Elizaveta Semenova Hannah Rose Kirk Aleksandar Shtedritski Max Bain 90 19 0 24 May 2023
A Neural Space-Time Representation for Text-to-Image Personalization Yuval Alaluf Elad Richardson G. Metzer Daniel Cohen-Or DiffM 104 100 0 24 May 2023
Visual Programming for Text-to-Image Generation and Evaluation Jaemin Cho Abhaysinh Zala Joey Tianyi Zhou MLLM 119 51 0 24 May 2023
MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation Marco Bellagente Manuel Brack H. Teufel Felix Friedrich Bjorn Deiseroth ... Koen Oostermeijer Andres Felipe Cruz Salinas P. Schramowski Kristian Kersting Samuel Weinbach 141 20 0 24 May 2023
Vision + Language Applications: A Survey Yutong Zhou N. Shimada VLM 117 7 0 24 May 2023
DirecT2V: Large Language Models are Frame-Level Directors for Zero-Shot Text-to-Video Generation Susung Hong Junyoung Seo Heeseong Shin Sung‐Jin Hong Seung Wook Kim DiffM VGen 106 36 0 23 May 2023
Compositional Text-to-Image Synthesis with Attention Map Control of Diffusion Models Ruichen Wang Zekang Chen Chen Chen Jiancang Ma H. Lu Xiaodong Lin DiffM 89 73 0 23 May 2023
i-Code Studio: A Configurable and Composable Framework for Integrative AI Yuwei Fang Mahmoud Khademi Chenguang Zhu Ziyi Yang Reid Pryzant ... Yao Qian Takuya Yoshioka Lu Yuan Michael Zeng Xuedong Huang 79 2 0 23 May 2023
Training Priors Predict Text-To-Image Model Performance Charles Lovering Ellie Pavlick CoGe 78 3 0 23 May 2023
DiffAVA: Personalized Text-to-Audio Generation with Visual Alignment Shentong Mo Jing Shi Yapeng Tian 65 17 0 22 May 2023
i-Code V2: An Autoregressive Generation Framework over Vision, Language, and Speech Data Ziyi Yang Mahmoud Khademi Yichong Xu Reid Pryzant Yuwei Fang ... Yu Shi Lu Yuan Takuya Yoshioka Michael Zeng Xuedong Huang 63 2 0 21 May 2023
Incomplete Multi-view Clustering via Diffusion Completion Sifan Fang DiffM 55 6 0 19 May 2023
A Survey of Safety and Trustworthiness of Large Language Models through the Lens of Verification and Validation Xiaowei Huang Wenjie Ruan Wei Huang Gao Jin Yizhen Dong ... Sihao Wu Peipei Xu Dengyu Wu André Freitas Mustafa A. Mustafa ALM 132 96 0 19 May 2023
SlotDiffusion: Object-Centric Generative Modeling with Diffusion Models Ziyi Wu Jingyu Hu Wuyue Lu Igor Gilitschenski Animesh Garg DiffM OCL 124 47 0 18 May 2023