Title
Evaluating the Robustness of Text-to-image Diffusion Models against Real-world Attacks Hongcheng Gao Hao Zhang Yinpeng Dong Zhijie Deng AAML 44 21 0 16 Jun 2023
Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation Shuai Yang Yifan Zhou Ziwei Liu Chen Change Loy VGen DiffM 54 207 0 13 Jun 2023
Generative Watermarking Against Unauthorized Subject-Driven Image Synthesis Yi Ma Zhengyu Zhao Xinlei He Zheng Li Michael Backes Yang Zhang AAML WIGM 22 21 0 13 Jun 2023
Controlling Text-to-Image Diffusion by Orthogonal Finetuning Zeju Qiu Wei-yu Liu Haiwen Feng Yuxuan Xue Yao Feng Zhen Liu Dan Zhang Adrian Weller Bernhard Schölkopf DiffM 51 136 0 12 Jun 2023
Scalable 3D Captioning with Pretrained Models Tiange Luo C. Rockwell Honglak Lee Justin Johnson 32 153 0 12 Jun 2023
A Comprehensive Survey on Applications of Transformers for Deep Learning Tasks Saidul Islam Hanae Elmekki Ahmed Elsebai Jamal Bentahar Najat Drawel Gaith Rjoub Witold Pedrycz ViT MedIm 24 174 0 11 Jun 2023
The Age of Synthetic Realities: Challenges and Opportunities J. P. Cardenuto Jing Yang Rafael Padilha Renjie Wan Daniel Moreira Haoliang Li Shiqi Wang Fernanda A. Andaló Sébastien Marcel Anderson de Rezende Rocha DeLMO 44 29 0 09 Jun 2023
AGIQA-3K: An Open Database for AI-Generated Image Quality Assessment Chunyi Li Zicheng Zhang Haoning Wu Wei Sun Xiongkuo Min Xiaohong Liu Guangtao Zhai Weisi Lin EGVM 35 115 0 07 Jun 2023
Multilingual Conceptual Coverage in Text-to-Image Models Michael Stephen Saxon William Yang Wang EGVM 49 8 0 02 Jun 2023
Wuerstchen: An Efficient Architecture for Large-Scale Text-to-Image Diffusion Models Pablo Pernias Dominic Rampas Mats L. Richter Christopher Pal Marc Aubreville DiffM VLM 26 42 0 01 Jun 2023
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment Guian Fang Zutao Jiang Jianhua Han Guangsong Lu Hang Xu Shengcai Liao Xiaodan Liang EGVM 29 1 0 31 May 2023
Cones 2: Customizable Image Synthesis with Multiple Subjects Zhiheng Liu Yifei Zhang Yujun Shen Kecheng Zheng Kai Zhu Ruili Feng Yu Liu Deli Zhao Jingren Zhou Yang Cao DiffM 65 80 0 30 May 2023
Translation-Enhanced Multilingual Text-to-Image Generation Yaoyiran Li Ching-Yun Chang Stephen Rawls Ivan Vulić Anna Korhonen 29 8 0 30 May 2023
RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths Zeyue Xue Guanglu Song Qiushan Guo Boxiao Liu Zhuofan Zong Yu Liu Ping Luo DiffM 48 133 0 29 May 2023
Photoswap: Personalized Subject Swapping in Images Jing Gu Yilin Wang Nanxuan Zhao Tsu-Jui Fu Wei Xiong ... Zhifei Zhang He Zhang Jianming Zhang Hyun-Sun Jung Xin Eric Wang DiffM 26 37 0 29 May 2023
Generating Images with Multimodal Language Models Jing Yu Koh Daniel Fried Ruslan Salakhutdinov MLLM 33 243 0 26 May 2023
Improved Visual Story Generation with Adaptive Context Modeling Zhangyin Feng Yuchen Ren Xinmiao Yu Xiaocheng Feng Duyu Tang Shuming Shi Bing Qin DiffM 40 14 0 26 May 2023
Uni-ControlNet: All-in-One Control to Text-to-Image Diffusion Models Shihao Zhao Dongdong Chen Yen-Chun Chen Jianmin Bao Shaozhe Hao Lu Yuan Kwan-Yee K. Wong 29 238 0 25 May 2023
Prompt-Free Diffusion: Taking "Text" out of Text-to-Image Diffusion Models Xingqian Xu Jiayi Guo Zhangyang Wang Gao Huang Irfan Essa Humphrey Shi VLM DiffM 42 57 0 25 May 2023
GenerateCT: Text-Conditional Generation of 3D Chest CT Volumes Ibrahim Ethem Hamamci Sezgin Er Anjany Sekuboyina Enis Simsar A. Tezcan ... Hadrien Reynaud Sarthak Pati Christian Bluethgen M. K. Özdemir Bjoern H. Menze DiffM MedIm 50 16 0 25 May 2023
T2TD: Text-3D Generation Model based on Prior Knowledge Guidance Weizhi Nie Ruidong Chen Weijie Wang Bruno Lepri N. Sebe 35 4 0 25 May 2023
Vision + Language Applications: A Survey Yutong Zhou N. Shimada VLM 35 6 0 24 May 2023
Text-guided 3D Human Generation from 2D Collections Tsu-Jui Fu Wenhan Xiong Yixin Nie Jingyu Liu Barlas Ouguz William Yang Wang 47 1 0 23 May 2023
Not All Image Regions Matter: Masked Vector Quantization for Autoregressive Image Generation Mengqi Huang Zhendong Mao Quang Wang Yongdong Zhang VGen DiffM 71 21 0 23 May 2023
Enhancing Detail Preservation for Customized Text-to-Image Generation: A Regularization-Free Approach Yufan Zhou Ruiyi Zhang Tongfei Sun Jinhui Xu DiffM 109 38 0 23 May 2023
ControlVideo: Training-free Controllable Text-to-Video Generation Yabo Zhang Yuxiang Wei Dongsheng Jiang Xiaopeng Zhang W. Zuo Qi Tian VGen DiffM 48 237 0 22 May 2023
FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering Megha Chakraborty Khusbu Pahwa Anku Rani Shreyas Chatterjee Dwip Dalal ... Shreyash Mishra K. Sensharma Aman Chadha Amit P. Sheth Amitava Das DiffM 35 7 0 22 May 2023
Any-to-Any Generation via Composable Diffusion Zineng Tang Ziyi Yang Chenguang Zhu Michael Zeng Joey Tianyi Zhou VGen DiffM 36 174 0 19 May 2023
Towards Accurate Image Coding: Improved Autoregressive Image Generation with Dynamic Vector Quantization Mengqi Huang Zhendong Mao Zhuowei Chen Yongdong Zhang MQ 38 36 0 19 May 2023
Efficient Cross-Lingual Transfer for Chinese Stable Diffusion with Images as Pivots Jinyi Hu Xu Han Xiaoyuan Yi Yutong Chen Wenhao Li Zhiyuan Liu Maosong Sun DiffM 33 4 0 19 May 2023
LaCon: Late-Constraint Diffusion for Steerable Guided Image Synthesis Chang-Shu Liu Rui Li Kaidong Zhang Xin Luo Dong Liu DiffM 29 3 0 19 May 2023
Swap Attention in Spatiotemporal Diffusions for Text-to-Video Generation Wenjing Wang Huan Yang Zixi Tuo Huiguo He Sitong Su Jianlong Fu Jiaying Liu DiffM VGen 53 114 0 18 May 2023
FastComposer: Tuning-Free Multi-Subject Image Generation with Localized Attention Guangxuan Xiao Tianwei Yin William T. Freeman F. Durand Song Han VGen DiffM 56 239 0 17 May 2023
Learning to Generate Poetic Chinese Landscape Painting with Calligraphy Shaozu Yuan Aijun Dai Zhiling Yan Ruixue Liu Meng Chen Baoyang Chen Zhijie Qiu Xiaodong He 44 7 0 08 May 2023
ReGeneration Learning of Diffusion Models with Rich Prompts for Zero-Shot Image Translation Yupei Lin Senyang Zhang Xiaojun Yang Tianlin Li Yukai Shi DiffM 38 5 0 08 May 2023
Guided Image Synthesis via Initial Image Editing in Diffusion Model Jiafeng Mao Xueting Wang Kiyoharu Aizawa DiffM 40 52 0 05 May 2023
Multimodal Procedural Planning via Dual Text-Image Prompting Yujie Lu Pan Lu Zhiyu Zoey Chen Wanrong Zhu Junfeng Fang William Yang Wang LM&Ro 64 43 0 02 May 2023
IconShop: Text-Guided Vector Icon Synthesis with Autoregressive Transformers Rong Wu Wanchao Su Kede Ma Jing Liao 35 34 0 27 Apr 2023
Controllable Image Generation via Collage Representations Arantxa Casanova Marlene Careil Adriana Romero Soriano Christopher Pal Jakob Verbeek M. Drozdzal DiffM 39 7 0 26 Apr 2023
Seeing is not always believing: Benchmarking Human and Model Perception of AI-Generated Images Zeyu Lu Di Huang Lei Bai Jingjing Qu Chengzhi Wu Xihui Liu Wanli Ouyang 26 53 0 25 Apr 2023
A Cookbook of Self-Supervised Learning Randall Balestriero Mark Ibrahim Vlad Sobal Ari S. Morcos Shashank Shekhar ... Pierre Fernandez Amir Bar Hamed Pirsiavash Yann LeCun Micah Goldblum SyDa FedML SSL 50 275 0 24 Apr 2023
Collaborative Diffusion for Multi-Modal Face Generation and Editing Ziqi Huang Kelvin C. K. Chan Yuming Jiang Ziwei Liu DiffM 52 103 0 20 Apr 2023
Not Only Generative Art: Stable Diffusion for Content-Style Disentanglement in Art Analysis Yankun Wu Yuta Nakashima Noa Garcia CoGe DiffM 39 26 0 20 Apr 2023
Text2Performer: Text-Driven Human Video Generation Yuming Jiang Shuai Yang Tong Liang Koh Wayne Wu Chen Change Loy Ziwei Liu DiffM VGen 51 48 0 17 Apr 2023
Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation Jie An Songyang Zhang Harry Yang Sonal Gupta Jia-Bin Huang Jiebo Luo Xiaoyue Yin DiffM VGen 38 107 0 17 Apr 2023
MasaCtrl: Tuning-Free Mutual Self-Attention Control for Consistent Image Synthesis and Editing Ming Cao Xintao Wang Zhongang Qi Ying Shan Xiaohu Qie Yinqiang Zheng DiffM 42 430 0 17 Apr 2023
AutoSplice: A Text-prompt Manipulated Image Dataset for Media Forensics Shan Jia Mingzhen Huang Zhou Zhou Yan Ju Jialing Cai Siwei Lyu DiffM 29 29 0 14 Apr 2023
ImageReward: Learning and Evaluating Human Preferences for Text-to-Image Generation Jiazheng Xu Xiao Liu Yuchen Wu Yuxuan Tong Qinkai Li Ming Ding Jie Tang Yuxiao Dong 63 325 0 12 Apr 2023
Gradient-Free Textual Inversion Zhengcong Fei Mingyuan Fan Junshi Huang DiffM 35 31 0 12 Apr 2023
HRS-Bench: Holistic, Reliable and Scalable Benchmark for Text-to-Image Models Eslam Mohamed Bakr Pengzhan Sun Xiaoqian Shen Faizan Farooq Khan Li Erran Li Mohamed Elhoseiny VLM 26 76 0 11 Apr 2023