LAFITE: Towards Language-Free Training for Text-to-Image Generation

27 November 2021

Jiuxiang Gu

Papers citing "LAFITE: Towards Language-Free Training for Text-to-Image Generation"

50 / 107 papers shown

Title
ECoFLaP: Efficient Coarse-to-Fine Layer-Wise Pruning for Vision-Language Models Yi-Lin Sung Jaehong Yoon Mohit Bansal VLM 17 14 0 04 Oct 2023
InstaFlow: One Step is Enough for High-Quality Diffusion-Based Text-to-Image Generation Xingchao Liu Xiwen Zhang Jianzhu Ma Jian Peng Qiang Liu 91 194 0 12 Sep 2023
Likelihood-Based Text-to-Image Evaluation with Patch-Level Perceptual and Semantic Credit Assignment Qi Chen Chaorui Deng Zixiong Huang Bowen Zhang Mingkui Tan Qi Wu EGVM 19 0 0 16 Aug 2023
Diffusion idea exploration for art generation N. Verma DiffM 32 1 0 11 Jul 2023
AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning Yuwei Guo Ceyuan Yang Anyi Rao Zhengyang Liang Yaohui Wang Yu Qiao Maneesh Agrawala Dahua Lin Bo Dai VGen 23 782 0 10 Jul 2023
JourneyDB: A Benchmark for Generative Image Understanding Keqiang Sun Junting Pan Yuying Ge Hao Li Haodong Duan ... Yi Wang Jifeng Dai Yu Qiao Limin Wang Hongsheng Li 54 102 0 03 Jul 2023
AIGCIQA2023: A Large-scale Image Quality Assessment Database for AI Generated Images: from the Perspectives of Quality, Authenticity and Correspondence Jiarui Wang Huiyu Duan Jing Liu S. Chen Xiongkuo Min Guangtao Zhai EGVM 41 54 0 01 Jul 2023
Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text-to-Image Synthesis Xiaoshi Wu Yiming Hao Keqiang Sun Yixiong Chen Feng Zhu Rui Zhao Hongsheng Li 46 252 0 15 Jun 2023
The Age of Synthetic Realities: Challenges and Opportunities J. P. Cardenuto Jing Yang Rafael Padilha Renjie Wan Daniel Moreira Haoliang Li Shiqi Wang Fernanda A. Andaló Sébastien Marcel Anderson de Rezende Rocha DeLMO 42 29 0 09 Jun 2023
Efficient Text-Guided 3D-Aware Portrait Generation with Score Distillation Sampling on Distribution Yiji Cheng Fei Yin Xiaoke Huang Xintong Yu Jiaxiang Liu Shi Feng Yujiu Yang Yansong Tang DiffM 26 4 0 03 Jun 2023
Translation-Enhanced Multilingual Text-to-Image Generation Yaoyiran Li Ching-Yun Chang Stephen Rawls Ivan Vulić Anna Korhonen 19 8 0 30 May 2023
Vision + Language Applications: A Survey Yutong Zhou N. Shimada VLM 30 6 0 24 May 2023
Boosting Human-Object Interaction Detection with Text-to-Image Diffusion Model Jie-jin Yang Bing Li Fengyu Yang Ailing Zeng Lei Zhang Ruimao Zhang VLM DiffM 24 17 0 20 May 2023
SneakyPrompt: Jailbreaking Text-to-image Generative Models Yuchen Yang Bo Hui Haolin Yuan Neil Gong Yinzhi Cao EGVM 33 74 0 20 May 2023
MMoT: Mixture-of-Modality-Tokens Transformer for Composed Multimodal Conditional Image Synthesis Jinsheng Zheng Daqing Liu Chaoyue Wang Minghui Hu Zuopeng Yang Changxing Ding Dacheng Tao 31 1 0 10 May 2023
Vision-Language Models in Remote Sensing: Current Progress and Future Trends Xiang Li Congcong Wen Yuan Hu Zhenghang Yuan Xiao Xiang Zhu VLM 21 71 0 09 May 2023
TR0N: Translator Networks for 0-Shot Plug-and-Play Conditional Generation Zhaoyan Liu Noël Vouitsis S. Gorti Jimmy Ba G. Loaiza-Ganem ViT 27 1 0 26 Apr 2023
Not Only Generative Art: Stable Diffusion for Content-Style Disentanglement in Art Analysis Yankun Wu Yuta Nakashima Noa Garcia CoGe DiffM 34 26 0 20 Apr 2023
HRS-Bench: Holistic, Reliable and Scalable Benchmark for Text-to-Image Models Eslam Mohamed Bakr Pengzhan Sun Xiaoqian Shen Faizan Farooq Khan Li Erran Li Mohamed Elhoseiny VLM 24 76 0 11 Apr 2023
Toward Verifiable and Reproducible Human Evaluation for Text-to-Image Generation Mayu Otani Riku Togashi Yu Sawai Ryosuke Ishigami Yuta Nakashima Esa Rahtu J. Heikkilä Shiníchi Satoh 38 62 0 04 Apr 2023
Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models Jaewoong Lee Sang-Sub Jang Jaehyeong Jo Jaehong Yoon Yunji Kim Jin-Hwa Kim Jung-Woo Ha Sung Ju Hwang DiffM 32 4 0 04 Apr 2023
Variational Distribution Learning for Unsupervised Text-to-Image Generation Minsoo Kang Doyup Lee Jiseob Kim Saehoon Kim Bohyung Han DRL OOD 19 3 0 28 Mar 2023
DreamStone: Image as Stepping Stone for Text-Guided 3D Shape Generation Zhengzhe Liu Peng Dai Ruihui Li Xiaojuan Qi Chi-Wing Fu DiffM 18 10 0 24 Mar 2023
LD-ZNet: A Latent Diffusion Approach for Text-Based Image Segmentation K. Pnvr Bharat Singh P. Ghosh Behjat Siddiquie David Jacobs DiffM 35 29 0 22 Mar 2023
Text-to-image Diffusion Models in Generative AI: A Survey Chenshuang Zhang Chaoning Zhang Mengchun Zhang In So Kweon VLM 51 265 0 14 Mar 2023
DeltaEdit: Exploring Text-free Training for Text-Driven Image Manipulation Yueming Lyu Tianwei Lin Fu Li Dongliang He Jing Dong Tien-Ping Tan 38 39 0 11 Mar 2023
Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models Jiarui Xu Sifei Liu Arash Vahdat Wonmin Byeon Xiaolong Wang Shalini De Mello VLM 223 320 0 08 Mar 2023
GALIP: Generative Adversarial CLIPs for Text-to-Image Synthesis Ming Tao Bingkun Bao Hao Tang Changsheng Xu DiffM VLM 65 101 0 30 Jan 2023
StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis Axel Sauer Tero Karras S. Laine Andreas Geiger Timo Aila 37 207 0 23 Jan 2023
Joint Representation Learning for Text and 3D Point Cloud Rui Huang Xuran Pan Henry Zheng Haojun Jiang Zhifeng Xie S. Song Gao Huang 30 19 0 18 Jan 2023
GLIGEN: Open-Set Grounded Text-to-Image Generation Yuheng Li Haotian Liu Qingyang Wu Fangzhou Mu Jianwei Yang Jianfeng Gao Chunyuan Li Yong Jae Lee VLM 77 569 1 17 Jan 2023
ANNA: Abstractive Text-to-Image Synthesis with Filtered News Captions Aashish Anantha Ramakrishnan Sharon X. Huang Dongwon Lee 21 5 0 05 Jan 2023
Dream3D: Zero-Shot Text-to-3D Synthesis Using 3D Shape Prior and Text-to-Image Diffusion Models Jiale Xu Xintao Wang Weihao Cheng Yan-Pei Cao Ying Shan Xiaohu Qie Shenghua Gao 188 161 0 28 Dec 2022
CREPE: Can Vision-Language Foundation Models Reason Compositionally? Zixian Ma Jerry Hong Mustafa Omer Gul Mona Gandhi Irena Gao Ranjay Krishna CoGe 29 125 0 13 Dec 2022
Training-Free Structured Diffusion Guidance for Compositional Text-to-Image Synthesis Weixi Feng Xuehai He Tsu-jui Fu Varun Jampani Arjun Reddy Akula P. Narayana Sugato Basu Qing Guo William Yang Wang CoGe 33 299 0 09 Dec 2022
High-Fidelity Guided Image Synthesis with Latent Diffusion Models Jaskirat Singh Stephen Gould Liang Zheng DiffM 38 40 0 30 Nov 2022
Unified Discrete Diffusion for Simultaneous Vision-Language Generation Minghui Hu Chuanxia Zheng Heliang Zheng Tat-Jen Cham Chaoyue Wang Zuopeng Yang Dacheng Tao Ponnuthurai Nagaratnam Suganthan DiffM 20 23 0 27 Nov 2022
Shifted Diffusion for Text-to-image Generation Yufan Zhou Bingchen Liu Yizhe Zhu Xiao Yang Changyou Chen Jinhui Xu DiffM 24 40 0 24 Nov 2022
ReCo: Region-Controlled Text-to-Image Generation Zhengyuan Yang Jianfeng Wang Zhe Gan Linjie Li Kevin Qinghong Lin ... Nan Duan Zicheng Liu Ce Liu Michael Zeng Lijuan Wang DiffM 56 140 0 23 Nov 2022
Language-free Training for Zero-shot Video Grounding Dahye Kim Jungin Park Jiyoung Lee S. Park Kwanghoon Sohn 28 20 0 24 Oct 2022
Swinv2-Imagen: Hierarchical Vision Transformer Diffusion Models for Text-to-Image Generation Rui Li Weihua Li Yi Yang Hanyu Wei Jianhua Jiang Quan-wei Bai DiffM 27 11 0 18 Oct 2022
Self-Guided Diffusion Models Vincent Tao Hu David W. Zhang Yuki M. Asano Gertjan J. Burghouts Cees G. M. Snoek 31 32 0 12 Oct 2022
ManiCLIP: Multi-Attribute Face Manipulation from Text Hao Wang Guosheng Lin A. Molino Anran Wang Jiashi Feng Zehuan Yuan CVBM 35 9 0 02 Oct 2022
All are Worth Words: A ViT Backbone for Diffusion Models Fan Bao Shen Nie Kaiwen Xue Yue Cao Chongxuan Li Hang Su Jun Zhu VLM 26 315 0 25 Sep 2022
Text2Light: Zero-Shot Text-Driven HDR Panorama Generation Zhaoxi Chen Guangcong Wang Ziwei Liu 90 30 0 20 Sep 2022
Txt2Img-MHN: Remote Sensing Image Generation from Text Using Modern Hopfield Networks Yonghao Xu Weikang Yu Pedram Ghamisi Michael K Kopp Sepp Hochreiter 27 31 0 08 Aug 2022
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding Chitwan Saharia William Chan Saurabh Saxena Lala Li Jay Whang ... Raphael Gontijo-Lopes Tim Salimans Jonathan Ho David J Fleet Mohammad Norouzi VLM 60 5,778 0 23 May 2022
CogView2: Faster and Better Text-to-Image Generation via Hierarchical Transformers Ming Ding Wendi Zheng Wenyi Hong Jie Tang VLM 32 321 0 28 Apr 2022
Hierarchical Text-Conditional Image Generation with CLIP Latents Aditya A. Ramesh Prafulla Dhariwal Alex Nichol Casey Chu Mark Chen VLM DiffM 77 6,650 0 13 Apr 2022
Diffusion Probabilistic Modeling for Video Generation Ruihan Yang Prakhar Srivastava Stephan Mandt DiffM VGen 50 256 0 16 Mar 2022