StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks

10 December 2016

Papers citing "StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks"

50 / 394 papers shown

Title
PRISM: A Unified Framework for Photorealistic Reconstruction and Intrinsic Scene Modeling Alara Dirik Tuanfeng Y. Wang Duygu Ceylan Stefanos Zafeiriou Anna Frühstück DiffM 47 0 0 19 Apr 2025
A Review on Generative AI For Text-To-Image and Image-To-Image Generation and Implications To Scientific Images Zineb Sordo Eric Chagnon Daniela Ushizima EGVM MedIm 69 1 0 28 Feb 2025
Texture Image Synthesis Using Spatial GAN Based on Vision Transformers Elahe Salari Zohreh Azimifar ViT 57 0 0 03 Feb 2025
INFELM: In-depth Fairness Evaluation of Large Text-To-Image Models Di Jin Xing Liu Yu Liu Jia Qing Yap Andrea Wong Adriana Crespo Qi Lin Zhiyuan Yin Qiang Yan Ryan Ye EGVM VLM 153 0 0 10 Jan 2025
CLIP-SR: Collaborative Linguistic and Image Processing for Super-Resolution Bingwen Hu Heng Liu Zhedong Zheng Ping Liu SupR 86 0 0 16 Dec 2024
TweedieMix: Improving Multi-Concept Fusion for Diffusion-based Image/Video Generation Gihyun Kwon Jong Chul Ye DiffM 64 3 0 08 Oct 2024
Denoising with a Joint-Embedding Predictive Architecture Dengsheng Chen Jie Hu Xiaoming Wei Enhua Wu DiffM 52 2 0 02 Oct 2024
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction Jing He Haodong Li Wei Yin Yixun Liang Leheng Li Kaiqiang Zhou Hongbo Zhang Bingbing Liu Ying-Cong Chen DiffM VLM 46 40 0 26 Sep 2024
Jailbreaking Text-to-Image Models with LLM-Based Agents Yingkai Dong Zheng Li Xiangtao Meng Ning Yu Shanqing Guo LLMAG 45 13 0 01 Aug 2024
Theoretical Insights into CycleGAN: Analyzing Approximation and Estimation Errors in Unpaired Data Generation Luwei Sun Dongrui Shen Han Feng 43 2 0 16 Jul 2024
Surgical Text-to-Image Generation C. Nwoye Rupak Bose K. Elgohary Lorenzo Arboit Giorgio Carlino Joël L. Lavanchy Pietro Mascagni N. Padoy MedIm 55 3 0 12 Jul 2024
User-Friendly Customized Generation with Multi-Modal Prompts Linhao Zhong Yan Hong Wentao Chen Binglin Zhou Yiyi Zhang Jianfu Zhang Liqing Zhang DiffM 45 0 0 26 May 2024
KiNETGAN: Enabling Distributed Network Intrusion Detection through Knowledge-Infused Synthetic Data Generation Anantaa Kotal Brandon Luton Anupam Joshi 40 1 0 26 May 2024
Evolving Storytelling: Benchmarks and Methods for New Character Customization with Diffusion Models Xiyu Wang Yufei Wang Satoshi Tsutsui Weisi Lin Bihan Wen Alex C. Kot 44 4 0 20 May 2024
SignAvatar: Sign Language 3D Motion Reconstruction and Generation Lu Dong Lipisha Chaudhary Fei Xu Xiao Wang Mason Lary Ifeoma Nwogu SLR 34 3 0 13 May 2024
TextGaze: Gaze-Controllable Face Generation with Natural Language Hengfei Wang Zhongqun Zhang Yihua Cheng Hyung Jin Chang DiffM 33 2 0 26 Apr 2024
Iteratively Prompting Multimodal LLMs to Reproduce Natural and AI-Generated Images Ali Naseh Katherine Thai Mohit Iyyer Amir Houmansadr 47 5 0 21 Apr 2024
LASER: Tuning-Free LLM-Driven Attention Control for Efficient Text-conditioned Image-to-Animation Haoyu Zheng Wenqiao Zhang Yaoke Wang Hao Zhou Jiang Liu Juncheng Li Zheqi Lv Siliang Tang Yueting Zhuang Yueting Zhuang 44 1 0 21 Apr 2024
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation Minbin Huang Yanxin Long Xinchi Deng Ruihang Chu Jiangfeng Xiong Xiaodan Liang Hong Cheng Qinglin Lu Wei Liu MLLM EGVM 65 8 0 13 Mar 2024
Improving deep learning with prior knowledge and cognitive models: A survey on enhancing explainability, adversarial robustness and zero-shot learning F. Mumuni A. Mumuni AAML 37 5 0 11 Mar 2024
Wavelet-Guided Acceleration of Text Inversion in Diffusion-Based Image Editing Gwanhyeong Koo Sunjae Yoon Changdong Yoo DiffM 27 7 0 18 Jan 2024
ChatTraffic: Text-to-Traffic Generation via Diffusion Model Chengyang Zhang Yong Zhang Qitan Shao Bo Li Yisheng Lv Xinglin Piao Baocai Yin 30 5 0 27 Nov 2023
IMPRESS: Evaluating the Resilience of Imperceptible Perturbations Against Unauthorized Data Usage in Diffusion-Based Generative AI Bochuan Cao Changjiang Li Ting Wang Jinyuan Jia Bo Li Jinghui Chen DiffM 31 21 0 30 Oct 2023
A Distributed Approach to Meteorological Predictions: Addressing Data Imbalance in Precipitation Prediction Models through Federated Learning and GANs Elaheh Jafarigol Theodore Trafalis 21 7 0 19 Oct 2023
Object-aware Inversion and Reassembly for Image Editing Zhen Yang Dinggang Gui Wen Wang Hao Chen Bohan Zhuang Chunhua Shen DiffM 31 14 0 18 Oct 2023
Improving Compositional Text-to-image Generation with Large Vision-Language Models Song Wen Guian Fang Renrui Zhang Peng Gao Hao Dong Dimitris N. Metaxas 25 17 0 10 Oct 2023
Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using only Images Cuican Yu Guansong Lu Yihan Zeng Jian Sun Xiaodan Liang Huibin Li Zongben Xu Songcen Xu Wei Zhang Hang Xu 44 14 0 31 Aug 2023
Language-guided Human Motion Synthesis with Atomic Actions Yuanhao Zhai Mingzhen Huang Tianyu Luan Lu Dong Ifeoma Nwogu Siwei Lyu David Doermann Junsong Yuan 35 11 0 18 Aug 2023
CoDeF: Content Deformation Fields for Temporally Consistent Video Processing Ouyang Hao Qiuyu Wang Yuxi Xiao Qingyan Bai Juntao Zhang Kecheng Zheng Xiaowei Zhou Qifeng Chen Yujun Shen DiffM VGen 46 81 0 15 Aug 2023
Interleaving GANs with knowledge graphs to support design creativity for book covers Alexandru Motogna Adrian Groza GAN 11 0 0 03 Aug 2023
Stylized Projected GAN: A Novel Architecture for Fast and Realistic Image Generation Md Nurul Muttakin Malik Shahid Sultan R. Hoehndorf H. Ombao GAN 39 0 0 30 Jul 2023
Synaptic Plasticity Models and Bio-Inspired Unsupervised Deep Learning: A Survey Gabriele Lagani Fabrizio Falchi Claudio Gennaro Giuseppe Amato AAML 41 6 0 30 Jul 2023
Semantic Image Completion and Enhancement using GANs Priyansh Saxena Raahat Gupta Akshat Maheshwari Saumil Maheshwari VLM 21 1 0 27 Jul 2023
Spatial-Frequency U-Net for Denoising Diffusion Probabilistic Models Xin Yuan Linjie Li Jianfeng Wang Zhengyuan Yang Kevin Qinghong Lin Zicheng Liu Lijuan Wang DiffM 59 6 0 27 Jul 2023
Image Captions are Natural Prompts for Text-to-Image Models Shiye Lei Hao Chen Senyang Zhang Bo-Lu Zhao Dacheng Tao VLM 29 19 0 17 Jul 2023
Counting Guidance for High Fidelity Text-to-Image Synthesis Wonjune Kang Kevin Galim H. Koo Nam Ik Cho DiffM 32 8 0 30 Jun 2023
Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation Shuai Yang Yifan Zhou Ziwei Liu Chen Change Loy VGen DiffM 37 207 0 13 Jun 2023
AGIQA-3K: An Open Database for AI-Generated Image Quality Assessment Chunyi Li Zicheng Zhang Haoning Wu Wei Sun Xiongkuo Min Xiaohong Liu Guangtao Zhai Weisi Lin EGVM 21 115 0 07 Jun 2023
Differential Diffusion: Giving Each Pixel Its Strength E. Levin Ohad Fried DiffM 37 20 0 01 Jun 2023
PanoGen: Text-Conditioned Panoramic Environment Generation for Vision-and-Language Navigation Jialu Li Joey Tianyi Zhou DiffM 31 49 0 30 May 2023
Text-to-image Editing by Image Information Removal Zhongping Zhang Jian Zheng Jacob Zhiyuan Fang Bryan A. Plummer DiffM 23 12 0 27 May 2023
Uni-ControlNet: All-in-One Control to Text-to-Image Diffusion Models Shihao Zhao Dongdong Chen Yen-Chun Chen Jianmin Bao Shaozhe Hao Lu Yuan Kwan-Yee K. Wong 27 234 0 25 May 2023
Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation Jie An Songyang Zhang Harry Yang Sonal Gupta Jia-Bin Huang Jiebo Luo Xiaoyue Yin DiffM VGen 32 106 0 17 Apr 2023
ALR-GAN: Adaptive Layout Refinement for Text-to-Image Synthesis Hongchen Tan Baocai Yin Kun Wei Xiuping Liu Xin Li 15 16 0 13 Apr 2023
HRS-Bench: Holistic, Reliable and Scalable Benchmark for Text-to-Image Models Eslam Mohamed Bakr Pengzhan Sun Xiaoqian Shen Faizan Farooq Khan Li Erran Li Mohamed Elhoseiny VLM 24 76 0 11 Apr 2023
Toward Verifiable and Reproducible Human Evaluation for Text-to-Image Generation Mayu Otani Riku Togashi Yu Sawai Ryosuke Ishigami Yuta Nakashima Esa Rahtu J. Heikkilä Shiníchi Satoh 38 62 0 04 Apr 2023
Spatial Latent Representations in Generative Adversarial Networks for Image Generation Maciej Sypetkowski GAN 26 1 0 25 Mar 2023
Freestyle Layout-to-Image Synthesis Han Xue Z. Huang Qianru Sun Li-Na Song Wenjun Zhang DiffM 17 62 0 25 Mar 2023
Factor Decomposed Generative Adversarial Networks for Text-to-Image Synthesis Jiguo Li Xiaobin Liu Lirong Zheng DRL 19 1 0 24 Mar 2023
TAPS3D: Text-Guided 3D Textured Shape Generation from Pseudo Supervision Jiacheng Wei Hao Wang Jiashi Feng Guosheng Lin Kim-Hui Yap 24 30 0 23 Mar 2023