A-STAR: Test-time Attention Segregation and Retention for Text-to-image
Synthesis

A-STAR: Test-time Attention Segregation and Retention for Text-to-image Synthesis

26 June 2023

Aishwarya Agarwal

Srikrishna Karanam

Koustava Goswami

Balaji Vasan Srinivasan

ArXiv (abs)PDF HTML

Papers citing "A-STAR: Test-time Attention Segregation and Retention for Text-to-image Synthesis"

17 / 17 papers shown

Title
Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers Zhengyao Lv Tianlin Pan Chenyang Si Zhaoxi Chen W. Zuo Ziwei Liu Kwan-Yee K. Wong 35 0 0 09 Jun 2025
ComposeAnything: Composite Object Priors for Text-to-Image Generation Zeeshan Khan Shizhe Chen Cordelia Schmid DiffM CoGe 56 0 0 30 May 2025
Interactive Video Generation via Domain Adaptation Ishaan Rawal Suryansh Kumar DiffM VGen 44 0 0 30 May 2025
Not All Parameters Matter: Masking Diffusion Models for Enhancing Generation Ability Liwen Wang Senmao Li Fei Yang Jianye Wang Ziheng Zhang Yang Liu Yijiao Wang Jian Yang DiffM 139 1 0 06 May 2025
VSC: Visual Search Compositional Text-to-Image Diffusion Model Do Huu Dat Nam Hyeonu Po Yuan Mao Tae-Hyun Oh DiffM CoGe 121 0 0 02 May 2025
Semantix: An Energy Guided Sampler for Semantic Style Transfer Huiang He Minghui Hu C. Zheng Chaoyue Wang Tat-Jen Cham DiffM 92 0 0 28 Mar 2025
Self-Cross Diffusion Guidance for Text-to-Image Synthesis of Similar Subjects Weimin Qiu Jieke Wang Meng Tang DiffM 185 1 0 28 Nov 2024
Text Embedding is Not All You Need: Attention Control for Text-to-Image Semantic Alignment with Text Self-Attention Maps Jeeyung Kim Erfan Esmaeili Qiang Qiu DiffM 139 1 0 21 Nov 2024
Diffusion Beats Autoregressive: An Evaluation of Compositional Generation in Text-to-Image Models Arash Marioriyad Parham Rezaei M. Baghshah M. Rohban CoGe 469 0 0 30 Oct 2024
Progressive Compositionality in Text-to-Image Generative Models Xu Han Linghao Jin Xiaofeng Liu Paul Pu Liang CoGe 151 4 0 22 Oct 2024
Composing Parts for Expressive Object Generation Harsh Rangwani Aishwarya Agarwal Kuldeep Kulkarni R. Venkatesh Babu Srikrishna Karanam DiffM 110 2 0 14 Jun 2024
Information Theoretic Text-to-Image Alignment Chao Wang Giulio Franzese A. Finamore Massimo Gallo Pietro Michiardi 176 0 0 31 May 2024
InitNO: Boosting Text-to-Image Diffusion Models via Initial Noise Optimization Xiefan Guo Jinlin Liu Miaomiao Cui Jiankai Li Hongyu Yang Di Huang 102 38 0 06 Apr 2024
Layout-to-Image Generation with Localized Descriptions using ControlNet with Cross-Attention Control Denis Lukovnikov Asja Fischer DiffM 63 3 0 20 Feb 2024
PEEKABOO: Interactive Video Generation via Masked-Diffusion Yash Jain Anshul Nasery Vibhav Vineet Harkirat Singh Behl VGen 100 35 0 12 Dec 2023
Grounded Text-to-Image Synthesis with Attention Refocusing Quynh Phung Songwei Ge Jia-Bin Huang DiffM 120 113 0 08 Jun 2023
DF-GAN: A Simple and Effective Baseline for Text-to-Image Synthesis Ming Tao Hao Tang Leilei Gan Xiaoyuan Jing Bingkun Bao Changsheng Xu 134 214 0 13 Aug 2020