Hierarchical Text-Conditional Image Generation with CLIP Latents

13 April 2022

Papers citing "Hierarchical Text-Conditional Image Generation with CLIP Latents"

50 / 4,897 papers shown

Title
CLIPure: Purification in Latent Space via CLIP for Adversarially Robust Zero-Shot Classification Mingkun Zhang Keping Bi Wei Chen Jiafeng Guo Xueqi Cheng BDL VLM 170 2 0 25 Feb 2025
FairGen: Controlling Sensitive Attributes for Fair Generations in Diffusion Models via Adaptive Latent Guidance Mintong Kang Vinayshekhar Bannihatti Kumar Shamik Roy Abhishek Kumar Sopan Khosla Balakrishnan Narayanaswamy Rashmi Gangadharaiah 77 0 0 25 Feb 2025
Multi-Perspective Data Augmentation for Few-shot Object Detection Anh-Khoa Nguyen Vu Quoc-Truong Truong Vinh-Tiep Nguyen T. Ngo Thanh-Toan Do Tam V. Nguyen 166 1 0 25 Feb 2025
Mitigating Hallucinations in Diffusion Models through Adaptive Attention Modulation Trevine Oorloff Yaser Yacoob Abhinav Shrivastava 72 0 0 24 Feb 2025
Improved Diffusion-based Generative Model with Better Adversarial Robustness Zekun Wang Mingyang Yi Shuchen Xue Zhiyu Li Ming Liu Bing Qin Zhi-Ming Ma DiffM 112 0 0 24 Feb 2025
Methods and Trends in Detecting Generated Images: A Comprehensive Review Arpan Mahara N. Rishe AAML 448 1 0 24 Feb 2025
Culture-TRIP: Culturally-Aware Text-to-Image Generation with Iterative Prompt Refinement Suchae Jeong Inseong Choi Youngsik Yun Jihie Kim DiffM 133 2 0 24 Feb 2025
DUNIA: Pixel-Sized Embeddings via Cross-Modal Alignment for Earth Observation Applications Ibrahim Fayad Max Zimmer Martin Schwartz P. Ciais Fabian Gieseke Gabriel Belouze Sarah Brood A. D. Truchis Alexandre d’Aspremont AI4TS 92 0 0 24 Feb 2025
Distributional Vision-Language Alignment by Cauchy-Schwarz Divergence Wenzhe Yin Zehao Xiao Pan Zhou Shujian Yu Jiayi Shen Jan-Jakob Sonke E. Gavves 177 1 0 24 Feb 2025
PuzzleFusion++: Auto-agglomerative 3D Fracture Assembly by Denoise and Verify Zhengqing Wang Jiacheng Chen Yasutaka Furukawa 146 8 0 24 Feb 2025
Posterior Inference with Diffusion Models for High-dimensional Black-box Optimization Taeyoung Yun Kiyoung Om Jaewoo Lee Sujin Yun Jinkyoo Park 117 2 0 24 Feb 2025
Human2Robot: Learning Robot Actions from Paired Human-Robot Videos Sicheng Xie Haidong Cao Zejia Weng Zhen Xing Shiwei Shen Jiaqi Leng Xipeng Qiu Yanwei Fu Zuxuan Wu Yu Jiang 148 0 0 23 Feb 2025
Unified Prompt Attack Against Text-to-Image Generation Models Duo Peng Qiuhong Ke Mark He Huang Ping Hu Jing Liu 89 1 0 23 Feb 2025
Robustness and Cybersecurity in the EU Artificial Intelligence Act Henrik Nolte Miriam Rateike Michèle Finck 103 2 0 22 Feb 2025
DualNeRF: Text-Driven 3D Scene Editing via Dual-Field Representation Yuxuan Xiong Yue Shi Yishun Dou Bingbing Ni DiffM 69 0 0 22 Feb 2025
PersGuard: Preventing Malicious Personalization via Backdoor Attacks on Pre-trained Text-to-Image Diffusion Models Xinwei Liu Xiaojun Jia Yuan Xun Qichuan Geng Xiaochun Cao DiffM AAML 78 1 0 22 Feb 2025
A Critical Assessment of Modern Generative Models' Ability to Replicate Artistic Styles Andrea Asperti Franky George Tiberio Marras Razvan Ciprian Stricescu Fabio Zanotti EGVM 91 0 0 21 Feb 2025
Text-to-Image Rectified Flow as Plug-and-Play Priors Xiaofeng Yang Cheng Chen Xulei Yang Fayao Liu Guosheng Lin DiffM 133 7 0 21 Feb 2025
Data Attribution for Text-to-Image Models by Unlearning Synthesized Images Sheng-Yu Wang Aaron Hertzmann Alexei A. Efros Jun-Yan Zhu Richard Zhang TDI 209 3 0 21 Feb 2025
Transfer Learning with Pre-trained Conditional Generative Models Shin'ya Yamaguchi Sekitoshi Kanai Atsutoshi Kumagai Daiki Chijiwa H. Kashima VLM CLL BDL DiffM 261 5 0 21 Feb 2025
Dynamic Concepts Personalization from Single Videos Rameen Abdal Or Patashnik Ivan Skorokhodov Willi Menapace Aliaksandr Siarohin Sergey Tulyakov Daniel Cohen-Or Kfir Aberman DiffM VGen 107 1 0 21 Feb 2025
Enhancing Adversarial Robustness of Vision-Language Models through Low-Rank Adaptation Yuheng Ji Yue Liu Zhicheng Zhang Zhao Zhang Yuting Zhao Gang Zhou Xingwei Zhang Xinwang Liu Xiaolong Zheng VLM 184 4 0 21 Feb 2025
On Memorization in Diffusion Models Xiangming Gu Chao Du Tianyu Pang Chongxuan Li Min Lin Ye Wang DiffM TDI 345 55 0 21 Feb 2025
SMITE: Segment Me In TimE Amirhossein Alimohammadi Sauradip Nag Saeid Asgari Taghanaki Andrea Tagliasacchi Ghassan Hamarneh Ali Mahdavi-Amiri VLM VOS 531 3 0 20 Feb 2025
Object-centric Binding in Contrastive Language-Image Pretraining Rim Assouel Pietro Astolfi Florian Bordes M. Drozdzal Adriana Romero Soriano OCL VLM CoGe 161 3 0 19 Feb 2025
MotionMatcher: Motion Customization of Text-to-Video Diffusion Models via Motion Feature Matching Yen-Siang Wu Chi-Pin Huang Fu-En Yang Yu-Jie Wang DiffM VGen 125 1 0 18 Feb 2025
GrainPaint: A multi-scale diffusion-based generative model for microstructure reconstruction of large-scale objects Nathan Hoffman Cashen Diniz Dehao Liu T. Rodgers Anh Tran Mark Fuge AI4CE DiffM 125 1 0 18 Feb 2025
Diffusion-Sharpening: Fine-tuning Diffusion Models with Denoising Trajectory Sharpening Ye Tian L. Yang Xinchen Zhang Yunhai Tong Mengdi Wang Tengjiao Wang 121 2 0 17 Feb 2025
FreeBlend: Advancing Concept Blending with Staged Feedback-Driven Interpolation Diffusion Yufan Zhou Haoyu Shen Huan Wang DiffM 258 1 0 17 Feb 2025
GaussianMotion: End-to-End Learning of Animatable Gaussian Avatars with Pose Guidance from Text Gyumin Shim Sangmin Lee Jaegul Choo 3DGS 106 0 0 17 Feb 2025
Precise Parameter Localization for Textual Generation in Diffusion Models Łukasz Staniszewski Bartosz Cywiński Franziska Boenisch Kamil Deja Adam Dziedzic DiffM 471 1 0 17 Feb 2025
HermesFlow: Seamlessly Closing the Gap in Multimodal Understanding and Generation L. Yang Xinchen Zhang Ye Tian Chenming Shang Minghao Xu Wentao Zhang Tengjiao Wang 147 4 0 17 Feb 2025
Learning to Sample Effective and Diverse Prompts for Text-to-Image Generation Taeyoung Yun Dinghuai Zhang Jinkyoo Park Ling Pan DiffM 108 6 0 17 Feb 2025
Exploiting Point-Language Models with Dual-Prompts for 3D Anomaly Detection Jiaxiang Wang Haote Xu Xiaolu Chen Haodi Xu Yue Huang Xinghao Ding Xiaotong Tu 87 0 0 16 Feb 2025
ControlText: Unlocking Controllable Fonts in Multilingual Text Rendering without Font Annotations Bowen Jiang Yuan Yuan Xinyi Bai Zhuoqun Hao Alyson Yin Yaojie Hu Wenyu Liao Lyle Ungar Camillo J Taylor DiffM 127 2 0 16 Feb 2025
PDA: Generalizable Detection of AI-Generated Images via Post-hoc Distribution Alignment Li Wang Wenyu Chen Zheng Li Shanqing Guo 97 0 0 15 Feb 2025
PCGRLLM: Large Language Model-Driven Reward Design for Procedural Content Generation Reinforcement Learning In-Chang Baek Sung-Hyun Kim Sam Earle Zehua Jiang Noh Jin-Ha Julian Togelius Kyung-Joong Kim 78 2 0 15 Feb 2025
SWA-LDM: Toward Stealthy Watermarks for Latent Diffusion Models Zhiyong Yang Linye Lyu Xuanhang Chang Daojing He Yu Li 105 0 0 14 Feb 2025
Regularization can make diffusion models more efficient Mahsa Taheri Johannes Lederer 171 0 0 13 Feb 2025
Diffusion Models Through a Global Lens: Are They Culturally Inclusive? Zahra Bayramli Ayhan Suleymanzade Na Min An Huzama Ahmad Eunsu Kim Junyeong Park James Thorne Alice Oh 137 4 0 13 Feb 2025
SketchFlex: Facilitating Spatial-Semantic Coherence in Text-to-Image Generation with Region-Based Sketches Haichuan Lin Yilin Ye Jiazhi Xia Wei Zeng DiffM 109 0 0 11 Feb 2025
UniMoD: Efficient Unified Multimodal Transformers with Mixture-of-Depths Weijia Mao Zhiyong Yang Mike Zheng Shou MoE 192 1 0 10 Feb 2025
Adversarial Transform Particle Filters Chengxin Gong Wei Lin Cheng Zhang 81 0 0 10 Feb 2025
Guidance-base Diffusion Models for Improving Photoacoustic Image Quality Tatsuhiro Eguchi Shumpei Takezaki Mihoko Shimano Takayuki Yagi Ryoma Bise MedIm 90 0 0 10 Feb 2025
Beyond Fine-Tuning: A Systematic Study of Sampling Techniques in Personalized Image Generation Vera Soboleva M. Nakhodnov Aibek Alanov 109 1 0 09 Feb 2025
Augmented Conditioning Is Enough For Effective Training Image Generation Jiahui Chen Amy Zhang Adriana Romero-Soriano DiffM VLM 203 0 0 06 Feb 2025
Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion Marco Mistretta Alberto Baldrati Lorenzo Agnolucci Marco Bertini Andrew D. Bagdanov CLIP VLM 168 5 0 06 Feb 2025
A Periodic Bayesian Flow for Material Generation Hanlin Wu Yuxuan Song Jingjing Gong Ziyao Cao Y. Ouyang Jianbing Zhang Hao Zhou Wei-Ying Ma Jingjing Liu DiffM 149 3 0 04 Feb 2025
Information-Theoretic Proofs for Diffusion Sampling Galen Reeves H. Pfister DiffM 150 0 0 04 Feb 2025
Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning Hanyang Zhao Haoxian Chen Ji Zhang D. Yao Wenpin Tang 147 1 0 03 Feb 2025