Hierarchical Text-Conditional Image Generation with CLIP Latents

13 April 2022

Papers citing "Hierarchical Text-Conditional Image Generation with CLIP Latents"

50 / 4,897 papers shown

Title
MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge Linxi Fan Guanzhi Wang Yunfan Jiang Ajay Mandlekar Yuncong Yang Haoyi Zhu Andrew Tang De-An Huang Yuke Zhu Anima Anandkumar LM&Ro 144 388 0 17 Jun 2022
MixGen: A New Multi-Modal Data Augmentation Xiaoshuai Hao Yi Zhu Srikar Appalaraju Aston Zhang Wanqian Zhang Boyang Li Mu Li VLM 111 90 0 16 Jun 2022
Know your audience: specializing grounded language models with listener subtraction Aaditya K. Singh David Ding Andrew M. Saxe Felix Hill Andrew Kyle Lampinen 65 2 0 16 Jun 2022
Sharper Convergence Guarantees for Asynchronous SGD for Distributed and Federated Learning Anastasia Koloskova Sebastian U. Stich Martin Jaggi FedML 67 82 0 16 Jun 2022
On Privacy and Personalization in Cross-Silo Federated Learning Ziyu Liu Shengyuan Hu Zhiwei Steven Wu Virginia Smith FedML 113 56 0 16 Jun 2022
Write and Paint: Generative Vision-Language Models are Unified Modal Learners Shizhe Diao Wangchunshu Zhou Xinsong Zhang Jiawei Wang MLLM AI4CE 93 17 0 15 Jun 2022
Emergent Abilities of Large Language Models Jason W. Wei Yi Tay Rishi Bommasani Colin Raffel Barret Zoph ... Tatsunori Hashimoto Oriol Vinyals Percy Liang J. Dean W. Fedus ELM ReLM LRM 320 2,524 0 15 Jun 2022
CARD: Classification and Regression Diffusion Models Xizewen Han Huangjie Zheng Mingyuan Zhou DiffM 108 115 0 15 Jun 2022
Towards a Solution to Bongard Problems: A Causal Approach Salahedine Youssef Matej Zečević Devendra Singh Dhami Kristian Kersting 64 5 0 14 Jun 2022
Efficiently Training Low-Curvature Neural Networks Suraj Srinivas Kyle Matoba Himabindu Lakkaraju François Fleuret AAML 92 16 0 14 Jun 2022
X-Risk Analysis for AI Research Dan Hendrycks Mantas Mazeika 77 71 0 13 Jun 2022
gDDIM: Generalized denoising diffusion implicit models Qinsheng Zhang Molei Tao Yongxin Chen DiffM 106 117 0 11 Jun 2022
Multi-instrument Music Synthesis with Spectrogram Diffusion Curtis Hawthorne Ian Simon Adam Roberts Neil Zeghidour Josh Gardner Ethan Manilow Jesse Engel DiffM 74 51 0 11 Jun 2022
Is Self-Supervised Learning More Robust Than Supervised Learning? Yuanyi Zhong Haoran Tang Jun-Kun Chen Jian-wei Peng Yu-Xiong Wang SSL OOD 77 25 0 10 Jun 2022
Refining neural network predictions using background knowledge Alessandro Daniele Emile van Krieken Luciano Serafini F. V. Harmelen 85 12 0 10 Jun 2022
Spatial Entropy as an Inductive Bias for Vision Transformers E. Peruzzo E. Sangineto Yahui Liu Marco De Nadai Wei Bi Bruno Lepri N. Sebe ViT MDE 114 2 0 09 Jun 2022
Unveiling Transformers with LEGO: a synthetic reasoning task Yi Zhang A. Backurs Sébastien Bubeck Ronen Eldan Suriya Gunasekar Tal Wagner LRM 136 91 0 09 Jun 2022
Neural Diffusion Processes Vincent Dutordoir Alan D. Saul Zoubin Ghahramani F. Simpson DiffM 112 42 0 08 Jun 2022
Autoregressive Perturbations for Data Poisoning Pedro Sandoval-Segura Vasu Singla Jonas Geiping Micah Goldblum Tom Goldstein David Jacobs AAML 100 41 0 08 Jun 2022
Intra-agent speech permits zero-shot task acquisition Chen Yan Federico Carnevale Petko Georgiev Adam Santoro Aurelia Guy Alistair Muldal Chia-Chun Hung Josh Abramson Timothy Lillicrap Greg Wayne LM&Ro 92 9 0 07 Jun 2022
Blended Latent Diffusion Omri Avrahami Ohad Fried Dani Lischinski DiffM 165 392 0 06 Jun 2022
Diffusion-GAN: Training GANs with Diffusion Zhendong Wang Huangjie Zheng Pengcheng He Weizhu Chen Mingyuan Zhou DiffM 81 235 0 05 Jun 2022
Compositional Visual Generation with Composable Diffusion Models Nan Liu Shuang Li Yilun Du Antonio Torralba J. Tenenbaum DiffM CoGe 207 530 0 03 Jun 2022
Language and Culture Internalisation for Human-Like Autotelic AI Cédric Colas Tristan Karch Clément Moulin-Frier Pierre-Yves Oudeyer LM&Ro 98 27 0 02 Jun 2022
DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps Cheng Lu Yuhao Zhou Fan Bao Jianfei Chen Chongxuan Li Jun Zhu DiffM 272 1,472 0 02 Jun 2022
When happy accidents spark creativity: Bringing collaborative speculation to life with generative AI Ziv Epstein Hope Schroeder Dava Newman 21 24 0 01 Jun 2022
DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder Jie Shi Chenfei Wu Jian Liang Xiang Liu Nan Duan DiffM 76 26 0 01 Jun 2022
Elucidating the Design Space of Diffusion-Based Generative Models Tero Karras M. Aittala Timo Aila S. Laine DiffM 262 2,035 0 01 Jun 2022
Discovering the Hidden Vocabulary of DALLE-2 Giannis Daras A. Dimakis 189 68 0 01 Jun 2022
Improved Vector Quantized Diffusion Models Zhicong Tang Shuyang Gu Jianmin Bao Dong Chen Fang Wen DiffM 246 63 0 31 May 2022
Few-Shot Diffusion Models Giorgio Giannone Didrik Nielsen Ole Winther DiffM 231 51 0 30 May 2022
Guided-TTS 2: A Diffusion Model for High-quality Adaptive Text-to-Speech with Untranscribed Data Sungwon Kim Heeseung Kim Sung-Hoon Yoon DiffM 249 53 0 30 May 2022
BinauralGrad: A Two-Stage Conditional Diffusion Probabilistic Model for Binaural Audio Synthesis Yichong Leng Zehua Chen Junliang Guo Haohe Liu Jiawei Chen ... Lei He Xiang-Yang Li Tao Qin Sheng Zhao Tie-Yan Liu DiffM 151 61 0 30 May 2022
CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers Wenyi Hong Ming Ding Wendi Zheng Xinghan Liu Jie Tang DiffM 322 632 0 29 May 2022
CyCLIP: Cyclic Contrastive Language-Image Pretraining Shashank Goel Hritik Bansal S. Bhatia Ryan Rossi Vishwa Vinay Aditya Grover CLIP VLM 280 140 0 28 May 2022
Diffusion-LM Improves Controllable Text Generation Xiang Lisa Li John Thickstun Ishaan Gulrajani Percy Liang Tatsunori B. Hashimoto AI4CE 248 837 0 27 May 2022
Multimodal Masked Autoencoders Learn Transferable Representations Xinyang Geng Hao Liu Lisa Lee Dale Schuurams Sergey Levine Pieter Abbeel 88 119 0 27 May 2022
Video2StyleGAN: Disentangling Local and Global Variations in a Video Rameen Abdal Peihao Zhu Niloy J. Mitra Peter Wonka VGen 83 7 0 27 May 2022
Pretraining is All You Need for Image-to-Image Translation Tengfei Wang Ting Zhang Bo Zhang Hao Ouyang Dong Chen Qifeng Chen Fang Wen DiffM 265 181 0 25 May 2022
Gradient-Based Constrained Sampling from Language Models Sachin Kumar Biswajit Paria Yulia Tsvetkov BDL 99 57 0 25 May 2022
mPLUG: Effective and Efficient Vision-Language Learning by Cross-modal Skip-connections Chenliang Li Haiyang Xu Junfeng Tian Wei Wang Ming Yan ... Ji Zhang Songfang Huang Feiran Huang Jingren Zhou Luo Si VLM MLLM 93 224 0 24 May 2022
Semi-Parametric Inducing Point Networks and Neural Processes R. Rastogi Yair Schiff Alon Hacohen Zhaozhi Li I-Hsiang Lee Yuntian Deng M. Sabuncu Volodymyr Kuleshov 3DPC 82 7 0 24 May 2022
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding Chitwan Saharia William Chan Saurabh Saxena Lala Li Jay Whang ... Raphael Gontijo-Lopes Tim Salimans Jonathan Ho David J Fleet Mohammad Norouzi VLM 486 6,102 0 23 May 2022
Evidence for Hypodescent in Visual Semantic AI Robert Wolfe M. Banaji Aylin Caliskan VLM 91 38 0 22 May 2022
Diverse Weight Averaging for Out-of-Distribution Generalization Alexandre Ramé Matthieu Kirchmeyer Thibaud Rahier A. Rakotomamonjy Patrick Gallinari Matthieu Cord OOD 256 138 0 19 May 2022
Deterministic training of generative autoencoders using invertible layers Gianluigi Silvestri Daan Roos L. Ambrogioni TPM 65 2 0 19 May 2022
Adversarial random forests for density estimation and generative modeling David S. Watson Kristin Blesch Jan Kapar Marvin N. Wright GAN 122 21 0 19 May 2022
What company do words keep? Revisiting the distributional semantics of J.R. Firth & Zellig Harris Mikael Brunila J. LaViolette 110 21 0 16 May 2022
Diffusion Models for Adversarial Purification Weili Nie Brandon Guo Yujia Huang Chaowei Xiao Arash Vahdat Anima Anandkumar WIGM 278 454 0 16 May 2022
The Mechanism of Prediction Head in Non-contrastive Self-supervised Learning Zixin Wen Yuanzhi Li SSL 116 35 0 12 May 2022