Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient
Vision Transformers

Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers

9 October 2023

Kaiqi Huang

Papers citing "Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers"

16 / 16 papers shown

Title
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities Jiahui Geng Jintao Guo Shanshan Zhao Minghao Fu Lunhao Duan Guo-Hua Wang Qing-Guo Chen Zhao Xu Weihua Luo Kaifu Zhang DiffM 74 0 0 05 May 2025
D2C: Unlocking the Potential of Continuous Autoregressive Image Generation with Discrete Tokens Panpan Wang Liqiang Niu Fandong Meng Jinan Xu Yufeng Chen Jie Zhou DiffM 55 0 0 21 Mar 2025
Tokenize Image as a Set Zigang Geng Mengde Xu Han Hu Shuyang Gu DiffM 58 0 0 20 Mar 2025
SemHiTok: A Unified Image Tokenizer via Semantic-Guided Hierarchical Codebook for Multimodal Understanding and Generation Zhenpeng Chen Chunwei Wang Xiuwei Chen Hang Xu Jiawei Han Xiandan Liang VLM 73 1 0 09 Mar 2025
Improving Detail in Pluralistic Image Inpainting with Feature Dequantization Kyungri Park Woohwan Jung 82 1 0 02 Dec 2024
PanoLlama: Generating Endless and Coherent Panoramas with Next-Token-Prediction LLMs Teng Zhou Xiaoyu Zhang Yongchuan Tang MLLM DiffM 97 0 0 24 Nov 2024
Multidimensional Byte Pair Encoding: Shortened Sequences for Improved Visual Data Generation Tim Elsner Paula Usinger Julius Nehring-Wirxel Gregor Kobsik Victor Czech Yanjiang He I. Lim Leif Kobbelt 39 1 0 15 Nov 2024
Autoregressive Models in Vision: A Survey Jing Xiong Gongye Liu Lun Huang Chengyue Wu Taiqiang Wu ... Hao Fei Guillermo Sapiro Jiebo Luo Ping Luo Ngai Wong VGen 53 9 0 08 Nov 2024
LARP: Tokenizing Videos with a Learned Autoregressive Generative Prior Hanyu Wang Saksham Suri Yixuan Ren Hao Chen Abhinav Shrivastava VGen 31 10 0 28 Oct 2024
An Image is Worth 32 Tokens for Reconstruction and Generation Qihang Yu Mark Weber XueQing Deng Xiaohui Shen Daniel Cremers Liang-Chieh Chen VLM ViT 60 85 0 11 Jun 2024
StrokeNUWA: Tokenizing Strokes for Vector Graphic Synthesis Zecheng Tang Chenfei Wu Zekai Zhang Mingheng Ni Sheng-Siang Yin ... Zhengyuan Yang Lijuan Wang Zicheng Liu Juntao Li Nan Duan 25 10 0 30 Jan 2024
HQ-VAE: Hierarchical Discrete Representation Learning with Variational Bayes Yuhta Takida Yukara Ikemiya Takashi Shibuya Kazuki Shimada Woosung Choi ... Naoki Murata Toshimitsu Uesaka Kengo Uchida Wei-Hsiang Liao Yuki Mitsufuji BDL 51 12 0 31 Dec 2023
Improved Vector Quantized Diffusion Models Zhicong Tang Shuyang Gu Jianmin Bao Dong Chen Fang Wen DiffM 187 63 0 31 May 2022
StyleGAN-XL: Scaling StyleGAN to Large Diverse Datasets Axel Sauer Katja Schwarz Andreas Geiger 184 496 0 01 Feb 2022
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 255 4,805 0 24 Feb 2021
A Style-Based Generator Architecture for Generative Adversarial Networks Tero Karras S. Laine Timo Aila 309 10,378 0 12 Dec 2018