Online Clustered Codebook

27 July 2023

Andrea Vedaldi

Papers citing "Online Clustered Codebook"

22 / 22 papers shown

Title
SMAP: Self-supervised Motion Adaptation for Physically Plausible Humanoid Whole-body Control Haoyu Zhao Sixu Lin Qingwei Ben Minyue Dai Hao Fei Jingbo Wang Hua Zou Junting Dong 49 0 0 26 May 2025
Restructuring Vector Quantization with the Rotation Trick Christopher Fifty Ronald G. Junkins Dennis Duan Aniketh Iger Jerry W. Liu Ehsan Amid Sebastian Thrun Christopher Ré LLMSV 87 12 0 08 Oct 2024
Loong: Generating Minute-level Long Videos with Autoregressive Language Models Yuqing Wang Tianwei Xiong Daquan Zhou Zhijie Lin Yang Zhao Bingyi Kang Jiashi Feng Xihui Liu VGen 85 26 0 03 Oct 2024
Sketch-A-Shape: Zero-Shot Sketch-to-3D Shape Generation Aditya Sanghi P. Jayaraman Arianna Rampini Joseph Lambourne Hooman Shayani Evan Atherton Saeid Asgari Taghanaki 3DV 67 15 0 08 Jul 2023
VQ3D: Learning a 3D-Aware Generative Model on ImageNet Kyle Sargent Jing Yu Koh Han Zhang Huiwen Chang Charles Herrmann Pratul P. Srinivasan Jiajun Wu Deqing Sun 86 31 0 14 Feb 2023
Unified Discrete Diffusion for Simultaneous Vision-Language Generation Minghui Hu Chuanxia Zheng Heliang Zheng Tat-Jen Cham Chaoyue Wang Zuopeng Yang Dacheng Tao Ponnuthurai Nagaratnam Suganthan DiffM 68 24 0 27 Nov 2022
Hierarchical Text-Conditional Image Generation with CLIP Latents Aditya A. Ramesh Prafulla Dhariwal Alex Nichol Casey Chu Mark Chen VLM DiffM 300 6,768 0 13 Apr 2022
UNIMO-2: End-to-End Unified Vision-Language Grounded Learning Wei Li Can Gao Guocheng Niu Xinyan Xiao Hao Liu Jiachen Liu Hua Wu Haifeng Wang MLLM 26 21 0 17 Mar 2022
Autoregressive Image Generation using Residual Quantization Doyup Lee Chiheon Kim Saehoon Kim Minsu Cho Wook-Shin Han VGen 220 343 0 03 Mar 2022
MaskGIT: Masked Generative Image Transformer Huiwen Chang Han Zhang Lu Jiang Ce Liu William T. Freeman ViT 92 664 0 08 Feb 2022
Global Context with Discrete Diffusion in Vector Quantised Modelling for Image Generation Minghui Hu Yujie Wang Tat-Jen Cham Jianfei Yang P.N.Suganthan DiffM 38 42 0 03 Dec 2021
NÜWA: Visual Synthesis Pre-training for Neural visUal World creAtion Chenfei Wu Jian Liang Lei Ji Fan Yang Yuejian Fang Daxin Jiang Nan Duan ViT VGen 52 294 0 24 Nov 2021
Projected GANs Converge Faster Axel Sauer Kashyap Chitta Jens Muller Andreas Geiger 73 234 0 01 Nov 2021
BEiT: BERT Pre-Training of Image Transformers Hangbo Bao Li Dong Songhao Piao Furu Wei ViT 182 2,790 0 15 Jun 2021
VideoGPT: Video Generation using VQ-VAE and Transformers Wilson Yan Yunzhi Zhang Pieter Abbeel A. Srinivas ViT VGen 288 495 0 20 Apr 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 329 4,873 0 24 Feb 2021
Latent Video Transformer Ruslan Rakhimov Denis Volkhonskiy Alexey Artemov Denis Zorin Evgeny Burnaev VGen 81 119 0 18 Jun 2020
Jukebox: A Generative Model for Music Prafulla Dhariwal Heewoo Jun Christine Payne Jong Wook Kim Alec Radford Ilya Sutskever VLM 96 731 0 30 Apr 2020
A Style-Based Generator Architecture for Generative Adversarial Networks Tero Karras S. Laine Timo Aila 513 10,500 0 12 Dec 2018
The Unreasonable Effectiveness of Deep Features as a Perceptual Metric Richard Y. Zhang Phillip Isola Alexei A. Efros Eli Shechtman Oliver Wang EGVM 302 11,610 0 11 Jan 2018
Neural Discrete Representation Learning Aaron van den Oord Oriol Vinyals Koray Kavukcuoglu BDL SSL OCL 173 4,928 0 02 Nov 2017
Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms Han Xiao Kashif Rasul Roland Vollgraf 189 8,807 0 25 Aug 2017