Jukebox: A Generative Model for Music

30 April 2020

ArXiv (abs)PDF HTML Github (7986★)

Papers citing "Jukebox: A Generative Model for Music"

50 / 473 papers shown

Title
Universal Music Representations? Evaluating Foundation Models on World Music Corpora Charilaos Papaioannou Emmanouil Benetos Alexandros Potamianos 34 0 0 20 Jun 2025
Versatile Symbolic Music-for-Music Modeling via Function Alignment Junyan Jiang Daniel Y. Chin Liwei Lin Xuanjie Liu Gus Xia 30 0 0 18 Jun 2025
Enhancing Vector Quantization with Distributional Matching: A Theoretical and Empirical Study Xianghong Fang Litao Guo Hengchao Chen Yuxuan Zhang XiaofanXia ... Yexin Liu Hao Wang Harry Yang Yuan Yuan Qiang Sun MQ 31 0 0 18 Jun 2025
Dynamic Sparse Training of Diagonally Sparse Networks Abhishek Tyagi Arjun Iyer William H Renninger Christopher Kanan Yuhao Zhu 17 0 0 13 Jun 2025
DanceChat: Large Language Model-Guided Music-to-Dance Generation Qing Wang Xiaohang Yang Yilan Dong Naveen Raj Govindaraj Gregory Slabaugh Shanxin Yuan 124 0 0 12 Jun 2025
Auto-Regressive vs Flow-Matching: a Comparative Study of Modeling Paradigms for Text-to-Music Generation Or Tal Felix Kreuk Yossi Adi AI4TS 62 0 0 10 Jun 2025
TuneGenie: Reasoning-based LLM agents for preferential music generation Amitesh Pandey Jafarbek Arifdjanov Ansh Tiwari LRM 26 0 0 10 Jun 2025
LeVo: High-Quality Song Generation with Multi-Preference Alignment Shun Lei Yaoxun Xu Zhiwei Lin Huaicheng Zhang Wei Tan ... Chenyu Yang Haina Zhu Shuai Wang Zhiyong Wu Dong Yu 49 0 0 09 Jun 2025
OpenDance: Multimodal Controllable 3D Dance Generation Using Large-scale Internet Data Jinlu Zhang Zixi Kang Yizhou Wang 24 0 0 09 Jun 2025
Survey on the Evaluation of Generative Models in Music Alexander Lerch Claire Arthur Nick Bryan-Kinns Corey Ford Qianyi Sun Ashvala Vinay 164 0 0 05 Jun 2025
Improving AI-generated music with user-guided training Vishwa Mohan Singh Sai Anirudh Aryasomayajula Ahan Chatterjee Beste Aydemir Rifat Mehreen Amin 102 0 0 05 Jun 2025
A Survey of Generative Categories and Techniques in Multimodal Large Language Models Longzhen Han Awes Mubarak Almas Baimagambetov Nikolaos Polatidis Thar Baker LRM 67 0 0 29 May 2025
MGE-LDM: Joint Latent Diffusion for Simultaneous Music Generation and Source Extraction Yunkee Chae Kyogu Lee 64 0 0 29 May 2025
ACE-Step: A Step Towards Music Generation Foundation Model Junmin Gong Sean Zhao Sen Wang S. Xu Joe Guo 44 2 0 28 May 2025
Large Language Models Implicitly Learn to See and Hear Just By Reading Prateek Verma Mert Pilanci 200 0 0 20 May 2025
Discovering Interpretable Concepts in Large Generative Music Models Nikhil Singh Manuel Cherep Pattie Maes 29 0 0 18 May 2025
Not that Groove: Zero-Shot Symbolic Music Editing Li Zhang 71 0 0 13 May 2025
ELGAR: Expressive Cello Performance Motion Generation for Audio Rendition Zhiping Qiu Yitong Jin Yijiao Wang Yi Shi Changbo Wang Chao Tan Xiaobing Li Feng Yu Tao Yu Qionghai Dai 71 0 0 07 May 2025
POET: Prompt Offset Tuning for Continual Human Action Adaptation Prachi Garg Joseph K J V. Balasubramanian Necati Cihan Camgöz Chengde Wan Kenrick Kin Weiguang Si Shugao Ma Fernando de la Torre 137 0 0 25 Apr 2025
A Survey on Cross-Modal Interaction Between Music and Multimodal Data Sifei Li Mining Tan Feier Shen Minyan Luo Zijiao Yin Fan Tang W. Dong Changsheng Xu 120 1 0 17 Apr 2025
STAGE: Stemmed Accompaniment Generation through Prefix-Based Conditioning Giorgio Strano Chiara Ballanti Donato Crisostomi Michele Mancusi Luca Cosmo Emanuele Rodolà 139 0 0 08 Apr 2025
DanceMosaic: High-Fidelity Dance Generation with Multimodal Editability Foram Niravbhai Shah Parshwa Shah Muhammad Usama Saleem Ekkasit Pinyoanuntapong Pu Wang Hongfei Xue Ahmed Helmy VGen 76 1 0 06 Apr 2025
LoopGen: Training-Free Loopable Music Generation Davide Marincione Giorgio Strano Donato Crisostomi Roberto Ribuoli Emanuele Rodolà MGen 172 0 0 06 Apr 2025
Activation Patching for Interpretable Steering in Music Generation Simone Facchiano Giorgio Strano Donato Crisostomi Irene Tallini Tommaso Mencattini Fabio Galasso Emanuele Rodolà LLMSV 71 1 0 06 Apr 2025
A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives Shuyu Li Shulei Ji Zihao Wang Songruoyao Wu Jiaxing Yu Kai Zhang MGen VGen 297 1 0 01 Apr 2025
Style Quantization for Data-Efficient GAN Training Jian Wang Xin Lan Jizhe Zhou Yuxin Tian Jiancheng Lv 96 0 0 31 Mar 2025
Tokenization of Gaze Data Tim Rolff Jurik Karimian Niklas Hypki S. Schmidt Markus Lappe Frank Steinicke 118 0 0 28 Mar 2025
Analyzable Chain-of-Musical-Thought Prompting for High-Fidelity Music Generation Max W. Y. Lam Yijin Xing Weiya You Jingcheng Wu Zongyu Yin ... T. Zhao Chien-Hung Liu Xuchen Song Yang Li Yahui Zhou LRM 101 4 0 25 Mar 2025
MerGen: Micro-electrode recording synthesis using a generative data-driven approach Thibault Martin Paul Sauleau Claire Haegelen Pierre Jannin John S. H. Baxter 80 0 0 21 Mar 2025
Align Your Rhythm: Generating Highly Aligned Dance Poses with Gating-Enhanced Rhythm-Aware Feature Representation Congyi Fan Jian Guan Xuanjia Zhao Dongli Xu Youtian Lin Tong Ye Pengming Feng Haiwei Pan 78 0 0 21 Mar 2025
STFTCodec: High-Fidelity Audio Compression through Time-Frequency Domain Representation Tao Feng Zhiyuan Zhao Yifan Xie Yuqi Ye Xiangyang Luo Xun Guan Yongqian Li 129 0 0 21 Mar 2025
Aligning Text-to-Music Evaluation with Human Preferences Yichen Huang Zachary Novack Koichi Saito Jiatong Shi Shinji Watanabe Yuki Mitsufuji John Thickstun Chris Donahue EGVM 119 1 0 20 Mar 2025
A Foundation Model for Patient Behavior Monitoring and Suicide Detection Rodrigo Oliver Josué Pérez-Sabater Leire Paz-Arbaizar Alejandro Lancho Antonio Artés Pablo M. Olmos 52 0 0 19 Mar 2025
Dual Codebook VQ: Enhanced Image Reconstruction with Reduced Codebook Size Parisa Boodaghi Malidarreh Jillur Rahman Saurav T. Pham Amir Hajighasemi Anahita Samadi Saurabh Shrinivas Maydeo M. Nasr Jacob M. Luber 97 0 0 13 Mar 2025
TAR3D: Creating High-Quality 3D Assets via Next-Part Prediction Xuying Zhang Yutong Liu Yangguang Li Renrui Zhang Yong Liu ... Wanli Ouyang Zhiwei Xiong Peng Gao Qibin Hou Ming-Ming Cheng 239 3 0 13 Mar 2025
Teaching Metric Distance to Autoregressive Multimodal Foundational Models Jiwan Chung Saejin Kim Yongrae Jo Jinho Park Dongjun Min Youngjae Yu 256 0 0 04 Mar 2025
UniWav: Towards Unified Pre-training for Speech Representation Learning and Generation Alexander H. Liu Sang-gil Lee Chao-Han Huck Yang Yuan Gong Yu-Chun Wang James Glass Rafael Valle Bryan Catanzaro SSL 101 1 0 02 Mar 2025
InspireMusic: Integrating Super Resolution and Large Language Model for High-Fidelity Long-Form Music Generation Chen Zhang Yukun Ma Qian Chen Wen Wang Shengkui Zhao ... Yiheng Jiang Chaohong Tan Zhifu Gao Zhihao Du B. Ma 83 1 0 28 Feb 2025
DGFM: Full Body Dance Generation Driven by Music Foundation Models Xinran Liu Zhenhua Feng Diptesh Kanojia Wenwu Wang DiffM 156 1 0 27 Feb 2025
GCDance: Genre-Controlled 3D Full Body Dance Generation Driven By Music Xinran Liu Xu Dong Diptesh Kanojia Wenwu Wang Zhenhua Feng DiffM 96 0 0 25 Feb 2025
X-Dancer: Expressive Music to Human Dance Video Generation Zeyuan Chen Hongyi Xu Guoxian Song You Xie Chenxu Zhang Xiusi Chen Chao Wang Di Chang Linjie Luo VGen 82 1 0 24 Feb 2025
Generative AI Training and Copyright Law Tim W. Dornis Sebastian Stober 106 1 0 21 Feb 2025
Myna: Masking-Based Contrastive Learning of Musical Representations Ori Yonay Tracy Hammond Tianbao Yang AAML 227 0 0 20 Feb 2025
SongGen: A Single Stage Auto-regressive Transformer for Text-to-Song Generation Ziqiang Liu Shuangrui Ding Zhixiong Zhang Xiaoyi Dong Pan Zhang Yuhang Zang Yuhang Cao Dahua Lin Jiaqi Wang 134 3 0 18 Feb 2025
Note-Level Singing Melody Transcription for Time-Aligned Musical Score Generation Leekyung Kim Sungwook Jeon Wan Heo Jonghun Park 142 0 0 18 Feb 2025
Towards Transparent and Accurate Plasma State Monitoring at JET Andrin Bürli Alessandro Pau Thomas Koller Olivier Sauter JET Contributors 92 2 0 14 Feb 2025
Hookpad Aria: A Copilot for Songwriters Chris Donahue Shih-Lun Wu Yewon Kim Dave Carlton Ryan Miyakawa John Thickstun 118 1 0 12 Feb 2025
Music for All: Representational Bias and Cross-Cultural Adaptability of Music Generation Models Atharva Mehta Shivam Chauhan Amirbek Djanibekov Atharva Kulkarni Gus Xia Monojit Choudhury 172 0 0 11 Feb 2025
The Case for Cleaner Biosignals: High-fidelity Neural Compressor Enables Transfer from Cleaner iEEG to Noisier EEG Francesco Stefano Carzaniga Gary Tom Hoppeler Michael Hersche Kaspar Anton Schindler Abbas Rahimi 81 0 0 10 Feb 2025
BRIDLE: Generalized Self-supervised Learning with Quantization Hoang M. Nguyen Satya Narayan Shukla Qiang Zhang Hanchao Yu Sreya D. Roy Taipeng Tian Lingjiong Zhu Yuchen Liu SSL MQ 142 0 0 04 Feb 2025