Video Background Music Generation with Controllable Music Transformer

16 November 2021

Papers citing "Video Background Music Generation with Controllable Music Transformer"

45 / 45 papers shown

Title
MusFlow: Multimodal Music Generation via Conditional Flow Matching Jiahao Song Yuzhao Wang 37 0 0 18 Apr 2025
A Survey on Cross-Modal Interaction Between Music and Multimodal Data Sifei Li Mining Tan Feier Shen Minyan Luo Zijiao Yin Fan Tang W. Dong Changsheng Xu 69 0 0 17 Apr 2025
Extending Visual Dynamics for Video-to-Music Generation Xiaohao Liu Teng Tu Yunshan Ma Tat-Seng Chua VGen 64 0 0 10 Apr 2025
A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives Shuyu Li Shulei Ji Zihao Wang Songruoyao Wu Jiaxing Yu Kaipeng Zhang MGen VGen 70 1 0 01 Apr 2025
Vision-to-Music Generation: A Survey Zhaokai Wang Chenxi Bao Le Zhuo Jingrui Han Yang Yue Yihong Tang Victor Shea-Jay Huang Yue Liao EGVM VGen 74 1 0 27 Mar 2025
AudioX: Diffusion Transformer for Anything-to-Audio Generation Zeyue Tian Yizhu Jin Zhaoyang Liu Ruibin Yuan Xu Tan Qifeng Chen Wei Xue Y. Guo 67 3 0 13 Mar 2025
FilmComposer: LLM-Driven Music Production for Silent Film Clips Zhifeng Xie Qile He Youjia Zhu Qiwei He Mengtian Li VGen 103 2 0 11 Mar 2025
MuMu-LLaMA: Multi-modal Music Understanding and Generation via Large Language Models Shansong Liu Atin Sakkeer Hussain Qilong Wu Chenshuo Sun Ying Shan AuLLM 69 3 0 09 Dec 2024
MotionLLaMA: A Unified Framework for Motion Synthesis and Comprehension Zeyu Ling Bo Han Shiyang Li H. Shen Jikang Cheng Changqing Zou 81 1 0 26 Nov 2024
MoMu-Diffusion: On Learning Long-Term Motion-Music Synchronization and Correspondence Fuming You Minghui Fang Li Tang Rongjie Huang Yongqi Wang Zhou Zhao 20 2 0 04 Nov 2024
MuVi: Video-to-Music Generation with Semantic Alignment and Rhythmic Synchronization Ruiqi Li Siqi Zheng Xize Cheng Ziang Zhang Shengpeng Ji Zhou Zhao VGen 71 7 0 16 Oct 2024
From Vision to Audio and Beyond: A Unified Model for Audio-Visual Representation and Generation Kun Su Xiulong Liu Eli Shlizerman VGen 36 6 0 27 Sep 2024
VMAS: Video-to-Music Generation via Semantic Alignment in Web Music Videos Yan-Bo Lin Yu Tian L. Yang Gedas Bertasius Heng Wang VGen 34 7 0 11 Sep 2024
VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling Zeyue Tian Zhaoyang Liu Ruibin Yuan Jiahao Pan Xiaoqiang Huang Xu Tan Xu Tan Qifeng Chen Y. Guo VGen 104 16 0 06 Jun 2024
A Survey of Deep Learning Audio Generation Methods Matej Bozic Marko Horvat VLM MedIm 56 0 0 31 May 2024
M $^3$ GPT: An Advanced Multimodal, Multitask Framework for Motion Comprehension and Generation Mingshuang Luo Ruibing Hou Hong Chang Zimo Liu Yaowei Wang Shiguang Shan 40 11 0 25 May 2024
The NES Video-Music Database: A Dataset of Symbolic Video Game Music Paired with Gameplay Videos Igor Cardoso Rubens O. Moraes Lucas N. Ferreira 35 4 0 05 Apr 2024
Natural Language Processing Methods for Symbolic Music Generation and Information Retrieval: a Survey Dinh-Viet-Toan Le Louis Bigo Mikaela Keller Dorien Herremans MedIm 32 9 0 27 Feb 2024
CMMD: Contrastive Multi-Modal Diffusion for Video-Audio Conditional Modeling Ruihan Yang H. Gamper Sebastian Braun DiffM 32 5 0 08 Dec 2023
Video2Music: Suitable Music Generation from Videos using an Affective Multimodal Transformer model Jaeyong Kang Soujanya Poria Dorien Herremans MGen VGen 17 32 0 02 Nov 2023
Tackling Data Bias in MUSIC-AVQA: Crafting a Balanced Dataset for Unbiased Question-Answering Xiulong Liu Zhikang Dong Peng Zhang 27 21 0 10 Oct 2023
XVO: Generalized Visual Odometry via Cross-Modal Self-Training Tohida Rehman Ronit Mandal Jimuyang Zhang Debarshi Kumar Sanyal SSL 33 17 0 28 Sep 2023
MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation Xinda Wu Zhijie Huang Kejun Zhang Jiaxing Yu Xu Tan Tieyao Zhang Zihao Wang Lingyun Sun 24 5 0 19 Sep 2023
Sparks of Large Audio Models: A Survey and Outlook S. Latif Moazzam Shoukat Fahad Shamshad Muhammad Usama Yi Ren ... Wenwu Wang Xulong Zhang Roberto Togneri Min Zhang Björn W. Schuller LM&MA AuLLM 33 38 0 24 Aug 2023
A Survey of AI Music Generation Tools and Models Yueyue Zhu Jared Baca Banafsheh Rekabdar Reza Rawassizadeh MGen 35 14 0 24 Aug 2023
V2A-Mapper: A Lightweight Solution for Vision-to-Audio Generation by Connecting Foundation Models Heng Wang Jianbo Ma Santiago Pascual Richard Cartwright Weidong (Tom) Cai VGen 21 38 0 18 Aug 2023
EmoGen: Eliminating Subjective Bias in Emotional Music Generation C. Kang Peiling Lu Botao Yu Xuejiao Tan Wei Ye Shikun Zhang Jiang Bian MGen 51 6 0 03 Jul 2023
MuseCoco: Generating Symbolic Music from Text Peiling Lu Xin Xu C. Kang Botao Yu Chengyi Xing Xuejiao Tan Jiang Bian 26 40 0 31 May 2023
V2Meow: Meowing to the Visual Beat via Video-to-Music Generation Kun Su Judith Yue Li Qingqing Huang Dima Kuzmin Joonseok Lee ... Fei Sha A. Jansen Yu Wang Mauro Verzetti Timo I. Denk VGen 39 12 0 11 May 2023
Long-Term Rhythmic Video Soundtracker Jiashuo Yu Yaohui Wang Xinyuan Chen Xiao Sun Yu Qiao DiffM 64 14 0 02 May 2023
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation Jiawei Liu Weining Wang Sihan Chen Xinxin Zhu Jiaheng Liu DiffM VGen 25 13 0 29 Mar 2023
Dance2MIDI: Dance-driven multi-instruments music generation Bo Han Yuheng Li Yixuan Shen Yi Ren Feilin Han 20 5 0 22 Jan 2023
Regeneration Learning: A Learning Paradigm for Data Generation Xu Tan Tao Qin Jiang Bian Tie-Yan Liu Yoshua Bengio GAN 38 15 0 21 Jan 2023
WuYun: Exploring hierarchical skeleton-guided melody generation using knowledge-enhanced deep learning Kejun Zhang Xinda Wu Tieyao Zhang Zhijie Huang Xu Tan Qihao Liang Songruoyao Wu Lingyun Sun 40 10 0 11 Jan 2023
MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation Ludan Ruan Y. Ma Huan Yang Huiguo He Bei Liu Jianlong Fu Nicholas Jing Yuan Qin Jin B. Guo DiffM VGen 36 174 0 19 Dec 2022
Video Background Music Generation: Dataset, Method and Evaluation Le Zhuo Zhaokai Wang Baisen Wang Yue Liao Chenxi Bao Stanley Peng Miao Lu Xiaobo Li Fei Fang Si Liu VGen 23 28 0 21 Nov 2022
ComMU: Dataset for Combinatorial Music Generation Lee Hyun Taehyun Kim Hyolim Kang Minjoo Ki H. Hwang Kwanho Park Sharang Han Seon Joo Kim 35 14 0 17 Nov 2022
Vision+X: A Survey on Multimodal Learning in the Light of Data Ye Zhu Yuehua Wu N. Sebe Yan Yan 33 16 0 05 Oct 2022
Learning in Audio-visual Context: A Review, Analysis, and New Perspective Yake Wei Di Hu Yapeng Tian Xuelong Li 46 55 0 20 Aug 2022
Debiased Cross-modal Matching for Content-based Micro-video Background Music Recommendation Jin Yi Zhenzhong Chen 38 1 0 07 Aug 2022
Discrete Contrastive Diffusion for Cross-Modal Music and Image Generation Ye Zhu Yuehua Wu Kyle Olszewski Jian Ren Sergey Tulyakov Yan Yan DiffM 28 47 0 15 Jun 2022
Quantized GAN for Complex Music Generation from Dance Videos Ye Zhu Kyle Olszewski Yuehua Wu Panos Achlioptas Menglei Chai Yan Yan Sergey Tulyakov MGen 25 44 0 01 Apr 2022
FIGARO: Generating Symbolic Music with Fine-Grained Artistic Control Dimitri von Rutte Luca Biggio Yannic Kilcher Thomas Hofmann 33 0 0 26 Jan 2022
Generating Chord Progression from Melody with Flexible Harmonic Rhythm and Controllable Harmonic Density Shangda Wu Yue Yang Zhaowen Wang Xiaobing Li Maosong Sun 19 4 0 21 Dec 2021
Compound Word Transformer: Learning to Compose Full-Song Music over Dynamic Directed Hypergraphs Wen-Yi Hsiao Jen-Yu Liu Yin-Cheng Yeh Yi-Hsuan Yang 113 180 0 07 Jan 2021