v1v2 (latest)

ViolinDiff: Enhancing Expressive Violin Synthesis with Pitch Bend Conditioning

19 September 2024

Daewoong Kim

Hao-Wen Dong

Dasaem Jeong

ArXiv (abs)PDF HTML

Papers citing "ViolinDiff: Enhancing Expressive Violin Synthesis with Pitch Bend Conditioning"

22 / 22 papers shown

Title
Expressive Acoustic Guitar Sound Synthesis with an Instrument-Specific Input Representation and Diffusion Outpainting Hounsu Kim Soonbeom Choi Juhan Nam 57 3 0 24 Jan 2024
Performance Conditioning for Diffusion-Based Multi-Instrument Music Synthesis Ben Maman Johannes Zeitler Meinard Muller Amit H. Bermano DiffM 52 4 0 21 Sep 2023
Human Motion Diffusion as a Generative Prior Yonatan Shafir Guy Tevet Roy Kapon Amit H. Bermano DiffM VGen 72 229 0 02 Mar 2023
EDGE: Editable Dance Generation From Music Jo-Han Tseng Rodrigo Castellon Chenxi Liu 99 239 0 19 Nov 2022
Large-scale Contrastive Language-Audio Pretraining with Feature Fusion and Keyword-to-Caption Augmentation Yusong Wu Kai Chen Tianyu Zhang Yuchen Hui Marianna Nezhurina Taylor Berg-Kirkpatrick Shlomo Dubnov CLIP 129 540 0 12 Nov 2022
Classifier-Free Diffusion Guidance Jonathan Ho Tim Salimans FaML 196 3,963 0 26 Jul 2022
Multi-instrument Music Synthesis with Spectrogram Diffusion Curtis Hawthorne Ian Simon Adam Roberts Neil Zeghidour Josh Gardner Ethan Manilow Jesse Engel DiffM 70 51 0 11 Jun 2022
Deep Performer: Score-to-Audio Music Performance Synthesis Hao-Wen Dong Cong Zhou Taylor Berg-Kirkpatrick Julian McAuley 59 17 0 12 Feb 2022
MIDI-DDSP: Detailed Control of Musical Performance via Hierarchical Modeling Yusong Wu Ethan Manilow Yi Deng Rigel Swavely Kyle Kastner Tim Cooijmans Aaron Courville Cheng-Zhi Anna Huang Jesse Engel 73 45 0 17 Dec 2021
VISinger: Variational Inference with Adversarial Learning for End-to-End Singing Voice Synthesis Yongmao Zhang Jian Cong Heyang Xue Lei Xie Pengcheng Zhu Mengxiao Bi 71 77 0 17 Oct 2021
SoundStream: An End-to-End Neural Audio Codec Neil Zeghidour Alejandro Luebs Ahmed Omran Jan Skoglund Marco Tagliasacchi AI4TS 114 805 0 07 Jul 2021
Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech Jaehyeon Kim Jungil Kong Juhee Son DRL 128 900 0 11 Jun 2021
Grad-TTS: A Diffusion Probabilistic Model for Text-to-Speech Vadim Popov Ivan Vovk Vladimir Gogoryan Tasnima Sadekova Mikhail Kudinov DiffM 107 543 0 13 May 2021
DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism Jinglin Liu Chengxi Li Yi Ren Feiyang Chen Zhou Zhao DiffM 133 269 0 06 May 2021
Denoising Diffusion Probabilistic Models Jonathan Ho Ajay Jain Pieter Abbeel DiffM 718 18,310 0 19 Jun 2020
XiaoiceSing: A High-Quality and Integrated Singing Voice Synthesis System Peiling Lu Jie Wu Jian Luan Xu Tan Li Zhou 74 98 0 11 Jun 2020
Glow-TTS: A Generative Flow for Text-to-Speech via Monotonic Alignment Search Jaehyeon Kim Sungwon Kim Jungil Kong Sungroh Yoon 105 496 0 22 May 2020
Onsets and Frames: Dual-Objective Piano Transcription Curtis Hawthorne Erich Elsen Jialin Song Adam Roberts Ian Simon Colin Raffel Jesse Engel Sageev Oore Douglas Eck 186 280 0 30 Oct 2017
FiLM: Visual Reasoning with a General Conditioning Layer Ethan Perez Florian Strub H. D. Vries Vincent Dumoulin Aaron Courville FAtt AIMat OffRL AI4CE 372 2,236 0 22 Sep 2017
Attention Is All You Need Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 787 132,454 0 12 Jun 2017
CNN Architectures for Large-Scale Audio Classification Shawn Hershey Sourish Chaudhuri D. Ellis J. Gemmeke A. Jansen ... Rif A. Saurous Bryan Seybold M. Slaney Ron J. Weiss K. Wilson 128 2,509 0 29 Sep 2016
WaveNet: A Generative Model for Raw Audio Aaron van den Oord Sander Dieleman Heiga Zen Karen Simonyan Oriol Vinyals Alex Graves Nal Kalchbrenner A. Senior Koray Kavukcuoglu DiffM 406 7,421 0 12 Sep 2016