AudioSR: Versatile Audio Super-resolution at Scale

AudioSR: Versatile Audio Super-resolution at Scale

13 September 2023

Mark D. Plumbley

Papers citing "AudioSR: Versatile Audio Super-resolution at Scale"

12 / 12 papers shown

Title
AnyEnhance: A Unified Generative Model with Prompt-Guidance and Self-Critic for Voice Enhancement Junan Zhang Jing Yang Zihao Fang Yansen Wang Zehua Zhang Zhuo Wang Fan Fan Zhikai Wu 41 3 0 26 Jan 2025
FlashSR: One-step Versatile Audio Super-resolution via Diffusion Distillation Jaekwon Im Juhan Nam DiffM 45 0 0 18 Jan 2025
AEROMamba: An efficient architecture for audio super-resolution using generative adversarial networks and state space models Wallace Abreu Luiz Wagner Pereira Biscainho Mamba 38 0 0 11 Nov 2024
Vector Quantized Diffusion Model Based Speech Bandwidth Extension Yuan Fang Jinglin Bai Jiajie Wang Xueliang Zhang 25 0 0 09 Sep 2024
FireRedTTS: A Foundation Text-To-Speech Framework for Industry-Level Generative Speech Applications Hao-Han Guo Kun Liu Fei-Yu Shen Yi-Chen Wu Xu Tang Kun Xie Kai-Tuo Xu Kun Xie Kai-Tuo Xu 42 21 0 05 Sep 2024
Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors J. Hauret Malo Olivier Thomas Joubaud C. Langrenne Sarah Poirée V. Zimpfer Éric Bavu 80 1 0 16 Jul 2024
Masked Generative Video-to-Audio Transformers with Enhanced Synchronicity Santiago Pascual Chunghsin Yeh Ioannis Tsiamas Joan Serrà DiffM VGen 47 13 0 15 Jul 2024
SpecMaskGIT: Masked Generative Modeling of Audio Spectrograms for Efficient Audio Synthesis and Beyond Marco Comunità Zhi-Wei Zhong Akira Takahashi Shiqi Yang Mengjie Zhao Koichi Saito Yukara Ikemiya Takashi Shibuya Shusuke Takahashi Yuki Mitsufuji 71 2 0 25 Jun 2024
FakeSound: Deepfake General Audio Detection Zeyu Xie Baihan Li Xuenan Xu Zheng Liang Kai Yu Mengyue Wu 33 2 0 12 Jun 2024
SemantiCodec: An Ultra Low Bitrate Semantic Audio Codec for General Sound Haohe Liu Xuenan Xu Yiitan Yuan Mengyue Wu Wenwu Wang Mark D. Plumbley 35 18 0 30 Apr 2024
MusicHiFi: Fast High-Fidelity Stereo Vocoding Ge Zhu Juan-Pablo Caceres Zhiyao Duan Nicholas J. Bryan DiffM 29 4 0 15 Mar 2024
HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation of Speech by Hierarchical Variational Inference for Zero-shot Speech Synthesis Sang-Hoon Lee Haram Choi Seung-Bin Kim Seong-Whan Lee BDL 32 31 0 21 Nov 2023