AudioLCM: Text-to-Audio Generation with Latent Consistency Models

AudioLCM: Text-to-Audio Generation with Latent Consistency Models

1 June 2024

Rongjie Huang

Xize Cheng

Siqi Zheng

Zhou Zhao

Papers citing "AudioLCM: Text-to-Audio Generation with Latent Consistency Models"

9 / 9 papers shown

Title
FlashSR: One-step Versatile Audio Super-resolution via Diffusion Distillation Jaekwon Im Juhan Nam DiffM 48 0 0 18 Jan 2025
Audio-Language Datasets of Scenes and Events: A Survey Gijs Wijngaard Elia Formisano Michele Esposito M. Dumontier 81 2 0 10 Jan 2025
FlashAudio: Rectified Flows for Fast and High-Fidelity Text-to-Audio Generation Huadai Liu Jialei Wang Rongjie Huang Yang Liu H. Lu Wei Xue Zhou Zhao 13 3 0 16 Oct 2024
Enhancing Robustness in Deep Reinforcement Learning: A Lyapunov Exponent Approach Rory Young Nicolas Pugeault AAML 65 0 0 14 Oct 2024
MEDIC: Zero-shot Music Editing with Disentangled Inversion Control Huadai Liu Jialei Wang Rongjie Huang Yang Liu Jiayang Xu Zhou Zhao 33 4 0 18 Jul 2024
Text-to-Audio Generation using Instruction-Tuned LLM and Latent Diffusion Model Deepanway Ghosal Navonil Majumder Ambuj Mehrish Soujanya Poria 152 145 0 24 Apr 2023
Audio Retrieval with WavText5K and CLAP Training Soham Deshmukh Benjamin Elizalde Huaming Wang 3DV CLIP 124 51 0 28 Sep 2022
CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers Wenyi Hong Ming Ding Wendi Zheng Xinghan Liu Jie Tang DiffM 258 570 0 29 May 2022
Why Do We Click: Visual Impression-aware News Recommendation Jiahao Xun Shengyu Zhang Zhou Zhao Jieming Zhu Qi Zhang Jingjie Li Xiuqiang He Xiaofei He Tat-Seng Chua Fei Wu 109 32 0 26 Sep 2021