CED: Consistent ensemble distillation for audio tagging

CED: Consistent ensemble distillation for audio tagging

23 August 2023

Heinrich Dinkel

Yujun Wang

Papers citing "CED: Consistent ensemble distillation for audio tagging"

14 / 14 papers shown

Title
Hierarchical Label Propagation: A Model-Size-Dependent Performance Booster for AudioSet Tagging Ludovic Tuncay Etienne Labbé Thomas Pellegrini VLM 35 0 0 26 Mar 2025
Data-Efficient Low-Complexity Acoustic Scene Classification via Distilling and Progressive Pruning Bing Han Wen Huang Zhengyang Chen Anbai Jiang Pingyi Fan Cheng Lu Zhiqiang Lv Jia Liu W. Zhang Yanmin Qian 29 0 0 28 Oct 2024
MT2KD: Towards A General-Purpose Encoder for Speech, Speaker, and Audio Events Xiaoyu Yang Qiujia Li Chao Zhang P. Woodland 18 0 0 25 Sep 2024
Effective Pre-Training of Audio Transformers for Sound Event Detection Florian Schmid T. Morocutti Francesco Foscarin Jan Schluter Paul Primus Gerhard Widmer ViT 23 2 0 14 Sep 2024
Improving Anomalous Sound Detection via Low-Rank Adaptation Fine-Tuning of Pre-Trained Audio Models Xinhu Zheng Anbai Jiang Bing Han Yanmin Qian Pingyi Fan Jia Liu Wei-Qiang Zhang 23 2 0 11 Sep 2024
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding Jizhong Liu Gang Li Junbo Zhang Heinrich Dinkel Yongqing Wang Zhiyong Yan Yujun Wang Bin Wang AuLLM 49 2 0 19 Jun 2024
Bridging Language Gaps in Audio-Text Retrieval Zhiyong Yan Heinrich Dinkel Yongqing Wang Jizhong Liu Junbo Zhang Yujun Wang Bin Wang VLM 31 4 0 11 Jun 2024
Scaling up masked audio encoder learning for general audio classification Heinrich Dinkel Zhiyong Yan Yongqing Wang Junbo Zhang Yujun Wang Bin Wang 38 2 0 11 Jun 2024
M2D-CLAP: Masked Modeling Duo Meets CLAP for Learning General-purpose Audio-Language Representation Daisuke Niizumi Daiki Takeuchi Yasunori Ohishi Noboru Harada Masahiro Yasuda Shunsuke Tsubaki Keisuke Imoto VLM 36 5 0 04 Jun 2024
EAT: Self-Supervised Pre-Training with Efficient Audio Transformer Wenxi Chen Yuzhe Liang Ziyang Ma Zhisheng Zheng Xie Chen ViT 48 17 0 07 Jan 2024
Dynamic Convolutional Neural Networks as Efficient Pre-trained Audio Models Florian Schmid Khaled Koutini Gerhard Widmer 16 11 0 24 Oct 2023
Unified Keyword Spotting and Audio Tagging on Mobile Devices with Transformers Heinrich Dinkel Yongqing Wang Zhiyong Yan Junbo Zhang Yujun Wang 27 4 0 03 Mar 2023
UniKW-AT: Unified Keyword Spotting and Audio Tagging Heinrich Dinkel Yongqing Wang Zhiyong Yan Junbo Zhang Yujun Wang 37 3 0 23 Sep 2022
HTS-AT: A Hierarchical Token-Semantic Audio Transformer for Sound Classification and Detection Ke Chen Xingjian Du Bilei Zhu Zejun Ma Taylor Berg-Kirkpatrick Shlomo Dubnov ViT 116 264 0 02 Feb 2022