IFEval-Audio: Benchmarking Instruction-Following Capability in Audio-based Large Language Models

IFEval-Audio: Benchmarking Instruction-Following Capability in Audio-based Large Language Models

22 May 2025

ArXiv (abs)PDF HTML

Papers citing "IFEval-Audio: Benchmarking Instruction-Following Capability in Audio-based Large Language Models"

8 / 8 papers shown

Title
SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning Prabhat Pandey Rupak Vignesh Swaminathan K V Vijay Girish Arunasish Sen Jian Xie Grant P. Strimel Andreas Schwarz 442 2 0 12 Apr 2025
MM-IFEngine: Towards Multimodal Instruction Following Shengyuan Ding Shenxi Wu Xiangyu Zhao Yuhang Zang Haodong Duan Xiaoyi Dong Pan Zhang Yuhang Cao Dahua Lin Jiaqi Wang OffRL 138 5 0 10 Apr 2025
MuChoMusic: Evaluating Music Understanding in Multimodal Audio-Language Models Yunwen Xia Hui Fang Emmanouil Benetos Jie Zhang Chong Long Dmitry Bogdanov AuLLM 94 22 0 02 Aug 2024
MIA-Bench: Towards Better Instruction Following Evaluation of Multimodal LLMs Yusu Qian Hanrong Ye J. Fauconnier Peter Grasch Yinfei Yang Zhe Gan 230 18 0 01 Jul 2024
WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research Xinhao Mei Chutong Meng Haohe Liu Qiuqiang Kong Tom Ko Chengqi Zhao Mark D. Plumbley Yuexian Zou Wenwu Wang 146 220 0 30 Mar 2023
Robust Speech Recognition via Large-Scale Weak Supervision Alec Radford Jong Wook Kim Tao Xu Greg Brockman C. McLeavey Ilya Sutskever OffRL 216 3,757 0 06 Dec 2022
Dynabench: Rethinking Benchmarking in NLP Douwe Kiela Max Bartolo Yixin Nie Divyansh Kaushik Atticus Geiger ... Pontus Stenetorp Robin Jia Joey Tianyi Zhou Christopher Potts Adina Williams 208 410 0 07 Apr 2021
Spoken SQuAD: A Study of Mitigating the Impact of Speech Recognition Errors on Listening Comprehension Chia-Hsuan Lee Szu-Lin Wu Chi-Liang Liu Hung-yi Lee 70 99 0 01 Apr 2018