Can Audio Captions Be Evaluated with Image Caption Metrics?

Can Audio Captions Be Evaluated with Image Caption Metrics?

10 October 2021

Papers citing "Can Audio Captions Be Evaluated with Image Caption Metrics?"

17 / 17 papers shown

Title
Improving Audio-Text Retrieval via Hierarchical Cross-Modal Interaction and Auxiliary Captions Yifei Xin Yuexian Zou 81 9 0 28 Jul 2023
Enriching Ontology with Temporal Commonsense for Low-Resource Audio Tagging Zhiling Zhang Zelin Zhou Haifeng Tang Guangwei Li Mengyue Wu Kenny Q. Zhu 101 4 0 03 Oct 2021
An Encoder-Decoder Based Audio Captioning System With Transfer and Reinforcement Learning Xinhao Mei Qiushi Huang Xubo Liu Gengyun Chen Jingqian Wu ... Tom Ko H. Tang Xingkun Shao Mark D. Plumbley Wenwu Wang 47 53 0 05 Aug 2021
Investigating Local and Global Information for Automated Audio Captioning with Transfer Learning Xuenan Xu Heinrich Dinkel Mengyue Wu Zeyu Xie Kai Yu 41 60 0 23 Feb 2021
BLEURT: Learning Robust Metrics for Text Generation Thibault Sellam Dipanjan Das Ankur P. Parikh 81 1,489 0 09 Apr 2020
PANNs: Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition Qiuqiang Kong Yin Cao Turab Iqbal Yuxuan Wang Wenwu Wang Mark D. Plumbley VLM SSL 166 1,074 0 21 Dec 2019
Clotho: An Audio Captioning Dataset Konstantinos Drossos Samuel Lipping Tuomas Virtanen 87 388 0 21 Oct 2019
TIGEr: Text-to-Image Grounding for Image Caption Evaluation Ming Jiang Qiuyuan Huang Lei Zhang Xin Eric Wang Pengchuan Zhang Zhe Gan Jana Diesner Jianfeng Gao 70 67 0 04 Sep 2019
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks Nils Reimers Iryna Gurevych 1.0K 12,129 0 27 Aug 2019
BERTScore: Evaluating Text Generation with BERT Tianyi Zhang Varsha Kishore Felix Wu Kilian Q. Weinberger Yoav Artzi 275 5,764 0 21 Apr 2019
Audio Caption: Listen and Tell Mengyue Wu Heinrich Dinkel Kai Yu 51 61 0 25 Feb 2019
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova VLM SSL SSeg 1.5K 94,511 0 11 Oct 2018
The price of debiasing automatic metrics in natural language evaluation Arun Tejasvi Chaganty Stephen Mussmann Percy Liang 53 117 0 06 Jul 2018
Why We Need New Evaluation Metrics for NLG Jekaterina Novikova Ondrej Dusek Amanda Cercas Curry Verena Rieser 73 459 0 21 Jul 2017
Automated Audio Captioning with Recurrent Neural Networks Konstantinos Drossos Sharath Adavanne Tuomas Virtanen 57 129 0 30 Jun 2017
SPICE: Semantic Propositional Image Caption Evaluation Peter Anderson Basura Fernando Mark Johnson Stephen Gould EGVM 87 1,909 0 29 Jul 2016
CIDEr: Consensus-based Image Description Evaluation Ramakrishna Vedantam C. L. Zitnick Devi Parikh 254 4,471 0 20 Nov 2014