v1v2 (latest)

CIDEr: Consensus-based Image Description Evaluation

20 November 2014

Ramakrishna Vedantam

C. L. Zitnick

Devi Parikh

ArXiv (abs)PDF HTML

Papers citing "CIDEr: Consensus-based Image Description Evaluation"

50 / 2,184 papers shown

Title
On the Evaluation of Commit Message Generation Models: An Experimental Study Wei Tao Yanlin Wang Ensheng Shi Lun Du Shi Han Hongyu Zhang Dongmei Zhang Wenqiang Zhang 66 50 0 12 Jul 2021
Controlled Caption Generation for Images Through Adversarial Attacks Nayyer Aafaq Naveed Akhtar Wei Liu M. Shah Ajmal Mian AAML 59 10 0 07 Jul 2021
Case Relation Transformer: A Crossmodal Language Generation Model for Fetching Instructions Motonari Kambara K. Sugiura ViT 62 6 0 02 Jul 2021
Egocentric Image Captioning for Privacy-Preserved Passive Dietary Intake Monitoring Jianing Qiu Frank P.-W. Lo Xiao Gu M. Jobarteh Wenyan Jia ... M. McCrory Edward Sazonov Mingui Sun Gary Frost Benny Lo EgoV 64 19 0 01 Jul 2021
Evaluation of Thematic Coherence in Microblogs I. Bilal Bo Wang Maria Liakata Rob Procter Adam Tsakalidis 55 5 0 30 Jun 2021
Contrastive Semantic Similarity Learning for Image Captioning Evaluation with Intrinsic Auto-encoder Chao Zeng Tiesong Zhao Sam Kwong 92 2 0 29 Jun 2021
Saying the Unseen: Video Descriptions via Dialog Agents Ye Zhu Yu Wu Yi Yang Yan Yan 71 6 0 26 Jun 2021
UMIC: An Unreferenced Metric for Image Captioning via Contrastive Learning Hwanhee Lee Seunghyun Yoon Franck Dernoncourt Trung Bui Kyomin Jung VLM 138 44 0 26 Jun 2021
Core Challenges in Embodied Vision-Language Planning Jonathan M Francis Nariaki Kitamura Felix Labelle Xiaopeng Lu Ingrid Navarro Jean Oh LM&Ro 144 48 0 26 Jun 2021
Knowledge-Grounded Self-Rationalization via Extractive and Natural Language Explanations Bodhisattwa Prasad Majumder Oana-Maria Camburu Thomas Lukasiewicz Julian McAuley 100 36 0 25 Jun 2021
TCIC: Theme Concepts Learning Cross Language and Vision for Image Captioning Zhihao Fan Zhongyu Wei Siyuan Wang Ruize Wang Zejun Li Haijun Shan Xuanjing Huang 58 26 0 21 Jun 2021
Trust It or Not: Confidence-Guided Automatic Radiology Report Generation Yixin Wang Zihao Lin Zhe Xu Haoyu Dong Jiang Tian Jie Luo Zhongchao Shi Yang Zhang Jianping Fan Zhiqiang He UQCV MedIm 113 12 0 21 Jun 2021
Exploring Semantic Relationships for Unpaired Image Captioning Fenglin Liu Meng Gao Tianhao Zhang Yuexian Zou 142 7 0 20 Jun 2021
GEM: A General Evaluation Benchmark for Multimodal Tasks Lin Su Nan Duan Edward Cui Lei Ji Chenfei Wu Huaishao Luo Yongfei Liu Ming Zhong Taroon Bharti Arun Sacheti VLM 112 19 0 18 Jun 2021
Semi-Autoregressive Transformer for Image Captioning Yuanen Zhou Yong Zhang Zhenzhen Hu Meng Wang VLM 78 25 0 17 Jun 2021
$C^3$ : Compositional Counterfactual Contrastive Learning for Video-grounded Dialogues Hung Le Nancy F. Chen Guosheng Lin 60 2 0 16 Jun 2021
Understanding and Evaluating Racial Biases in Image Captioning Dora Zhao Angelina Wang Olga Russakovsky 71 138 0 16 Jun 2021
Straight to the Gradient: Learning to Use Novel Tokens for Neural Text Generation Xiang Lin Simeng Han Shafiq Joty 55 25 0 14 Jun 2021
Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation Fenglin Liu Xian Wu Shen Ge Wei Fan Yuexian Zou MedIm 120 262 0 13 Jun 2021
ImaginE: An Imagination-Based Automatic Evaluation Metric for Natural Language Generation Wanrong Zhu Xinze Wang An Yan Miguel P. Eckstein Wenjie Wang 61 7 0 10 Jun 2021
AGGGEN: Ordering and Aggregating while Generating Xinnuo Xu Ondrej Dusek Verena Rieser Ioannis Konstas 65 15 0 10 Jun 2021
VALUE: A Multi-Task Benchmark for Video-and-Language Understanding Evaluation Linjie Li Jie Lei Zhe Gan Licheng Yu Yen-Chun Chen ... Tamara L. Berg Joey Tianyi Zhou Jingjing Liu Lijuan Wang Zicheng Liu VLM 119 103 0 08 Jun 2021
Counterfactual Maximum Likelihood Estimation for Training Deep Networks Xinyi Wang Wenhu Chen Michael Stephen Saxon Wenjie Wang OOD CML BDL 107 8 0 07 Jun 2021
BERTGEN: Multi-task Generation through BERT Faidon Mitzalis Ozan Caglayan Pranava Madhyastha Lucia Specia VLM 48 7 0 07 Jun 2021
Transferring Knowledge from Text to Video: Zero-Shot Anticipation for Procedural Actions Fadime Sener Rishabh Saraf Angela Yao LM&Ro 66 12 0 06 Jun 2021
Few-shot Knowledge Graph-to-Text Generation with Pretrained Language Models Junyi Li Tianyi Tang Wayne Xin Zhao Zhicheng Wei N. Yuan Ji-Rong Wen 79 49 0 03 Jun 2021
SMURF: SeMantic and linguistic UndeRstanding Fusion for Caption Evaluation via Typicality Analysis Joshua Forster Feinglass Yezhou Yang 60 22 0 02 Jun 2021
Learning to Select: A Fully Attentive Approach for Novel Object Captioning Marco Cagrandi Marcella Cornia Matteo Stefanini Lorenzo Baraldi Rita Cucchiara 69 9 0 02 Jun 2021
Longer Version for "Deep Context-Encoding Network for Retinal Image Captioning" Jia-Hong Huang Ting-Wei Wu Chao-Han Huck Yang Marcel Worring MedIm 66 29 0 30 May 2021
Towards Diverse Paragraph Captioning for Untrimmed Videos Yuqing Song Shizhe Chen Qin Jin 66 38 0 30 May 2021
Controllable Abstractive Dialogue Summarization with Sketch Supervision Chien-Sheng Wu Linqing Liu Wenhao Liu Pontus Stenetorp Caiming Xiong 83 52 0 28 May 2021
New Encoder Learning for Captioning Heavy Rain Images via Semantic Visual Feature Matching Chang-Hwan Son Pung-Hwi Ye 130 3 0 28 May 2021
OTTers: One-turn Topic Transitions for Open-Domain Dialogue Karin Sevegnani David M. Howcroft Ioannis Konstas Verena Rieser LRM 74 42 0 28 May 2021
Guiding the Growth: Difficulty-Controllable Question Generation through Step-by-Step Rewriting Yi Cheng Siyao Li Bang Liu Ruihui Zhao Sujian Li Chenghua Lin Yefeng Zheng 132 40 0 25 May 2021
Retrieval Enhanced Model for Commonsense Generation Han Wang Yang Liu Chenguang Zhu Linjun Shou Ming Gong Yichong Xu Michael Zeng RALM LRM 71 32 0 24 May 2021
Learning from My Friends: Few-Shot Personalized Conversation Systems via Social Networks Zhiliang Tian Wei Bi Zi-qiang Zhang Dongkyu Lee Yiping Song N. Zhang 74 11 0 21 May 2021
Dependent Multi-Task Learning with Causal Intervention for Image Captioning Wenqing Chen Jidong Tian Caoyun Fan Hao He Yaohui Jin CML 136 6 0 18 May 2021
Audio Captioning with Composition of Acoustic and Semantic Information Aysegül Özkaya Eren M. Sert 63 3 0 13 May 2021
Connecting What to Say With Where to Look by Modeling Human Attention Traces Zihang Meng Licheng Yu Ning Zhang Tamara L. Berg Babak Damavandi Vikas Singh Amy Bearman 157 25 0 12 May 2021
TextOCR: Towards large-scale end-to-end reasoning for arbitrary-shaped scene text Amanpreet Singh Guan Pang Mandy Toh Jing Huang Wojciech Galuba Tal Hassner 86 174 0 12 May 2021
Matching Visual Features to Hierarchical Semantic Topics for Image Paragraph Captioning D. Guo Ruiying Lu Bo Chen Zequn Zeng Mingyuan Zhou VLM 89 9 0 10 May 2021
e-ViL: A Dataset and Benchmark for Natural Language Explanations in Vision-Language Tasks Maxime Kayser Oana-Maria Camburu Leonard Salewski Cornelius Emde Virginie Do Zeynep Akata Thomas Lukasiewicz VLM 114 101 0 08 May 2021
Exploring Explicit and Implicit Visual Relationships for Image Captioning Zeliang Song Xiaofei Zhou 26 8 0 06 May 2021
A First Look: Towards Explainable TextVQA Models via Visual and Textual Explanations Varun Nagaraj Rao Xingjian Zhen K. Hovsepian Mingwei Shen 97 19 0 29 Apr 2021
Removing Word-Level Spurious Alignment between Images and Pseudo-Captions in Unsupervised Image Captioning Ukyo Honda Yoshitaka Ushiku Atsushi Hashimoto Taro Watanabe Yuji Matsumoto 68 23 0 28 Apr 2021
TRECVID 2020: A comprehensive campaign for evaluating video retrieval tasks across multiple application domains G. Awad A. Butt Keith Curtis Jonathan G. Fiscus A. Godil ... Alan F. Smeaton Yvette Graham Gareth J. F. Jones Wessel Kraaij Georges Quénot 46 65 0 27 Apr 2021
Contextualized Keyword Representations for Multi-modal Retinal Image Captioning Jia-Hong Huang Ting-Wei Wu Marcel Worring MedIm 125 27 0 26 Apr 2021
MusCaps: Generating Captions for Music Audio Ilaria Manco Emmanouil Benetos Elio Quinton Gyorgy Fazekas 116 37 0 24 Apr 2021
Towards Accurate Text-based Image Captioning with Content Diversity Exploration Guanghui Xu Shuaicheng Niu Mingkui Tan Yucheng Luo Qing Du Qi Wu DiffM 84 58 0 23 Apr 2021
CLIPScore: A Reference-free Evaluation Metric for Image Captioning Jack Hessel Ari Holtzman Maxwell Forbes Ronan Le Bras Yejin Choi CLIP 241 1,597 0 18 Apr 2021