v1v2 (latest)

CIDEr: Consensus-based Image Description Evaluation

20 November 2014

Ramakrishna Vedantam

C. L. Zitnick

Devi Parikh

ArXiv (abs)PDF HTML

Papers citing "CIDEr: Consensus-based Image Description Evaluation"

50 / 2,184 papers shown

Title
Explain Me the Painting: Multi-Topic Knowledgeable Art Description Generation Zechen Bai Yuta Nakashima Noa Garcia 110 44 0 13 Sep 2021
COSMic: A Coherence-Aware Generation Metric for Image Descriptions Mert Inan P. Sharma Baber Khalid Radu Soricut Matthew Stone Malihe Alikhani EGVM 50 13 0 11 Sep 2021
Partially-Supervised Novel Object Captioning Leveraging Context from Paired Data Shashank Bujimalla Mahesh Subedar Omesh Tickoo 110 1 0 10 Sep 2021
Retrieve, Caption, Generate: Visual Grounding for Enhancing Commonsense in Text Generation Models Steven Y. Feng Kevin Lu Zhuofu Tao Malihe Alikhani Teruko Mitamura Eduard H. Hovy Varun Gangal LRM 79 13 0 08 Sep 2021
RefineCap: Concept-Aware Refinement for Image Captioning Yekun Chai Shuo Jin Junliang Xing VLM 25 1 0 08 Sep 2021
Journalistic Guidelines Aware News Image Captioning Xuewen Yang Svebor Karaman Joel R. Tetreault Alex Jaimes 82 27 0 07 Sep 2021
Exploring Strategies for Generalizable Commonsense Reasoning with Pre-trained Models Kaixin Ma Filip Ilievski Jonathan M Francis Satoru Ozaki Eric Nyberg A. Oltramari LRM 89 17 0 07 Sep 2021
Vision Guided Generative Pre-trained Language Models for Multimodal Abstractive Summarization Tiezheng Yu Wenliang Dai Zihan Liu Pascale Fung 105 74 0 06 Sep 2021
LAViTeR: Learning Aligned Visual and Textual Representations Assisted by Image and Caption Generation Mohammad Abuzar Shaikh Zhanghexuan Ji Dana Moukheiber Yan Shen S. Srihari Mingchen Gao VLM 51 1 0 04 Sep 2021
Multimodal Conditionality for Natural Language Generation Michael Sollami Aashish Jain 73 10 0 02 Sep 2021
Working Memory Connections for LSTM Federico Landi Lorenzo Baraldi Marcella Cornia Rita Cucchiara KELM 74 173 0 31 Aug 2021
QACE: Asking Questions to Evaluate an Image Caption Hwanhee Lee Thomas Scialom Seunghyun Yoon Franck Dernoncourt Kyomin Jung CoGe 87 19 0 28 Aug 2021
Automatic Text Evaluation through the Lens of Wasserstein Barycenters Pierre Colombo Guillaume Staerman Chloé Clavel Pablo Piantanida 199 41 0 27 Aug 2021
Reinforcement Learning-powered Semantic Communication via Semantic Similarity Kun Lu Rongpeng Li Xianfu Chen Zhifeng Zhao Honggang Zhang 55 53 0 27 Aug 2021
Similar Scenes arouse Similar Emotions: Parallel Data Augmentation for Stylized Image Captioning Guodun Li Yuchen Zhai Zehao Lin Yin Zhang 106 21 0 26 Aug 2021
Vision-Language Navigation: A Survey and Taxonomy Wansen Wu Tao Chang Xinmeng Li LM&Ro 71 24 0 26 Aug 2021
Product-oriented Machine Translation with Cross-modal Cross-lingual Pre-training Yuqing Song Shizhe Chen Qin Jin Wei Luo Jun Xie Fei Huang 101 20 0 25 Aug 2021
INVIGORATE: Interactive Visual Grounding and Grasping in Clutter Hanbo Zhang Yunfan Lu Cunjun Yu David Hsu Xuguang Lan Nanning Zheng LM&Ro 108 66 0 25 Aug 2021
Auto-Parsing Network for Image Captioning and Visual Question Answering Xu Yang Chongyang Gao Hanwang Zhang Jianfei Cai 117 37 0 24 Aug 2021
Language Model Augmented Relevance Score Ruibo Liu Jason W. Wei Soroush Vosoughi 51 10 0 19 Aug 2021
End-to-End Dense Video Captioning with Parallel Decoding Teng Wang Ruimao Zhang Zhichao Lu Feng Zheng Ran Cheng Ping Luo 3DV 99 187 0 17 Aug 2021
SAPPHIRE: Approaches for Enhanced Concept-to-Text Generation Steven Y. Feng Jessica Huynh Chaitanya Narisetty Eduard H. Hovy Varun Gangal VLM 58 9 0 15 Aug 2021
Medical-VLBERT: Medical Visual Language BERT for COVID-19 CT Report Generation With Alternate Learning Guangyi Liu Yinghong Liao Fuyu Wang Bin Zhang Lu Zhang ... Xiang Wan Shaolin Li Zhen Li Shuixing Zhang Shuguang Cui 114 59 0 11 Aug 2021
Automated Audio Captioning using Transfer Learning and Reconstruction Latent Space Similarity Regularization Andrew Koh Fuzhao Xue Chng Eng Siong 68 20 0 10 Aug 2021
BERT-based distractor generation for Swedish reading comprehension questions using a small-scale dataset Dmytro Kalpakchi Johan Boye 62 21 0 09 Aug 2021
Discriminative Latent Semantic Graph for Video Captioning Yang Bai Junyan Wang Yang Long Bingzhang Hu Yang Song Maurice Pagnucco Yu Guan 90 31 0 08 Aug 2021
Screen2Words: Automatic Mobile UI Summarization with Multimodal Learning Bryan Wang Gang Li Xin Zhou Zhourong Chen Tovi Grossman Yang Li 209 160 0 07 Aug 2021
An Encoder-Decoder Based Audio Captioning System With Transfer and Reinforcement Learning Xinhao Mei Qiushi Huang Xubo Liu Gengyun Chen Jingqian Wu ... Tom Ko H. Tang Xingkun Shao Mark D. Plumbley Wenwu Wang 93 54 0 05 Aug 2021
Dual Graph Convolutional Networks with Transformer and Curriculum Learning for Image Captioning Xinzhi Dong Chengjiang Long Wenju Xu Chunxia Xiao ViT 147 68 0 05 Aug 2021
Hybrid Reasoning Network for Video-based Commonsense Captioning Weijiang Yu Jian Liang Lei Ji Lu Li Yuejian Fang Nong Xiao Nan Duan 65 10 0 05 Aug 2021
O2NA: An Object-Oriented Non-Autoregressive Approach for Controllable Video Captioning Fenglin Liu Xuancheng Ren Xian Wu Bang-ju Yang Shen Ge Yuexian Zou Xu Sun 83 32 0 05 Aug 2021
Ordered Attention for Coherent Visual Storytelling Tom Braude Idan Schwartz Alex Schwing Ariel Shamir 63 9 0 04 Aug 2021
Question-controlled Text-aware Image Captioning Anwen Hu Shizhe Chen Qin Jin 76 15 0 04 Aug 2021
ICECAP: Information Concentrated Entity-aware Image Captioning Anwen Hu Shizhe Chen Qin Jin 61 20 0 04 Aug 2021
How to Evaluate Your Dialogue Models: A Review of Approaches Xinmeng Li Wansen Wu Long Qin Quanjun Yin ELM 58 8 0 03 Aug 2021
Distributed Attention for Grounded Image Captioning Nenglun Chen Xingjia Pan Runnan Chen Lei Yang Zhiwen Lin Yuqiang Ren Haolei Yuan Xiaowei Guo Feiyue Huang Wenping Wang 76 21 0 02 Aug 2021
ReFormer: The Relational Transformer for Image Captioning Xuewen Yang Yingru Liu Xin Wang ViT 103 57 0 29 Jul 2021
A Thorough Review on Recent Deep Learning Methodologies for Image Captioning Ahmed Elhagry Karima Kadaoui VLM 65 17 0 28 Jul 2021
Neural Rule-Execution Tracking Machine For Transformer-Based Text Generation Yufei Wang Can Xu Huang Hu Chongyang Tao Stephen Wan Mark Dras Mark Johnson Daxin Jiang 57 10 0 27 Jul 2021
Boosting Entity-aware Image Captioning with Multi-modal Knowledge Graph Wentian Zhao Yao Hu Heda Wang Xinxiao Wu Jiebo Luo 55 49 0 26 Jul 2021
Boosting Video Captioning with Dynamic Loss Network Nasib Ullah Partha Pratim Mohanta 49 2 0 25 Jul 2021
Class-Incremental Domain Adaptation with Smoothing and Calibration for Surgical Report Generation Mengya Xu Mobarakol Islam C. Lim Hongliang Ren MedIm 73 32 0 23 Jul 2021
Explainable artificial intelligence (XAI) in deep learning-based medical image analysis Bas H. M. van der Velden Hugo J. Kuijf K. Gilhuijs M. Viergever XAI 106 677 0 22 Jul 2021
CogME: A Cognition-Inspired Multi-Dimensional Evaluation Metric for Story Understanding Minjung Shin Seongho Choi Y. Heo M. Lee Byoung-Tak Zhang Jeh-Kwang Ryu 85 2 0 21 Jul 2021
Continual Learning for Automated Audio Captioning Using The Learning Without Forgetting Approach Jan van den Berg Konstantinos Drossos CLL 73 11 0 16 Jul 2021
On the Evaluation of Neural Code Summarization Ensheng Shi Yanlin Wang Lun Du Junjie Chen Shi Han Hongyu Zhang Dongmei Zhang Hongbin Sun ELM 188 93 0 15 Jul 2021
Surgical Instruction Generation with Transformers Jinglu Zhang Y. Nie Jian Chang Jiangning Zhang MedIm 94 13 0 14 Jul 2021
HTLM: Hyper-Text Pre-Training and Prompting of Language Models Armen Aghajanyan Dmytro Okhonko M. Lewis Mandar Joshi Hu Xu Gargi Ghosh Luke Zettlemoyer VLM VPVLM AI4TS AI4CE 73 76 0 14 Jul 2021
From Show to Tell: A Survey on Deep Learning-based Image Captioning Matteo Stefanini Marcella Cornia Lorenzo Baraldi S. Cascianelli G. Fiameni Rita Cucchiara 3DV VLM MLLM 153 270 0 14 Jul 2021
How Much Can CLIP Benefit Vision-and-Language Tasks? Sheng Shen Liunian Harold Li Hao Tan Joey Tianyi Zhou Anna Rohrbach Kai-Wei Chang Z. Yao Kurt Keutzer CLIP VLM MLLM 274 412 0 13 Jul 2021