v1v2 (latest)

CIDEr: Consensus-based Image Description Evaluation

20 November 2014

Ramakrishna Vedantam

C. L. Zitnick

Devi Parikh

ArXiv (abs)PDF HTML

Papers citing "CIDEr: Consensus-based Image Description Evaluation"

50 / 2,183 papers shown

Title
Towards Diverse and Accurate Image Captions via Reinforcing Determinantal Point Process Qingzhong Wang Antoni B. Chan 61 7 0 14 Aug 2019
Towards Generating Stylized Image Captions via Adversarial Training Omid Mohamad Nezami Mark Dras Stephen Wan Cécile Paris Len Hamey GAN 70 18 0 08 Aug 2019
Image Captioning using Facial Expression and Attention Omid Mohamad Nezami Mark Dras Stephen Wan Cécile Paris CVBM 72 10 0 08 Aug 2019
Scene-based Factored Attention for Image Captioning Chen Shen Rongrong Ji Fuhai Chen Xiaoshuai Sun Xiangming Li 29 0 0 07 Aug 2019
Addressing Data Bias Problems for Chest X-ray Image Report Generation Philipp Harzig Yan-Ying Chen Francine Chen Rainer Lienhart MedIm 58 52 0 06 Aug 2019
Visual-Relation Conscious Image Generation from Structured-Text D. Vo Akihiro Sugimoto 79 17 0 05 Aug 2019
Prediction and Description of Near-Future Activities in Video T. Mahmud Mohammad Billah Mahmudul Hasan Amit K. Roy-Chowdhury 77 17 0 02 Aug 2019
Convolutional Auto-encoding of Sentence Topics for Image Paragraph Generation Jing Wang Yingwei Pan Ting Yao Jinhui Tang Tao Mei VLM BDL DiffM 61 36 0 01 Aug 2019
Curiosity-driven Reinforcement Learning for Diverse Visual Paragraph Generation Yadan Luo Zi Huang Zheng Zhang Ziwei Wang Jingjing Li Yang Yang 71 40 0 01 Aug 2019
ShapeCaptioner: Generative Caption Network for 3D Shapes by Learning a Mapping from Parts Detected in Multiple Views to Sentences Zhizhong Han Chao Chen Yu-Shen Liu Matthias Zwicker 3DPC 72 46 0 31 Jul 2019
Learning Question-Guided Video Representation for Multi-Turn Video Question Answering Guan-Lin Chao Abhinav Rastogi Semih Yavuz Dilek Z. Hakkani-Tür Jindong Chen Ian Lane 51 6 0 31 Jul 2019
Cooperative image captioning Gilad Vered Gal Oren Yuval Atzmon Gal Chechik 54 2 0 26 Jul 2019
Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and Methods Aditya Mogadala M. Kalimuthu Dietrich Klakow VLM 141 136 0 22 Jul 2019
VIFIDEL: Evaluating the Visual Fidelity of Image Descriptions Pranava Madhyastha Josiah Wang Lucia Specia 66 33 0 22 Jul 2019
Watch It Twice: Video Captioning with a Refocused Video Encoder Xiangxi Shi Jianfei Cai Shafiq Joty Jiuxiang Gu 70 28 0 21 Jul 2019
Justifying Diagnosis Decisions by Deep Neural Networks Graham Spinks Marie-Francine Moens 93 14 0 12 Jul 2019
On the Evaluation of Conditional GANs Terrance Devries Adriana Romero Luis Villaseñor-Pineda Graham W. Taylor M. Drozdzal EGVM 87 43 0 11 Jul 2019
Informative Visual Storytelling with Cross-modal Rules Jiacheng Li Haizhou Shi Siliang Tang Leilei Gan Yueting Zhuang 50 24 0 07 Jul 2019
Multimodal Transformer Networks for End-to-End Video-Grounded Dialogue Systems Hung Le Doyen Sahoo Nancy F. Chen Guosheng Lin 63 112 0 02 Jul 2019
A Deep Decoder Structure Based on WordEmbedding Regression for An Encoder-Decoder Based Model for Image Captioning A. Asadi Reza Safabakhsh 19 3 0 26 Jun 2019
Informative Image Captioning with External Sources of Information Sanqiang Zhao Piyush Sharma Tomer Levinboim Radu Soricut 65 46 0 20 Jun 2019
Automatic Source Code Summarization with Extended Tree-LSTM Yusuke Shido Yasuaki Kobayashi Akihiro Yamamoto A. Miyamoto Tadayuki Matsumura 67 88 0 19 Jun 2019
Expressing Visual Relationships via Language Hao Tan Franck Dernoncourt Zhe Lin Trung Bui Joey Tianyi Zhou 90 68 0 18 Jun 2019
Generating Diverse and Informative Natural Language Fashion Feedback Gil Sadeh L. Fritz Gabi Shalev Eduard Oks 50 5 0 15 Jun 2019
Comparison of Diverse Decoding Methods from Conditional Language Models Daphne Ippolito Reno Kriz M. Kustikova João Sedoc Chris Callison-Burch AI4CE 85 114 0 14 Jun 2019
Improving Visual Question Answering by Referring to Generated Paragraph Captions Hyounghun Kim Joey Tianyi Zhou CoGe 50 20 0 14 Jun 2019
Image Captioning: Transforming Objects into Words Simão Herdade Armin Kappeler K. Boakye Joao Soares ViT 155 476 0 14 Jun 2019
Continual and Multi-Task Architecture Search Ramakanth Pasunuru Joey Tianyi Zhou CLL 67 48 0 12 Jun 2019
Object-aware Aggregation with Bidirectional Temporal Graph for Video Captioning Junchao Zhang Yuxin Peng 88 172 0 11 Jun 2019
Generation of Multimodal Justification Using Visual Word Constraint Model for Explainable Computer-Aided Diagnosis Hyebin Lee S. T. Kim Yong Man Ro MedIm 66 44 0 10 Jun 2019
Figure Captioning with Reasoning and Sequence-Level Training Charles C. Chen Ruiyi Zhang Eunyee Koh Sungchul Kim Scott D. Cohen Tong Yu Ryan Rossi Razvan Bunescu AIMat 69 39 0 07 Jun 2019
ActivityNet-QA: A Dataset for Understanding Complex Web Videos via Question Answering Zhou Yu D. Xu Jun-chen Yu Ting Yu Zhou Zhao Yueting Zhuang Dacheng Tao 146 478 0 06 Jun 2019
Context-Aware Visual Policy Network for Fine-Grained Image Captioning Zhengjun Zha Daqing Liu Hanwang Zhang Yongdong Zhang Feng Wu 66 122 0 06 Jun 2019
Relational Reasoning using Prior Knowledge for Visual Captioning Jingyi Hou Xinxiao Wu Yayun Qi Wentian Zhao Jiebo Luo Yunde Jia 85 14 0 04 Jun 2019
Handling Divergent Reference Texts when Evaluating Table-to-Text Generation Bhuwan Dhingra Manaal Faruqui Ankur P. Parikh Ming-Wei Chang Dipanjan Das William W. Cohen 108 197 0 03 Jun 2019
Masked Non-Autoregressive Image Captioning Junlong Gao Xi Meng Shiqi Wang Xia Li Shanshe Wang Siwei Ma Wen Gao 80 39 0 03 Jun 2019
Reconstruct and Represent Video Contents for Captioning via Reinforcement Learning Wei Zhang Bairui Wang Lin Ma Wei Liu 116 67 0 03 Jun 2019
Learning to Generate Grounded Visual Captions without Localization Supervision Chih-Yao Ma Yannis Kalantidis Ghassan AlRegib Peter Vajda Marcus Rohrbach Z. Kira SSL 43 10 0 01 Jun 2019
Vision-to-Language Tasks Based on Attributes and Attention Mechanism Xuelong Li Aihong Yuan Xiaoqiang Lu 77 37 0 29 May 2019
Ensuring Readability and Data-fidelity using Head-modifier Templates in Deep Type Description Generation Jiangjie Chen Ao Wang Haiyun Jiang Suo Feng Chenguang Li Yanghua Xiao 63 3 0 29 May 2019
A Survey on Biomedical Image Captioning Vasiliki Kougia John Pavlopoulos Ion Androutsopoulos MedIm 81 83 0 26 May 2019
Bivariate Beta-LSTM Kyungwoo Song Joonho Jang Seung-Jae Shin Il-Chul Moon 45 6 0 25 May 2019
Triple-to-Text: Converting RDF Triples into High-Quality Natural Languages via Optimizing an Inverse KL Divergence Yaoming Zhu Juncheng Wan Zhiming Zhou Liheng Chen Lin Qiu Weinan Zhang Xin Jiang Yong Yu 68 28 0 25 May 2019
Designing a Symbolic Intermediate Representation for Neural Surface Realization H. Elder Jennifer Foster James Barry Alexander O’Connor 64 13 0 24 May 2019
Image Captioning based on Deep Learning Methods: A Survey Yiyu Wang Jungang Xu Yingfei Sun Xianpei Han VLM 34 7 0 20 May 2019
Multimodal Transformer with Multi-View Visual Representation for Image Captioning Jun-chen Yu Jing Li Zhou Yu Qingming Huang ViT 65 387 0 20 May 2019
Aligning Visual Regions and Textual Concepts for Semantic-Grounded Image Representations Fenglin Liu Yuanxin Liu Xuancheng Ren Xiaodong He Xu Sun VLM 71 82 0 15 May 2019
Memory-Attended Recurrent Network for Video Captioning Wenjie Pei Jiyuan Zhang Xiangrong Wang Lei Ke Xiaoyong Shen Yu-Wing Tai 106 204 0 10 May 2019
Learning Representations for Predicting Future Activities Mohammadreza Zolfaghari Özgün Çiçek S. M. Ali F. Mahdisoltani Can Zhang Thomas Brox AI4TS 47 6 0 09 May 2019
Multimodal Semantic Attention Network for Video Captioning Liang Sun Bing Li Chunfen Yuan Zhengjun Zha Weiming Hu 57 11 0 08 May 2019