SPICE: Semantic Propositional Image Caption Evaluation

29 July 2016

Papers citing "SPICE: Semantic Propositional Image Caption Evaluation"

50 / 949 papers shown

Title
Exploiting Cross-Modal Prediction and Relation Consistency for Semi-Supervised Image Captioning Yang Yang Haoran Wei Hengshu Zhu Dianhai Yu Hui Xiong Jian Yang SSL 27 33 0 22 Oct 2021
Cortico-cerebellar networks as decoupling neural interfaces J. Pemberton E. Boven Richard Apps Rui Ponte Costa 68 6 0 21 Oct 2021
A Self-Explainable Stylish Image Captioning Framework via Multi-References Chengxi Li Brent Harrison 124 0 0 20 Oct 2021
R $^3$ Net:Relation-embedded Representation Reconstruction Network for Change Captioning Yunbin Tu Liang Li C. Yan Shengxiang Gao Zhengtao Yu 77 24 0 20 Oct 2021
Unifying Multimodal Transformer for Bi-directional Image and Text Generation Yupan Huang Hongwei Xue Bei Liu Yutong Lu 79 59 0 19 Oct 2021
Multimodal Dialogue Response Generation Qingfeng Sun Yujing Wang Can Xu Kai Zheng Yaming Yang Huang Hu Fei Xu Jessica Zhang Xiubo Geng Daxin Jiang 104 49 0 16 Oct 2021
A Good Prompt Is Worth Millions of Parameters: Low-resource Prompt-based Learning for Vision-Language Models Woojeong Jin Yu Cheng Yelong Shen Weizhu Chen Xiang Ren VLM VPVLM MLLM 117 138 0 16 Oct 2021
Self-Annotated Training for Controllable Image Captioning Zhangzi Zhu Tianlei Wang Hong Qu 70 2 0 16 Oct 2021
Diverse Audio Captioning via Adversarial Training Xinhao Mei Xubo Liu Jianyuan Sun Mark D. Plumbley Wenwu Wang DiffM GAN 102 28 0 13 Oct 2021
CLIP4Caption: CLIP for Video Caption Mingkang Tang Zhanyu Wang Zhenhua Liu Fengyun Rao Dian Li Xiu Li CLIP VLM 84 155 0 13 Oct 2021
Improving the Performance of Automated Audio Captioning via Integrating the Acoustic and Semantic Information Zhongjie Ye Helin Wang Dongchao Yang Yuexian Zou 96 28 0 12 Oct 2021
Semi-Autoregressive Image Captioning Xu Yan Zhengcong Fei Zekang Li Shuhui Wang Qingming Huang Qi Tian 91 25 0 11 Oct 2021
CLIP4Caption ++: Multi-CLIP for Video Caption Mingkang Tang Zhanyu Wang Zhaoyang Zeng Feng Rao Dian Li VLM CLIP 42 7 0 11 Oct 2021
Can Audio Captions Be Evaluated with Image Caption Metrics? Zelin Zhou Zhiling Zhang Xuenan Xu Zeyu Xie Mengyue Wu Kenny Q. Zhu 68 46 0 10 Oct 2021
Natural Language for Human-Robot Collaboration: Problems Beyond Language Grounding Seth Pate Wei Xu Ziyi Yang Maxwell Love Siddarth Ganguri Lawson L. S. Wong 80 7 0 09 Oct 2021
Is An Image Worth Five Sentences? A New Look into Semantics for Image-Text Matching Ali Furkan Biten Andrés Mafla Lluís Gómez Dimosthenis Karatzas 237 18 0 06 Oct 2021
Let there be a clock on the beach: Reducing Object Hallucination in Image Captioning Ali Furkan Biten L. G. I. Bigorda Dimosthenis Karatzas 159 63 0 04 Oct 2021
Audio Captioning Using Sound Event Detection Aycsegul Ozkaya Eren M. Sert 72 8 0 04 Oct 2021
Geometry Attention Transformer with Position-aware LSTMs for Image Captioning Chi-Yin Wang Yulin Shen Luping Ji ViT 106 53 0 01 Oct 2021
Geometry-Entangled Visual Semantic Transformer for Image Captioning Ling Cheng Wei Wei Feida Zhu Yong Liu Chunyan Miao ViT 45 3 0 29 Sep 2021
CIDEr-R: Robust Consensus-based Image Description Evaluation G. O. D. Santos Esther Luna Colombini Sandra Avila 81 30 0 28 Sep 2021
Multimodal Incremental Transformer with Visual Grounding for Visual Dialogue Generation Feilong Chen Fandong Meng Xiuyi Chen Peng Li Jie Zhou 93 23 0 17 Sep 2021
GoG: Relation-aware Graph-over-Graph Network for Visual Dialog Feilong Chen Xiuyi Chen Fandong Meng Peng Li Jie Zhou 138 35 0 17 Sep 2021
Cross Modification Attention Based Deliberation Model for Image Captioning Zheng Lian Yanan Zhang Haichang Li Rui Wang Xiaohui Hu 64 5 0 17 Sep 2021
Label-Attention Transformer with Geometrically Coherent Objects for Image Captioning Shikha Dubey Farrukh Olimov M. Rafique Joonmo Kim M. Jeon ViT 82 42 0 16 Sep 2021
Improving Text Auto-Completion with Next Phrase Prediction Dong-Ho Lee Zhiqiang Hu Roy Ka-wei Lee LRM 50 4 0 15 Sep 2021
KFCNet: Knowledge Filtering and Contrastive Learning Network for Generative Commonsense Reasoning Haonan Li Yeyun Gong Jian Jiao Ruofei Zhang Timothy Baldwin Nan Duan OffRL 93 6 0 14 Sep 2021
Learning to Ground Visual Objects for Visual Dialog Feilong Chen Xiuyi Chen Can Xu Daxin Jiang OOD 86 18 0 13 Sep 2021
Perturbation CheckLists for Evaluating NLG Evaluation Metrics Ananya B. Sai Tanay Dixit D. Y. Sheth S. Mohan Mitesh M. Khapra AAML 155 58 0 13 Sep 2021
Constructing Phrase-level Semantic Labels to Form Multi-Grained Supervision for Image-Text Retrieval Zhihao Fan Zhongyu Wei Zejun Li Siyuan Wang Haijun Shan Xuanjing Huang Jianqing Fan CLIP 42 12 0 12 Sep 2021
COSMic: A Coherence-Aware Generation Metric for Image Descriptions Mert Inan P. Sharma Baber Khalid Radu Soricut Matthew Stone Malihe Alikhani EGVM 50 13 0 11 Sep 2021
Partially-Supervised Novel Object Captioning Leveraging Context from Paired Data Shashank Bujimalla Mahesh Subedar Omesh Tickoo 104 1 0 10 Sep 2021
Retrieve, Caption, Generate: Visual Grounding for Enhancing Commonsense in Text Generation Models Steven Y. Feng Kevin Lu Zhuofu Tao Malihe Alikhani Teruko Mitamura Eduard H. Hovy Varun Gangal LRM 70 13 0 08 Sep 2021
RefineCap: Concept-Aware Refinement for Image Captioning Yekun Chai Shuo Jin Junliang Xing VLM 22 1 0 08 Sep 2021
Exploring Strategies for Generalizable Commonsense Reasoning with Pre-trained Models Kaixin Ma Filip Ilievski Jonathan M Francis Satoru Ozaki Eric Nyberg A. Oltramari LRM 89 17 0 07 Sep 2021
Problem Learning: Towards the Free Will of Machines Yongfeng Zhang FaML 58 2 0 01 Sep 2021
Working Memory Connections for LSTM Federico Landi Lorenzo Baraldi Marcella Cornia Rita Cucchiara KELM 74 170 0 31 Aug 2021
QACE: Asking Questions to Evaluate an Image Caption Hwanhee Lee Thomas Scialom Seunghyun Yoon Franck Dernoncourt Kyomin Jung CoGe 87 19 0 28 Aug 2021
Automatic Text Evaluation through the Lens of Wasserstein Barycenters Pierre Colombo Guillaume Staerman Chloé Clavel Pablo Piantanida 197 41 0 27 Aug 2021
Vision-Language Navigation: A Survey and Taxonomy Wansen Wu Tao Chang Xinmeng Li LM&Ro 67 24 0 26 Aug 2021
INVIGORATE: Interactive Visual Grounding and Grasping in Clutter Hanbo Zhang Yunfan Lu Cunjun Yu David Hsu Xuguang Lan Nanning Zheng LM&Ro 98 66 0 25 Aug 2021
Auto-Parsing Network for Image Captioning and Visual Question Answering Xu Yang Chongyang Gao Hanwang Zhang Jianfei Cai 112 37 0 24 Aug 2021
ROSITA: Enhancing Vision-and-Language Semantic Alignments via Cross- and Intra-modal Knowledge Integration Yuhao Cui Zhou Yu Chunqi Wang Zhongzhou Zhao Ji Zhang Meng Wang Jun-chen Yu VLM 59 56 0 16 Aug 2021
SAPPHIRE: Approaches for Enhanced Concept-to-Text Generation Steven Y. Feng Jessica Huynh Chaitanya Narisetty Eduard H. Hovy Varun Gangal VLM 58 9 0 15 Aug 2021
Caption Generation on Scenes with Seen and Unseen Object Categories B. Demirel R. G. Cinbis VLM 115 1 0 13 Aug 2021
Automated Audio Captioning using Transfer Learning and Reconstruction Latent Space Similarity Regularization Andrew Koh Fuzhao Xue Chng Eng Siong 68 20 0 10 Aug 2021
Neural Twins Talk & Alternative Calculations Zanyar Zohourianshahzadi Jugal Kalita 52 0 0 05 Aug 2021
An Encoder-Decoder Based Audio Captioning System With Transfer and Reinforcement Learning Xinhao Mei Qiushi Huang Xubo Liu Gengyun Chen Jingqian Wu ... Tom Ko H. Tang Xingkun Shao Mark D. Plumbley Wenwu Wang 91 54 0 05 Aug 2021
Question-controlled Text-aware Image Captioning Anwen Hu Shizhe Chen Qin Jin 76 15 0 04 Aug 2021
Distributed Attention for Grounded Image Captioning Nenglun Chen Xingjia Pan Runnan Chen Lei Yang Zhiwen Lin Yuqiang Ren Haolei Yuan Xiaowei Guo Feiyue Huang Wenping Wang 66 21 0 02 Aug 2021