Title
Explanation vs Attention: A Two-Player Game to Obtain Attention for VQA Badri N. Patro Anupriy Vinay P. Namboodiri AAML FAtt 48 26 0 19 Nov 2019
Exploring Overall Contextual Information for Image Captioning in Human-Like Cognitive Style Hongwei Ge Zehang Yan Kai Zhang Mingde Zhao Liang Sun 30 24 0 15 Oct 2019
Learning Visual Relation Priors for Image-Text Matching and Image Captioning with Neural Scene Graph Generators Kuang-Huei Lee Hamid Palangi Xi Chen Houdong Hu Jianfeng Gao VLM 27 37 0 22 Sep 2019
CAMP: Cross-Modal Adaptive Message Passing for Text-Image Retrieval Zihao Wang Xihui Liu Hongsheng Li Lu Sheng Junjie Yan Xiaogang Wang Jing Shao VLM 25 299 0 12 Sep 2019
Probabilistic framework for solving Visual Dialog Badri N. Patro Anupriy Vinay P. Namboodiri BDL 30 13 0 11 Sep 2019
Compositional Generalization in Image Captioning Mitja Nikolaus Mostafa Abdou Matthew Lamm Rahul Aralikatte Desmond Elliott CoGe 27 49 0 10 Sep 2019
MULE: Multimodal Universal Language Embedding Donghyun Kim Kuniaki Saito Kate Saenko Stan Sclaroff Bryan A. Plummer VLM 32 40 0 08 Sep 2019
Aesthetic Image Captioning From Weakly-Labelled Photographs Koustav Ghosal A. Rana A. Smolic 27 25 0 29 Aug 2019
Sequential Latent Spaces for Modeling the Intention During Diverse Image Captioning J. Aneja Harsh Agrawal Dhruv Batra A. Schwing BDL VLM 23 66 0 22 Aug 2019
Towards High-Resolution Salient Object Detection Yi Zeng Pingping Zhang Jianming Zhang Zhe-nan Lin Huchuan Lu 33 197 0 20 Aug 2019
Attention on Attention for Image Captioning Lun Huang Wenmin Wang Jie Chen Xiao-Yong Wei 24 823 0 19 Aug 2019
U-CAM: Visual Explanation using Uncertainty based Class Activation Maps Badri N. Patro Mayank Lunayach Shivansh Patel Vinay P. Namboodiri FAtt UQCV 27 76 0 17 Aug 2019
Unpaired Cross-lingual Image Caption Generation with Self-Supervised Rewards Yuqing Song Shizhe Chen Yida Zhao Qin Jin SSL 26 40 0 15 Aug 2019
Aligning Linguistic Words and Visual Semantic Units for Image Captioning Longteng Guo Jing Liu Jinhui Tang Jiangwei Li W. Luo Hanqing Lu 25 102 0 06 Aug 2019
Cascaded Revision Network for Novel Object Captioning Qianyu Feng Yu Wu Hehe Fan C. Yan Yezhou Yang 29 35 0 06 Aug 2019
Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and Methods Aditya Mogadala M. Kalimuthu Dietrich Klakow VLM 20 132 0 22 Jul 2019
MeetUp! A Corpus of Joint Activity Dialogues in a Visual Environment N. Ilinykh Sina Zarrieß David Schlangen 27 43 0 11 Jul 2019
Informative Visual Storytelling with Cross-modal Rules Jiacheng Li Haizhou Shi Siliang Tang Fei Wu Yueting Zhuang 24 24 0 07 Jul 2019
Improving Description-based Person Re-identification by Multi-granularity Image-text Alignments K. Niu Y. Huang Wanli Ouyang Liang Wang 27 138 0 23 Jun 2019
Image Captioning: Transforming Objects into Words Simão Herdade Armin Kappeler K. Boakye Joao Soares ViT 33 462 0 14 Jun 2019
Context-Aware Visual Policy Network for Fine-Grained Image Captioning Zhengjun Zha Daqing Liu Hanwang Zhang Yongdong Zhang Feng Wu 25 119 0 06 Jun 2019
Natural Vocabulary Emerges from Free-Form Annotations Jordi Pont-Tuset Michael Gygli V. Ferrari VLM 26 3 0 04 Jun 2019
Aligning Visual Regions and Textual Concepts for Semantic-Grounded Image Representations Fenglin Liu Yuanxin Liu Xuancheng Ren Xiaodong He Xu Sun VLM 34 81 0 15 May 2019
On Exploring Undetermined Relationships for Visual Relationship Detection Yibing Zhan Jun-chen Yu Ting Yu Dacheng Tao 31 82 0 05 May 2019
Pointing Novel Objects in Image Captioning Yehao Li Ting Yao Yingwei Pan Hongyang Chao Tao Mei 33 69 0 25 Apr 2019
3G structure for image caption generation Aihong Yuan Xuelong Li Xiaoqiang Lu 21 34 0 21 Apr 2019
Self-critical n-step Training for Image Captioning Junlong Gao Shiqi Wang Shanshe Wang Siwei Ma Wen Gao 16 55 0 15 Apr 2019
Cross-lingual Visual Verb Sense Disambiguation Spandana Gella Desmond Elliott Frank Keller 16 19 0 10 Apr 2019
End-to-End Video Captioning Silvio Olivastri Gurkirt Singh Fabio Cuzzolin 16 18 0 04 Apr 2019
Good News, Everyone! Context driven entity-aware captioning for news images Ali Furkan Biten Lluís Gómez Marçal Rusiñol Dimosthenis Karatzas 21 139 0 02 Apr 2019
Describing like humans: on diversity in image captioning Qingzhong Wang Antoni B. Chan 24 98 0 28 Mar 2019
Unmasking Clever Hans Predictors and Assessing What Machines Really Learn Sebastian Lapuschkin S. Wäldchen Alexander Binder G. Montavon Wojciech Samek K. Müller 17 996 0 26 Feb 2019
Multi-step Reasoning via Recurrent Dual Attention for Visual Dialog Zhe Gan Yu Cheng Ahmed El Kholy Linjie Li Jingjing Liu Jianfeng Gao 11 104 0 01 Feb 2019
Evaluating Text-to-Image Matching using Binary Image Selection (BISON) Hexiang Hu Ishan Misra L. V. D. van der Maaten 24 22 0 19 Jan 2019
nocaps: novel object captioning at scale Harsh Agrawal Karan Desai Yufei Wang Xinlei Chen Rishabh Jain Mark Johnson Dhruv Batra Devi Parikh Stefan Lee Peter Anderson VLM 21 468 0 20 Dec 2018
Auto-Encoding Scene Graphs for Image Captioning Xu Yang Kaihua Tang Hanwang Zhang Jianfei Cai 21 692 0 06 Dec 2018
A Comprehensive Survey of Deep Learning for Image Captioning Md Zakir Hossain Ferdous Sohel M. Shiratuddin Hamid Laga VLM 3DV 45 760 0 06 Oct 2018
Neural Approaches to Conversational AI Jianfeng Gao Michel Galley Lihong Li 46 669 0 21 Sep 2018
Image Captioning based on Deep Reinforcement Learning Haichao Shi Peng Li Bo Wang Zhenyu Wang 20 25 0 13 Sep 2018
simNet: Stepwise Image-Topic Merging Network for Generating Detailed and Comprehensive Image Captions Fenglin Liu Xuancheng Ren Yuanxin Liu Houfeng Wang Xu Sun 98 65 0 27 Aug 2018
Context-Aware Visual Policy Network for Sequence-Level Image Captioning Daqing Liu Zhengjun Zha Hanwang Zhang Yongdong Zhang Feng Wu CLIP 33 103 0 16 Aug 2018
Distinctive-attribute Extraction for Image Captioning Boeun Kim Young Han Lee Hyedong Jung C. Cho 19 6 0 25 Jul 2018
"Factual" or "Emotional": Stylized Image Captioning with Adaptive Learning and Attention Tianlang Chen Zhongping Zhang Quanzeng You Chen Fang Zhaowen Wang Hailin Jin Jiebo Luo 24 86 0 10 Jul 2018
Topic-Guided Attention for Image Captioning Zhihao Zhu Zhan Xue Zejian Yuan 30 23 0 10 Jul 2018
Face-Cap: Image Captioning using Facial Expression Analysis Omid Mohamad Nezami Mark Dras Peter Anderson Len Hamey CVBM 27 27 0 06 Jul 2018
Learning Visual Knowledge Memory Networks for Visual Question Answering Zhou Su Chen Zhu Yinpeng Dong Dongqi Cai Yurong Chen Jianguo Li 34 62 0 13 Jun 2018
Object Counts! Bringing Explicit Detections Back into Image Captioning Josiah Wang Pranava Madhyastha Lucia Specia ObjD 19 37 0 23 Apr 2018
Beyond Narrative Description: Generating Poetry from Images by Multi-Adversarial Training Bei Liu Jianlong Fu Makoto P. Kato Masatoshi Yoshikawa GAN 24 73 0 23 Apr 2018
Jointly Localizing and Describing Events for Dense Video Captioning Yehao Li Ting Yao Yingwei Pan Hongyang Chao Tao Mei 24 168 0 23 Apr 2018
Entity-aware Image Caption Generation Di Lu Spencer Whitehead Lifu Huang Heng Ji Shih-Fu Chang VLM 25 82 0 21 Apr 2018