v1v2v3 (latest)

Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

10 February 2015

Jimmy Ba

Aaron Courville

Papers citing "Show, Attend and Tell: Neural Image Caption Generation with Visual Attention"

50 / 3,520 papers shown

Title
TDAM: Top-Down Attention Module for Contextually Guided Feature Selection in CNNs Shantanu Jaiswal Basura Fernando Cheston Tan ViT 73 16 0 26 Nov 2021
ContIG: Self-supervised Multimodal Contrastive Learning for Medical Imaging with Genetics Aiham Taleb Matthias Kirchler Remo Monti C. Lippert SSL MedIm 75 58 0 26 Nov 2021
Generating More Pertinent Captions by Leveraging Semantics and Style on Multi-Source Datasets Marcella Cornia Lorenzo Baraldi G. Fiameni Rita Cucchiara 109 12 0 24 Nov 2021
Efficient Anomaly Detection Using Self-Supervised Multi-Cue Tasks Loic Jezequel Ngoc-Son Vu Jean Beaudet A. Histace 83 19 0 24 Nov 2021
Reinforcement Learning based Path Exploration for Sequential Explainable Recommendation Yicong Li Hongxu Chen Yile Li Lin Li Philip S. Yu Guandong Xu 87 16 0 24 Nov 2021
A General Divergence Modeling Strategy for Salient Object Detection Xinyu Tian Jing Zhang Yuchao Dai 67 0 0 23 Nov 2021
Hierarchical Text Classification As Sub-Hierarchy Sequence Generation Sanghun Im Gibaeg Kim Heung-Seon Oh Seong-Mok Jo Donghwan Kim BDL 146 4 0 22 Nov 2021
Local-Selective Feature Distillation for Single Image Super-Resolution Seonguk Park Nojun Kwak 46 9 0 22 Nov 2021
Isomer: Transfer enhanced Dual-Channel Heterogeneous Dependency Attention Network for Aspect-based Sentiment Classification Yukun Cao Yijia Tang Ziyue Wei Chengkun Jin Zeyu Miao Yixin Fang Haizhou Du Feifei Xu 54 0 0 21 Nov 2021
AGA-GAN: Attribute Guided Attention Generative Adversarial Network with U-Net for Face Hallucination Abhishek Srivastava S. Chanda Umapada Pal GAN CVBM 122 10 0 20 Nov 2021
Combined Scaling for Zero-shot Transfer Learning Hieu H. Pham Zihang Dai Golnaz Ghiasi Kenji Kawaguchi Hanxiao Liu ... Yi-Ting Chen Minh-Thang Luong Yonghui Wu Mingxing Tan Quoc V. Le VLM 140 202 0 19 Nov 2021
ClipCap: CLIP Prefix for Image Captioning Ron Mokady Amir Hertz Amit H. Bermano CLIP VLM 85 684 0 18 Nov 2021
Image-specific Convolutional Kernel Modulation for Single Image Super-resolution Yuanfei Huang Jie Li Yanting Hu Xinbo Gao Huan Huang SupR 71 0 0 16 Nov 2021
Attention Mechanisms in Computer Vision: A Survey Meng-Hao Guo Tianhan Xu Jiangjiang Liu Zheng-Ning Liu Peng-Tao Jiang Tai-Jiang Mu Song-Hai Zhang Ralph Robert Martin Ming-Ming Cheng Shimin Hu 144 1,746 0 15 Nov 2021
Fingerprint Presentation Attack Detection by Channel-wise Feature Denoising Feng Liu Zhe Kong Haozhe Liu Wentian Zhang Linlin Shen AAML 88 24 0 15 Nov 2021
A Probabilistic Hard Attention Model For Sequentially Observed Scenes Samrudhdhi B. Rangrej James J. Clark 71 12 0 15 Nov 2021
Co-segmentation Inspired Attention Module for Video-based Computer Vision Tasks Arulkumar Subramaniam Jayesh Vaidya Muhammed Ameen Athira M. Nambiar Anurag Mittal 73 7 0 14 Nov 2021
Where to Look: A Unified Attention Model for Visual Recognition with Reinforcement Learning Gang Chen 46 3 0 13 Nov 2021
Yaw-Guided Imitation Learning for Autonomous Driving in Urban Environments Yandong Liu Chengzhong Xu Hui Kong 57 0 0 11 Nov 2021
Learning to ignore: rethinking attention in CNNs Firas Laakom K. Chumachenko Jenni Raitoharju Alexandros Iosifidis Moncef Gabbouj 109 7 0 10 Nov 2021
Explaining Face Presentation Attack Detection Using Natural Language H. Mirzaalian Mohamed E. Hussein L. Spinoulas Jonathan May Wael AbdAlmageed CVBM FAtt AAML 66 5 0 08 Nov 2021
Auto-Encoding Knowledge Graph for Unsupervised Medical Report Generation Fenglin Liu Chenyu You Xian Wu Shen Ge Sheng Wang Xu Sun MedIm 141 94 0 08 Nov 2021
"How Does It Detect A Malicious App?" Explaining the Predictions of AI-based Android Malware Detector Zhi Lu V. Thing AAML 51 4 0 06 Nov 2021
The Curious Layperson: Fine-Grained Image Recognition without Expert Labels Subhabrata Choudhury Iro Laina Christian Rupprecht Andrea Vedaldi VLM 80 10 0 05 Nov 2021
An Entropy-guided Reinforced Partial Convolutional Network for Zero-Shot Learning Yun Yvonna Li Zhe Liu L. Yao Xianzhi Wang Julian McAuley Xiaojun Chang 85 22 0 03 Nov 2021
A Simple Approach to Image Tilt Correction with Self-Attention MobileNet for Smartphones Siddhant Garg D. Mohanty S. Thota Sukumar Moharana ViT 121 2 0 31 Oct 2021
Attacking Video Recognition Models with Bullet-Screen Comments Kai-xiang Chen Zhipeng Wei Jingjing Chen Zuxuan Wu Yu-Gang Jiang AAML 90 23 0 29 Oct 2021
ST-ABN: Visual Explanation Taking into Account Spatio-temporal Information for Video Recognition Masahiro Mitsuhara Tsubasa Hirakawa Takayoshi Yamashita H. Fujiyoshi 57 1 0 29 Oct 2021
Leveraging Recursive Gumbel-Max Trick for Approximate Inference in Combinatorial Spaces Kirill Struminsky Artyom Gadetsky D. Rakitin Danil Karpushkin Dmitry Vetrov BDL 113 9 0 28 Oct 2021
Discovering Non-monotonic Autoregressive Orderings with Variational Inference Xuanlin Li Brandon Trabucco Dongmin Park Michael Luo S. Shen Trevor Darrell Yang Gao 90 13 0 27 Oct 2021
Understanding Interlocking Dynamics of Cooperative Rationalization Mo Yu Yang Zhang Shiyu Chang Tommi Jaakkola 94 44 0 26 Oct 2021
BioIE: Biomedical Information Extraction with Multi-head Attention Enhanced Graph Convolutional Network Jialun Wu Yang Liu Zeyu Gao Tieliang Gong Chunbao Wang Chen Li 51 16 0 26 Oct 2021
Transferring Domain-Agnostic Knowledge in Video Question Answering Tianran Wu Noa Garcia Mayu Otani Chenhui Chu Yuta Nakashima Haruo Takemura 53 8 0 26 Oct 2021
Alignment Attention by Matching Key and Query Distributions Shujian Zhang Xinjie Fan Huangjie Zheng Korawat Tanwisuth Mingyuan Zhou OOD 122 10 0 25 Oct 2021
Simple Dialogue System with AUDITED Eugenio Clerico Piotr Koniusz 75 2 0 22 Oct 2021
Recurrence along Depth: Deep Convolutional Neural Networks with Recurrent Layer Aggregation Jingyu Zhao Yanwen Fang Guodong Li 69 24 0 22 Oct 2021
Exploiting Cross-Modal Prediction and Relation Consistency for Semi-Supervised Image Captioning Yang Yang Haoran Wei Hengshu Zhu Dianhai Yu Hui Xiong Jian Yang SSL 34 33 0 22 Oct 2021
SciCap: Generating Captions for Scientific Figures Ting-Yao Hsu C. Lee Giles Ting-Hao 'Kenneth' Huang 135 90 0 22 Oct 2021
MHAttnSurv: Multi-Head Attention for Survival Prediction Using Whole-Slide Pathology Images Shuai Jiang A. Suriawinata Saeed Hassanpour 51 30 0 22 Oct 2021
AEI: Actors-Environment Interaction with Adaptive Attention for Temporal Action Proposals Generation Khoa T. Vo Kevin Hyekang Joo Kashu Yamazaki Sang Truong Kris Kitani Minh-Triet Tran Ngan Le EgoV 136 18 0 21 Oct 2021
Video and Text Matching with Conditioned Embeddings Ameen Ali Idan Schwartz Tamir Hazan Lior Wolf 182 14 0 21 Oct 2021
Self-Supervision and Spatial-Sequential Attention Based Loss for Multi-Person Pose Estimation Haiyang Liu Dingli Luo Songlin Du T. Ikenaga 3DH 69 0 0 20 Oct 2021
A Self-Explainable Stylish Image Captioning Framework via Multi-References Chengxi Li Brent Harrison 126 0 0 20 Oct 2021
Inductive Biases and Variable Creation in Self-Attention Mechanisms Benjamin L. Edelman Surbhi Goel Sham Kakade Cyril Zhang 110 125 0 19 Oct 2021
Compositional Attention: Disentangling Search and Retrieval Sarthak Mittal Sharath Chandra Raparthy Irina Rish Yoshua Bengio Guillaume Lajoie 79 20 0 18 Oct 2021
Deep Transfer Learning & Beyond: Transformer Language Models in Information Systems Research Ross Gruetzemacher D. Paradice 86 35 0 18 Oct 2021
Visual-aware Attention Dual-stream Decoder for Video Captioning Zhixin Sun Xian Zhong Shuqin Chen Lin Li Luo Zhong 92 3 0 16 Oct 2021
Multimodal Dialogue Response Generation Qingfeng Sun Yujing Wang Can Xu Kai Zheng Yaming Yang Huang Hu Fei Xu Jessica Zhang Xiubo Geng Daxin Jiang 114 49 0 16 Oct 2021
Self-Annotated Training for Controllable Image Captioning Zhangzi Zhu Tianlei Wang Hong Qu 76 2 0 16 Oct 2021
Guiding Visual Question Generation Nihir Vedd Zixu Wang Marek Rei Yishu Miao Lucia Specia 140 22 0 15 Oct 2021