v1v2v3 (latest)

Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

10 February 2015

Jimmy Ba

Aaron Courville

Papers citing "Show, Attend and Tell: Neural Image Caption Generation with Visual Attention"

50 / 3,520 papers shown

Title
Missingness Bias in Model Debugging Saachi Jain Hadi Salman E. Wong Pengchuan Zhang Vibhav Vineet Sai H. Vemprala Aleksander Madry 100 37 0 19 Apr 2022
Causal Intervention for Subject-Deconfounded Facial Action Unit Recognition Yingjie Chen Diqi Chen Tao Wang Yizhou Wang Yun Liang CVBM CML 53 30 0 17 Apr 2022
Visual Attention Methods in Deep Learning: An In-Depth Survey Mohammed Hassanin Saeed Anwar Ibrahim Radwan Fahad Shahbaz Khan Ajmal Mian 136 166 0 16 Apr 2022
It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection Youssef Mohamed Faizan Farooq Khan Kilichbek Haydarov Mohamed Elhoseiny 59 33 0 15 Apr 2022
Guiding Attention using Partial-Order Relationships for Image Captioning Murad Popattia Muhammad Rafi Rizwan Qureshi Shah Nawaz 54 5 0 15 Apr 2022
Image Captioning In the Transformer Age Yangliu Xu Li Li Haiyang Xu Songfang Huang Fei Huang Jianfei Cai ViT 59 6 0 15 Apr 2022
Improving Cross-Modal Understanding in Visual Dialog via Contrastive Learning Feilong Chen Xiuyi Chen Shuang Xu Bo Xu VLM 92 19 0 15 Apr 2022
Interpretability of Machine Learning Methods Applied to Neuroimaging Elina Thibeau-Sutre S. Collin Ninon Burgos O. Colliot 58 5 0 14 Apr 2022
A Review of Machine Learning Methods Applied to Structural Dynamics and Vibroacoustic Barbara Z Cunha C. Droz A. Zine Stéphane Foulard M. Ichchou AI4CE 71 91 0 13 Apr 2022
Video Captioning: a comparative review of where we are and which could be the route Daniela Moctezuma Tania A. Ramirez-delreal Guillermo Ruiz Othón González-Chávez 61 11 0 12 Apr 2022
X-DETR: A Versatile Architecture for Instance-wise Vision-Language Tasks Zhaowei Cai Gukyeong Kwon Avinash Ravichandran Erhan Bas Zhuowen Tu Rahul Bhotika Stefano Soatto ObjD MLLM VLM 67 50 0 12 Apr 2022
ProtoTEx: Explaining Model Decisions with Prototype Tensors Anubrata Das Chitrank Gupta Venelin Kovatchev Matthew Lease Junjie Li 93 28 0 11 Apr 2022
RubCSG at SemEval-2022 Task 5: Ensemble learning for identifying misogynous MEMEs Wentao Yu Benedikt T. Boenninghoff Jonas Roehrig D. Kolossa 44 3 0 08 Apr 2022
On Distinctive Image Captioning via Comparing and Reweighting Jiuniu Wang Wenjia Xu Qingzhong Wang Antoni B. Chan 91 16 0 08 Apr 2022
IA-GCN: Interactive Graph Convolutional Network for Recommendation Yinan Zhang Pei Wang Congcong Liu Xiwei Zhao Hao Qi Jie He Junsheng Jin Changping Peng Zhangang Lin Jingping Shao GNN 64 6 0 08 Apr 2022
OccamNets: Mitigating Dataset Bias by Favoring Simpler Hypotheses Robik Shrestha Kushal Kafle Christopher Kanan CML 106 13 0 05 Apr 2022
Consistency driven Sequential Transformers Attention Model for Partially Observable Scenes Samrudhdhi B. Rangrej C. Srinidhi J. Clark 72 12 0 01 Apr 2022
Symbolic music generation conditioned on continuous-valued emotions Serkan Sulun M. Davies Paula Viana MGen 86 27 0 30 Mar 2022
NICGSlowDown: Evaluating the Efficiency Robustness of Neural Image Caption Generation Models Simin Chen Zihe Song Mirazul Haque Cong Liu Wei Yang 75 42 0 29 Mar 2022
Quantifying Societal Bias Amplification in Image Captioning Yusuke Hirota Yuta Nakashima Noa Garcia 76 48 0 29 Mar 2022
End-to-End Transformer Based Model for Image Captioning Yiyu Wang Jungang Xu Yingfei Sun VLM ViT 64 126 0 29 Mar 2022
Vision Transformers in Medical Computer Vision -- A Contemplative Retrospection Arshi Parvaiz Muhammad Anwaar Khalid Rukhsana Zafar Huma Ameer M. Ali M. Fraz MedIm 79 64 0 29 Mar 2022
3D Shape Reconstruction from 2D Images with Disentangled Attribute Flow Xin Wen Junsheng Zhou Yu-Shen Liu Zhen Dong Zhizhong Han 3DV 3DPC 90 53 0 29 Mar 2022
Text2Pos: Text-to-Point-Cloud Cross-Modal Localization Manuel Kolmet Qunjie Zhou Aljosa Osep Laura Leal-Taixe 86 24 0 28 Mar 2022
X-Pool: Cross-Modal Language-Video Attention for Text-Video Retrieval S. Gorti Noël Vouitsis Junwei Ma Keyvan Golestan Anthony L. Caterini Animesh Garg Guangwei Yu 101 162 0 28 Mar 2022
A Survey on Aspect-Based Sentiment Classification Gianni Brauwers Flavius Frasincar LLMAG 110 120 0 27 Mar 2022
A General Survey on Attention Mechanisms in Deep Learning Gianni Brauwers Flavius Frasincar 106 334 0 27 Mar 2022
Transformers Meet Visual Learning Understanding: A Comprehensive Review Yuting Yang Licheng Jiao Xuantong Liu Fan Liu Shuyuan Yang Zhixi Feng Xu Tang ViT MedIm 120 28 0 24 Mar 2022
On the link between conscious function and general intelligence in humans and machines Arthur Juliani Kai Arulkumaran Shuntaro Sasai Ryota Kanai 105 26 0 24 Mar 2022
CNN Attention Guidance for Improved Orthopedics Radiographic Fracture Classification Zhibin Liao Kewen Liao Haifeng Shen M. F. van Boxel J. Prijs R. Jaarsma J. Doornberg Anton Van Den Hengel Johan Verjans 59 17 0 21 Mar 2022
AlignTransformer: Hierarchical Alignment of Visual Regions and Disease Tags for Medical Report Generation Di You Fenglin Liu Shen Ge Xiaoxia Xie Jing Zhang Xian Wu ViT MedIm 138 114 0 18 Mar 2022
ARTEMIS: Attention-based Retrieval with Text-Explicit Matching and Implicit Similarity Ginger Delmas Rafael Sampaio de Rezende G. Csurka Diane Larlus VLM 73 107 0 15 Mar 2022
A Novel Perspective to Look At Attention: Bi-level Attention-based Explainable Topic Modeling for News Classification Dairui Liu Derek Greene Ruihai Dong 64 12 0 14 Mar 2022
Modelling word learning and recognition using visually grounded speech Danny Merkx Sebastiaan Scholten S. Frank M. Ernestus O. Scharenborg SSL 130 0 0 14 Mar 2022
Grounding Commands for Autonomous Vehicles via Layer Fusion with Region-specific Dynamic Layer Attention Hou Pong Chan M. Guo Chengguang Xu 76 4 0 14 Mar 2022
Global2Local: A Joint-Hierarchical Attention for Video Captioning Chengpeng Dai Fuhai Chen Xiaoshuai Sun Rongrong Ji QiXiang Ye Yongjian Wu 86 1 0 13 Mar 2022
Chart-to-Text: A Large-Scale Benchmark for Chart Summarization Shankar Kanthara Rixie Tiffany Ko Leong Xiang Lin Ahmed Masry Megh Thakkar Enamul Hoque Shafiq Joty 121 150 0 12 Mar 2022
Concentration Network for Reinforcement Learning of Large-Scale Multi-Agent Systems Qing Fu Tenghai Qiu Jianqiang Yi Zhiqiang Pu Shiguang Wu 60 16 0 12 Mar 2022
BiBERT: Accurate Fully Binarized BERT Haotong Qin Yifu Ding Mingyuan Zhang Qing Yan Aishan Liu Qingqing Dang Ziwei Liu Xianglong Liu MQ 77 96 0 12 Mar 2022
Perception Over Time: Temporal Dynamics for Robust Image Understanding Maryam Daniali Edward J. Kim AI4TS 61 6 0 11 Mar 2022
DRTAM: Dual Rank-1 Tensor Attention Module Hanxing Chi Baihong Lin Juntao Hu Liang Wang AI4TS ViT 36 0 0 11 Mar 2022
Knowledge-enriched Attention Network with Group-wise Semantic for Visual Storytelling Tengpeng Li Hanli Wang Bin He Changan Chen DiffM 88 10 0 10 Mar 2022
Structure-Aware Flow Generation for Human Body Reshaping Jianqiang Ren Yuan Yao Biwen Lei Miaomiao Cui Xuansong Xie 3DH 55 6 0 09 Mar 2022
Attention-Based Lip Audio-Visual Synthesis for Talking Face Generation in the Wild Gang Wang Peng Zhang Lei Xie Wei Huang Yufei Zha CVBM 61 17 0 08 Mar 2022
Interpretable part-whole hierarchies and conceptual-semantic relationships in neural networks Nicola Garau N. Bisagno Zeno Sambugaro Nicola Conci 92 21 0 07 Mar 2022
Modeling Coreference Relations in Visual Dialog Mingxiao Li Marie-Francine Moens 51 10 0 06 Mar 2022
Adaptive Cross-Layer Attention for Image Restoration Yancheng Wang N. Xu Yingzhen Yang 93 3 0 04 Mar 2022
FS-COCO: Towards Understanding of Freehand Sketches of Common Objects in Context Pinaki Nath Chowdhury Aneeshan Sain A. Bhunia Tao Xiang Yulia Gryaditskaya Yi-Zhe Song 3DV 93 54 0 04 Mar 2022
Attention-based Region of Interest (ROI) Detection for Speech Emotion Recognition Jay Desai Houwei Cao Ravi Shah 25 0 0 03 Mar 2022
Vision-Language Intelligence: Tasks, Representation Learning, and Large Models Feng Li Hao Zhang Yi-Fan Zhang Shixuan Liu Jian Guo L. Ni Pengchuan Zhang Lei Zhang AI4TS VLM 83 37 0 03 Mar 2022