Show and Tell: A Neural Image Caption Generator

17 November 2014

Papers citing "Show and Tell: A Neural Image Caption Generator"

50 / 2,023 papers shown

Title
Language Models Can See: Plugging Visual Controls in Text Generation Yixuan Su Tian Lan Yahui Liu Fangyu Liu Dani Yogatama Yan Wang Lingpeng Kong Nigel Collier VLM MLLM 53 97 0 05 May 2022
CoCa: Contrastive Captioners are Image-Text Foundation Models Jiahui Yu Zirui Wang Vijay Vasudevan Legg Yeung Mojtaba Seyedhosseini Yonghui Wu VLM CLIP OffRL 85 1,263 0 04 May 2022
ASE: Large-Scale Reusable Adversarial Skill Embeddings for Physically Simulated Characters Xue Bin Peng Yunrong Guo L. Halper Sergey Levine Sanja Fidler 28 15 0 04 May 2022
Diverse Image Captioning with Grounded Style Franz Klein Shweta Mahajan S. Roth 22 7 0 03 May 2022
Flamingo: a Visual Language Model for Few-Shot Learning Jean-Baptiste Alayrac Jeff Donahue Pauline Luc Antoine Miech Iain Barr ... Mikolaj Binkowski Ricardo Barreira Oriol Vinyals Andrew Zisserman Karen Simonyan MLLM VLM 51 3,360 0 29 Apr 2022
Cross-modal Memory Networks for Radiology Report Generation Zhihong Chen Yaling Shen Yan Song Xiang Wan MedIm 38 248 0 28 Apr 2022
Attention Mechanism in Neural Networks: Where it Comes and Where it Goes Derya Soydaner 3DV 44 150 0 27 Apr 2022
CapOnImage: Context-driven Dense-Captioning on Image Yiqi Gao Xinglin Hou Yuanmeng Zhang T. Ge Yuning Jiang Peifeng Wang 33 10 0 27 Apr 2022
Translation between Molecules and Natural Language Carl Edwards T. Lai Kevin Ros Garrett Honke Kyunghyun Cho Heng Ji 33 158 0 25 Apr 2022
Progressive Learning for Image Retrieval with Hybrid-Modality Queries Yida Zhao Yuqing Song Qin Jin 8 29 0 24 Apr 2022
Training and challenging models for text-guided fashion image retrieval Eric Dodds Jack Culpepper Gaurav Srivastava 18 8 0 23 Apr 2022
Learning with Signatures J. Curtò I. D. Zarzà Hongfei Yan Carlos T. Calafate 13 0 0 17 Apr 2022
Attention Mechanism based Cognition-level Scene Understanding Xuejiao Tang Tai Le Quy LRM 30 0 0 17 Apr 2022
Guiding Attention using Partial-Order Relationships for Image Captioning Murad Popattia Muhammad Rafi Rizwan Qureshi Shah Nawaz 21 4 0 15 Apr 2022
Image Captioning In the Transformer Age Yangliu Xu Li Li Haiyang Xu Songfang Huang Fei Huang Jianfei Cai ViT 27 5 0 15 Apr 2022
On Principal Curve-Based Classifiers and Similarity-Based Selective Sampling in Time-Series Aref Hakimzadeh K. Ziarati M. Taheri AI4TS 16 0 0 10 Apr 2022
On Distinctive Image Captioning via Comparing and Reweighting Jiuniu Wang Wenjia Xu Qingzhong Wang Antoni B. Chan 38 16 0 08 Apr 2022
Modeling Motion with Multi-Modal Features for Text-Based Video Segmentation Wangbo Zhao Kai Wang Xiangxiang Chu Fuzhao Xue Xinchao Wang Yang You 29 21 0 06 Apr 2022
Collaborative Transformers for Grounded Situation Recognition Junhyeong Cho Youngseok Yoon Suha Kwak ViT 27 25 0 30 Mar 2022
NICGSlowDown: Evaluating the Efficiency Robustness of Neural Image Caption Generation Models Simin Chen Zihe Song Mirazul Haque Cong Liu Wei Yang 6 37 0 29 Mar 2022
Text-Driven Video Acceleration: A Weakly-Supervised Reinforcement Learning Method W. Ramos M. Silva Edson R. Araujo Victor Moura Keller Clayderman Martins de Oliveira Leandro Soriano Marcolino Erickson R. Nascimento VGen 19 3 0 29 Mar 2022
Interactive Audio-text Representation for Automated Audio Captioning with Contrastive Learning Chen Chen Nana Hou Yuchen Hu Heqing Zou Xiaofeng Qi Chng Eng Siong VLM 26 21 0 29 Mar 2022
Quantifying Societal Bias Amplification in Image Captioning Yusuke Hirota Yuta Nakashima Noa Garcia 19 48 0 29 Mar 2022
End-to-End Transformer Based Model for Image Captioning Yiyu Wang Jungang Xu Yingfei Sun VLM ViT 26 117 0 29 Mar 2022
Vision Transformers in Medical Computer Vision -- A Contemplative Retrospection Arshi Parvaiz Muhammad Anwaar Khalid Rukhsana Zafar Huma Ameer M. Ali M. Fraz MedIm 23 59 0 29 Mar 2022
3D Shape Reconstruction from 2D Images with Disentangled Attribute Flow Xin Wen Junsheng Zhou Yu-Shen Liu Zhen Dong Zhizhong Han 3DV 3DPC 40 52 0 29 Mar 2022
Text2Pos: Text-to-Point-Cloud Cross-Modal Localization Manuel Kolmet Qunjie Zhou Aljosa Osep Laura Leal-Taixe 27 24 0 28 Mar 2022
NOC-REK: Novel Object Captioning with Retrieved Vocabulary from External Knowledge D. Vo Hong Chen Akihiro Sugimoto Hideki Nakayama 11 13 0 28 Mar 2022
AlignTransformer: Hierarchical Alignment of Visual Regions and Disease Tags for Medical Report Generation Di You Fenglin Liu Shen Ge Xiaoxia Xie Jing Zhang Xian Wu ViT MedIm 31 107 0 18 Mar 2022
Spot the Difference: A Cooperative Object-Referring Game in Non-Perfectly Co-Observable Scene Duo Zheng Fandong Meng Q. Si Hairun Fan Zipeng Xu Jie Zhou Fangxiang Feng Xiaojie Wang 27 0 0 16 Mar 2022
What is the best RNN-cell structure for forecasting each time series behavior? Rohaifa Khaldi A. E. Afia R. Chiheb Siham Tabik AI4TS 22 1 0 15 Mar 2022
Factored Attention and Embedding for Unstructured-view Topic-related Ultrasound Report Generation Fuhai Chen Rongrong Ji Chengpeng Dai Xuri Ge Shengchuan Zhang Xiaojing Ma Yue Gao MedIm 34 1 0 12 Mar 2022
Democratizing Contrastive Language-Image Pre-training: A CLIP Benchmark of Data, Model, and Supervision Yufeng Cui Lichen Zhao Feng Liang Yangguang Li Jing Shao UQCV VLM CLIP 19 43 0 11 Mar 2022
Conditional Prompt Learning for Vision-Language Models Kaiyang Zhou Jingkang Yang Chen Change Loy Ziwei Liu VLM CLIP VPVLM 53 1,294 0 10 Mar 2022
Knowledge-enriched Attention Network with Group-wise Semantic for Visual Storytelling Tengpeng Li Hanli Wang Bin He Changan Chen DiffM 27 9 0 10 Mar 2022
StyleBabel: Artistic Style Tagging and Captioning Dan Ruta Andrew Gilbert Pranav Aggarwal Naveen Marri Ajinkya Kale ... Hailin Jin Baldo Faieta Alex Filipkowski Zhe-nan Lin John Collomosse 27 12 0 10 Mar 2022
Faithfulness in Natural Language Generation: A Systematic Survey of Analysis, Evaluation and Optimization Methods Wei Li Wenhao Wu Moye Chen Jiachen Liu Xinyan Xiao Hua Wu HILM 29 27 0 10 Mar 2022
NLX-GPT: A Model for Natural Language Explanations in Vision and Vision-Language Tasks Fawaz Sammani Tanmoy Mukherjee Nikos Deligiannis MILM ELM LRM 24 67 0 09 Mar 2022
Unpaired Image Captioning by Image-level Weakly-Supervised Visual Concept Recognition Peipei Zhu Tianlin Li Yong Luo Zhenglong Sun Wei-Shi Zheng Yaowei Wang Chen Chen 30 12 0 07 Mar 2022
FS-COCO: Towards Understanding of Freehand Sketches of Common Objects in Context Pinaki Nath Chowdhury Aneeshan Sain A. Bhunia Tao Xiang Yulia Gryaditskaya Yi-Zhe Song 3DV 46 52 0 04 Mar 2022
Vision-Language Intelligence: Tasks, Representation Learning, and Large Models Feng Li Hao Zhang Yi-Fan Zhang Shixuan Liu Jian Guo L. Ni Pengchuan Zhang Lei Zhang AI4TS VLM 24 36 0 03 Mar 2022
A Deep Neural Framework for Image Caption Generation Using GRU-Based Attention Mechanism Rashid Khan Shujah Islam Khadija Kanwal Mansoor Iqbal Md. Imran Hossain Z. Ye 3DV 28 16 0 03 Mar 2022
TableFormer: Table Structure Understanding with Transformers A. Nassar Nikolaos Livathinos Maksym Lysak Peter W. J. Staar LMTD ViT 13 73 0 02 Mar 2022
Enhancing Satellite Imagery using Deep Learning for the Sensor To Shooter Timeline Matthew Ciolino Dom Hambrick David Noever 187 0 0 28 Feb 2022
CaMEL: Mean Teacher Learning for Image Captioning Manuele Barraco Matteo Stefanini Marcella Cornia S. Cascianelli Lorenzo Baraldi Rita Cucchiara ViT VLM 43 27 0 21 Feb 2022
VLP: A Survey on Vision-Language Pre-training Feilong Chen Duzhen Zhang Minglun Han Xiuyi Chen Jing Shi Shuang Xu Bo Xu VLM 82 213 0 18 Feb 2022
Where Is My Training Bottleneck? Hidden Trade-Offs in Deep Learning Preprocessing Pipelines Alexander Isenko R. Mayer Jeffrey Jedele Hans-Arno Jacobsen 19 23 0 17 Feb 2022
VRConvMF: Visual Recurrent Convolutional Matrix Factorization for Movie Recommendation Zhu Wang Honglong Chen Zhe Li Kai Lin Nan Jiang Feng Xia 31 13 0 16 Feb 2022
Edge Data Based Trailer Inception Probabilistic Matrix Factorization for Context-Aware Movie Recommendation Honglong Chen Zhe Li Zhu Wang Zhichen Ni Junjian Li Ge Xu Abdul Aziz Feng Xia 35 4 0 16 Feb 2022
HAKE: A Knowledge Engine Foundation for Human Activity Understanding Yong-Lu Li Xinpeng Liu Xiaoqian Wu Yizhuo Li Zuoyu Qiu Liang Xu Yue Xu Haoshu Fang Cewu Lu 32 38 0 14 Feb 2022