Diverse and Accurate Image Description Using a Variational Auto-Encoder with an Additive Gaussian Encoding Space

19 November 2017

Papers citing "Diverse and Accurate Image Description Using a Variational Auto-Encoder with an Additive Gaussian Encoding Space"

34 / 34 papers shown

Title
Group-based Distinctive Image Captioning with Memory Difference Encoding and Attention Jiuniu Wang Wenjia Xu Qingzhong Wang Antoni B. Chan 45 0 0 03 Apr 2025
ConZIC: Controllable Zero-shot Image Captioning by Sampling-Based Polishing Zequn Zeng Hao Zhang Zhengjue Wang Ruiying Lu Dongsheng Wang Bo Chen BDL DiffM 19 33 0 04 Mar 2023
CodeLMSec Benchmark: Systematically Evaluating and Finding Security Vulnerabilities in Black-Box Code Language Models Hossein Hajipour Keno Hassler Thorsten Holz Lea Schonherr Mario Fritz ELM 40 20 0 08 Feb 2023
IC3: Image Captioning by Committee Consensus David M. Chan Austin Myers Sudheendra Vijayanarasimhan David A. Ross John F. Canny 32 17 0 02 Feb 2023
DuNST: Dual Noisy Self Training for Semi-Supervised Controllable Text Generation Yuxi Feng Xiaoyuan Yi Xiting Wang L. Lakshmanan Xing Xie DiffM 35 5 0 16 Dec 2022
Make-A-Story: Visual Memory Conditioned Consistent Story Generation Tanzila Rahman Hsin-Ying Lee Jian Ren Sergey Tulyakov Shweta Mahajan Leonid Sigal DiffM 19 68 0 23 Nov 2022
Fuse It More Deeply! A Variational Transformer with Layer-Wise Latent Variable Inference for Text Generation Jinyi Hu Xiaoyuan Yi Wenhao Li Maosong Sun Xing Xie 21 21 0 13 Jul 2022
Diverse Image Captioning with Grounded Style Franz Klein Shweta Mahajan S. Roth 22 7 0 03 May 2022
FS-COCO: Towards Understanding of Freehand Sketches of Common Objects in Context Pinaki Nath Chowdhury Aneeshan Sain A. Bhunia Tao Xiang Yulia Gryaditskaya Yi-Zhe Song 3DV 41 52 0 04 Mar 2022
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic Yoad Tewel Yoav Shalev Idan Schwartz Lior Wolf VLM 34 192 0 29 Nov 2021
Group-based Distinctive Image Captioning with Memory Attention Jiuniu Wang Wenjia Xu Qingzhong Wang Antoni B. Chan 13 18 0 20 Aug 2021
From Show to Tell: A Survey on Deep Learning-based Image Captioning Matteo Stefanini Marcella Cornia Lorenzo Baraldi S. Cascianelli G. Fiameni Rita Cucchiara 3DV VLM MLLM 67 254 0 14 Jul 2021
Human-like Controllable Image Captioning with Verb-specific Semantic Roles Long Chen Zhihong Jiang Jun Xiao Wei Liu 30 74 0 22 Mar 2021
CapWAP: Captioning with a Purpose Adam Fisch Kenton Lee Ming-Wei Chang J. Clark Regina Barzilay 8 11 0 09 Nov 2020
Geodesics in fibered latent spaces: A geometric approach to learning correspondences between conditions Tariq Daouda Reda Chhaibi Prudencio Tossou A. Villani 6 2 0 16 May 2020
Better Captioning with Sequence-Level Exploration Jia Chen Qin Jin 37 12 0 08 Mar 2020
Latent Normalizing Flows for Many-to-Many Cross-Domain Mappings Shweta Mahajan Iryna Gurevych Stefan Roth DRL 15 36 0 16 Feb 2020
Pre-train and Plug-in: Flexible Conditional Text Generation with Variational Auto-Encoders Yu Duan Canwen Xu Jiaxin Pei Jialong Han Chenliang Li 16 42 0 10 Nov 2019
Probabilistic framework for solving Visual Dialog Badri N. Patro Anupriy Vinay P. Namboodiri BDL 27 13 0 11 Sep 2019
Compositional Generalization in Image Captioning Mitja Nikolaus Mostafa Abdou Matthew Lamm Rahul Aralikatte Desmond Elliott CoGe 24 49 0 10 Sep 2019
Conditional Flow Variational Autoencoders for Structured Sequence Prediction Apratim Bhattacharyya M. Hanselmann Mario Fritz Bernt Schiele C. Straehle BDL DRL AI4TS 24 83 0 24 Aug 2019
Make a Face: Towards Arbitrary High Fidelity Face Manipulation Shengju Qian Kwan-Yee Lin Wayne Wu Yangxiaokang Liu Quan Wang Fumin Shen Chao Qian Ran He CVBM 24 71 0 20 Aug 2019
Deep Metric Learning Beyond Binary Supervision Sungyeon Kim Minkyo Seo Ivan Laptev Minsu Cho Suha Kwak SSL 15 94 0 21 Apr 2019
Effective Estimation of Deep Generative Language Models Tom Pelsmaeker Wilker Aziz BDL 22 27 0 17 Apr 2019
Factor Graph Attention Idan Schwartz Seunghak Yu Tamir Hazan A. Schwing 21 110 0 11 Apr 2019
A Simple Baseline for Audio-Visual Scene-Aware Dialog Idan Schwartz A. Schwing Tamir Hazan 19 69 0 11 Apr 2019
Describing like humans: on diversity in image captioning Qingzhong Wang Antoni B. Chan 19 98 0 28 Mar 2019
Mixture Models for Diverse Machine Translation: Tricks of the Trade T. Shen Myle Ott Michael Auli MarcÁurelio Ranzato MoE 27 148 0 20 Feb 2019
Generating Multiple Diverse Responses for Short-Text Conversation Jun Gao Wei Bi Xiaojiang Liu Junhui Li Shuming Shi 22 56 0 14 Nov 2018
Diverse and Coherent Paragraph Generation from Images Moitreya Chatterjee A. Schwing 13 66 0 03 Sep 2018
Variational Memory Encoder-Decoder Hung Le T. Tran Thin Nguyen Svetha Venkatesh VLM DRL 15 32 0 26 Jul 2018
Fast, Diverse and Accurate Image Captioning Guided By Part-of-Speech Aditya Deshpande J. Aneja Liwei Wang A. Schwing David A. Forsyth 19 146 0 31 May 2018
Discriminability objective for training descriptive captions Ruotian Luo Brian L. Price Scott D. Cohen Gregory Shakhnarovich 19 202 0 12 Mar 2018
Convolutional Image Captioning J. Aneja Aditya Deshpande A. Schwing VLM 23 359 0 24 Nov 2017