Multimodal Pivots for Image Caption Translation

15 January 2016

Papers citing "Multimodal Pivots for Image Caption Translation"

29 / 29 papers shown

Title
TopicVD: A Topic-Based Dataset of Video-Guided Multimodal Machine Translation for Documentaries Jinze Lv Jian Chen Zi Long Xianghua Fu Yin Chen VGen 47 0 0 09 May 2025
Beyond Decoder-only: Large Language Models Can be Good Encoders for Machine Translation Yingfeng Luo Tong Zheng Yongyu Mu Yangqiu Song Qinghong Zhang ... Ziqiang Xu Peinan Feng Xiaoqian Liu Tong Xiao Jingbo Zhu AI4CE 215 0 0 09 Mar 2025
Image captioning in different languages Emiel van Miltenburg VLM 41 0 0 31 May 2024
Semantic and Expressive Variation in Image Captions Across Languages Andre Ye Sebastin Santy Jena D. Hwang Amy X. Zhang Ranjay Krishna VLM 61 3 0 22 Oct 2023
Beyond Triplet: Leveraging the Most Data for Multimodal Machine Translation Yaoming Zhu Zewei Sun Shanbo Cheng Yuyang Huang Liwei Wu Mingxuan Wang 28 10 0 20 Dec 2022
GLAMI-1M: A Multilingual Image-Text Fashion Dataset Vaclav Kosar A. Hoskovec Milan Šulc Radek Bartyzal VLM 32 3 0 17 Nov 2022
Neural Machine Translation with Phrase-Level Universal Visual Representations Qingkai Fang Yang Feng 33 40 0 19 Mar 2022
Read, Listen, and See: Leveraging Multimodal Information Helps Chinese Spell Checking Heng-Da Xu Zhongli Li Qingyu Zhou Chao Li Zizhen Wang Yunbo Cao Heyan Huang Xian-Ling Mao 46 94 0 26 May 2021
WIT: Wikipedia-based Image Text Dataset for Multimodal Multilingual Machine Learning Krishna Srinivasan K. Raman Jiecao Chen Michael Bendersky Marc Najork VLM 210 310 0 02 Mar 2021
Exploiting Multimodal Reinforcement Learning for Simultaneous Machine Translation Julia Ive A. Li Yishu Miao Ozan Caglayan Pranava Madhyastha Lucia Specia 29 10 0 22 Feb 2021
Visual Pivoting for (Unsupervised) Entity Alignment Fangyu Liu Muhao Chen Dan Roth Nigel Collier OCL 21 117 0 28 Sep 2020
Neural Machine Translation: A Review and Survey Felix Stahlberg 3DV AI4TS MedIm 20 312 0 04 Dec 2019
Multimodal Machine Translation through Visuals and Speech U. Sulubacak Ozan Caglayan Stig-Arne Gronroos Aku Rouhe Desmond Elliott Lucia Specia Jörg Tiedemann 49 73 0 28 Nov 2019
MULE: Multimodal Universal Language Embedding Donghyun Kim Kuniaki Saito Kate Saenko Stan Sclaroff Bryan A. Plummer VLM 32 40 0 08 Sep 2019
Unpaired Cross-lingual Image Caption Generation with Self-Supervised Rewards Yuqing Song Shizhe Chen Yida Zhao Qin Jin SSL 26 40 0 15 Aug 2019
Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and Methods Aditya Mogadala M. Kalimuthu Dietrich Klakow VLM 25 132 0 22 Jul 2019
Distilling Translations with Visual Awareness Julia Ive Pranava Madhyastha Lucia Specia VLM 30 76 0 18 Jun 2019
Cross-lingual Visual Verb Sense Disambiguation Spandana Gella Desmond Elliott Frank Keller 16 19 0 10 Apr 2019
Doubly Attentive Transformer Machine Translation Hasan Sait Arslan Mark Fishel G. Anbarjafari 35 13 0 30 Jul 2018
COCO-CN for Cross-Lingual Image Tagging, Captioning and Retrieval Xirong Li Chaoxi Xu Xiaoxu Wang Weiyu Lan Zhengxiong Jia Gang Yang Jieping Xu 22 149 0 22 May 2018
Zero-Resource Neural Machine Translation with Multi-Agent Communication Game Yun Chen Yang Liu V. Li 41 47 0 09 Feb 2018
Using Artificial Tokens to Control Languages for Multilingual Image Caption Generation Satoshi Tsutsui David J. Crandall 16 19 0 20 Jun 2017
Imagination improves Multimodal Translation Desmond Elliott Ákos Kádár 29 136 0 11 May 2017
Doubly-Attentive Decoder for Multi-modal Neural Machine Translation Iacer Calixto Qun Liu N. Campbell 40 179 0 04 Feb 2017
Incorporating Global Visual Features into Attention-Based Neural Machine Translation Iacer Calixto Qun Liu Nick Campbell 32 154 0 23 Jan 2017
Neural Machine Translation with Latent Semantic of Image and Text Joji Toyama Masanori Misono Masahiro Suzuki Kotaro Nakayama Y. Matsuo 14 14 0 25 Nov 2016
Zero-resource Machine Translation by Multimodal Encoder-decoder Network with Multimedia Pivot Hideki Nakayama Noriki Nishida 29 62 0 14 Nov 2016
Multi30K: Multilingual English-German Image Descriptions Desmond Elliott Stella Frank K. Simaán Lucia Specia VLM 27 580 0 02 May 2016
Multilingual Image Description with Neural Sequence Models Desmond Elliott Stella Frank Eva Hasler VLM 22 75 0 15 Oct 2015