Multi-task Learning of Hierarchical Vision-Language Representation

3 December 2018

Papers citing "Multi-task Learning of Hierarchical Vision-Language Representation"

17 / 17 papers shown

Title
IntentRec: Predicting User Session Intent with Hierarchical Multi-Task Learning Sejoon Oh Moumita Bhattacharya Yesu Feng Sudarshan Lamkhede 48 1 0 25 Jul 2024
Post-hoc and manifold explanations analysis of facial expression data based on deep learning Yang Xiao 31 0 0 29 Apr 2024
FAME-ViL: Multi-Tasking Vision-Language Model for Heterogeneous Fashion Tasks Xiaoping Han Xiatian Zhu Licheng Yu Li Zhang Yi-Zhe Song Tao Xiang VLM 24 38 0 04 Mar 2023
MINOTAUR: Multi-task Video Grounding From Multimodal Queries Raghav Goyal E. Mavroudi Xitong Yang Sainbayar Sukhbaatar Leonid Sigal Matt Feiszli Lorenzo Torresani Du Tran 36 7 0 16 Feb 2023
Cold Start Streaming Learning for Deep Networks Cameron R. Wolfe Anastasios Kyrillidis CLL 23 2 0 09 Nov 2022
Learning More May Not Be Better: Knowledge Transferability in Vision and Language Tasks Tianwei Chen Noa Garcia Mayu Otani Chenhui Chu Yuta Nakashima Hajime Nagahara VLM 41 0 0 23 Aug 2022
Answer-Me: Multi-Task Open-Vocabulary Visual Question Answering A. Piergiovanni Wei Li Weicheng Kuo M. Saffar Fred Bertsch A. Angelova 17 16 0 02 May 2022
Exceeding the Limits of Visual-Linguistic Multi-Task Learning Cameron R. Wolfe Keld T. Lundgaard VLM 45 2 0 27 Jul 2021
Core Challenges in Embodied Vision-Language Planning Jonathan M Francis Nariaki Kitamura Felix Labelle Xiaopeng Lu Ingrid Navarro Jean Oh LM&Ro 51 45 0 26 Jun 2021
Multi-Task Learning with Deep Neural Networks: A Survey M. Crawshaw CVBM 55 610 0 10 Sep 2020
Span-based Localizing Network for Natural Language Video Localization Hao Zhang Aixin Sun Wei Jing Qiufeng Wang 32 312 0 29 Apr 2020
IMRAM: Iterative Matching with Recurrent Attention Memory for Cross-Modal Image-Text Retrieval Hui Chen Guiguang Ding Xudong Liu Zijia Lin Ji Liu Jungong Han 22 318 0 08 Mar 2020
Factorized Multimodal Transformer for Multimodal Sequential Learning Amir Zadeh Chengfeng Mao Kelly Shi Yiwei Zhang Paul Pu Liang Soujanya Poria Louis-Philippe Morency 25 44 0 22 Nov 2019
MULE: Multimodal Universal Language Embedding Donghyun Kim Kuniaki Saito Kate Saenko Stan Sclaroff Bryan A. Plummer VLM 32 40 0 08 Sep 2019
Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and Methods Aditya Mogadala M. Kalimuthu Dietrich Klakow VLM 25 132 0 22 Jul 2019
Neural Baby Talk Jiasen Lu Jianwei Yang Dhruv Batra Devi Parikh VLM 200 434 0 27 Mar 2018
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 167 1,465 0 06 Jun 2016