A Feature-space Multimodal Data Augmentation Technique for Text-video
Retrieval

A Feature-space Multimodal Data Augmentation Technique for Text-video Retrieval

3 August 2022

Papers citing "A Feature-space Multimodal Data Augmentation Technique for Text-video Retrieval"

13 / 13 papers shown

Title
Multimodal LLM Enhanced Cross-lingual Cross-modal Retrieval Yabing Wang Le Wang Qiang-feng Zhou Zhibin Wang Hao Li Gang Hua Wei Tang 33 7 0 30 Sep 2024
A Survey on Multimodal Wearable Sensor-based Human Action Recognition Jianyuan Ni Hao Tang Syed Tousiful Haque Yan Yan A. Ngu 74 6 0 14 Apr 2024
MCF-VC: Mitigate Catastrophic Forgetting in Class-Incremental Learning for Multimodal Video Captioning Huiyu Xiong Lanxiao Wang Heqian Qiu Taijin Zhao Benliu Qiu Hongliang Li CLL 40 1 0 27 Feb 2024
CL2CM: Improving Cross-Lingual Cross-Modal Retrieval via Cross-Lingual Knowledge Transfer Yabing Wang Fan Wang Jianfeng Dong Hao Luo VLM 24 9 0 14 Dec 2023
FArMARe: a Furniture-Aware Multi-task methodology for Recommending Apartments based on the user interests Ali Abdari Alex Falcon Giuseppe Serra 32 2 0 06 Sep 2023
UniUD Submission to the EPIC-Kitchens-100 Multi-Instance Retrieval Challenge 2023 Alex Falcon Giuseppe Serra 26 0 0 27 Jun 2023
Verbs in Action: Improving verb understanding in video-language models Liliane Momeni Mathilde Caron Arsha Nagrani Andrew Zisserman Cordelia Schmid 37 70 0 13 Apr 2023
Retrieving Multimodal Information for Augmented Generation: A Survey Ruochen Zhao Hailin Chen Weishi Wang Fangkai Jiao Do Xuan Long ... Bosheng Ding Xiaobao Guo Minzhi Li Xingxuan Li Shafiq R. Joty 25 80 0 20 Mar 2023
Heterogeneous Graph Learning for Acoustic Event Classification A. Shirian Mona Ahmadian Krishna Somandepalli T. Guha 25 2 0 05 Mar 2023
Auxiliary Cross-Modal Representation Learning with Triplet Loss Functions for Online Handwriting Recognition Felix Ott David Rügamer Lucas Heublein Bernd Bischl Christopher Mutschler 53 9 0 16 Feb 2022
T2VLAD: Global-Local Sequence Alignment for Text-Video Retrieval Xiaohan Wang Linchao Zhu Yi Yang 167 170 0 20 Apr 2021
Improving Zero and Few-Shot Abstractive Summarization with Intermediate Fine-tuning and Data Augmentation Alexander R. Fabbri Simeng Han Haoyuan Li Haoran Li Marjan Ghazvininejad Shafiq R. Joty Dragomir R. Radev Yashar Mehdad 123 95 0 24 Oct 2020
Multi-modal Transformer for Video Retrieval Valentin Gabeur Chen Sun Alahari Karteek Cordelia Schmid ViT 424 596 0 21 Jul 2020