TiMix: Text-aware Image Mixing for Effective Vision-Language
Pre-training

TiMix: Text-aware Image Mixing for Effective Vision-Language Pre-training

14 December 2023

Ji Zhang

Papers citing "TiMix: Text-aware Image Mixing for Effective Vision-Language Pre-training"

7 / 7 papers shown

Title
OPDR: Order-Preserving Dimension Reduction for Semantic Embedding of Multimodal Scientific Data Chengyu Gong Gefei Shen Luanzheng Guo Nathan R. Tallent Dongfang Zhao 21 1 0 15 Aug 2024
Hal-Eval: A Universal and Fine-grained Hallucination Evaluation Framework for Large Vision Language Models Chaoya Jiang Wei Ye Mengfan Dong Hongrui Jia Haiyang Xu Mingshi Yan Ji Zhang Shikun Zhang VLM MLLM 43 15 0 24 Feb 2024
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong S. Hoi MLLM BDL VLM CLIP 392 4,137 0 28 Jan 2022
Playing Lottery Tickets with Vision and Language Zhe Gan Yen-Chun Chen Linjie Li Tianlong Chen Yu Cheng Shuohang Wang Jingjing Liu Lijuan Wang Zicheng Liu VLM 106 54 0 23 Apr 2021
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts Soravit Changpinyo P. Sharma Nan Ding Radu Soricut VLM 293 1,084 0 17 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 310 3,708 0 11 Feb 2021
Co-Mixup: Saliency Guided Joint Mixup with Supermodular Diversity Jang-Hyun Kim Wonho Choo Hosan Jeong Hyun Oh Song 199 176 0 05 Feb 2021