A Multi-Modal Foundation Model to Assist People with Blindness and Low Vision in Environmental Interaction

31 October 2023

Papers citing "A Multi-Modal Foundation Model to Assist People with Blindness and Low Vision in Environmental Interaction"

1 / 1 papers shown

Title
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 320 4,261 0 30 Jan 2023