Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks

2 October 2024

Wenhao Yu

Kaixin Ma

Zhihan Zhang

Siru Ouyang

Hongming Zhang

Papers citing "Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks"

3 / 3 papers shown

Title
WebEvolver: Enhancing Web Agent Self-Improvement with Coevolving World Model Tianqing Fang H. M. Zhang Z. Zhang Kaixin Ma W. Yu Haitao Mi Dong Yu LLMAG KELM 159 0 0 23 Apr 2025
Baichuan-Omni-1.5 Technical Report Yadong Li Jiaheng Liu Tao Zhang Tao Zhang S. Chen ... Jianhua Xu Haoze Sun Mingan Lin Zenan Zhou Xin Wu AuLLM 72 10 0 28 Jan 2025
MultiChartQA: Benchmarking Vision-Language Models on Multi-Chart Problems Zifeng Zhu Mengzhao Jia Z. Zhang Lang Li Meng Jiang LRM 37 3 0 18 Oct 2024