IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language
Models

IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models

23 March 2024

Haz Sameen Shahgir

Khondker Salman Sayeed

Abhik Bhattacharjee

Wasi Uddin Ahmad

Rifat Shahriyar

Papers citing "IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models"

10 / 10 papers shown

Title
ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception, Reasoning, and Robustness Yijun Liang Ming Li Chenrui Fan Ziyue Li Dang Nguyen Kwesi Cobbina Shweta Bhardwaj Jiuhai Chen Fuxiao Liu Tianyi Zhou VLM CoGe 51 0 0 10 Apr 2025
VLRMBench: A Comprehensive and Challenging Benchmark for Vision-Language Reward Models Jiacheng Ruan Wenzhen Yuan Xian Gao Ye Guo Daoxin Zhang Zhe Xu Yao Hu Ting Liu Yuzhuo Fu LRM VLM 68 4 0 10 Mar 2025
M2-omni: Advancing Omni-MLLM for Comprehensive Modality Support with Competitive Performance Qingpei Guo Kaiyou Song Zipeng Feng Ziping Ma Qinglong Zhang ... Yunxiao Sun Tai-WeiChang Jingdong Chen Ming Yang Jun Zhou MLLM VLM 87 3 0 26 Feb 2025
Rethinking Evaluation of Sparse Autoencoders through the Representation of Polysemous Words Gouki Minegishi Hiroki Furuta Yusuke Iwasawa Y. Matsuo 49 1 0 09 Jan 2025
The Art of Deception: Color Visual Illusions and Diffusion Models Alex Gomez-Villa Kai Wang Alejandro C. Parraga Bartlomiej Twardowski Jesús Malo Javier Vázquez-Corral Joost van de Weijer DiffM 85 2 0 13 Dec 2024
PaliGemma: A versatile 3B VLM for transfer Lucas Beyer Andreas Steiner André Susano Pinto Alexander Kolesnikov Xiao Wang ... Olivier J. Hénaff Xi Xiong Radu Soricut Jeremiah Harmsen Xiaohua Zhai VLM 57 160 0 10 Jul 2024
Sparks of Artificial General Intelligence: Early experiments with GPT-4 Sébastien Bubeck Varun Chandrasekaran Ronen Eldan J. Gehrke Eric Horvitz ... Scott M. Lundberg Harsha Nori Hamid Palangi Marco Tulio Ribeiro Yi Zhang ELM AI4MH AI4CE ALM 298 3,007 0 22 Mar 2023
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images Nitzan Bitton-Guetta Yonatan Bitton Jack Hessel Ludwig Schmidt Yuval Elovici Gabriel Stanovsky Roy Schwartz VLM 121 66 0 13 Mar 2023
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 367 8,495 0 28 Jan 2022
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 255 4,781 0 24 Feb 2021