Logical Implications for Visual Question Answering Consistency

16 March 2023

Papers citing "Logical Implications for Visual Question Answering Consistency"

6 / 6 papers shown

Title
Consistency of Compositional Generalization across Multiple Levels Chuanhao Li Zhen Li Chenchen Jing Xiaomeng Fan Wenbo Ye Yuwei Wu Yunde Jia CoGe 84 0 0 18 Dec 2024
Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language Models Wenhao Shi Zhiqiang Hu Yi Bin Junhua Liu Yang Yang See-Kiong Ng Lidong Bing Roy Ka-Wei Lee SyDa MLLM LRM 34 41 0 25 Jun 2024
BenchLMM: Benchmarking Cross-style Visual Capability of Large Multimodal Models Rizhao Cai Zirui Song Dayan Guan Zhenhao Chen Xing Luo Chenyu Yi Alex C. Kot MLLM VLM 36 31 0 05 Dec 2023
UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models Yanyang Guo Fangkai Jiao Zhiqi Shen Liqiang Nie Mohan S. Kankanhalli MLLM 27 5 0 17 Oct 2023
Counterfactual Samples Synthesizing for Robust Visual Question Answering Long Chen Xin Yan Jun Xiao Hanwang Zhang Shiliang Pu Yueting Zhuang OOD AAML 154 290 0 14 Mar 2020
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 164 1,464 0 06 Jun 2016