Title
UVE: Are MLLMs Unified Evaluators for AI-Generated Videos? Yuanxin Liu Rui Zhu Shuhuai Ren Jiacong Wang Haoyuan Guo Xu Sun Lu Jiang 351 1 0 13 Mar 2025
Apollo: An Exploration of Video Understanding in Large Multimodal Models Orr Zohar Xiaohan Wang Yann Dubois Nikhil Mehta Tong Xiao ... Xiaofang Wang F. Xu Ning Zhang Serena Yeung-Levy Xide Xia VLM 163 28 0 13 Dec 2024
LMM-VQA: Advancing Video Quality Assessment with Large Multimodal Models Qihang Ge Wei Sun Yu Zhang Yunhao Li Zhongpeng Ji Fengyu Sun Shangling Jui Xiongkuo Min Guangtao Zhai 77 7 0 26 Aug 2024
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models Jiabo Ye Haiyang Xu Haowei Liu Anwen Hu Ming Yan Qi Qian Ji Zhang Fei Huang Jingren Zhou MLLM VLM 77 138 0 09 Aug 2024
LLaVA-OneVision: Easy Visual Task Transfer Bo Li Yuanhan Zhang Dong Guo Renrui Zhang Feng Li Hao Zhang Kaichen Zhang Yanwei Li Ziwei Liu Chunyuan Li MLLM SyDa VLM 119 860 0 06 Aug 2024
LongVideoBench: A Benchmark for Long-context Interleaved Video-Language Understanding Haoning Wu Dongxu Li Bei Chen Junnan Li 96 163 0 22 Jul 2024
VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation Xuan He Dongfu Jiang Ge Zhang Max Ku Achint Soni ... Yaswanth Narsupalli Rongqi Fan Zhiheng Lyu Yuchen Lin Wenhu Chen EGVM VGen ALM 102 56 0 21 Jun 2024
MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding Xinyu Fang Kangrui Mao Haodong Duan Xiangyu Zhao Yining Li Dahua Lin Kai Chen VLM 95 82 0 20 Jun 2024
A-Bench: Are LMMs Masters at Evaluating AI-generated Images? Zicheng Zhang H. Wu Chunyi Li Yingjie Zhou Wei Sun Xiongkuo Min Zijian Chen Xiaohong Liu Weisi Lin Guangtao Zhai EGVM 117 18 0 05 Jun 2024
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis Chaoyou Fu Yuhan Dai Yondong Luo Lei Li Shuhuai Ren ... Xiawu Zheng Enhong Chen Caifeng Shan Xing Sun Xing Sun VLM MLLM 154 418 0 31 May 2024
Light-VQA+: A Video Quality Assessment Model for Exposure Correction with Vision-Language Guidance Xunchu Zhou Xiaohong Liu Yunlong Dong Tengchuan Kou Yixuan Gao Zicheng Zhang Chunyi Li Haoning Wu Guangtao Zhai 70 3 0 06 May 2024
LMM-PCQA: Assisting Point Cloud Quality Assessment with LMM Zicheng Zhang Haoning Wu Yingjie Zhou Chunyi Li Wei Sun Chaofeng Chen Xiongkuo Min Xiaohong Liu Weisi Lin Guangtao Zhai 66 10 0 28 Apr 2024
PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense Captioning Lin Xu Yilin Zhao Daquan Zhou Zhijie Lin See Kiong Ng Jiashi Feng MLLM VLM 80 184 0 25 Apr 2024
How Far Are We to GPT-4V? Closing the Gap to Commercial Multimodal Models with Open-Source Suites Zhe Chen Weiyun Wang Hao Tian Shenglong Ye Zhangwei Gao ... Tong Lu Dahua Lin Yu Qiao Jifeng Dai Wenhai Wang MLLM VLM 115 637 0 25 Apr 2024
NTIRE 2024 Quality Assessment of AI-Generated Content Challenge Xiaohong Liu Xiongkuo Min Guangtao Zhai Chunyi Li Tengchuan Kou ... Qi Yan Youran Qu Xiaohui Zeng Lele Wang Renjie Liao 93 31 0 25 Apr 2024
NTIRE 2024 Challenge on Short-form UGC Video Quality Assessment: Methods and Results Xin Li Kun Yuan Yajing Pei Yiting Lu Ming Sun ... Kele Xu Qisheng Xu Tao Sun Zhi-Guo Ding Yuhan Hu 67 23 0 17 Apr 2024
ST-LLM: Large Language Models Are Effective Temporal Learners Ruyang Liu Chen Li Haoran Tang Yixiao Ge Ying Shan Ge Li 98 82 0 30 Mar 2024
A Comprehensive Study of Multimodal Large Language Models for Image Quality Assessment Tianhe Wu Kede Ma Jie Liang Yujiu Yang Lei Zhang 61 26 0 16 Mar 2024
Modular Blind Video Quality Assessment Wen Wen Mu Li Yabin Zhang Yiting Liao Junli Li Li Zhang Kede Ma 72 11 0 29 Feb 2024
2AFC Prompting of Large Multimodal Models for Image Quality Assessment Hanwei Zhu Xiangjie Sui Baoliang Chen Xuelin Liu Peilin Chen Yuming Fang Shiqi Wang 70 14 0 02 Feb 2024
AesBench: An Expert Benchmark for Multimodal Large Language Models on Image Aesthetics Perception Yipo Huang Quan Yuan Xiangfei Sheng Zhichao Yang Haoning Wu Pengfei Chen Yuzhe Yang Leida Li Weisi Lin VLM 56 40 0 16 Jan 2024
Q-Align: Teaching LMMs for Visual Scoring via Discrete Text-Defined Levels Haoning Wu Zicheng Zhang Weixia Zhang Chaofeng Chen Liang Liao ... Wenxiu Sun Qiong Yan Xiongkuo Min Guangtao Zhai Weisi Lin 62 159 0 28 Dec 2023
Q-Boost: On Visual Quality Assessment Ability of Low-level Multi-Modality Foundation Models Zicheng Zhang Haoning Wu Zhongpeng Ji Chunyi Li Erli Zhang ... Xiongkuo Min Fengyu Sun Shangling Jui Weisi Lin Guangtao Zhai 77 16 0 23 Dec 2023
VITATECS: A Diagnostic Dataset for Temporal Concept Understanding of Video-Language Models Shicheng Li Lei Li Shuhuai Ren Yuanxin Liu Yi Liu Rundong Gao Xu Sun Lu Hou 76 37 0 29 Nov 2023
MVBench: A Comprehensive Multi-modal Video Understanding Benchmark Kunchang Li Yali Wang Yinan He Yizhuo Li Yi Wang ... Jilan Xu Guo Chen Ping Luo Limin Wang Yu Qiao VLM MLLM 143 503 0 28 Nov 2023
mPLUG-Owl2: Revolutionizing Multi-modal Large Language Model with Modality Collaboration Qinghao Ye Haiyang Xu Jiabo Ye Mingshi Yan Anwen Hu Haowei Liu Qi Qian Ji Zhang Fei Huang Jingren Zhou MLLM VLM 212 418 0 07 Nov 2023
Improved Baselines with Visual Instruction Tuning Haotian Liu Chunyuan Li Yuheng Li Yong Jae Lee VLM MLLM 152 2,817 0 05 Oct 2023
InternLM-XComposer: A Vision-Language Large Model for Advanced Text-image Comprehension and Composition Pan Zhang Xiaoyi Wang Bin Wang Yuhang Cao Chao Xu ... Conghui He Xingcheng Zhang Yu Qiao Da Lin Jiaqi Wang MLLM 142 241 0 26 Sep 2023
Q-Bench: A Benchmark for General-Purpose Foundation Models on Low-level Vision Haoning Wu Zicheng Zhang Erli Zhang Chaofeng Chen Liang Liao ... Chunyi Li Wenxiu Sun Qiong Yan Guangtao Zhai Weisi Lin VLM 100 155 0 25 Sep 2023
EgoSchema: A Diagnostic Benchmark for Very Long-form Video Language Understanding K. Mangalam Raiymbek Akshulakov Jitendra Malik 113 308 0 17 Aug 2023
MMBench: Is Your Multi-modal Model an All-around Player? Yuanzhan Liu Haodong Duan Yuanhan Zhang Yue Liu Songyang Zhang ... Jiaqi Wang Conghui He Ziwei Liu Kai-xiang Chen Dahua Lin 119 1,055 0 12 Jul 2023
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models Chaoyou Fu Peixian Chen Yunhang Shen Yulei Qin Mengdan Zhang ... Xiawu Zheng Ke Li Xing Sun Zhenyu Qiu Rongrong Ji ELM MLLM 115 856 0 23 Jun 2023
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality Qinghao Ye Haiyang Xu Guohai Xu Jiabo Ye Ming Yan ... Junfeng Tian Qiang Qi Ji Zhang Feiyan Huang Jingren Zhou VLM MLLM 288 955 0 27 Apr 2023
Visual Instruction Tuning Haotian Liu Chunyuan Li Qingyang Wu Yong Jae Lee SyDa VLM MLLM 569 4,910 0 17 Apr 2023
MD-VQA: Multi-Dimensional Quality Assessment for UGC Live Videos Zicheng Zhang Wei Wu Wei Sun Dangyang Tu Wei Lu Xiongkuo Min Ying-Cong Chen Guangtao Zhai 81 43 0 27 Mar 2023
VILA: Learning Image Aesthetics from User Comments with Vision-Language Pretraining Junjie Ke Keren Ye Jiahui Yu Yonghui Wu P. Milanfar Feng Yang VLM 85 61 0 24 Mar 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 1.5K 14,699 0 15 Mar 2023
Exploring Video Quality Assessment on User Generated Contents from Aesthetic and Technical Perspectives Haoning Wu Erli Zhang Liang Liao Chaofeng Chen Jingwen Hou Annan Wang Wenxiu Sun Qiong Yan Weisi Lin 80 168 0 09 Nov 2022
Evaluating Point Cloud from Moving Camera Videos: A No-Reference Metric Zicheng Zhang Wei Sun Yucheng Zhu Xiongkuo Min Wei Wu Ying-Cong Chen Guangtao Zhai 3DPC 62 41 0 30 Aug 2022
FAST-VQA: Efficient End-to-end Video Quality Assessment with Fragment Sampling Haoning Wu Chaofeng Chen Jingwen Hou Liang Liao Annan Wang Wenxiu Sun Qiong Yan Weisi Lin 104 177 0 06 Jul 2022
A Deep Learning based No-reference Quality Assessment Model for UGC Videos Wei Sun Xiongkuo Min Wei Lu Guangtao Zhai 85 166 0 29 Apr 2022
Subjective and Objective Analysis of Streamed Gaming Videos Xiangxu Yu Zhenqiang Ying Neil Birkbeck Yilin Wang Balu Adsumilli A. Bovik 49 13 0 24 Mar 2022
Blindly Assess Quality of In-the-Wild Videos via Quality-aware Pre-training and Motion Perception Bowen Li Weixia Zhang Meng Tian Guangtao Zhai Xianpei Wang 79 123 0 19 Aug 2021
Patch-VQ: 'Patching Up' the Video Quality Problem Zhenqiang Ying Maniratnam Mandal Deepti Ghadiyaram AI Facebook 65 167 0 27 Nov 2020
Quality Assessment of In-the-Wild Videos Dingquan Li Tingting Jiang Ming Jiang 66 299 0 01 Aug 2019
OK-VQA: A Visual Question Answering Benchmark Requiring External Knowledge Kenneth Marino Mohammad Rastegari Ali Farhadi Roozbeh Mottaghi 117 1,090 0 31 May 2019