v1v2 (latest)

PPLLaVA: Varied Video Sequence Understanding With Prompt Guidance

4 November 2024

Papers citing "PPLLaVA: Varied Video Sequence Understanding With Prompt Guidance"

3 / 3 papers shown

Title
One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory Chenhao Zheng Jieyu Zhang Mohammadreza Salehi Ziqi Gao Vishnu Iyengar Norimasa Kobori Quan Kong Ranjay Krishna 51 0 0 29 May 2025
Aligning Multimodal LLM with Human Preference: A Survey Tao Yu Yize Zhang Chaoyou Fu Junkang Wu Jinda Lu ... Qingsong Wen Zheng Zhang Yan Huang Liang Wang Tieniu Tan 443 4 0 18 Mar 2025
Valley: Video Assistant with Large Language model Enhanced abilitY Ruipu Luo Ziwang Zhao Min Yang Junwei Dong Da Li Pengcheng Lu Tao Wang Linmei Hu Ming-Hui Qiu MLLM 150 209 0 12 Jun 2023