Re-Align: Aligning Vision Language Models via Retrieval-Augmented Direct Preference Optimization

18 February 2025

Papers citing "Re-Align: Aligning Vision Language Models via Retrieval-Augmented Direct Preference Optimization"

6 / 6 papers shown

Title
UniOcc: A Unified Benchmark for Occupancy Forecasting and Prediction in Autonomous Driving Yuping Wang Xiangyu Huang Xiaokang Sun Mingxuan Yan Shuo Xing Zhengzhong Tu Jiachen Li 37 0 0 31 Mar 2025
Aligning Multimodal LLM with Human Preference: A Survey Tao Yu Y. Zhang Chaoyou Fu Junkang Wu Jinda Lu ... Qingsong Wen Z. Zhang Yan Huang Liang Wang T. Tan 158 2 0 18 Mar 2025
Can Large Vision Language Models Read Maps Like a Human? Shuo Xing Zezhou Sun Shuangyu Xie Kaiyuan Chen Yanjia Huang Yuping Wang Jiachen Li Dezhen Song Zhengzhong Tu 68 2 0 18 Mar 2025
MDocAgent: A Multi-Modal Multi-Agent Framework for Document Understanding S. Han Peng Xia Ruiyi Zhang Tong Sun Yun-Qing Li Hongtu Zhu Huaxiu Yao VLM 90 3 0 18 Mar 2025
DecAlign: Hierarchical Cross-Modal Alignment for Decoupled Multimodal Representation Learning Chengxuan Qian Shuo Xing Shawn Li Yue Zhao Zhengzhong Tu 50 0 0 14 Mar 2025
DynCIM: Dynamic Curriculum for Imbalanced Multimodal Learning Chengxuan Qian Kai Han J. Wang Zhenlong Yuan Rui Qian Chongwen Lyu Jun Chen 48 1 0 09 Mar 2025