Tuning Large Multimodal Models for Videos using Reinforcement Learning from AI Feedback

6 February 2024

Papers citing "Tuning Large Multimodal Models for Videos using Reinforcement Learning from AI Feedback"

5 / 5 papers shown

Title
Sailing AI by the Stars: A Survey of Learning from Rewards in Post-Training and Test-Time Scaling of Large Language Models Xiaobao Wu LRM 72 1 0 05 May 2025
Stealing Creator's Workflow: A Creator-Inspired Agentic Framework with Iterative Feedback Loop for Improved Scientific Short-form Generation J. Park Maanas Taneja Qianwen Wang Dongyeop Kang VGen 70 0 0 26 Apr 2025
Is Your Video Language Model a Reliable Judge? M. Liu Wensheng Zhang 59 2 0 07 Mar 2025
VideoSAVi: Self-Aligned Video Language Models without Human Supervision Yogesh Kulkarni Pooyan Fazli VLM 103 2 0 01 Dec 2024
Direct Preference Optimization of Video Large Multimodal Models from Language Model Reward Ruohong Zhang Liangke Gui Zhiqing Sun Yihao Feng Keyang Xu ... Di Fu Chunyuan Li Alexander G. Hauptmann Yonatan Bisk Yiming Yang MLLM 50 57 0 01 Apr 2024