Beyond Bradley-Terry Models: A General Preference Model for Language Model Alignment

3 October 2024

Papers citing "Beyond Bradley-Terry Models: A General Preference Model for Language Model Alignment"

2 / 2 papers shown

Title
Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning Kai Ye Hongyi Zhou Jin Zhu Francesco Quinzan C. Shi 25 1 0 03 Apr 2025
Reinforcement Learning Enhanced LLMs: A Survey Shuhe Wang Shengyu Zhang J. Zhang Runyi Hu Xiaoya Li Tianwei Zhang Jiwei Li Fei Wu G. Wang Eduard H. Hovy OffRL 134 7 0 05 Dec 2024