Soft Preference Optimization: Aligning Language Models to Expert Distributions

30 April 2024

Papers citing "Soft Preference Optimization: Aligning Language Models to Expert Distributions"

4 / 4 papers shown

Title
Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences Corby Rosset Ching-An Cheng Arindam Mitra Michael Santacroce Ahmed Hassan Awadallah Tengyang Xie 152 114 0 04 Apr 2024
Provably Robust DPO: Aligning Language Models with Noisy Feedback Sayak Ray Chowdhury Anush Kini Nagarajan Natarajan 33 55 0 01 Mar 2024
Direct Preference Optimization with an Offset Afra Amini Tim Vieira Ryan Cotterell 73 55 0 16 Feb 2024
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 319 11,953 0 04 Mar 2022