Reinforcement Learning from Human Feedback: Whose Culture, Whose Values, Whose Perspectives?

20 January 2025

Papers citing "Reinforcement Learning from Human Feedback: Whose Culture, Whose Values, Whose Perspectives?"

1 / 1 papers shown

Title
Fine-Tuning Language Models from Human Preferences Daniel M. Ziegler Nisan Stiennon Jeff Wu Tom B. Brown Alec Radford Dario Amodei Paul Christiano G. Irving ALM 301 1,616 0 18 Sep 2019