A Framework for Fine-Tuning LLMs using Heterogeneous Feedback

5 August 2024

Franck Dernoncourt

Tong Yu

Xiang Chen

Papers citing "A Framework for Fine-Tuning LLMs using Heterogeneous Feedback"

2 / 2 papers shown

Title
Active Instruction Tuning: Improving Cross-Task Generalization by Training on Prompt Sensitive Tasks Po-Nien Kung Fan Yin Di Wu Kai-Wei Chang Nanyun Peng 77 40 0 01 Nov 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 319 11,953 0 04 Mar 2022