RLTHF: Targeted Human Feedback for LLM Alignment

24 February 2025

Papers citing "RLTHF: Targeted Human Feedback for LLM Alignment"

1 / 1 papers shown

Title
Optimizing Safe and Aligned Language Generation: A Multi-Objective GRPO Approach Xuying Li Zhuo Li Yuji Kosuga Victor Bian 45 3 0 26 Mar 2025