Aligning Dialogue Agents with Global Feedback via Large Language Model Reward Decomposition

21 May 2025

Papers citing "Aligning Dialogue Agents with Global Feedback via Large Language Model Reward Decomposition"

1 / 1 papers shown

Title
Latent Reward: LLM-Empowered Credit Assignment in Episodic Reinforcement Learning Yun Qu Yuhang Jiang Boyuan Wang Yixiu Mao Cheems Wang Chang-Shu Liu Xiangyang Ji 190 8 0 10 Jan 2025