Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs

v1v2 (latest)

Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs

17 June 2025

ArXiv (abs)PDF HTML

Papers citing "Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs"

Title
No papers