v1v2v3 (latest)

RLSF: Fine-tuning LLMs via Symbolic Feedback

26 May 2024

Papers citing "RLSF: Fine-tuning LLMs via Symbolic Feedback"

3 / 3 papers shown

Title
DualSchool: How Reliable are LLMs for Optimization Education? Michael Klamkin Arnaud Deza Sikai Cheng Haoruo Zhao Pascal Van Hentenryck 51 0 0 27 May 2025
A Sober Look at Progress in Language Model Reasoning: Pitfalls and Paths to Reproducibility Andreas Hochlehnert Hardik Bhatnagar Vishaal Udandarao Samuel Albanie Ameya Prabhu Matthias Bethge ReLM ALM LRM 232 26 0 09 Apr 2025
Reinforcement Learning for Generative AI: A Survey Yuanjiang Cao Quan.Z Sheng Julian McAuley Lina Yao SyDa 198 13 0 28 Aug 2023