ReliableEval: A Recipe for Stochastic LLM Evaluation via Method of Moments

28 May 2025

Papers citing "ReliableEval: A Recipe for Stochastic LLM Evaluation via Method of Moments"

1 / 1 papers shown

Title
DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation Eliya Habba Ofir Arviv Itay Itzhak Yotam Perlitz Elron Bandel Leshem Choshen Michal Shmueli-Scheuer Gabriel Stanovsky 129 5 0 03 Mar 2025