v1v2v3 (latest)

Not All Metrics Are Guilty: Improving NLG Evaluation by Diversifying References

24 May 2023

Papers citing "Not All Metrics Are Guilty: Improving NLG Evaluation by Diversifying References"

3 / 3 papers shown

Title
Evaluation Should Not Ignore Variation: On the Impact of Reference Set Choice on Summarization Metrics Silvia Casola Yang Liu Siyao Peng Oliver Kraus Albert Gatt Barbara Plank 23 0 0 17 Jun 2025
RevisEval: Improving LLM-as-a-Judge via Response-Adapted References Qiyuan Zhang Yufei Wang Tiezheng YU Yuxin Jiang Chuhan Wu ... Xin Jiang Lifeng Shang Ruiming Tang Fuyuan Lyu Chen Ma 131 7 0 07 Oct 2024
Chain-of-Dictionary Prompting Elicits Translation in Large Language Models Hongyuan Lu Haoran Yang Haoyang Huang Dongdong Zhang Wai Lam Furu Wei LRM AI4CE 108 18 0 11 May 2023