SAGEval: The frontiers of Satisfactory Agent based NLG Evaluation for reference-free open-ended text

25 November 2024

Papers citing "SAGEval: The frontiers of Satisfactory Agent based NLG Evaluation for reference-free open-ended text"

7 / 7 papers shown

Title
MATEval: A Multi-Agent Discussion Framework for Advancing Open-Ended Text Evaluation Yu Li Shenyu Zhang Rui Wu Xiutian Huang Yongrui Chen Wenhao Xu Guilin Qi Dehai Min LLMAG 43 11 0 28 Mar 2024
MEGA: Multilingual Evaluation of Generative AI Kabir Ahuja Harshita Diddee Rishav Hada Millicent Ochieng Krithika Ramesh ... T. Ganu Sameer Segal Maxamed Axmed Kalika Bali Sunayana Sitaram LM&MA LRM ELM 101 289 0 22 Mar 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 1.5K 14,748 0 15 Mar 2023
Is ChatGPT a Good NLG Evaluator? A Preliminary Study Jiaan Wang Yunlong Liang Fandong Meng Zengkui Sun Haoxiang Shi Zhixu Li Jinan Xu Jianfeng Qu Jie Zhou LM&MA ELM ALM AI4MH 131 471 0 07 Mar 2023
Training Verifiers to Solve Math Word Problems K. Cobbe V. Kosaraju Mohammad Bavarian Mark Chen Heewoo Jun ... Jerry Tworek Jacob Hilton Reiichiro Nakano Christopher Hesse John Schulman ReLM OffRL LRM 348 4,596 0 27 Oct 2021
OpenMEVA: A Benchmark for Evaluating Open-ended Story Generation Metrics Jian Guan Zhexin Zhang Zhuoer Feng Zitao Liu Wenbiao Ding Xiaoxi Mao Changjie Fan Minlie Huang 72 61 0 19 May 2021
Asking and Answering Questions to Evaluate the Factual Consistency of Summaries Alex Jinpeng Wang Kyunghyun Cho M. Lewis HILM 86 482 0 08 Apr 2020