Title
Evaluation of Retrieval-Augmented Generation: A Survey Hao Yu Aoran Gan Kai Zhang Shiwei Tong Qi Liu Zhaofeng Liu 3DV 136 100 0 13 May 2024
A Survey of Automatic Hallucination Evaluation on Natural Language Generation Siya Qi Yulan He Yulan He Zheng Yuan LRM HILM 99 1 0 18 Apr 2024
HypoTermQA: Hypothetical Terms Dataset for Benchmarking Hallucination Tendency of LLMs Cem Uluoglakci T. Taşkaya-Temizel HILM 64 3 0 25 Feb 2024
CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models Yuanjie Lyu Zhiyu Li Pengnian Qi Feiyu Xiong Simin Niu Wenjin Wang Hao Wu Huan Liu Tong Xu Enhong Chen RALM 84 40 0 30 Jan 2024
Baichuan 2: Open Large-scale Language Models Ai Ming Yang Bin Xiao Bingning Wang Borong Zhang Ce Bian ... Youxin Jiang Yuchen Gao Yupeng Zhang Guosheng Dong Zhiying Wu ELM LRM 322 755 0 19 Sep 2023