A Course Shared Task on Evaluating LLM Output for Clinical Questions

31 July 2024

Doan Nam Long Vu

Papers citing "A Course Shared Task on Evaluating LLM Output for Clinical Questions"

2 / 2 papers shown

Title
WikiContradict: A Benchmark for Evaluating LLMs on Real-World Knowledge Conflicts from Wikipedia Yufang Hou Alessandra Pascale Javier Carnerero-Cano T. Tchrakian Radu Marinescu Elizabeth M. Daly Inkit Padhi P. Sattigeri 51 6 0 19 Jun 2024
Explainable Automated Fact-Checking for Public Health Claims Neema Kotonya Francesca Toni 218 251 0 19 Oct 2020