VERISCORE: Evaluating the factuality of verifiable claims in long-form text generation

27 June 2024

Papers citing "VERISCORE: Evaluating the factuality of verifiable claims in long-form text generation"

22 / 22 papers shown

Title
BLEUBERI: BLEU is a surprisingly effective reward for instruction following Yapei Chang Yekyung Kim Michael Krumdick Amir Zadeh Chuan Li Chris Tanner Mohit Iyyer ALM 22 0 0 16 May 2025
Towards Automated Situation Awareness: A RAG-Based Framework for Peacebuilding Reports Poli A. Nemkova Suleyman O. Polat Rafid I. Jahan Sagnik Ray Choudhury Sun-joo Lee Shouryadipta Sarkar Mark V. Albert 17 0 0 14 May 2025
Towards Long Context Hallucination Detection Siyi Liu Kishaloy Halder Zheng Qi Wei Xiao Nikolaos Pappas Phu Mon Htut Neha Anna John Yassine Benajiba Dan Roth HILM 73 0 0 28 Apr 2025
Explanatory Summarization with Discourse-Driven Planning Dongqi Liu Xi Yu Vera Demberg Mirella Lapata 50 0 0 27 Apr 2025
HalluLens: LLM Hallucination Benchmark Yejin Bang Ziwei Ji Alan Schelten Anthony Hartshorn Tara Fowler Cheng Zhang Nicola Cancedda Pascale Fung HILM 92 1 0 24 Apr 2025
Retrieval Augmented Generation Evaluation in the Era of Large Language Models: A Comprehensive Survey Aoran Gan Hao Yu Kai Zhang Qi Liu Wenyu Yan Zhenya Huang Shiwei Tong Guoping Hu RALM 3DV 43 0 0 21 Apr 2025
BOOST: Bootstrapping Strategy-Driven Reasoning Programs for Program-Guided Fact-Checking Qisheng Hu Quanyu Long Wenya Wang LRM 53 0 0 03 Apr 2025
Extract, Match, and Score: An Evaluation Paradigm for Long Question-context-answer Triplets in Financial Analysis Bo Hu Han Yuan Vlad Pandelea Wuqiong Luo Yingzhu Zhao Zheng Ma 55 0 0 20 Mar 2025
Optimizing Decomposition for Optimal Claim Verification Yining Lu Noah Ziems Hy Dang Meng Jiang 58 0 0 19 Mar 2025
MAMM-Refine: A Recipe for Improving Faithfulness in Generation with Multi-Agent Collaboration David Wan Justin Chih-Yao Chen Elias Stengel-Eskin Joey Tianyi Zhou LLMAG LRM 65 1 0 19 Mar 2025
Conformal Linguistic Calibration: Trading-off between Factuality and Specificity Zhengping Jiang Anqi Liu Benjamin Van Durme 92 1 0 26 Feb 2025
FactReasoner: A Probabilistic Approach to Long-Form Factuality Assessment for Large Language Models Radu Marinescu D. Bhattacharjya Junkyu Lee T. Tchrakian Javier Carnerero-Cano Yufang Hou Elizabeth M. Daly Alessandra Pascale HILM LRM 61 0 0 25 Feb 2025
OverThink: Slowdown Attacks on Reasoning LLMs A. Kumar Jaechul Roh A. Naseh Marzena Karpinska Mohit Iyyer Amir Houmansadr Eugene Bagdasarian LRM 64 14 0 04 Feb 2025
The FACTS Grounding Leaderboard: Benchmarking LLMs' Ability to Ground Responses to Long-Form Input Alon Jacovi Andrew Wang Chris Alberti Connie Tao Jon Lipovetz ... Rachana Fellinger Rui Wang Zizhao Zhang Sasha Goldshtein Dipanjan Das HILM ALM 93 13 0 06 Jan 2025
FactBench: A Dynamic Benchmark for In-the-Wild Language Model Factuality Evaluation Farima Fatahi Bayat Lechen Zhang Sheza Munir Lu Wang HILM 52 3 0 29 Oct 2024
Decomposition Dilemmas: Does Claim Decomposition Boost or Burden Fact-Checking Performance? Qisheng Hu Quanyu Long Wenya Wang 128 5 0 17 Oct 2024
BookWorm: A Dataset for Character Description and Analysis Argyrios Papoudakis Mirella Lapata Frank Keller 23 1 0 14 Oct 2024
Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to Refuse Maojia Song Shang Hong Sim Rishabh Bhardwaj Hai Leong Chieu Navonil Majumder Soujanya Poria 37 6 0 17 Sep 2024
Claim Verification in the Age of Large Language Models: A Survey A. Dmonte Roland Oruche Marcos Zampieri Prasad Calyam Isabelle Augenstein 49 8 0 26 Aug 2024
CaLMQA: Exploring culturally specific long-form question answering across 23 languages Shane Arora Marzena Karpinska Hung-Ting Chen Ipsita Bhattacharjee Mohit Iyyer Eunsol Choi HILM 49 11 0 25 Jun 2024
Satyrn: A Platform for Analytics Augmented Generation Marko Sterbentz Cameron Barrie Shubham Shahi Abhratanu Dutta Donna Hooshmand Harper Pack Kristian J. Hammond 36 0 0 17 Jun 2024
OLMo: Accelerating the Science of Language Models Dirk Groeneveld Iz Beltagy Pete Walsh Akshita Bhagia Rodney Michael Kinney ... Jesse Dodge Kyle Lo Luca Soldaini Noah A. Smith Hanna Hajishirzi OSLM 141 358 0 01 Feb 2024