Verifiable by Design: Aligning Language Models to Quote from Pre-Training Data

Verifiable by Design: Aligning Language Models to Quote from Pre-Training Data

5 April 2024

Jingyu Zhang

Benjamin Van Durme

Daniel Khashabi

Papers citing "Verifiable by Design: Aligning Language Models to Quote from Pre-Training Data"

15 / 15 papers shown

Title
Transparentize the Internal and External Knowledge Utilization in LLMs with Trustworthy Citation Jiajun Shen Tong Zhou Yubo Chen Delai Qiu Shengping Liu Kang-Jun Liu Jun Zhao HILM RALM 86 0 0 21 Apr 2025
Conformal Linguistic Calibration: Trading-off between Factuality and Specificity Zhengping Jiang Anqi Liu Benjamin Van Durme 86 1 0 26 Feb 2025
ImageRef-VL: Enabling Contextual Image Referencing in Vision-Language Models Jingwei Yi Junhao Yin Ju Xu Peng Bao Y. Wang Wei Fan H. Wang 47 0 0 20 Jan 2025
Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to Refuse Maojia Song Shang Hong Sim Rishabh Bhardwaj Hai Leong Chieu Navonil Majumder Soujanya Poria 34 6 0 17 Sep 2024
Citekit: A Modular Toolkit for Large Language Model Citation Generation Jiajun Shen Tong Zhou Suifeng Zhao Yubo Chen Kang Liu HILM KELM 39 7 0 06 Aug 2024
ProgressGym: Alignment with a Millennium of Moral Progress Tianyi Qiu Yang Zhang Xuchuan Huang Jasmine Xinze Li Jiaming Ji Yaodong Yang AI4TS 33 4 0 28 Jun 2024
Attribute First, then Generate: Locally-attributable Grounded Text Generation Aviv Slobodkin Eran Hirsch Arie Cattan Tal Schuster Ido Dagan 71 20 0 25 Mar 2024
Training Language Models to Generate Text with Citations via Fine-grained Rewards Chengyu Huang Zeqiu Wu Yushi Hu Wenya Wang HILM LRM 79 25 0 06 Feb 2024
Self-Rewarding Language Models Weizhe Yuan Richard Yuanzhe Pang Kyunghyun Cho Xian Li Sainbayar Sukhbaatar Jing Xu Jason Weston ReLM SyDa ALM LRM 235 298 0 18 Jan 2024
"According to ...": Prompting Language Models Improves Quoting from Pre-Training Data Orion Weller Marc Marone Nathaniel Weir Dawn J Lawrie Daniel Khashabi Benjamin Van Durme HILM 70 44 0 22 May 2023
Data Portraits: Recording Foundation Model Training Data Marc Marone Benjamin Van Durme 135 30 0 06 Mar 2023
Teaching language models to support answers with verified quotes Jacob Menick Maja Trebacz Vladimir Mikulik John Aslanides Francis Song ... Mia Glaese Susannah Young Lucy Campbell-Gillingham G. Irving Nat McAleese ELM RALM 237 257 0 21 Mar 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 313 11,915 0 04 Mar 2022
The Pile: An 800GB Dataset of Diverse Text for Language Modeling Leo Gao Stella Biderman Sid Black Laurence Golding Travis Hoppe ... Horace He Anish Thite Noa Nabeshima Shawn Presser Connor Leahy AIMat 253 1,986 0 31 Dec 2020
Extracting Training Data from Large Language Models Nicholas Carlini Florian Tramèr Eric Wallace Matthew Jagielski Ariel Herbert-Voss ... Tom B. Brown D. Song Ulfar Erlingsson Alina Oprea Colin Raffel MLAU SILM 290 1,814 0 14 Dec 2020