Enhancing Large Language Models Against Inductive Instructions with
Dual-critique Prompting

Enhancing Large Language Models Against Inductive Instructions with Dual-critique Prompting

23 May 2023

Papers citing "Enhancing Large Language Models Against Inductive Instructions with Dual-critique Prompting"

13 / 13 papers shown

Title
Foot-In-The-Door: A Multi-turn Jailbreak for LLMs Zixuan Weng Xiaolong Jin Jinyuan Jia Xinsong Zhang AAML 169 0 0 27 Feb 2025
NILE: Internal Consistency Alignment in Large Language Models Minda Hu Qiyuan Zhang Yufei Wang Bowei He Hongru Wang Jingyan Zhou Liangyou Li Yasheng Wang Chen Ma Irwin King 91 0 0 21 Dec 2024
Grade Like a Human: Rethinking Automated Assessment with Large Language Models Wenjing Xie Juxin Niu Chun Jason Xue Nan Guan AI4Ed 44 3 0 30 May 2024
Analyzing the Inherent Response Tendency of LLMs: Real-World Instructions-Driven Jailbreak Yanrui Du Sendong Zhao Ming Ma Yuhan Chen Bing Qin 26 15 0 07 Dec 2023
A Survey of the Evolution of Language Model-Based Dialogue Systems Hongru Wang Lingzhi Wang Yiming Du Liang Chen Jing Zhou Yufei Wang Kam-Fai Wong LRM 67 21 0 28 Nov 2023
Alignment is not sufficient to prevent large language models from generating harmful information: A psychoanalytic perspective Zi Yin Wei Ding Jia Liu 29 1 0 14 Nov 2023
Improving Diversity of Demographic Representation in Large Language Models via Collective-Critiques and Self-Voting Preethi Lahoti Nicholas Blumm Xiao Ma Raghavendra Kotikalapudi Sahitya Potluri ... Hansa Srinivasan Ben Packer Ahmad Beirami Alex Beutel Jilin Chen 44 28 0 25 Oct 2023
Improving Factual Consistency for Knowledge-Grounded Dialogue Systems via Knowledge Enhancement and Alignment Boyang Xue Weichao Wang Hongru Wang Fei Mi Rui Wang Yasheng Wang Lifeng Shang Xin Jiang Qun Liu Kam-Fai Wong KELM HILM 219 15 0 12 Oct 2023
Query-Dependent Prompt Evaluation and Optimization with Offline Inverse RL Hao Sun Alihan Huyuk M. Schaar OffRL LRM 23 28 0 13 Sep 2023
Distractor generation for multiple-choice questions with predictive prompting and large language models Semere Kiros Bitew Johannes Deleu Chris Develder Thomas Demeester LRM 16 11 0 30 Jul 2023
GLM-130B: An Open Bilingual Pre-trained Model Aohan Zeng Xiao Liu Zhengxiao Du Zihan Wang Hanyu Lai ... Jidong Zhai Wenguang Chen Peng-Zhen Zhang Yuxiao Dong Jie Tang BDL LRM 253 1,073 0 05 Oct 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 339 12,003 0 04 Mar 2022
Which Linguist Invented the Lightbulb? Presupposition Verification for Question-Answering Najoung Kim Ellie Pavlick Burcu Karagol Ayan Deepak Ramachandran 70 43 0 02 Jan 2021