PROMPTFUZZ: Harnessing Fuzzing Techniques for Robust Testing of Prompt Injection in LLMs

23 September 2024

Jiahao Yu

Xinyu Xing

ArXiv (abs)PDF HTML Github (30★)

Main:13 Pages

16 Figures

Bibliography:2 Pages

8 Tables

Appendix:5 Pages

Abstract

Large Language Models (LLMs) have gained widespread use in various applications due to their powerful capability to generate human-like text. However, prompt injection attacks, which involve overwriting a model's original instructions with malicious prompts to manipulate the generated text, have raised significant concerns about the security and reliability of LLMs. Ensuring that LLMs are robust against such attacks is crucial for their deployment in real-world applications, particularly in critical tasks.

View on arXiv

Comments on this paper