GASLITEing the Retrieval: Exploring Vulnerabilities in Dense Embedding-based Search

31 December 2024

Papers citing "GASLITEing the Retrieval: Exploring Vulnerabilities in Dense Embedding-based Search"

48 / 48 papers shown

Title
PoisonArena: Uncovering Competing Poisoning Attacks in Retrieval-Augmented Generation Liuji Chen Xiaofang Yang Yuanzhuo Lu Jinghao Zhang Xin Sun Qiang Liu Shu Wu Jing Dong Liang Wang AAML 71 0 0 18 May 2025
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases Zhaorun Chen Zhen Xiang Chaowei Xiao Dawn Song Bo Li LLMAG AAML 105 79 0 17 Jul 2024
Machine Against the RAG: Jamming Retrieval-Augmented Generation with Blocker Documents Avital Shafran R. Schuster Vitaly Shmatikov 144 37 0 09 Jun 2024
Arctic-Embed: Scalable, Efficient, and Accurate Text Embedding Models Luke Merrick Danmei Xu Gaurav Nuti Daniel Campos 77 27 0 08 May 2024
AdvPrompter: Fast Adaptive Adversarial Prompting for LLMs Anselm Paulus Arman Zharmagambetov Chuan Guo Brandon Amos Yuandong Tian AAML 153 67 0 21 Apr 2024
Manipulating Large Language Models to Increase Product Visibility Aounon Kumar Himabindu Lakkaraju 101 9 0 11 Apr 2024
Neural Exec: Learning (and Learning from) Execution Triggers for Prompt Injection Attacks Dario Pasquini Martin Strohmeier Carmela Troncoso AAML 112 28 0 06 Mar 2024
PoisonedRAG: Knowledge Poisoning Attacks to Retrieval-Augmented Generation of Large Language Models Wei Zou Runpeng Geng Binghui Wang Jinyuan Jia SILM 112 45 1 12 Feb 2024
Improving Text Embeddings with Large Language Models Liang Wang Nan Yang Xiaolong Huang Linjun Yang Rangan Majumder Furu Wei SyDa 142 190 0 31 Dec 2023
Poisoning Retrieval Corpora by Injecting Adversarial Passages Zexuan Zhong Ziqing Huang Alexander Wettig Danqi Chen AAML 129 76 0 29 Oct 2023
AutoDAN: Interpretable Gradient-Based Adversarial Attacks on Large Language Models Sicheng Zhu Ruiyi Zhang Bang An Gang Wu Joe Barrow Zichao Wang Furong Huang A. Nenkova Tong Sun SILM AAML 90 49 0 23 Oct 2023
Nightshade: Prompt-Specific Poisoning Attacks on Text-to-Image Generative Models Shawn Shan Wenxin Ding Josephine Passananti Stanley Wu Haitao Zheng Ben Y. Zhao SILM DiffM 111 53 0 20 Oct 2023
Text Embeddings Reveal (Almost) As Much As Text John X. Morris Volodymyr Kuleshov Vitaly Shmatikov Alexander M. Rush RALM 103 115 0 10 Oct 2023
Baseline Defenses for Adversarial Attacks Against Aligned Language Models Neel Jain Avi Schwarzschild Yuxin Wen Gowthami Somepalli John Kirchenbauer Ping Yeh-Chiang Micah Goldblum Aniruddha Saha Jonas Geiping Tom Goldstein AAML 194 410 0 01 Sep 2023
Detecting Language Model Attacks with Perplexity Gabriel Alon Michael Kamfonas AAML 174 229 0 27 Aug 2023
Universal and Transferable Adversarial Attacks on Aligned Language Models Andy Zou Zifan Wang Nicholas Carlini Milad Nasr J. Zico Kolter Matt Fredrikson 411 1,530 0 27 Jul 2023
Are aligned neural networks adversarially aligned? Nicholas Carlini Milad Nasr Christopher A. Choquette-Choo Matthew Jagielski Irena Gao ... Pang Wei Koh Daphne Ippolito Katherine Lee Florian Tramèr Ludwig Schmidt AAML 99 254 0 26 Jun 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 1.7K 14,870 0 15 Mar 2023
Automatically Auditing Large Language Models via Discrete Optimization Erik Jones Anca Dragan Aditi Raghunathan Jacob Steinhardt 127 172 0 08 Mar 2023
Not what you've signed up for: Compromising Real-World LLM-Integrated Applications with Indirect Prompt Injection Kai Greshake Sahar Abdelnabi Shailesh Mishra C. Endres Thorsten Holz Mario Fritz SILM 197 504 0 23 Feb 2023
Poisoning Web-Scale Training Datasets is Practical Nicholas Carlini Matthew Jagielski Christopher A. Choquette-Choo Daniel Paleka Will Pearce Hyrum S. Anderson Andreas Terzis Kurt Thomas Florian Tramèr SILM 131 204 0 20 Feb 2023
In-Context Retrieval-Augmented Language Models Ori Ram Yoav Levine Itay Dalmedigos Dor Muhlgay Amnon Shashua Kevin Leyton-Brown Y. Shoham KELM RALM LRM 119 616 0 31 Jan 2023
Text Embeddings by Weakly-Supervised Contrastive Pre-training Liang Wang Nan Yang Xiaolong Huang Binxing Jiao Linjun Yang Daxin Jiang Rangan Majumder Furu Wei VLM 272 625 0 07 Dec 2022
MTEB: Massive Text Embedding Benchmark Niklas Muennighoff Nouamane Tazi L. Magne Nils Reimers 577 423 0 13 Oct 2022
Order-Disorder: Imitation Adversarial Attacks for Black-box Neural Ranking Models Jiawei Liu Yangyang Kang Di Tang Kaisong Song Changlong Sun Wenyuan Xu Wei Lu Xiaozhong Liu AAML 118 42 0 14 Sep 2022
ToxiGen: A Large-Scale Machine-Generated Dataset for Adversarial and Implicit Hate Speech Detection Thomas Hartvigsen Saadia Gabriel Hamid Palangi Maarten Sap Dipankar Ray Ece Kamar 102 393 0 17 Mar 2022
Unsupervised Dense Information Retrieval with Contrastive Learning Gautier Izacard Mathilde Caron Lucas Hosseini Sebastian Riedel Piotr Bojanowski Armand Joulin Edouard Grave RALM 306 929 0 16 Dec 2021
Large Dual Encoders Are Generalizable Retrievers Jianmo Ni Chen Qu Jing Lu Zhuyun Dai Gustavo Hernández Ábrego ... Vincent Zhao Yi Luan Keith B. Hall Ming-Wei Chang Yinfei Yang DML 172 465 0 15 Dec 2021
Generating Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution Ron Shmelkin Tomer Friedlander Lior Wolf CVBM 94 13 0 01 Aug 2021
SimCSE: Simple Contrastive Learning of Sentence Embeddings Tianyu Gao Xingcheng Yao Danqi Chen AILaw SSL 306 3,450 0 18 Apr 2021
Adversarial Semantic Collisions Congzheng Song Alexander M. Rush Vitaly Shmatikov AAML 93 52 0 09 Nov 2020
Approximate Nearest Neighbor Negative Contrastive Learning for Dense Text Retrieval Lee Xiong Chenyan Xiong Ye Li Kwok-Fung Tang Jialin Liu Paul N. Bennett Junaid Ahmed Arnold Overwijk 162 1,241 0 01 Jul 2020
MPNet: Masked and Permuted Pre-training for Language Understanding Kaitao Song Xu Tan Tao Qin Jianfeng Lu Tie-Yan Liu 111 1,142 0 20 Apr 2020
Dense Passage Retrieval for Open-Domain Question Answering Vladimir Karpukhin Barlas Oğuz Sewon Min Patrick Lewis Ledell Yu Wu Sergey Edunov Danqi Chen Wen-tau Yih RALM 256 3,816 0 10 Apr 2020
Adversarial Ranking Attack and Defense Mo Zhou Zhenxing Niu Le Wang Qilin Zhang G. Hua 156 39 0 26 Feb 2020
MiniLM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers Wenhui Wang Furu Wei Li Dong Hangbo Bao Nan Yang Ming Zhou VLM 297 1,286 0 25 Feb 2020
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer Colin Raffel Noam M. Shazeer Adam Roberts Katherine Lee Sharan Narang Michael Matena Yanqi Zhou Wei Li Peter J. Liu AIMat 993 20,462 0 23 Oct 2019
How Contextual are Contextualized Word Representations? Comparing the Geometry of BERT, ELMo, and GPT-2 Embeddings Kawin Ethayarajh 124 879 0 02 Sep 2019
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks Nils Reimers Iryna Gurevych 1.4K 12,365 0 27 Aug 2019
Universal Adversarial Triggers for Attacking and Analyzing NLP Eric Wallace Shi Feng Nikhil Kandpal Matt Gardner Sameer Singh AAML SILM 137 879 0 20 Aug 2019
Better the Devil you Know: An Analysis of Evasion Attacks using Out-of-Distribution Adversarial Examples Vikash Sehwag A. Bhagoji Liwei Song Chawin Sitawarin Daniel Cullina M. Chiang Prateek Mittal OODD 79 26 0 05 May 2019
PAWS: Paraphrase Adversaries from Word Scrambling Yuan Zhang Jason Baldridge Luheng He 95 545 0 01 Apr 2019
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova VLM SSL SSeg 2.0K 95,668 0 11 Oct 2018
Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks Ali Shafahi Wenjie Huang Mahyar Najibi Octavian Suciu Christoph Studer Tudor Dumitras Tom Goldstein AAML 110 1,101 0 03 Apr 2018
Evasion Attacks against Machine Learning at Test Time Battista Biggio Igino Corona Davide Maiorca B. Nelson Nedim Srndic Pavel Laskov Giorgio Giacinto Fabio Roli AAML 214 2,160 0 21 Aug 2017
Towards Deep Learning Models Resistant to Adversarial Attacks Aleksander Madry Aleksandar Makelov Ludwig Schmidt Dimitris Tsipras Adrian Vladu SILM OOD 530 12,186 0 19 Jun 2017
Intriguing properties of neural networks Christian Szegedy Wojciech Zaremba Ilya Sutskever Joan Bruna D. Erhan Ian Goodfellow Rob Fergus AAML 325 15,004 1 21 Dec 2013
Poisoning Attacks against Support Vector Machines Battista Biggio B. Nelson Pavel Laskov AAML 169 1,601 0 27 Jun 2012