v1v2v3v4 (latest)

ModelShield: Adaptive and Robust Watermark against Model Extraction Attack

3 May 2024

Papers citing "ModelShield: Adaptive and Robust Watermark against Model Extraction Attack"

44 / 44 papers shown

Title
Privacy-preserving Machine Learning in Internet of Vehicle Applications: Fundamentals, Recent Advances, and Future Direction Nazmul Islam Mohammad Zulkernine 76 0 0 03 Mar 2025
Attention Tracker: Detecting Prompt Injection Attacks in LLMs Kuo-Han Hung Ching-Yun Ko Ambrish Rawat I-Hsin Chung Winston H. Hsu Pin-Yu Chen 112 11 0 01 Nov 2024
Defense Against Prompt Injection Attack by Leveraging Attack Techniques Yulin Chen Haoran Li Zihao Zheng Yangqiu Song Dekai Wu Bryan Hooi SILM AAML 143 7 0 01 Nov 2024
WARDEN: Multi-Directional Backdoor Watermarks for Embedding-as-a-Service Copyright Protection Anudeex Shetty Yue Teng Ke He Xingliang Yuan WaLM 74 5 0 03 Mar 2024
Publicly-Detectable Watermarking for Language Models Jaiden Fairoze Sanjam Garg Somesh Jha Saeed Mahloujifar Mohammad Mahmoody Mingyuan Wang WaLM 188 51 0 27 Oct 2023
Mistral 7B Albert Q. Jiang Alexandre Sablayrolles A. Mensch Chris Bamford Devendra Singh Chaplot ... Teven Le Scao Thibaut Lavril Thomas Wang Timothée Lacroix William El Sayed MoE LRM 110 2,246 0 10 Oct 2023
Domain Watermark: Effective and Harmless Dataset Copyright Protection is Closed at Hand Junfeng Guo Yiming Li Lixu Wang Shu-Tao Xia Heng-Chiao Huang Cong Liu Boheng Li 78 61 0 09 Oct 2023
Robust Distortion-free Watermarks for Language Models Rohith Kuditipudi John Thickstun Tatsunori Hashimoto Percy Liang WaLM 90 184 0 28 Jul 2023
Llama 2: Open Foundation and Fine-Tuned Chat Models Hugo Touvron Louis Martin Kevin R. Stone Peter Albert Amjad Almahairi ... Sharan Narang Aurelien Rodriguez Robert Stojnic Sergey Edunov Thomas Scialom AI4MH ALM 408 12,076 0 18 Jul 2023
Undetectable Watermarks for Language Models Miranda Christ Sam Gunn Or Zamir WaLM 64 146 0 25 May 2023
Are You Copying My Model? Protecting the Copyright of Large Language Models for EaaS via Backdoor Watermark Wenjun Peng Jingwei Yi Fangzhao Wu Shangxi Wu Bin Zhu Lingjuan Lyu Binxing Jiao Tongye Xu Guangzhong Sun Xing Xie WaLM 59 66 0 17 May 2023
Protecting Language Generation Models via Invisible Watermarking Xuandong Zhao Yu-Xiang Wang Lei Li WaLM 71 87 0 06 Feb 2023
A Watermark for Large Language Models John Kirchenbauer Jonas Geiping Yuxin Wen Jonathan Katz Ian Miers Tom Goldstein VLM WaLM 113 508 0 24 Jan 2023
How Close is ChatGPT to Human Experts? Comparison Corpus, Evaluation, and Detection Biyang Guo Xin Zhang Ziyuan Wang Minqi Jiang Jinran Nie Yuxuan Ding Jianwei Yue Yupeng Wu DeLMO ELM 116 620 0 18 Jan 2023
Watermarking Pre-trained Language Models with Backdooring Chenxi Gu Chengsong Huang Xiaoqing Zheng Kai-Wei Chang Cho-Jui Hsieh WaLM 46 47 0 14 Oct 2022
Untargeted Backdoor Watermark: Towards Harmless and Stealthy Dataset Copyright Protection Yiming Li Yang Bai Yong Jiang Yong-Liang Yang Shutao Xia Bo Li AAML 120 106 0 27 Sep 2022
CATER: Intellectual Property Protection on Text Generation APIs via Conditional Watermarks Xuanli He Xingliang Yuan Yi Zeng Lingjuan Lyu Fangzhao Wu Jiwei Li R. Jia WaLM 234 75 0 19 Sep 2022
Black-box Dataset Ownership Verification via Backdoor Watermarking Yiming Li Mingyan Zhu Xue Yang Yong Jiang Tao Wei Shutao Xia AAML 76 79 0 04 Aug 2022
Towards Data-Free Model Stealing in a Hard Label Setting Sunandini Sanyal Sravanti Addepalli R. Venkatesh Babu AAML 110 90 0 23 Apr 2022
Evaluating Distributional Distortion in Neural Language Modeling Benjamin LeBrun Alessandro Sordoni Timothy J. O'Donnell 66 23 0 24 Mar 2022
Self-Consistency Improves Chain of Thought Reasoning in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Sharan Narang Aakanksha Chowdhery Denny Zhou ReLM BDL LRM AI4CE 552 3,737 0 21 Mar 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 888 13,207 0 04 Mar 2022
StolenEncoder: Stealing Pre-trained Encoders in Self-supervised Learning Yupei Liu Jinyuan Jia Hongbin Liu Neil Zhenqiang Gong MIACV 72 26 0 15 Jan 2022
Copy, Right? A Testing Framework for Copyright Protection of Deep Learning Models Jialuo Chen Jingyi Wang Tinglan Peng Youcheng Sun Peng Cheng S. Ji Xingjun Ma Yue Liu Basel Alomair AAML 76 63 0 10 Dec 2021
Defending against Model Stealing via Verifying Embedded External Features Yiming Li Linghui Zhu Xiaojun Jia Yong Jiang Shutao Xia Xiaochun Cao AAML 80 64 0 07 Dec 2021
Protecting Intellectual Property of Language Generation APIs with Lexical Watermark Xuanli He Xingliang Yuan Lingjuan Lyu Fangzhao Wu Chenguang Wang WaLM 240 98 0 05 Dec 2021
Mind the Style of Text! Adversarial and Backdoor Attacks Based on Text Style Transfer Fanchao Qi Yangyi Chen Xurui Zhang Mukai Li Zhiyuan Liu Maosong Sun AAML SILM 146 186 0 14 Oct 2021
Student Surpasses Teacher: Imitation Attack for Black-Box NLP APIs Xingliang Yuan Xuanli He Lingjuan Lyu Zhuang Li Gholamreza Haffari MLAU 73 23 0 29 Aug 2021
LoRA: Low-Rank Adaptation of Large Language Models J. E. Hu Yelong Shen Phillip Wallis Zeyuan Allen-Zhu Yuanzhi Li Shean Wang Lu Wang Weizhu Chen OffRL AI4TS AI4CE ALM AIMat 502 10,526 0 17 Jun 2021
Hidden Backdoors in Human-Centric Language Models Shaofeng Li Hui Liu Tian Dong Benjamin Zi Hao Zhao Minhui Xue Haojin Zhu Jialiang Lu SILM 102 154 0 01 May 2021
BODAME: Bilevel Optimization for Defense Against Model Extraction Y. Mori Atsushi Nitanda Akiko Takeda MIACV 65 4 0 11 Mar 2021
Knowledge Distillation: A Survey Jianping Gou B. Yu Stephen J. Maybank Dacheng Tao VLM 177 2,986 0 09 Jun 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 889 42,463 0 28 May 2020
GoEmotions: A Dataset of Fine-Grained Emotions Dorottya Demszky Dana Movshovitz-Attias Jeongwoo Ko Alan S. Cowen Gaurav Nemade Sujith Ravi AI4MH 90 718 0 01 May 2020
Imitation Attacks and Defenses for Black-box Machine Translation Systems Eric Wallace Mitchell Stern Basel Alomair AAML 98 123 0 30 Apr 2020
Defending Against Model Stealing Attacks with Adaptive Misinformation Sanjay Kariyappa Moinuddin K. Qureshi MLAU AAML 54 109 0 16 Nov 2019
Thieves on Sesame Street! Model Extraction of BERT-based APIs Kalpesh Krishna Gaurav Singh Tomar Ankur P. Parikh Nicolas Papernot Mohit Iyyer MIACV MLAU 116 201 0 27 Oct 2019
High Accuracy and High Fidelity Extraction of Neural Networks Matthew Jagielski Nicholas Carlini David Berthelot Alexey Kurakin Nicolas Papernot MLAU MIACV 81 381 0 03 Sep 2019
Prediction Poisoning: Towards Defenses Against DNN Model Stealing Attacks Tribhuvanesh Orekondy Bernt Schiele Mario Fritz AAML 57 166 0 26 Jun 2019
BERTScore: Evaluating Text Generation with BERT Tianyi Zhang Varsha Kishore Felix Wu Kilian Q. Weinberger Yoav Artzi 360 5,872 0 21 Apr 2019
PRADA: Protecting against DNN Model Stealing Attacks Mika Juuti S. Szyller Samuel Marchal Nadarajah Asokan SILM AAML 74 443 0 07 May 2018
Attention Is All You Need Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 805 132,725 0 12 Jun 2017
Membership Inference Attacks against Machine Learning Models Reza Shokri M. Stronati Congzheng Song Vitaly Shmatikov SLR MIALM MIACV 280 4,160 0 18 Oct 2016
Stealing Machine Learning Models via Prediction APIs Florian Tramèr Fan Zhang Ari Juels Michael K. Reiter Thomas Ristenpart SILM MLAU 109 1,811 0 09 Sep 2016