Detecting AI Trojans Using Meta Neural Analysis

8 October 2019

Papers citing "Detecting AI Trojans Using Meta Neural Analysis"

50 / 196 papers shown

Title
On the Security Risks of ML-based Malware Detection Systems: A Survey Ping He Yuhao Mao Changjiang Li Lorenzo Cavallaro Ting Wang Shouling Ji 21 0 0 16 May 2025
Cert-SSB: Toward Certified Sample-Specific Backdoor Defense Ting Qiao Yansen Wang Xing Liu Sixing Wu Jianbing Li Yiming Li AAML SILM 66 0 0 30 Apr 2025
DeBackdoor: A Deductive Framework for Detecting Backdoor Attacks on Deep Models with Limited Data Dorde Popovic Amin Sadeghi Ting Yu Sanjay Chawla Issa M. Khalil AAML 54 0 0 27 Mar 2025
Prototype Guided Backdoor Defense Venkat Adithya Amula Sunayana Samavedam Saurabh Saini Avani Gupta Narayanan P J AAML 50 0 0 26 Mar 2025
Scanning Trojaned Models Using Out-of-Distribution Samples Hossein Mirzaei Ali Ansari Bahar Dibaei Nia Mojtaba Nafez Moein Madadi ... Kian Shamsaie Mahdi Hajialilue Jafar Habibi Mohammad Sabokrou M. Rohban OODD 68 2 0 28 Jan 2025
Data Free Backdoor Attacks Bochuan Cao Jinyuan Jia Chuxuan Hu Wenbo Guo Zhen Xiang Jinghui Chen Bo-wen Li Dawn Song AAML 86 0 0 09 Dec 2024
PEFTGuard: Detecting Backdoor Attacks Against Parameter-Efficient Fine-Tuning Zhen Sun Tianshuo Cong Yule Liu Chenhao Lin Xinlei He Rongmao Chen Xingshuo Han Xinyi Huang AAML 88 3 0 26 Nov 2024
BackdoorMBTI: A Backdoor Learning Multimodal Benchmark Tool Kit for Backdoor Defense Evaluation Haiyang Yu Tian Xie Jiaping Gui Pengyang Wang P. Yi Yue Wu 56 1 0 17 Nov 2024
Solving Trojan Detection Competitions with Linear Weight Classification Todd P. Huster Peter Lin Razvan Stefanescu E. Ekwedike R. Chadha AAML 37 0 0 05 Nov 2024
Long-Tailed Backdoor Attack Using Dynamic Data Augmentation Operations Lu Pang Tao Sun Weimin Lyu Haibin Ling Chong Chen AAML 28 0 0 16 Oct 2024
Meta-Models: An Architecture for Decoding LLM Behaviors Through Interpreted Embeddings and Natural Language Anthony Costarelli Mat Allen Severin Field 27 1 0 03 Oct 2024
Mitigating Backdoor Threats to Large Language Models: Advancement and Challenges Qin Liu Wenjie Mo Terry Tong Lyne Tchapmi Fei Wang Chaowei Xiao Muhao Chen AAML 43 4 0 30 Sep 2024
Psychometrics for Hypnopaedia-Aware Machinery via Chaotic Projection of Artificial Mental Imagery Ching-Chun Chang Kai Gao Shuying Xu Anastasia Kordoni Christopher Leckie Isao Echizen 29 0 0 29 Sep 2024
Persistent Backdoor Attacks in Continual Learning Zhen Guo Abhinav Kumar R. Tourani AAML 35 3 0 20 Sep 2024
Data Poisoning and Leakage Analysis in Federated Learning Wenqi Wei Tiansheng Huang Zachary Yahn Anoop Singhal Margaret Loper Ling Liu FedML SILM 33 0 0 19 Sep 2024
CLIBE: Detecting Dynamic Backdoors in Transformer-based NLP Models Rui Zeng Xi Chen Yuwen Pu Xuhong Zhang Tianyu Du Shouling Ji 43 2 0 02 Sep 2024
Backdoor Defense through Self-Supervised and Generative Learning Ivan Sabolić Ivan Grubišić Siniša Šegvić AAML 62 0 0 02 Sep 2024
Rethinking Backdoor Detection Evaluation for Language Models Jun Yan Wenjie Jacky Mo Xiang Ren Robin Jia ELM 56 3 0 31 Aug 2024
Large Language Models are Good Attackers: Efficient and Stealthy Textual Backdoor Attacks Ziqiang Li Yueqi Zeng Pengfei Xia Lei Liu Zhangjie Fu Bin Li SILM AAML 55 2 0 21 Aug 2024
A Practical Trigger-Free Backdoor Attack on Neural Networks Jiahao Wang Xianglong Zhang Xiuzhen Cheng Pengfei Hu Guoming Zhang AAML 55 0 0 21 Aug 2024
A Survey of Trojan Attacks and Defenses to Deep Neural Networks Lingxin Jin Xianyu Wen Wei Jiang Jinyu Zhan AAML 41 1 0 15 Aug 2024
Towards Clean-Label Backdoor Attacks in the Physical World Thinh Dao Cuong Chi Le Khoa D. Doan Kok-Seng Wong AAML 34 1 0 27 Jul 2024
UNIT: Backdoor Mitigation via Automated Neural Distribution Tightening Shuyang Cheng Guangyu Shen Kaiyuan Zhang Guanhong Tao Shengwei An Hanxi Guo Shiqing Ma Xiangyu Zhang AAML 31 0 0 16 Jul 2024
Model-agnostic clean-label backdoor mitigation in cybersecurity environments Giorgio Severi Simona Boboila J. Holodnak K. Kratkiewicz Rauf Izmailov Alina Oprea Alina Oprea AAML 35 1 0 11 Jul 2024
Mitigating Backdoor Attacks using Activation-Guided Model Editing Felix Hsieh H. Nguyen AprilPyone Maungmaung Dmitrii Usynin Isao Echizen AAML KELM LLMSV 42 0 0 10 Jul 2024
Dye4AI: Assuring Data Boundary on Generative AI Services Shu Wang Kun Sun Yan Zhai 42 1 0 20 Jun 2024
NBA: defensive distillation for backdoor removal via neural behavior alignment Zonghao Ying Bin Wu AAML 26 6 0 16 Jun 2024
PSBD: Prediction Shift Uncertainty Unlocks Backdoor Detection Wei Li Pin-Yu Chen Sijia Liu Ren Wang AAML 49 3 0 09 Jun 2024
Unveiling and Mitigating Backdoor Vulnerabilities based on Unlearning Weight Changes and Backdoor Activeness Weilin Lin Li Liu Shaokui Wei Jianze Li Hui Xiong AAML 53 2 0 30 May 2024
Invisible Backdoor Attack against Self-supervised Learning Hanrong Zhang Zhenting Wang Tingxu Han Mingyu Jin Chenlu Zhan Mengnan Du Hongwei Wang Shiqing Ma Hongwei Wang Shiqing Ma AAML SSL 51 2 0 23 May 2024
Nearest is Not Dearest: Towards Practical Defense against Quantization-conditioned Backdoor Attacks Boheng Li Yishuo Cai Haowei Li Feng Xue Zhifeng Li Yiming Li MQ AAML 37 20 0 21 May 2024
Poser: Unmasking Alignment Faking LLMs by Manipulating Their Internals Joshua Clymer Caden Juang Severin Field CVBM 34 2 0 08 May 2024
CloudFort: Enhancing Robustness of 3D Point Cloud Classification Against Backdoor Attacks via Spatial Partitioning and Ensemble Prediction Wenhao Lan Yijun Yang Haihua Shen Sha Li 3DPC 46 0 0 22 Apr 2024
LOTUS: Evasive and Resilient Backdoor Attacks through Sub-Partitioning Shuyang Cheng Guanhong Tao Yingqi Liu Guangyu Shen Shengwei An Shiwei Feng Xiangzhe Xu Kaiyuan Zhang Shiqing Ma Xiangyu Zhang AAML 35 4 0 25 Mar 2024
Backdoor Secrets Unveiled: Identifying Backdoor Data with Optimized Scaled Prediction Consistency Soumyadeep Pal Yuguang Yao Ren Wang Bingquan Shen Sijia Liu AAML 36 8 0 15 Mar 2024
Model Pairing Using Embedding Translation for Backdoor Attack Detection on Open-Set Classification Tasks A. Unnervik Hatef Otroshi-Shahreza Anjith George S´ebastien Marcel AAML SILM 43 0 0 28 Feb 2024
Model X-ray:Detect Backdoored Models via Decision Boundary Yanghao Su Jie Zhang Ting Xu Tianwei Zhang Weiming Zhang Neng H. Yu AAML 52 1 0 27 Feb 2024
Mudjacking: Patching Backdoor Vulnerabilities in Foundation Models Hongbin Liu Michael K. Reiter Neil Zhenqiang Gong AAML 44 2 0 22 Feb 2024
Purifying Large Language Models by Ensembling a Small Language Model Tianlin Li Qian Liu Tianyu Pang Chao Du Qing Guo Yang Liu Min Lin 53 16 0 19 Feb 2024
Game of Trojans: Adaptive Adversaries Against Output-based Trojaned-Model Detectors D. Sahabandu Xiaojun Xu Arezoo Rajabi Luyao Niu Bhaskar Ramasubramanian Bo Li Radha Poovendran AAML 32 1 0 12 Feb 2024
Comprehensive Assessment of Jailbreak Attacks Against LLMs Junjie Chu Yugeng Liu Ziqing Yang Xinyue Shen Michael Backes Yang Zhang AAML 43 68 0 08 Feb 2024
Preference Poisoning Attacks on Reward Model Learning Junlin Wu Jiong Wang Chaowei Xiao Chenguang Wang Ning Zhang Yevgeniy Vorobeychik AAML 32 5 0 02 Feb 2024
Trustworthy Distributed AI Systems: Robustness, Privacy, and Governance Wenqi Wei Ling Liu 31 16 0 02 Feb 2024
Multi-Trigger Backdoor Attacks: More Triggers, More Threats Yige Li Xingjun Ma Jiabo He Hanxun Huang Yu-Gang Jiang AAML 38 5 0 27 Jan 2024
Backdoor Attack on Unpaired Medical Image-Text Foundation Models: A Pilot Study on MedCLIP Ruinan Jin Chun-Yin Huang Chenyu You Xiaoxiao Li AAML MedIm 30 2 0 01 Jan 2024
UltraClean: A Simple Framework to Train Robust Neural Networks against Backdoor Attacks Bingyin Zhao Yingjie Lao AAML 38 1 0 17 Dec 2023
On the Difficulty of Defending Contrastive Learning against Backdoor Attacks Changjiang Li Ren Pang Bochuan Cao Zhaohan Xi Jinghui Chen Shouling Ji Ting Wang AAML 40 6 0 14 Dec 2023
Defenses in Adversarial Machine Learning: A Survey Baoyuan Wu Shaokui Wei Mingli Zhu Meixi Zheng Zihao Zhu Ruotong Wang Hongrui Chen Danni Yuan Li Liu Qingshan Liu AAML 37 14 0 13 Dec 2023
BELT: Old-School Backdoor Attacks can Evade the State-of-the-Art Defense with Backdoor Exclusivity Lifting Huming Qiu Junjie Sun Mi Zhang Xudong Pan Min Yang AAML 42 4 0 08 Dec 2023
Robust Backdoor Detection for Deep Learning via Topological Evolution Dynamics Xiaoxing Mo Yechao Zhang Leo Yu Zhang Wei Luo Nan Sun Shengshan Hu Shang Gao Yang Xiang AAML 35 16 0 05 Dec 2023