UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models

3 November 2024

Papers citing "UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models"

5 / 5 papers shown

Title
GuardReasoner-VL: Safeguarding VLMs via Reinforced Reasoning Yong-Jin Liu Shengfang Zhai Mingzhe Du Yulin Chen Tri Cao ... Xuzhao Li Kun Wang Junfeng Fang Jiaheng Zhang Bryan Hooi OffRL LRM 7 0 0 16 May 2025
No Free Lunch with Guardrails Divyanshu Kumar Nitin Aravind Birur Tanay Baswa Sahil Agarwal P. Harshangi 54 1 0 01 Apr 2025
ScreenLLM: Stateful Screen Schema for Efficient Action Understanding and Prediction Yiqiao Jin Stefano Petrangeli Yu Shen Gang Wu LLMAG LM&Ro 162 0 0 26 Mar 2025
EigenShield: Causal Subspace Filtering via Random Matrix Theory for Adversarially Robust Vision-Language Models Nastaran Darabi Devashri Naik Sina Tayebati Dinithi Jayasuriya Ranganath Krishnan A. R. Trivedi AAML 52 0 0 24 Feb 2025
Jailbreak Attacks and Defenses against Multimodal Generative Models: A Survey Xuannan Liu Xing Cui Peipei Li Zekun Li Huaibo Huang Shuhan Xia Miaoxuan Zhang Yueying Zou Ran He AAML 65 8 0 14 Nov 2024