Title
Poisoned-MRAG: Knowledge Poisoning Attacks to Multimodal Retrieval Augmented Generation Yinuo Liu Zenghui Yuan Guiyao Tie Jiawen Shi Lichao Sun Lichao Sun Neil Zhenqiang Gong 92 1 0 08 Mar 2025
Universal Adversarial Attack on Aligned Multimodal LLMs Temurbek Rahmatullaev Polina Druzhinina Nikita Kurdiukov Matvey Mikhalchuk Andrey Kuznetsov Anton Razzhigaev AAML 177 0 0 11 Feb 2025
Adversarial Attacks on Both Face Recognition and Face Anti-spoofing Models Fengfan Zhou Qianyu Zhou Hefei Ling Xuequan Lu AAML 113 3 0 27 May 2024
Boosting the Transferability of Adversarial Attacks with Global Momentum Initialization Jiafeng Wang Zhaoyu Chen Kaixun Jiang Dingkang Yang Lingyi Hong Pinxue Guo Yan Wang Wenqiang Zhang AAML 89 29 0 21 Nov 2022
A Survey of Vision-Language Pre-Trained Models Yifan Du Zikang Liu Junyi Li Wayne Xin Zhao VLM 114 185 0 18 Feb 2022
OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework Peng Wang An Yang Rui Men Junyang Lin Shuai Bai Zhikang Li Jianxin Ma Chang Zhou Jingren Zhou Hongxia Yang MLLM ObjD 152 873 0 07 Feb 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong Guosheng Lin MLLM BDL VLM CLIP 542 4,360 0 28 Jan 2022
FLAVA: A Foundational Language And Vision Alignment Model Amanpreet Singh Ronghang Hu Vedanuj Goswami Guillaume Couairon Wojciech Galuba Marcus Rohrbach Douwe Kiela CLIP VLM 99 710 0 08 Dec 2021
Uni-Perceiver: Pre-training Unified Architecture for Generic Perception for Zero-shot and Few-shot Tasks Xizhou Zhu Jinguo Zhu Hao Li Xiaoshi Wu Xiaogang Wang Hongsheng Li Xiaohua Wang Jifeng Dai 104 133 0 02 Dec 2021
UniTAB: Unifying Text and Box Outputs for Grounded Vision-Language Modeling Zhengyuan Yang Zhe Gan Jianfeng Wang Xiaowei Hu Faisal Ahmed Zicheng Liu Yumao Lu Lijuan Wang 93 116 0 23 Nov 2021
Adversarial GLUE: A Multi-Task Benchmark for Robustness Evaluation of Language Models Wei Ping Chejian Xu Shuohang Wang Zhe Gan Yu Cheng Jianfeng Gao Ahmed Hassan Awadallah Yangqiu Song VLM ELM AAML 65 222 0 04 Nov 2021
Towards Transferable Adversarial Attacks on Vision Transformers Zhipeng Wei Jingjing Chen Micah Goldblum Zuxuan Wu Tom Goldstein Yu-Gang Jiang ViT AAML 96 120 0 09 Sep 2021
BadEncoder: Backdoor Attacks to Pre-trained Encoders in Self-Supervised Learning Jinyuan Jia Yupei Liu Neil Zhenqiang Gong SILM SSL 93 159 0 01 Aug 2021
Align before Fuse: Vision and Language Representation Learning with Momentum Distillation Junnan Li Ramprasaath R. Selvaraju Akhilesh Deepak Gotmare Shafiq Joty Caiming Xiong Guosheng Lin FaML 212 1,970 0 16 Jul 2021
ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision Wonjae Kim Bokyung Son Ildoo Kim VLM CLIP 128 1,749 0 05 Feb 2021
Transformers in Vision: A Survey Salman Khan Muzammal Naseer Munawar Hayat Syed Waqas Zamir Fahad Shahbaz Khan M. Shah ViT 305 2,516 0 04 Jan 2021
OpenAttack: An Open-source Textual Adversarial Attack Toolkit Guoyang Zeng Fanchao Qi Qianrui Zhou Ting Zhang Zixian Ma Bairu Hou Yuan Zang Zhiyuan Liu Maosong Sun AAML 169 124 0 19 Sep 2020
A Self-supervised Approach for Adversarial Robustness Muzammal Naseer Salman Khan Munawar Hayat Fahad Shahbaz Khan Fatih Porikli AAML 74 260 0 08 Jun 2020
Perturbing Across the Feature Hierarchy to Improve Standard and Strict Blackbox Attack Transferability Nathan Inkawhich Kevin J. Liang Binghui Wang Matthew J. Inkawhich Lawrence Carin Yiran Chen AAML 45 90 0 29 Apr 2020
Transferable Perturbations of Deep Feature Distributions Nathan Inkawhich Kevin J. Liang Lawrence Carin Yiran Chen AAML 61 86 0 27 Apr 2020
Skip Connections Matter: On the Transferability of Adversarial Examples Generated with ResNets Dongxian Wu Yisen Wang Shutao Xia James Bailey Xingjun Ma AAML SILM 81 313 0 14 Feb 2020
Enhancing Cross-task Black-Box Transferability of Adversarial Examples with Dispersion Reduction Yantao Lu Yunhan Jia Jianyu Wang Bai Li Weiheng Chai Lawrence Carin Senem Velipasalar AAML 59 81 0 22 Nov 2019
LXMERT: Learning Cross-Modality Encoder Representations from Transformers Hao Hao Tan Joey Tianyi Zhou VLM MLLM 247 2,483 0 20 Aug 2019
ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks Jiasen Lu Dhruv Batra Devi Parikh Stefan Lee SSL VLM 231 3,684 0 06 Aug 2019
Is BERT Really Robust? A Strong Baseline for Natural Language Attack on Text Classification and Entailment Di Jin Zhijing Jin Qiufeng Wang Peter Szolovits SILM AAML 179 1,078 0 27 Jul 2019
RoBERTa: A Robustly Optimized BERT Pretraining Approach Yinhan Liu Myle Ott Naman Goyal Jingfei Du Mandar Joshi Danqi Chen Omer Levy M. Lewis Luke Zettlemoyer Veselin Stoyanov AIMat 665 24,528 0 26 Jul 2019
Enhancing Adversarial Example Transferability with an Intermediate Level Attack Qian Huang Isay Katsman Horace He Zeqi Gu Serge J. Belongie Ser-Nam Lim SILM AAML 84 246 0 23 Jul 2019
Visual Entailment: A Novel Task for Fine-Grained Image Understanding Ning Xie Farley Lai Derek Doran Asim Kadav CoGe 114 325 0 20 Jan 2019
TextBugger: Generating Adversarial Text Against Real-world Applications Jinfeng Li S. Ji Tianyu Du Bo Li Ting Wang SILM AAML 211 743 0 13 Dec 2018
A Corpus for Reasoning About Natural Language Grounded in Photographs Alane Suhr Stephanie Zhou Ally Zhang Iris Zhang Huajun Bai Yoav Artzi LRM 103 604 0 01 Nov 2018
Adversarial Example Generation with Syntactically Controlled Paraphrase Networks Mohit Iyyer John Wieting Kevin Gimpel Luke Zettlemoyer AAML GAN 341 719 0 17 Apr 2018
Improving Transferability of Adversarial Examples with Input Diversity Cihang Xie Zhishuai Zhang Yuyin Zhou Song Bai Jianyu Wang Zhou Ren Alan Yuille AAML 106 1,123 0 19 Mar 2018
Towards Deep Learning Models Resistant to Adversarial Attacks Aleksander Madry Aleksandar Makelov Ludwig Schmidt Dimitris Tsipras Adrian Vladu SILM OOD 310 12,117 0 19 Jun 2017
Adversarial Machine Learning at Scale Alexey Kurakin Ian Goodfellow Samy Bengio AAML 472 3,144 0 04 Nov 2016
Neural Machine Translation of Rare Words with Subword Units Rico Sennrich Barry Haddow Alexandra Birch 224 7,745 0 31 Aug 2015
VQA: Visual Question Answering Aishwarya Agrawal Jiasen Lu Stanislaw Antol Margaret Mitchell C. L. Zitnick Dhruv Batra Devi Parikh CoGe 211 5,478 0 03 May 2015
Microsoft COCO Captions: Data Collection and Evaluation Server Xinlei Chen Hao Fang Nayeon Lee Ramakrishna Vedantam Saurabh Gupta Piotr Dollar C. L. Zitnick 215 2,489 0 01 Apr 2015
Explaining and Harnessing Adversarial Examples Ian Goodfellow Jonathon Shlens Christian Szegedy AAML GAN 277 19,066 0 20 Dec 2014
Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks Ian Goodfellow Yaroslav Bulatov Julian Ibarz Sacha Arnoud Vinay D. Shet 102 720 0 20 Dec 2013