Towards Robustness Against Natural Language Word Substitutions

28 July 2021

Papers citing "Towards Robustness Against Natural Language Word Substitutions"

50 / 70 papers shown

Title
Model Hemorrhage and the Robustness Limits of Large Language Models Ziyang Ma Zehan Li L. Zhang Gui-Song Xia Bo Du Liangpei Zhang Dacheng Tao 59 0 0 31 Mar 2025
Confidence Elicitation: A New Attack Vector for Large Language Models Brian Formento Chuan-Sheng Foo See-Kiong Ng AAML 99 0 0 07 Feb 2025
Tougher Text, Smarter Models: Raising the Bar for Adversarial Defence Benchmarks Yang Wang Chenghua Lin ELM 37 0 0 05 Jan 2025
ProTransformer: Robustify Transformers via Plug-and-Play Paradigm Zhichao Hou Weizhi Gao Yuchen Shen Feiyi Wang Xiaorui Liu VLM 30 2 0 30 Oct 2024
ViANLI: Adversarial Natural Language Inference for Vietnamese Tin Van Huynh Kiet Van Nguyen Ngan Luu-Thuy Nguyen 22 0 0 25 Jun 2024
Exploiting the Layered Intrinsic Dimensionality of Deep Models for Practical Adversarial Training Enes Altinisik Safa Messaoud H. Sencar Hassan Sajjad Sanjay Chawla AAML 48 0 0 27 May 2024
GenFighter: A Generative and Evolutive Textual Attack Removal Md Athikul Islam Edoardo Serra Sushil Jajodia AAML 23 0 0 17 Apr 2024
SemRoDe: Macro Adversarial Training to Learn Representations That are Robust to Word-Level Attacks Brian Formento Wenjie Feng Chuan-Sheng Foo Anh Tuan Luu See-Kiong Ng AAML 34 6 0 27 Mar 2024
Extreme Miscalibration and the Illusion of Adversarial Robustness Vyas Raina Samson Tan V. Cevher Aditya Rawal Sheng Zha George Karypis AAML 41 2 0 27 Feb 2024
Defending Against Weight-Poisoning Backdoor Attacks for Parameter-Efficient Fine-Tuning Shuai Zhao Leilei Gan Anh Tuan Luu Jie Fu Lingjuan Lyu Meihuizi Jia Jinming Wen AAML 26 23 0 19 Feb 2024
Fast Adversarial Training against Textual Adversarial Attacks Yichen Yang Xin Liu Kun He AAML 8 4 0 23 Jan 2024
Toward Stronger Textual Attack Detectors Pierre Colombo Marine Picot Nathan Noiry Guillaume Staerman Pablo Piantanida 49 5 0 21 Oct 2023
Beyond Hard Samples: Robust and Effective Grammatical Error Correction with Cycle Self-Augmenting Zecheng Tang Kaiqi Feng Juntao Li Min Zhang 26 2 0 20 Oct 2023
Fooling the Textual Fooler via Randomizing Latent Representations Duy C. Hoang Quang H. Nguyen Saurav Manchanda MinLong Peng Kok-Seng Wong Khoa D. Doan SILM AAML 15 0 0 02 Oct 2023
Defending Against Alignment-Breaking Attacks via Robustly Aligned LLM Bochuan Cao Yu Cao Lu Lin Jinghui Chen AAML 28 133 0 18 Sep 2023
LimeAttack: Local Explainable Method for Textual Hard-Label Adversarial Attack HaiXiang Zhu Zhaoqing Yang Weiwei Shang Yuren Wu AAML FAtt 10 3 0 01 Aug 2023
Text-CRS: A Generalized Certified Robustness Framework against Textual Adversarial Attacks Xinyu Zhang Hanbin Hong Yuan Hong Peng Huang Binghui Wang Zhongjie Ba Kui Ren SILM 34 18 0 31 Jul 2023
Transferable Adversarial Robustness for Categorical Data via Universal Robust Embeddings Klim Kireev Maksym Andriushchenko Carmela Troncoso Nicolas Flammarion OOD 27 1 0 06 Jun 2023
A Causal View of Entity Bias in (Large) Language Models Fei Wang Wen-An Mo Yiwei Wang Wenxuan Zhou Muhao Chen 30 12 0 24 May 2023
Randomized Smoothing with Masked Inference for Adversarially Robust Text Classifications Han Cheol Moon Shafiq R. Joty Ruochen Zhao Megh Thakkar Xu Chi AAML 16 14 0 11 May 2023
Toward Adversarial Training on Contextualized Language Representation Hongqiu Wu Yong-Jin Liu Han Shi Haizhen Zhao M. Zhang AAML 15 13 0 08 May 2023
The Best Defense is Attack: Repairing Semantics in Textual Adversarial Examples Heng Yang Ke Li AAML 27 2 0 06 May 2023
ANTONIO: Towards a Systematic Method of Generating NLP Benchmarks for Verification Marco Casadio Luca Arnaboldi M. Daggitt Omri Isac Tanvi Dinkar Daniel Kienitz Verena Rieser Ekaterina Komendantskaya 25 4 0 06 May 2023
Prompt as Triggers for Backdoor Attack: Examining the Vulnerability in Language Models Shuai Zhao Jinming Wen Anh Tuan Luu J. Zhao Jie Fu SILM 62 89 0 02 May 2023
RoCOCO: Robustness Benchmark of MS-COCO to Stress-test Image-Text Matching Models Seulki Park Daeho Um Hajung Yoon Sanghyuk Chun Sangdoo Yun Jin Young Choi 38 2 0 21 Apr 2023
Masked Language Model Based Textual Adversarial Example Detection Xiaomei Zhang Zhaoxi Zhang Qi Zhong Xufei Zheng Yanjun Zhang Shengshan Hu L. Zhang AAML 28 2 0 18 Apr 2023
Backdoor Learning for NLP: Recent Advances, Challenges, and Future Research Directions Marwan Omar SILM AAML 33 20 0 14 Feb 2023
Less is More: Understanding Word-level Textual Adversarial Attack via n-gram Frequency Descend Ning Lu Shengcai Liu Zhirui Zhang Qi. Wang Haifeng Liu Jiaheng Zhang AAML 80 5 0 06 Feb 2023
TextShield: Beyond Successfully Detecting Adversarial Sentences in Text Classification Lingfeng Shen Ze Zhang Haiyun Jiang Ying Chen AAML 41 5 0 03 Feb 2023
On Robustness of Prompt-based Semantic Parsing with Large Pre-trained Language Model: An Empirical Study on Codex Terry Yue Zhuo Zhuang Li Yujin Huang Fatemeh Shiri Weiqing Wang Gholamreza Haffari Yuan-Fang Li AAML 26 53 0 30 Jan 2023
TextGrad: Advancing Robustness Evaluation in NLP by Gradient-Driven Optimization Bairu Hou Jinghan Jia Yihua Zhang Guanhua Zhang Yang Zhang Sijia Liu Shiyu Chang SILM AAML 16 21 0 19 Dec 2022
Preserving Semantics in Textual Adversarial Attacks David Herel Hugo Cisneros Tomáš Mikolov AAML 35 6 0 08 Nov 2022
Textual Manifold-based Defense Against Natural Language Adversarial Examples D. M. Nguyen Anh Tuan Luu AAML 19 17 0 05 Nov 2022
Emergent Linguistic Structures in Neural Networks are Fragile Emanuele La Malfa Matthew Wicker Marta Kiatkowska 22 1 0 31 Oct 2022
Disentangled Text Representation Learning with Information-Theoretic Perspective for Adversarial Robustness Jiahao Zhao Wenji Mao DRL OOD 17 3 0 26 Oct 2022
TCAB: A Large-Scale Text Classification Attack Benchmark Kalyani Asthana Zhouhang Xie Wencong You Adam Noack Jonathan Brophy Sameer Singh Daniel Lowd 39 3 0 21 Oct 2022
Probabilistic Categorical Adversarial Attack & Adversarial Training Han Xu Penghei He J. Ren Yuxuan Wan Zitao Liu Hui Liu Jiliang Tang AAML SILM 25 0 0 17 Oct 2022
Rethinking Textual Adversarial Defense for Pre-trained Language Models Jiayi Wang Rongzhou Bao Zhuosheng Zhang Hai Zhao AAML SILM 17 11 0 21 Jul 2022
Certified Robustness Against Natural Language Attacks by Causal Intervention Haiteng Zhao Chang Ma Xinshuai Dong A. Luu Zhi-Hong Deng Hanwang Zhang AAML 33 35 0 24 May 2022
A Word is Worth A Thousand Dollars: Adversarial Attack on Tweets Fools Stock Predictions Yong Xie Dakuo Wang Pin-Yu Chen Jinjun Xiong Sijia Liu Oluwasanmi Koyejo AAML 19 22 0 01 May 2022
Improving robustness of language models from a geometry-aware perspective Bin Zhu Zhaoquan Gu Le Wang Jinyin Chen Qi Xuan AAML 16 9 0 28 Apr 2022
"That Is a Suspicious Reaction!": Interpreting Logits Variation to Detect NLP Adversarial Attacks Edoardo Mosca Shreyash Agarwal Javier Rando Georg Groh AAML 27 30 0 10 Apr 2022
Text Adversarial Purification as Defense against Adversarial Attacks Linyang Li Demin Song Xipeng Qiu AAML 15 14 0 27 Mar 2022
Adversarial Training for Improving Model Robustness? Look at Both Prediction and Interpretation Hanjie Chen Yangfeng Ji OOD AAML VLM 24 21 0 23 Mar 2022
On Robust Prefix-Tuning for Text Classification Zonghan Yang Yang Liu VLM 13 20 0 19 Mar 2022
A Survey of Adversarial Defences and Robustness in NLP Shreyansh Goyal Sumanth Doddapaneni Mitesh M.Khapra B. Ravindran AAML 34 30 0 12 Mar 2022
Robust Textual Embedding against Word-level Adversarial Attacks Yichen Yang Xiaosen Wang Kun He AAML 14 16 0 28 Feb 2022
Constrained Optimization with Dynamic Bound-scaling for Effective NLPBackdoor Defense Guangyu Shen Yingqi Liu Guanhong Tao Qiuling Xu Zhuo Zhang Shengwei An Shiqing Ma Xinming Zhang AAML 13 33 0 11 Feb 2022
Identifying Adversarial Attacks on Text Classifiers Zhouhang Xie Jonathan Brophy Adam Noack Wencong You Kalyani Asthana Carter Perkins Sabrina Reis Sameer Singh Daniel Lowd AAML 24 9 0 21 Jan 2022
Robust Natural Language Processing: Recent Advances, Challenges, and Future Directions Marwan Omar Soohyeon Choi Daehun Nyang David A. Mohaisen 26 57 0 03 Jan 2022