ERASER: A Benchmark to Evaluate Rationalized NLP Models

8 November 2019

Papers citing "ERASER: A Benchmark to Evaluate Rationalized NLP Models"

50 / 138 papers shown

Title
Uncertainty-Aware Large Language Models for Explainable Disease Diagnosis Shuang Zhou Jiashuo Wang Zidu Xu Song Wang David Brauer ... Zaifu Zhan Yu Hou Mingquan Lin Genevieve B. Melton Rui Zhang 53 0 0 06 May 2025
Adversarial Cooperative Rationalization: The Risk of Spurious Correlations in Even Clean Datasets Wei Liu Zhongyu Niu Lang Gao Zhiying Deng Jun Wang Haozhao Wang Ruixuan Li 140 1 0 04 May 2025
PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications Trisanth Srinivasan Santosh Patapati 39 0 0 03 May 2025
Gender Bias in Explainability: Investigating Performance Disparity in Post-hoc Methods Mahdi Dhaini Ege Erdogan Nils Feldhus Gjergji Kasneci 49 0 0 02 May 2025
Walk the Talk? Measuring the Faithfulness of Large Language Model Explanations Katie Matton Robert Osazuwa Ness John Guttag Emre Kıcıman 21 2 0 19 Apr 2025
A Unified Framework with Novel Metrics for Evaluating the Effectiveness of XAI Techniques in LLMs Melkamu Mersha Mesay Gemeda Yigezu Hassan Shakil Ali Al shami SangHyun Byun Jugal Kalita 62 0 0 06 Mar 2025
Self-Rationalization in the Wild: A Large Scale Out-of-Distribution Evaluation on NLI-related tasks Jing Yang Max Glockner Anderson de Rezende Rocha Iryna Gurevych LRM 73 1 0 07 Feb 2025
Regularization, Semi-supervision, and Supervision for a Plausible Attention-Based Explanation Duc Hau Nguyen Cyrielle Mallart Guillaume Gravier Pascale Sébillot 60 0 0 22 Jan 2025
Attention Mechanisms Don't Learn Additive Models: Rethinking Feature Importance for Transformers Tobias Leemann Alina Fastowski Felix Pfeiffer Gjergji Kasneci 62 4 0 10 Jan 2025
FitCF: A Framework for Automatic Feature Importance-guided Counterfactual Example Generation Qianli Wang Nils Feldhus Simon Ostermann Luis Felipe Villa-Arenas Sebastian Möller Vera Schmitt AAML 34 0 0 01 Jan 2025
Beyond Label Attention: Transparency in Language Models for Automated Medical Coding via Dictionary Learning John Wu David Wu Jimeng Sun 52 1 0 31 Oct 2024
F-Fidelity: A Robust Framework for Faithfulness Evaluation of Explainable AI Xu Zheng Farhad Shirani Zhuomin Chen Chaohao Lin Wei Cheng Wenbo Guo Dongsheng Luo AAML 38 0 0 03 Oct 2024
DILA: Dictionary Label Attention for Mechanistic Interpretability in High-dimensional Multi-label Medical Coding Prediction John Wu David Wu Jimeng Sun 109 0 0 16 Sep 2024
Explainable Artificial Intelligence: A Survey of Needs, Techniques, Applications, and Future Direction Melkamu Mersha Khang Lam Joseph Wood Ali AlShami Jugal Kalita XAI AI4TS 69 28 0 30 Aug 2024
Counterfactuals As a Means for Evaluating Faithfulness of Attribution Methods in Autoregressive Language Models Sepehr Kamahi Yadollah Yaghoobzadeh 53 0 0 21 Aug 2024
An Investigation Into Explainable Audio Hate Speech Detection Jinmyeong An Wonjun Lee Yejin Jeon Jungseul Ok Yunsu Kim Gary Geunbae Lee 28 2 0 12 Aug 2024
DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models Bowen Wang Jiuyang Chang Yiming Qian Guoxin Chen Junhao Chen Zhouqiang Jiang Jiahao Zhang Yuta Nakashima Hajime Nagahara LM&MA ELM LRM 40 3 0 04 Aug 2024
Exploring the Plausibility of Hate and Counter Speech Detectors with Explainable AI Adrian Jaques Böck D. Slijepcevic Matthias Zeppelzauer 44 0 0 25 Jul 2024
Explanation Regularisation through the Lens of Attributions Pedro Ferreira Wilker Aziz Ivan Titov 43 1 0 23 Jul 2024
Evaluating Human Alignment and Model Faithfulness of LLM Rationale Mohsen Fayyaz Fan Yin Jiao Sun Nanyun Peng 65 3 0 28 Jun 2024
Evaluating Saliency Explanations in NLP by Crowdsourcing Xiaotian Lu Jiyi Li Zhen Wan Xiaofeng Lin Koh Takeuchi Hisashi Kashima XAI FAtt LRM 27 1 0 17 May 2024
Evaluation of Retrieval-Augmented Generation: A Survey Hao Yu Aoran Gan Kai Zhang Shiwei Tong Qi Liu Zhaofeng Liu 3DV 62 82 0 13 May 2024
Accurate estimation of feature importance faithfulness for tree models Mateusz Gajewski Adam Karczmarz Mateusz Rapicki Piotr Sankowski 37 0 0 04 Apr 2024
Exploring the Trade-off Between Model Performance and Explanation Plausibility of Text Classifiers Using Human Rationales Lucas Resck Marcos M. Raimundo Jorge Poco 50 1 0 03 Apr 2024
Towards Faithful Explanations: Boosting Rationalization with Shortcuts Discovery Linan Yue Qi Liu Yichao Du Li Wang Weibo Gao Yanqing An 34 5 0 12 Mar 2024
Evaluating Webcam-based Gaze Data as an Alternative for Human Rationale Annotations Stephanie Brandl Oliver Eberle Tiago F. R. Ribeiro Anders Søgaard Nora Hollenstein 40 1 0 29 Feb 2024
Explainable Depression Symptom Detection in Social Media Eliseo Bao Souto Anxo Perez Javier Parapar 30 5 0 20 Oct 2023
Evaluating Explanation Methods for Vision-and-Language Navigation Guanqi Chen Lei Yang Guanhua Chen Jia Pan XAI 23 0 0 10 Oct 2023
InterroLang: Exploring NLP Models and Datasets through Dialogue-based Explanations Nils Feldhus Qianli Wang Tatiana Anikina Sahil Chopra Cennet Oguz Sebastian Möller 32 9 0 09 Oct 2023
Robust Ranking Explanations Chao Chen Chenghua Guo Guixiang Ma Ming Zeng Xi Zhang Sihong Xie FAtt AAML 35 0 0 08 Jul 2023
Explanation Graph Generation via Generative Pre-training over Synthetic Graphs H. Cui Sha Li Yu Zhang Qi Shi 19 1 0 01 Jun 2023
Check-COVID: Fact-Checking COVID-19 News Claims with Scientific Evidence Gengyu Wang Kate Harwood Lawrence Chillrud Amith Ananthram Melanie Subbiah Kathleen McKeown HILM 13 22 0 29 May 2023
Consistent Multi-Granular Rationale Extraction for Explainable Multi-hop Fact Verification Jiasheng Si Yingjie Zhu Deyu Zhou AAML 52 3 0 16 May 2023
GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark Dongyang Li Ruixue Ding Qiang-Wei Zhang Zheng Li Boli Chen ... Yao Xu Xin Li Ning Guo Fei Huang Xiaofeng He ELM VLM 34 5 0 11 May 2023
Are Human Explanations Always Helpful? Towards Objective Evaluation of Human Natural Language Explanations Bingsheng Yao Prithviraj Sen Lucian Popa James A. Hendler Dakuo Wang XAI ELM FAtt 25 10 0 04 May 2023
Finding the Needle in a Haystack: Unsupervised Rationale Extraction from Long Text Classifiers Kamil Bujel Andrew Caines H. Yannakoudakis Marek Rei AI4TS 19 1 0 14 Mar 2023
Towards Reconciling Usability and Usefulness of Explainable AI Methodologies Pradyumna Tambwekar Matthew C. Gombolay 28 8 0 13 Jan 2023
Explainable AI for Bioinformatics: Methods, Tools, and Applications Md. Rezaul Karim Tanhim Islam Oya Beyan Christoph Lange Michael Cochez Dietrich-Rebholz Schuhmann Stefan Decker 29 68 0 25 Dec 2022
Convolution-enhanced Evolving Attention Networks Yujing Wang Yaming Yang Zhuowan Li Jiangang Bai Mingliang Zhang Xiangtai Li Jiahao Yu Ce Zhang Gao Huang Yu Tong ViT 27 6 0 16 Dec 2022
Going Beyond XAI: A Systematic Survey for Explanation-Guided Learning Yuyang Gao Siyi Gu Junji Jiang S. Hong Dazhou Yu Liang Zhao 29 39 0 07 Dec 2022
Truthful Meta-Explanations for Local Interpretability of Machine Learning Models Ioannis Mollas Nick Bassiliades Grigorios Tsoumakas 18 3 0 07 Dec 2022
Exploring Faithful Rationale for Multi-hop Fact Verification via Salience-Aware Graph Learning Jiasheng Si Yingjie Zhu Deyu Zhou 34 12 0 02 Dec 2022
AutoCAD: Automatically Generating Counterfactuals for Mitigating Shortcut Learning Jiaxin Wen Yeshuang Zhu Jinchao Zhang Jie Zhou Minlie Huang CML AAML 22 8 0 29 Nov 2022
SEAT: Stable and Explainable Attention Lijie Hu Yixin Liu Ninghao Liu Mengdi Huai Lichao Sun Di Wang OOD 32 18 0 23 Nov 2022
MEGAN: Multi-Explanation Graph Attention Network Jonas Teufel Luca Torresi Patrick Reiser Pascal Friederich 26 8 0 23 Nov 2022
GLUE-X: Evaluating Natural Language Understanding Models from an Out-of-distribution Generalization Perspective Linyi Yang Shuibai Zhang Libo Qin Yafu Li Yidong Wang Hanmeng Liu Jindong Wang Xingxu Xie Yue Zhang ELM 44 79 0 15 Nov 2022
What Makes a Good Explanation?: A Harmonized View of Properties of Explanations Zixi Chen Varshini Subhash Marton Havasi Weiwei Pan Finale Doshi-Velez XAI FAtt 33 18 0 10 Nov 2022
Towards Human-Centred Explainability Benchmarks For Text Classification Viktor Schlegel Erick Mendez Guzman R. Batista-Navarro 20 5 0 10 Nov 2022
Why Is It Hate Speech? Masked Rationale Prediction for Explainable Hate Speech Detection Jiyun Kim Byounghan Lee Kyung-ah Sohn 21 13 0 01 Nov 2022
XMD: An End-to-End Framework for Interactive Explanation-Based Debugging of NLP Models Dong-Ho Lee Akshen Kadakia Brihi Joshi Aaron Chan Ziyi Liu ... Takashi Shibuya Ryosuke Mitani Toshiyuki Sekiya Jay Pujara Xiang Ren LRM 40 9 0 30 Oct 2022