Finding and Visualizing Weaknesses of Deep Reinforcement Learning Agents

Finding and Visualizing Weaknesses of Deep Reinforcement Learning Agents

2 April 2019

Christian Rupprecht

Papers citing "Finding and Visualizing Weaknesses of Deep Reinforcement Learning Agents"

7 / 7 papers shown

Title
ASQ-IT: Interactive Explanations for Reinforcement-Learning Agents Yotam Amitai Guy Avni Ofra Amir 45 3 0 24 Jan 2023
Introspection-based Explainable Reinforcement Learning in Episodic and Non-episodic Scenarios Niclas Schroeter Francisco Cruz S. Wermter 22 2 0 23 Nov 2022
Trustworthy Reinforcement Learning Against Intrinsic Vulnerabilities: Robustness, Safety, and Generalizability Mengdi Xu Zuxin Liu Peide Huang Wenhao Ding Zhepeng Cen Bo-wen Li Ding Zhao 79 45 0 16 Sep 2022
A Survey of Explainable Reinforcement Learning Stephanie Milani Nicholay Topin Manuela Veloso Fei Fang XAI LRM 30 52 0 17 Feb 2022
Red Teaming Language Models with Language Models Ethan Perez Saffron Huang Francis Song Trevor Cai Roman Ring John Aslanides Amelia Glaese Nat McAleese G. Irving AAML 13 611 0 07 Feb 2022
Understanding Learned Reward Functions Eric J. Michaud Adam Gleave Stuart J. Russell XAI OffRL 30 33 0 10 Dec 2020
Exploratory Not Explanatory: Counterfactual Analysis of Saliency Maps for Deep Reinforcement Learning Akanksha Atrey Kaleigh Clary David D. Jensen FAtt LRM 19 90 0 09 Dec 2019