Towards a Generic Framework for Black-box Explanation Methods (Extended Version)

Uloženo v:
Podrobná bibliografie
Název: Towards a Generic Framework for Black-box Explanation Methods (Extended Version)
Autoři: Henin, Clement, Le Métayer, Daniel
Přispěvatelé: Henin, Clement
Informace o vydavateli: 2019.
Rok vydání: 2019
Témata: [INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI], transparence des algorithmes, explanability, machine-learning, explications, [INFO] Computer Science [cs], artificial intelligence, Système de décision automatique, apprentissage, intelligence artificielle, Automatic decision system, algorithm transparency, black-box model, explicabilité, modèle boîte-noire
Popis: Dans ce rapport de recherche, nous proposons un cadre générique pour décrire les méthodes d’explication fonctionnant en mode “boîte noire”, l’objectif étant de faciliter la comparaison et la classification de ces méthodes. Nous définissons formellement deux composantes principales, appelées respectivement l’“Echantillonnage” et la “Génération”, qui sont ensuite utilisées pour construire une taxonomie des méthodes d’explication. Nous décrivons aussi précisément la manière dont les méthodes de la littérature s’expriment dans ce cadre.
The main goal of this research report is to define a generic framework for black-box explanation methods in order to make it easier to compare and classify different approaches. We focus on two components of this framework, called respectively “Sampling” and “Generation”, which are characterized formally and used to build a taxonomy of explanation methods. We also describe precisely how each method can be expressed in the framework.
Druh dokumentu: External research report
Popis souboru: application/pdf
Jazyk: English
Přístupová URL adresa: https://inria.hal.science/hal-02131174v5
Přístupové číslo: edsair.dedup.wf.002..3da51e4c8eae44cc2d3da3d157a585d8
Databáze: OpenAIRE
Popis
Abstrakt:Dans ce rapport de recherche, nous proposons un cadre générique pour décrire les méthodes d’explication fonctionnant en mode “boîte noire”, l’objectif étant de faciliter la comparaison et la classification de ces méthodes. Nous définissons formellement deux composantes principales, appelées respectivement l’“Echantillonnage” et la “Génération”, qui sont ensuite utilisées pour construire une taxonomie des méthodes d’explication. Nous décrivons aussi précisément la manière dont les méthodes de la littérature s’expriment dans ce cadre.<br />The main goal of this research report is to define a generic framework for black-box explanation methods in order to make it easier to compare and classify different approaches. We focus on two components of this framework, called respectively “Sampling” and “Generation”, which are characterized formally and used to build a taxonomy of explanation methods. We also describe precisely how each method can be expressed in the framework.