Matrices de confusion

De Poids-plume
Version datée du 16 décembre 2020 à 12:24 par Alex (discussion | contributions) (Ajout de la catégorie "Aide du site")
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche


Exemple de matrice de confusion

Une matrice de confusion présente la classification réalisée par un algorithme par rapport à la vraie classification (faite par l'utilisateur). Dans le cadre du projet Poids-Plume, les matrices de confusions représentent la plupart du temps la classification automatique des espèces par rapport à celle faites en annotant les vidéos manuellement.

La diagonale de la matrice (les cases vertes) contient la proportion des vidéos correctement classifiées pour une espèce annotée (une ligne dans le graphe). Les cases hors diagonale représentent les proportions de vidéos incorrectement classifiées comme une autre espèce. Par exemple, dans l'exemple ci-contre, la ligne "Moineau domestique" indique que 99.7% des vidéos annotées comme tel sont correctement classifiée en "Moineau domestique" par l'algorithme, le restant étant classifié en "Mésange charbonnière" (0.3%). Les lignes grises correspondent à des espèces qui ont été annotée manuellement mais pour lesquelles la classification automatique n'est pas active.

Sur la plate-forme, on trouve deux types de matrices de confusion:

  • La matrice de confusion sur les données d'entraînement, qui représente la performance du modèle sur les données qui ont servi à faire l'apprentissage
  • La matrice de confusion sur les données observées, qui représente la performance du modèle sur les nouvelles données, celles qui ont été étiquetées depuis le dernier apprentissage. Cette matrice est donc plus proche des performances qu'on peut attendre en pratique de la reconnaissance automatique.