Médical et Santé

Diagnostic de cancer du sein

Cette étude montre comment xtractis améliore le diagnostic du cancer à partir d’images de cellules mammaires pour aider l’anatomo-pathologiste à prendre une décision plus précoce, plus rapide et plus fiable. Le médecin pourra ainsi suggérer un traitement prioritaire des patients les plus à risque, ou éviter à certains patients des chimiothérapies ou des radiothérapies inutiles.

Les avantages : diagnostics rapides et systématiques, diagnostic rendu plus accessible dans les déserts médicaux, coût moindre pour les systèmes d’assurance maladie, meilleure prise en charge des patients (douleurs, durée du traitement)…

upd 1807 - Résultats par xtractis® Generate 9.2.21161

TYPE DE MODÉLISATION

Modèle de Classification : cas bénin / cas malin.

DONNÉES D'APPRENTISSAGE

Les données sont issues de photos de cellules de biopsies mammaires. Un traitement d’image a été préalablement réalisé sur chacune des photos pour générer des descripteurs topologiques et géométriques, interprétables par l’expert humain (surface, symétrie, concavité, compacité, rayon, texture, périmètre, dimension fractale…).

Dimension des données : 569 images de patients, 30 descripteurs de cellules.

Sortie à 2 classes : 357 images classées en diagnostic Bénin (0) soit 62.7% des cas et 212 images classées en diagnostic Malin (1) soit 37.3%.

Données : Dr. William H. Wolberg, W. Nick Street, Olvi L. Mangasarian.
University of Wisconsin [UCI Machine Learning Repository]
http://archive.ics.uci.edu/ml

SOLUTION XTRACTIS

Grâce à leur intelligence collective et évolutive, les robots xtractis explorent 2 000 stratégies différentes d’apprentissage inductif, puis sélectionnent la stratégie la plus performante pour former un collège d’experts virtuels. Ce collège permettra de diagnostiquer la présence ou l’absence d’un cancer.

Dimension du collège :  20 modèles combinant 180 règles en tout (3 à 16 règles par modèle) et utilisant les 30 variables prédictives (21 à 30 variables par modèle), chaque règle n’utilisant pas nécessairement toutes les variables.

L’agrégateur du collège est la moyenne des degrés de Possibilité normalisés.

CRITÈRES DE PERFORMANCE

La performance du collège des 20 modèles est mesurée grâce à la validation croisée: 100 partitionnements aléatoires composés de 40% de points en training, 40% en validation et 20% en testing. Les points de training sont utilisés pour créer le modèle, les points de validation sont utilisés pour évaluer la robustesse ou capacité prédictive du modèle et les points de testing ne sont utilisés que pour constater la performance réelle du modèle (prédiction sur des cas inconnus du modèle).

Les métriques de performance sont :

  • la Sensitivité (le taux de vrais positifs)
  • la Spécificité (le taux de vrais négatifs)
  • le minimum entre Sensitivité et Spécificité (minSS) car la difficulté est détecter le maximum de cas malins sans se tromper sur les cas bénins
  • le PPV (Positive Predictive Value) : la chance qu’une prédiction de 1 faite par le collège corresponde à un vrai positif
  • le NPV (Negative Predictive Value) :  la chance qu’une prédiction de 0 faite par le collège corresponde à un vrai négatif
  • une erreur globale de classification

résultats

Les niveaux de performance des modèles évalués sur ces critères sont reportés dans les différentes matrices de confusion :

Classification Error & MinSS

COMPRENDRE LES RÉSULTATS

En situations réelles inconnues, xtractis fournit d’excellents résultats :

    • les indicateurs de robustesse sont fiables puisque les résultats réels sont proches des résultats estimés lors de la validation ;
    • excellente Sensitivité : pour 10000 cas réellement malins, xtractis en détecte 9668 ;
    • excellente Spécificité : pour 10000 cas réellement bénins, xtractis en déclare 9887 ;
    • Le minSS est très élevé (96.68%) confirmant la très bonne détection aussi bien des cas malins que des cas bénins. Selon le principe de précaution, les experts humains ont tendance à maximiser la Sensitivité au détriment de la Spécificité, d’où un grand nombre de prescriptions inutiles de chimiothérapie ;
    • une très faible erreur globale de classification : 1.95%, résultat à comparer avec l’erreur moyenne des anatomo-pathologistes (humains) qui est estimée à environ 35% ;
    • En situations opérationnelles, la confiance dans ce système décisionnel prédictif est validée par les très hautes valeurs du PPV et NPV : lorsque le système classe un nouveau dossier comme « malin », il a raison dans 98.08% des cas. Lorsqu’il classe un nouveau dossier comme « bénin », il a raison dans 98.04% des cas.
Fermer le menu

Nous Contacter

Une question ? Laissez-nous un message.

14 Rue du Fonds Pernant

60200 COMPIÈGNE - FRANCE

+33 3 44 23 48 90