Dr C.Bour, 7 sept 2021
Pas assez de preuves de bonne qualité pour envisager un remplacement de radiologues humains par la technologie de l’intelligence artificielle (IA) dans le dépistage du cancer du sein.
Utilisation de l’intelligence artificielle pour l’analyse d’images dans les programmes de dépistage du cancer du sein : examen systématique de la précision des tests
BMJ 2021 ; 374 doi : https://doi.org/10.1136/bmj.n1872 (Publié le 02 septembre 2021)
L’expertise et l’analyse humaines semblent toujours surpasser la technologie, explique un article du BMJ.
Depuis 2019 déjà sont publiés des articles vantant les mérites de l’IA comme méthode innovante pouvant « prédire » les tumeurs du sein, méthode qui révolutionnerait à l’avenir le dépistage.
Nous nous en étions fait l’écho ici : https://cancer-rose.fr/2019/06/05/intelligence-artificielle-de-prediction/ et ici : https://cancer-rose.fr/2019/04/08/depistage-et-intelligence-artificielle/
Qu’en est-il en 2021 ?
Cette revue systématique, effectuée par des chercheurs de l’université de Warwick (Coventry, RU) examine l’exactitude de l’IA pour rechercher et anticiper les tumeurs mammaires.
Méthode :
Des recherches bibliographiques ont été effectuées pour regrouper 12 études publiées entre le 1er janvier 2010 et le 9 septembre 2020, concernant 131.822 femmes de Suède, Etats-Unis, Allemagne, Pays-Bas et Espagne.
Les bases de données consultées étaient Medline, Embase,; Web of Science et la base de données Cochrane des revues systématiques.
Le critère de sélection des études : rapporter la précision des tests d’algorithmes d’IA dans la détection du cancer lors les mammographies numériques au sein de la pratique du dépistage, quand ces système d’IA étaient utilisés seuls ou en association avec l’examen réalisé par des radiologues.
La norme de référence était : cancer confirmé par l’analyse histologique d’échantillons de biopsie lors du dépistage, ou la présentation d’un symptôme par la femme (pour les femmes non dépistées.)
Les résultats incluaient la précision du test (en fonction de la biopsie) et le type de cancer détecté.
Résultats :
De façon générale, la qualité des méthodes employées dans les 12 études était mauvaise et les possibilités d’application aux programmes européens ou britanniques du dépistage du cancer du sein étaient inférieures au dispositif actuel avec « humains ».
La majorité des systèmes d’IA évalués dans trois grandes études comparant les systèmes IA et les décisions cliniques du radiologue étaient moins précis qu’un radiologue unique, et tous les systèmes étaient moins précis que l’avis conjoint de deux radiologues ou plus, ce qui est la pratique courante en Europe (double lecture).
En revanche, cinq plus petites études rapportaient que les systèmes d’IA évalués étaient plus performants qu’un seul radiologue, mais les chercheurs de cette revue de littérature notent que les résultats prometteurs des petites études n’étaient pas reproduits ni retrouvés dans les études de plus grande ampleur.
Conclusions :
L’utilisation de critères très rigoureux de la part des auteurs de Warwick pour l’inclusion d’études contribuent à la robustesse de leurs conclusions : il y a actuellement un manque de preuves de bonne qualité pour remplacer des radiologues humains par la technologie IA pour le cancer du sein. Plus exactement : « La preuve actuelle sur l’utilisation des systèmes d’IA dans le dépistage du cancer du sein est loin d’avoir la qualité et la quantité exigées pour sa mise en place dans la pratique clinique. »
Les études étaient de mauvaise qualité méthodologique et aucune étude prospective[1] mesurant la précision des tests d’IA dans la pratique du dépistage n’a été trouvée dans la revue de littérature.
Pour les auteurs :
Il n’est pas clair où l’IA pourrait contributive. Les systèmes d’IA ne sont pas suffisamment spécifiques pour remplacer la double lecture des radiologues dans les programmes de dépistage.
Les résultats prometteurs de petites études ne sont pas retrouvés dans les plus grandes études.
Les preuves actuelles sur l’utilisation des systèmes d’IA dans le dépistage du cancer du sein sont loin d’avoir la qualité et la quantité requises pour sa mise en œuvre dans la pratique.
Des études prospectives, et des études comparatives bien conçues sur la précision des tests, des essais contrôlés randomisés et des études de cohorte dans de grandes populations de dépistage seront nécessaires pour évaluer les systèmes d’IA disponibles actuellement en association avec des radiologues.
Pour synthétiser, retenons :
- Les preuves actuelles sur l’utilisation des systèmes d’IA dans le dépistage du cancer du sein sont de qualité et de quantité insuffisantes pour être mises en œuvre dans la pratique clinique
- Dans les études rétrospectives disponibles étudiant la précision des tests utilisant l’IA, 94 % des systèmes IA étaient moins précis que le radiologue d’origine, et tous étaient moins précis que le consensus initial de deux radiologues ; une évaluation prospective est requise.
Bref, l’utilisation de l’IA dans le dépistage, ce n’est pas demain.
Sur le même sujet lire aussi :
Intelligence artificielle de prédiction
Dépistage et intelligence artificielle
Une étude pilote multi-lecteurs sur la détection du cancer du poumon par radiographie thoracique
Cette étude a pour objectif d’examiner si des résultats de l’intelligence artificielle (IA) incorrects ont un impact sur les performances du radiologue et, dans l’affirmative, si les facteurs humains peuvent être optimisés pour réduire les erreurs.
L’étude conclut qu’une IA incorrecte amène les radiologues à prendre des décisions de suivi incorrectes, alors qu’elles étaient correctes sans IA. Cet effet est atténué lorsque les radiologues pensent que l’IA sera supprimée du dossier du patient ou qu’un encadré est fourni autour de la région d’intérêt.
Conclusion détaillée et implications :
L’IA a souvent raison mais parfois tort. Puisque nous ne savons pas quand elle est exacte, nous devons considérer comment minimiser la mesure dans laquelle les radiologues sont influencés par des résultats incorrects. Dans cette étude, les auteurs montrent que des résultats d’IA incorrects peuvent influencer un radiologue à prendre une mauvaise décision. Cependant, cet effet est atténué lorsque les radiologues sont informés que les résultats de l’IA sont supprimés, plutôt que conservés, dans le dossier du patient, et lorsque l’IA fournit une boîte qui décrit visuellement les régions suspectes (la ‘boîte’ est un cadre visuel qui s’affiche sur l’écran d’interprétation, généré par l’IA, autour d’une image jugée suspecte et à étudier particulièrement par le radiologue-NDLR) .
En fait, l’IA qui incluait une boîte améliorait les performances des radiologues que l’IA soit correcte ou incorrecte .
Selon l’étude les facteurs humains de l’IA peuvent avoir un impact sur les radiologues.
Pour améliorer les soins aux patients, les cabinets de radiologie doivent tenir compte de la manière dont l’IA est mise en œuvre. Les sociétés de radiologie devraient formuler des lignes directrices, disent les auteurs, à l’intention des radiologues, concernant l’intégration des résultats de l’IA dans le compte rendu des examens. De plus, les radiologues devraient être formés aux meilleures pratiques d’utilisation clinique des outils d’IA.
Note :
[1] Dans les études dites « prospectives », la période de suivi débute à la date de mise en place de l’enquête ; diverses données sont alors recueillies : questionnaires, tests fonctionnels, indicateurs biologiques, etc.
🛈 Nous sommes un collectif de professionnels de la santé, rassemblés en association. Nous agissons et fonctionnons sans publicité, sans conflit d’intérêt, sans subvention. Merci de soutenir notre action sur HelloAsso.
🛈 We are an French non-profit organization of health care professionals. We act our activity without advertising, conflict of interest, subsidies. Thank you to support our activity on HelloAsso.