Performance de l’IA dans le dépistage mammographique, à propos de l’essai MASAI

https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00267-X/fulltext

L’étude MASAI (Mammography Screening with Artificial Intelligence trial), de quoi s’agit-il ?

Il s’agit d’un essai randomisé, contrôlé, en groupes parallèles, de non-infériorité, en simple aveugle, réalisée dans le cadre du programme national de dépistage suédois ; les femmes sont recrutées dans quatre sites de dépistage du sud-ouest de la Suède (Malmö, Lund, Landskrona et Trelleborg) et éligibles au dépistage par mammographie ; elles sont réparties au hasard (1:1) entre deux groupes : l’un soumis à un dépistage assisté par intelligence artificielle (IA) et un autre groupe suivant un dépistage avec la double lecture standard.
Le principal critère d’évaluation de l’essai MASAI est le taux de cancer d’intervalle*, qui sera évalué après que tous les participantes à l’étude auront bénéficié d’un suivi d’au moins deux ans (estimé à décembre 2024 plus 6 mois pour s’assurer que tous les événements sont enregistrés dans le registre du cancer).
Mesures de résultats secondaires : taux de rappel des femmes, détection de cancers, les taux de faux positifs (suspicion d’un cancer qui ne se confirme pas après d’autres examens complémentaires), le type et le stade du cancer détecté et la charge de travail liée à la lecture de l’écran.

*Les cancers de l’intervalle sont des cancers qui surviennent entre deux mammographies, après une mammographie normale.
Ce sont soit des cancers occultes, non visibles et ratés car trop diffus ou présents dans un sein très dense, ou bien ce sont des cancers qui n’existent effectivement pas au moment de l’examen, et puis se développent très vite, dans un laps de temps court.
Il existe en effet des mécaniques d’évolution très différents entre les cancers, avec des formes lentes, très lentes qui n’impacteront pas la santé des femmes, et d’autres au contraire, rapides et agressives, à développement trop véloce pour que le dépistage les détecte ; ces cancers de l’intervalle sont des échecs du dépistage. Lire à ce sujet : https://cancer-rose.fr/2023/06/26/quest-ce-que-lhistoire-naturelle-du-cancer/
et voir : https://cancer-rose.fr/2024/05/30/mecanismes-dun-cancer-du-sein/

Contexte

Depuis 2019 ont été publiés des articles vantant les mérites de l’IA comme méthode innovante pouvant « prédire » les tumeurs du sein, méthode qui révolutionnerait à l’avenir le dépistage mammographique, améliorerait la détection des cancers tout en réduisant la charge de travail pour les radiologues liée à la lecture sur écran, mais il était nécessaire de mieux comprendre l’impact clinique, d’où cet essai MASAI.

Notre collectif avait relayé ici une méta-analyse de 2021 publiée dans le BMJ (recherche bibliographique sur 12 études), dont les auteurs concluaient : il y a actuellement un manque de preuves de bonne qualité pour remplacer des radiologues humains par la technologie IA pour le cancer du sein. Plus exactement : « les données actuelles sur l’IA ne permettent pas encore de juger de sa précision dans les programmes de dépistage du cancer du sein, et l’on ne sait pas exactement à quel stade du parcours clinique l’IA pourrait être le plus utile. Les systèmes d’IA ne sont pas suffisamment spécifiques pour remplacer la double lecture du radiologue dans les programmes de dépistage. Les résultats prometteurs des petites études ne sont pas reproduits dans les grandes études. Des études prospectives sont nécessaires pour mesurer l’effet de l’IA dans la pratique clinique. »
D’où cette essai MASAI pour apprécier l’impact clinique de l’utilisation de l’IA dans le dépistage mammographique.

Résultats de l’essai MASAI et discussion

Principalement, les résultats suggèrent que l’IA contribue à la détection précoce du cancer du sein cliniquement pertinent et réduit la charge de travail des radiologues liée à la lecture des écrans sans augmenter le nombre de faux positifs.

Plus exactement : l’utilisation l’IA comme aide à la détection dans le cadre du dépistage par mammographie a entraîné, disent les auteurs, une augmentation significative de 29 % de la détection du cancer par rapport à la double lecture standard sans IA (6,4 contre 5,0 pour 1000 participantes dépistées), avec un taux de faux positifs similaire et une réduction substantielle de 44 % de la charge de travail liée à la lecture sur écran.
L’augmentation de la détection concernait principalement des cancers invasifs de petite taille et sans envahissement ganglionnaire.
Nous verrons ultérieurement (dans la partie commentaires Cancer Rose) la signification réelle de ces 29%.

Le dépistage assisté par l’IA a donc permis, selon les auteurs, de détecter davantage de cancers invasifs d’un sous-type moléculaire de moins bon pronostic, y compris davantage de cancers triple-négatifs. Les auteurs écrivent : « La forte augmentation du nombre de cancers invasifs de petite taille et sans envahissement ganglionnaire détectés suggère qu’il est possible de réduire le stade du cancer en le détectant plus tôt grâce à l’IA. »
Le principal résultat de l’essai MASAI étant le taux de cancer de l’intervalle, les auteurs supposent que la détection accrue de petits cancers invasifs sans envahissement ganglionnaire dont certains avec des caractéristiques de moins bon pronostic, pourrait entraîner une diminution ultérieure des cancers d’intervalle et des cancers de haut grade de malignité lors du prochain cycle de dépistage ; toutefois ils émettent une première réserve : car pour évaluer la véracité de cette hypothèse et le réel impact clinique, cette supposition devra être confirmée lors d’un suivi à long terme, afin de détecter si réellement le taux de cancers d’intervalle se réduit par rapport aux procédures de dépistage sans IA.

Les auteurs émettent d’autres réserves.
Le dépistage soutenu par l’IA a également entraîné une augmentation relative de la détection des cancers in situ, bien que leur nombre soit inférieur à celui des cancers invasifs. Ces carcinomes in situ alimentent grandement le surdiagnostic, c’est à dire le réservoir de cancers non invasifs dont une très grande proportion ne menacerait pas la vie ni la santé de la femme s’ils n’avaient pas été trouvés. Ce sont alors des diagnostics inutiles, suivis de traitements tout aussi inutiles et agressifs.
Les auteurs notent toutefois qu’il n’y a pas eu d’augmentation du nombre de carcinomes canalaires in situ de bas grade, qui auraient alourdi encore le fardeau du surdiagnostic dans le cadre du dépistage du cancer du sein.
Environ la moitié des carcinomes canalaires in situ supplémentaires détectés étaient de grade nucléaire III, ce qui est considéré comme une détection précoce cliniquement pertinente, car le profil biologique de ces in situ est plus agressif et la probabilité de devenir un cancer invasif est plus élevée.
Cependant, l’autre moitié des in situ trouvés présentait un risque intermédiaire, et cette partie pourrait donc potentiellement aggraver le surdiagnostic lié au dépistage.

Selon les auteurs, concernant les 29% de cancers détectés en plus, cette augmentation rapportée indiquerait une plus grande augmentation de la détection du cancer par l’utilisation de l’IA, mais pourrait aussi être le résultat d’une courbe d’apprentissage des radiologues participants qui se sont habitués à la lecture sur écran avec IA.
Pour eux il est important que les radiologues conservent la décision finale, car l’IA est susceptible de se tromper dans les deux sens, il est donc capital que les radiologues in fine soient là et puissent écarter les résultats potentiellement inexacts signalés par l’IA, afin de maintenir un faible taux de faux positifs.
Les auteurs ont constaté une augmentation non significative de 8 % du taux de rappel dans le groupe d’intervention (dépistage avec IA) par rapport au groupe de contrôle (dépistage sans IA), mais une proportion nettement plus importante des dossiers rappelés dans le groupe dépistage avec IA étaient de vrais positifs, ce qui n’a entraîné que sept faux positifs supplémentaires par rapport au groupe dépistage habituel.
Là encore, un suivi ultérieur montrera l’effet net de cette approche sur les faux positifs.

Il existe donc encore bien des incertitudes, et l’évaluation future des cancers d’intervalle dans le cadre de l’essai MASAI sera instructive, les auteurs insistent également sur la nécessité de réaliser d’autres essais randomisés supplémentaires, afin d’étudier l’effet réel du travail du radiologue avec l’IA et son influence sur la prise de décision médicale.

La charge de travail

L’importante réduction de la charge de travail (presque de moitié) pour les radiologues rendue possible par la procédure de lecture d’imagerie assistée par l’IA permettrait aux radiologues du sein de consacrer plus de temps à des tâches plus complexes centrées sur le patient, avancent les auteurs.
Étant donné que le traitement du cancer du sein et les coûts connexes augmentent avec le stade, la rétrogradation du cancer grâce à une détection plus précoce au moyen de l’IA permettrait de réduire la morbidité et les coûts de traitement.

Les limites de cette étude concernent la généralisation de la procédure avec IA.
L’essai a été réalisé dans le cadre d’un programme de dépistage suédois, à partir de l’âge de 40 ans, avec de faibles taux de rappel de base et l’utilisation d’un seul fournisseur de mammographie et d’IA. La race et l’origine ethnique n’ont pas été enregistrées, car ces données ne sont pas systématiquement collectées dans les cliniques pour des raisons de confidentialité, mais jusqu’à 35 % de la population ciblée est issue de l’immigration selon les statistiques officielles. On sait qu’il peut y avoir des variations en matière de types de cancers du sein liées à l’origine ethnique, et ceci est un facteur qu’il faut pouvoir intégrer si on veut éviter des biais lors de l’interprétation des résultats.

Conclusion des auteurs

Le dépistage assisté par l’IA a principalement contribué à l’augmentation de la détection des petits cancers invasifs sans envahissement ganglionnaire, qui, outre les cancers de bons pronostic, comprenaient aussi des cancers de moins bon pronostic et des cancers invasifs triple-négatifs.

Dans une moindre mesure, on assiste à l’augmentation de la détection des cancers in situ, comprenant une augmentation de la détection des cancers de haut grade sans augmentation de la détection des cancers de bas grade, mais avec une augmentation des in situ de stade intermédiaire.

Dans l’ensemble, l’utilisation de l’IA aurait le potentiel d’augmenter la détection précoce du cancer du sein cliniquement pertinent sans augmenter indûment les dommages causés par les faux positifs et le surdiagnostic du cancer in situ de bas grade, selon l’étude.
Toutefois un suivi plus approfondi du taux de cancer de l’intervalle et du rapport coût-efficacité est nécessaire, et il faut prolonger la durée de l’étude.

Des conclusions plus nuancées d’un éditorial accompagnant l’étude

Les deux auteurs australiens rédacteurs de l’éditorial soulignent que la détection accrue dans la stratégie de dépistage assisté par IA incluait les cancers du sein invasifs, généralement avec des caractéristiques pronostiques favorables et notamment l’absence de métastases ganglionnaires, mais aussi les formes in situ. Pour eux, étant donné que la maladie in situ en particulier peut être cliniquement non progressive, ceci a obligatoirement des implications dans le surdiagnostic et le surtraitement qui en découle. L’assurance concernant la détection précoce de cancers cliniquement progressifs sur la base des caractéristiques descriptives ne nie pas le fait que 30 % de la détection différentielle dans le dépistage assisté par IA était une malignité in situ. Le surdiagnostic ne doit pas être une préoccupation négligée ou minimisée.

Par conséquent, comme l’ont reconnu les auteurs-mêmes de l’essai, il sera nécessaire d’attendre le critère d’évaluation principal de cet essai randomisé, à savoir les taux des cancers d’intervalle, pour démontrer si la détection accrue de cancers dans le dépistage assisté par IA telle que rapportée dans MASAI a eu pour effet de réduire effectivement les taux de cancers du sein les plus agressifs.

Il est probable, à terme, que la double lecture standard des mammographies soit progressivement supprimée des programmes organisés de dépistage du cancer du sein à condition que des essais supplémentaires ou des études de mise en œuvre démontrent une récupération des cancers d’intervalle, les plus menaçants.

Une autre condition est que les lecteurs humains restent un élément central du dépistage, conformément aux attentes des femmes, et dans la mesure où l’IA n’est pas à 100% infaillible. .

Commentaires Cancer Rose

Tout d’abord, dans cet article les taux de détection sont présentés comme significatifs.
D’où viennent les 29% de cancers détectés en plus grâce à l’IA ?
Comme expliqué dans l’article, les taux de détection du cancer étaient, en valeurs absolues, de 6,4 pour 1 000 femmes parmi les participantes dépistées dans le groupe avec IA, et de 5,0 pour 1 000 dans le groupe sans IA.
la différence relative, (c’est à dire en comparant les deux groupes) s’obtient en calculant le ratio du groupe test (avec IA)/ groupe référent (sans IA).
A savoir ici 6,4/5,0 : 1,29 ; l’augmentation relative de détecter un cancer grâce à l’IA est de 1,29-1 = 0,29, à savoir les 29% que les auteurs mettent en avant.

Mais la différence absolue de trouver un cancer grâce à l’IA n’est que de 6,4/1000 – 5,0/1000 = c’est à dire de 1,4 patiente/1000 femmes, soit 0,14%
C’est déjà beaucoup moins impressionnant comme résultat.

En résumé, dans le groupe où l’intelligence artificielle a été utilisée, sur 1000 femmes, le nombre de cancers détectés a été de 6,4 tandis que lorsque l’intelligence artificielle n’a pas été utilisée, sur 1000 femmes, le nombre de cancers détectés a été de 5,0. Cette différence annoncée par les auteurs comme « une augmentation de 29% » est une manière artificiellement gonflée de présenter les choses et d’enjoliver la situation.
Parmi ces 1,4 pour 1000 femmes détectées en plus grâce à l’IA, reste encore à savoir combien sont des cancers invasifs et combien sont des in situ, et font partie des surdiagnostics.

Car le surdiagnostic reste encore et toujours un problème entier, qui ne peut être toléré que s’il est minime et si le dépistage démontre son efficacité significative sur la détections des cancers les plus graves. Cela reste entièrement encore à prouver.

Une préoccupation rarement mise en avant est le facteur humain. D’une part, il faut que le radiologue se garde d’être trop confiant dans cette technologie, et sous couvert d’optimiser le temps gagné, ne contrôle pas les résultats en lui faisant aveuglément confiance.
De même, une autre préoccupation est que le radiologue, étant assisté, perde des capacités et des aptitudes de détection, qui s’acquièrent en grande partie avec le temps et la répétition de l’exercice de lecture des clichés.

Comme les auteurs eux-mêmes l’avancent, l’humain reste indispensable, car d’autres capacités entrent en jeu dans le diagnostic d’un imageur, à savoir son expérience et sa capacité de jugement critique sur un résultat d’IA qui lui paraît discutable.
L’IA n’est pas infaillible, et, en matière de dépistage, il reste à démontrer encore que cette innovation rime avec progrès.


🛈 Nous sommes un collectif de professionnels de la santé, rassemblés en association. Nous agissons et fonctionnons sans publicité, sans conflit d’intérêt, sans subvention. Merci de soutenir notre action sur HelloAsso.
🛈 We are an French non-profit organization of health care professionals. We act our activity without advertising, conflict of interest, subsidies. Thank you to support our activity on HelloAsso.
Retour en haut