My PEBS par Cancer Rose

Une revue systématique et une évaluation qualité des modèles individualisés de prédiction du risque de cancer du sein

British Journal of Cancer (2019) 121:76–85; https://doi.org/10.1038/s41416-019-0476-8

Javier Louro, Margarita Posso, Michele Hilton Boon, Marta Román, Laia Domingo, Xavier Castells  and María Sala

Synthèse Dr C.Bour, 27 août 2019

Les modèles individualisés de prédiction du risque au cancer du sein sont des éléments fondamentaux sur lesquels se basent les nouvelles approches de dépistage fondées sur le risque individuel de développer un cancer du sein, étant donné qu'ils sont conçus pour quantifier le risque individuel d'une femme à développer un cancer du sein au cours d’une période définie.

Deux de ces logiciels de prédiction du risque seront utilisés dans l'étude Mypebs, étude qui, rappelons-le, doit tester la pertinence d'un dépistage individualisé fondé sur le risque individuel de chaque femme de développer un cancer du sein. On va donc "classer" les femmes du groupe dépistage individuel en sous-groupes, des femmes à risque faible à celle à risque fort et très fort.

De quoi s'agit-il exactement dans Mypebs ?

Il s’agit de vérifier si un dépistage individualisé fondé sur le risque individuel de développer un cancer ne serait pas moins bon que le dépistage standard actuel pour réduire le taux des cancers graves. En effet un dépistage efficace conduit à ce qu'il y ait moins de cancers de stade 2 et + dans la population dépistée. Or, la conception de l'étude stipule que le but est de vérifier si un nouveau dépistage individuel ne conduit pas à une augmentation de plus de 25% du taux de cancers graves, par comparaison avec le dépistage standard. Ce seuil de 25% semble fixé arbitrairement. Donc si après l'étude on trouve 23% ou 24% de cancers graves en plus, les concepteurs de l'étude s'accorderont le droit de dire que les deux modes de dépistage sont équivalents..

Concrètement :

Selon le synopsis de l’étude, dans le groupe standard, on attend la survenue de 480 tumeurs de stade 2 ou plus pour 100 000 femmes au cours des 4 ans de l’essai.

Le synopsis explique que le seuil de non infériorité choisi  « correspond à une augmentation jusqu’à 120/100 000 cancers de stade 2 du taux de risque cumulé sur 4 ans dans le groupe basé sur le risque individuel »

Autrement dit, s’il apparaît 600 cancers avancés / 100 000 femmes (au lieu de 480), soit +25% dans le groupe dépistage individuel, alors il sera considéré comme « non inférieur » ou « équivalent » au dépistage standard.

[1]

Les auteurs de l'article ici présenté évaluent ces outils prédictifs en analysant les études sélectionnées.

La méta-analyse, les logiciels examinés

 

Les études incluses dans la méta-analyse des auteurs peuvent être regroupées selon le modèle de risque qu’elles ont mentionné :

Les auteurs ont estimé la validité des modèles en évaluant deux scores, le pouvoir discriminant du modèle (femmes à risque ou non) et sa "précision de calibration" pour les femmes dans la population générale.

Explication de ces deux critères :

1) Discrimination, c'est le pouvoir de séparer les personnes, c'est une attribution dichotomique en malades/non malades, ou ici femmes à risque/non à risque.

2) Calibration adéquate (calibration accuracy)

La calibration fait référence à l’accord entre les résultats observés et les prévisions, ou dans quelle mesure le risque prédit est proche du risque réel.

Pour évaluer cette calibration, on compare le nombre d’événements prédits et le nombre d'évènements réellement observés.

 

Cette revue systématique se limite aux études publiées en anglais et ne comportait pas une recherche active de littérature "grise", c’est-à-dire non officiellement publiée dans des sources comme livres ou articles de revues. Par conséquent, certains modèles n’ont peut-être pas été identifiés.

Cependant les auteurs estiment avoir effectué une recherche documentaire exhaustive dans Medline, EMBASE et la Cochrane Library, et estiment que la perte d’information attribuable aux critères de sélection de l’étude est faible.

 

Les modèles pour Mypebs [2]

 

L'essai Mypebs allègue l'utilisation de deux modèles : Le modèle américain BCSC qui, selon les concepteurs de Mypebs, a été validé dans les populations françaises de dépistage général du cancer du sein (après ajustement sur l’incidence nationale). Le score du BCSC donnerait de bons résultats dans la cohorte PROCAS du Royaume-Uni, après ajustement sur l’incidence nationale, (mais ces données ne sont pas publiées).

Le modèle Tyrer-Cuzick ou outil IBIS a été largement décrit pour les femmes ayant des antécédents familiaux importants : sa précision est moyenne dans la population générale alors qu’elle serait très élevée dans les populations à risque familial. Ce modèle comprend des informations génétiques qui ajoutent les gènes BRCA et un gène hypothétique de susceptibilité au cancer.

Toutefois le papier original du modèle IBIS ne contient aucune mention de validation, il aurait été validé extérieurement (c'est à dire sur une autre échantillon de personnes que celui sur lequel il a été initialement conçu) avec une estimation de sa précision qui augmente un peu lors de l’ajout de la densité mammographique.[3]

 

Résultats généraux

 

Cette revue systématique comprenait 24 études visant à estimer le risque individuel de développer un cancer du sein chez les femmes de la population générale. Vingt études étaient fondées sur quatre modèles de risque spécifiques (le BCRAT, le BCSC, le modèle Rosner & Colditz et le modèle IBIS), tandis que quatre études utilisaient d’autres modèles originaux.

Le nombre de facteurs de risque inclus dans les modèles variait de 5 à 18. Autre que l’âge, qui était le seul facteur de risque présent dans tous les modèles, La densité mammaire, la maladie bénigne du sein et le score polygénétique étaient présents dans le modèle BCSC.

Bien qu’au cours de la dernière décennie, les modèles aient montré des améliorations dans leur exactitude discriminatoire, ils demeurent au mieux modérés. La précision de calibration était très hétérogène. De plus, la qualité des études n’était pas élevée en raison des limites de l’exactitude discriminante, du plan d’étude et des entrées des données.

Les auteurs ont identifié deux nouvelles tendances en ce qui concerne l’utilisation et le développement des modèles, à savoir l’utilisation accrue du modèle BCSC et l’inclusion de variations génétiques communes dans les modèles de prédiction. Le modèle BCSC a concentré l’attention de plusieurs auteurs au cours des cinq dernières années, bien que son exactitude discriminatoire n’ait pas exceptionnellement augmenté.

Les auteurs de l'article pensent que les modèles inclus dans les études examinées ont une précision discriminatoire et une précision d’étalonnage modérées lorsqu’ils sont appliqués aux femmes de la population générale.
Toutefois les modèles sont cliniquement utiles car ils  peuvent re-classifier des personnes à risques extrêmes. Ainsi le verdict sur les modèles de risque ne devrait pas être fondé uniquement sur ces deux estimateurs, mais les modèles doivent plutôt être évalués, selon les auteurs, prospectivement dans le cadre d’essais cliniques, dont Mypebs...

 

Conclusion

La conclusion est un peu mitigée.

Le développement de modèles individualisés de prédiction du risque de cancer du sein s’est accru au cours des trois dernières décennies, mais les améliorations à la fois de la puissance discriminatoire et de la précision de calibration sont encore limitées.

Actuellement, il est toujours difficile de recommander n’importe lequel des modèles comme norme pour prédire le risque individuel dans le contexte du dépistage.

Les études peuvent aider à comprendre le rendement d’un modèle dans un contexte particulier, mais certains modèles n’ont pas été validés suffisamment en externe (sur d'autres échantillons) ce qui accroît l’incertitude quant à son applicabilité.

En effet la validité externe témoigne de la reproductibilité et la transposabilité du score, et correspond en fait à la vérification de la discrimination et de la calibration sur d'autres populations que celle pour laquelle le modèle a été conçu.

Les modèles ont certes été remis à jour en ajoutant de nouvelles variables, telles que les variations génétiques communes ou les variables radiologiques, et auraient montré des améliorations dans leur qualité ainsi que dans leur précision discriminante.

Mais ces nouvelles variables doivent encore faire l’objet d’une évaluation plus approfondie afin de confirmer leur impact prometteur sur la capacité prédictive de proposer des stratégies personnalisées pour le dépistage du cancer du sein.

De fait, il existe actuellement deux très grands essais randomisés qui évaluent les stratégies de dépistage fondées sur le risque. Les deux utilisent des modèles individualisés, les modèles IBIS et BCSC qui sont testés dans l’essai européen Mypebs (My Personalised Breast Screening).

Le modèle BCSC est aussi mis à l’essai dans le cadre de l’essai US WISDOM (Women Informed to Screen Depending On Measures of risk)).

 

__________

 

Reste la question : l'essai est-il éthique et le résultat ensuite fiable lorsqu'il trie les femmes selon leur risque dans une étude visant à diminuer officiellement le nombre de cancers graves, avec des réajustements possibles du risque en cours d'étude comme le mentionne le protocole détaillé, sur la base de logiciels d'évaluation du risque incertains, aléatoires et encore à l'essai ?

 

 

Références

[1] https://cancer-rose.fr/my-pebs/2019/03/15/presentation-analyse-methodologique/

[2] 

https://cancer-rose.fr/my-pebs/wp-content/uploads/2019/08/MyPEBS-SYNOPSIS-.pdf

[3] Brentnall, A. R., Harkness, E. F., Astley, S. M., Donnelly, L. S., Stavrinos, P., Sampson, S. et al. Mammographic density adds accuracy to both the Tyrer-Cuzick and Gail breast cancer risk models in a prospective UK screening cohort. Breast Cancer Res. 17, 147 (2015).