Une grande difficulté réside pour tout un chacun dans la compréhension de la méthode choisie.
Nous essayons ici de simplifier.
Nous avons eu beaucoup de mal à croire que le fait de trouver, dans l'étude, un nombre de cancers de stade avancé statistiquement supérieur, mais de moins de 25% par rapport au dépistage standard, ferait conclure aux concepteurs de Mypebs que le dépistage individualisé est « non inférieur » au dépistage habituel, mais c’est bien ce qui est prévu dans le protocole.
Etude MyPebs, Que veut-on faire ?
On veut comparer deux types du dépistage du cancer du sein, le dépistage standard (DS) et le dépistage individualisé (DI) qui, lui, est basé sur le risque individuel de chaque femme de contracter un cancer du sein.
Pourquoi l'étude ?
Le dépistage vise à détecter des cancers de faible stade afin de faire diminuer le nombre des cancers graves (de stade 2 ou plus). C'est l'objectif théorique de tout dépistage. Le dépistage standard est remis en cause, en particulier en raison de ses effets indésirables (surdiagnostic). On teste un autre mode de dépistage.
Le procédé
L'étude MyPebs ne cherche pas à vérifier si le DI réduira plus efficacement le taux de cancers graves que le DS. Non.
Elle se contente de voir si le dépistage individualisé ne laisse pas passer trop de cancers graves, par comparaison avec le dépistage standard.
C’est ce qu’on appelle un « essai de non infériorité ». Si le dépistage individualisé laisse passer moins de 25% de cancers graves de plus que le dépistage standard, on considérera qu’il est « non inférieur », et que les deux techniques, somme toute, se valent.
Car statistiquement parlant, et c'est là toute la subtilité, DI "non-inférieur" à DS ne signifie pas que DI est équivalent à DS, non ; DI "non-inférieur" cela signifie que DI peut très bien, mais oui, être inférieur à DS, mais sans dépasser un certain seuil préalablement déterminé.
Concrètement :
Selon les promoteurs de l’étude, chez les femmes soumises au dépistage standard, on attend 480 tumeurs graves (de stade 2 ou plus) pour 100 000 femmes au cours des 4 ans de l’essai.
Ils expliquent qu’ils ont choisi un seuil de non infériorité de 25% qui « correspond à une augmentation tolérable, dans le groupe DI, jusqu’à 120/100 000 cancers de stade 2 (risque cumulé sur les 4 ans). Que signifie ce jargon ?
Il signifie que si, dans le groupe dépistage individualisé, il apparait plus de cancers graves que dans le groupe dépistage standard, mais que ce dépassement n’atteint pas 25%, on considérera que le dépistage individualisé est « non inférieur » au dépistage standard. En réalité, on les considérera comme équivalents.
Pour les promoteurs de MyPEBs, on peut tolérer un supplément de cancers graves de
480 x 25 % = 120. Et on peut donc accepter qu’il apparaisse 480 + 120 = 600 cancers graves pour 100 000 femmes dans ce groupe.
Donc si, dans le groupe dépistage individuel, on observe 600 cancers graves au lieu de 480 dans le groupe dépistage standard (+ 25%), on dira quand même que les deux techniques sont équivalentes.
Il pourra donc y avoir 480 X 1,25 cancers graves (= 600) dans le groupe DI, pour 100 000 femmes, sur 4 ans.
Ce 1,25 correspond à un rapport, un ratio.
Il s'agit du ratio "cancers graves DI" / "cancers graves DS".
600 / 480 = 1,25
Tant que le ratio (nombre de cancers avancés DI / nombre de cancers avancés DS) ne dépasse pas 1.25, alors le dépistage individualisé ne sera pas significativement inférieur au dépistage standard, et donc tout à fait acceptable.
Les résultats qu'on peut attendre
Toutefois on ne se contente pas d'un seul résultat, d'un seul ratio lorsqu'on effectue une étude.
Car on considère que les résultats d'un essai pourraient être variables si on le renouvelait plusieurs fois avec d'autres échantillons.
Afin d'intégrer cette variabilité, les statisticiens calculent ce qu'on appelle un "intervalle de confiance", généralement de 95%, ce qui correspond non pas à un résultat ponctuel mais à une zone de résultats de part et d'autre du résultat médian. Cette zone c'est l'intervalle dans lequel la vérité à 95 chances sur 100 de se situer.
Voyons à présent ce qui pourrait se présenter comme situations lors de l'essai MyPebs.
Les flèches rouges représentent les intervalles de confiance.
Le chiffre rouge représente le ratio trouvé pour chaque situation,
1,25 est la limite de ratio à ne pas dépasser.
cliquez sur l'image
Situation n°1
groupe dépistage standard : 135 cancers avancés ; groupe dépistage individualisé : 163 cancers avancés
ratio observé = 163 / 135 = 1.21
intervalle de confiance à 95% du ratio = 0.96 à 1.53
borne supérieure de l'intervalle > 1.25 -> perdu !
On ne peut pas conclure que le DI soit non-inférieur au DS, il l'est probablement.
Situation n°2
groupe dépistage standard : 149 cancers avancés ; groupe dépistage individualisé : 149 cancers avancés
ratio observé = 149 / 149 = 1
intervalle de confiance à 95% du ratio = 0.79 à 1.263
borne supérieure de l'intervalle > 1.25 -> perdu !
On ne peut une fois encore pas conclure que le DI serait non-inférieur au DS
Situation n°3
groupe dépistage standard : 150 cancers avancés ; groupe dépistage individualisé : 148 cancers avancés
ratio observé = 148 / 150 = 0.99
intervalle de confiance à 95% du ratio = 0.78 à 1.247
borne supérieure < 1.25 -> gagné !
On pourrait conclure à la non infériorité du DI par rapport au DS.
Toutefois, nous pensons que dans cette situation, une différence statistiquement significative aussi minime ne devrait pas être interprétée au final comme une non-infériorité. En général, dans des situations analogues pour des essais de non-infériorité sur des médicaments, c'est ce qui est observé, ces situations limites ne sont pas jugées probantes.
Malgré le fait que nous ne disposons pas du protocole complet de l'étude gardé secret aux non-investigateurs, cette éventualité, si elle se présente, ne serait logiquement pas retenue, car manquant de puissance pour convaincre d'une véritable non-infériorité.
Situation n°4
groupe dépistage standard : 163 cancers avancés ; groupe dépistage individualisé : 135 cancers avancés
ratio observé = 135 / 163 = 0.83
intervalle de confiance à 95% du ratio = 0.65 à 1.05
borne supérieure < 1.25 -> gagné !
On peut conclure à la non-infériorité du DI par rapport au DS
Conclusion
Voilà comment s'effectuera en pratique l'analyse dont on tirera la conclusion de MyPebs, on voit très bien à quel point des résultats quasiment identiques, très proches en tous cas, pourraient théoriquement donner lieu à des conclusions diamétralement opposées.
Mais de toute façon, avec ce seuil arbitraire choisi, très avantageux de 25%, le dépistage individualisé aura toutes les chances d'être déclaré « non inférieur » au dépistage standard, quelle que soit son efficacité, ou son inefficacité.