Le biais d’attrition

MyPEBS SYNOPSIS . pdf

Vous trouverez l'analyse statistique expliquée et détaillée sur le site de Dr Vincent Robert :

http://mypebs-en-question.fr/mypebs.php

Critique du design de l'étude et du choix du seuil de la non infériorité, par Dr V.Robert, cliquez sur l'image

 

Ci dessous, décryptage du chapitre Analyses statistiques (page 6) tel qu'il figure dans le synopsis de MyPeBS.

Le biais d'attrition ,

Dr Vincent Robert

 

  1. Effectifs espérés

 

Groupe témoin :

nombre de femmes incluses : 42 500

nombre de femmes analysables : 28 260  (5% d'abandon puis 30% de non-respect du protocole)

 

Groupe dépistage personnalisé :

nombre de femmes incluses : 42 500

nombre de femmes analysables : 36 340 (5% d'abandon puis 10% de non-respect du protocole)

 

Commentaire : les sorties d'étude prévues sont importantes et asymétriques (14% pour le groupe dépistage personnalisé, 33% pour le groupe témoin). Ceci peut conduire à un biais d'attrition, d'autant plus que l'analyse est prévue en per protocole.

Pour mémoire, biais d'attrition = biais lié aux sorties d'étude (perdus de vue, refus de continuer à participer ou exclusions) ; ces sorties d'étude peuvent faire perdre la comparabilité des groupes issue de la randomisation.

 

  1. Efficacité espérée

 

Groupe témoin :

122 tumeurs évoluées / 100000 femmes / an

soit pour 28 260 femmes :122*28260/100000 =  34 à 35 tumeurs évoluées / an

soit 138  tumeurs évoluées au total (sur 4 ans)

Groupe dépistage personnalisé :

10% de tumeurs évoluées en moins par rapport au groupe témoin,

soit 122*0.9 = 110 tumeurs évoluées / 100000 femmes / an

soit pour 36 340 femmes : 110*36340/100000 = 40 tumeurs évoluées / an

soit 160 tumeurs évoluées au total (sur 4 ans)

138 +160 = 298 ; on retrouve les 298 tumeurs annoncées dans le synopsis.

 

On peut donc dresser le tableau de contingence suivant :

Groupe témoin Groupe dépistage personnalisé Total
Tumeur évoluée 138 160 298
Pas de tumeur évoluée 28122 36180 64302
Total 28260 36340 64600

A partir de ce tableau, on peut calculer le risque relatif :

RR = (160/36340) / (138/28260) = 0.00440 / 0.00488 = 0.90

Ainsi que son intervalle de confiance à 95% qui vaut approximativement 0.71 à 1.13

(intervalle de confiance calculé par la méthode de Miettinen :

Chi2 = 0.80 ; racine de Chi2 = 0.894

borne basse de l'intervalle = RR1+1.96/racine du Chi2 = 0.91+1.96/0.894 = 0.93.19 = 0.71

borne haute de l'intervalle = RR1-1.96/racine du Chi2 = 0.91-1.96/0.894 = 0.9-1.19 = 1.13)

 

L'intervalle de confiance du risque relatif vaut approximativement 0.71 à 1.13 et déborde donc largement de part et d'autre de 1. Avec les effectifs prévus et les hypothèses faites par les promoteurs de l'essai, la différence espérée de 10% entre les 2 groupes n'est donc pas statistiquement significative. On comprend ainsi pourquoi les promoteurs de MyPeBS n'ont pas voulu faire un essai classique de supériorité.

 

  1. Seuil de non-infériorité

 

Le seuil de non-infériorité à 1.25 signifie 25% de tumeurs évoluées en plus dans le groupe dépistage personnalisé. Soit 122*0.25 = 30 tumeurs évoluées en plus / 100000 femmes / an.

 

Les hypothèses de base de MyPeBS incluent une puissance de 80%. Le risque de 2ème espèce est donc de 20% ; autrement dit, les promoteurs de MyPeBS acceptent qu'il y ait 20 chances sur 100 que l'essai conclut à la non-infériorité alors qu'en réalité le seuil de 25% de tumeurs évoluées en plus est dépassé.

(Pour mémoire, tout test statistique expose à 2 risques d'erreur :

  • le risque de se tromper en concluant à une différence statistiquement significative alors qu'en réalité la différence est due au hasard = risque de 1ère espèce, dont le seuil est par tradition fixé à 5 chances sur 100
  • le risque de se tromper en concluant à une différence non statistiquement significative alors qu'en réalité la différence est statistiquement significative = risque de 2ème espèce.

Dans un essai classique, le risque de 1ère espèce est crucial, d'où un seuil assez bas à 5 chances d'erreur sur 100.

Dans un essai de non-infériorité, le risque de 2ème espèce est au moins aussi crucial que le risque de 1ère espèce et devrait être fixé aussi bas.)

 

Le test de non-infériorité prévu est un test unilatéral. Autrement dit et en terme d'intervalle de confiance, MyPeBS ne va s'intéresser qu'à une seule des bornes de l'intervalle de confiance et ignorer l'autre.

En théorie, l'intervalle de confiance pourrait être intégralement compris entre 1 et 1.25 exclus. Dans cette situation, on va conclure à la non-infériorité puisque la borne supérieure ne dépasse pas 1.25. Et on ne verra pas que la borne basse est supérieure à 1, donc qu'il y a une infériorité statistiquement significative, même si elle n'atteint pas 1.25.

En pratique, c'est vrai, ce risque est très faible car il suppose que l'essai ait plus de puissance que prévue (ce qui dans la pratique est très rare ; en général, c'est plutôt l'inverse). Mais tout de même, c'est un peu léger comme façon de faire.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *