Actualisation des recommandations de dépistage, davantage de rigueur

9 septembre 2024
Traduction est synthèse de https://ebm.bmj.com/content/early/2024/09/03/bmjebm-2024-113025
Auteurs Alison Huffstetler,1 Kenneth W Lin ,2 Russell P Harris3,4
1Robert Graham Center for Primary Care Policy Studies, Washington, District of Columbia, USA
2Family Medicine Residency Program, Lancaster General Hospital, Lancaster, Pennsylvania, USA
3Cecil G. Sheps Center for Health Services Research, University of North Carolina, Chapel Hill, Chapel Hill, North Carolina, USA
4Division of General Medicine and Clinical Epidemiology, University of North Carolina, Chapel Hill, Chapel Hill, North Carolina, USA

« L’utilisation croissante de la modélisation statistique et de preuves de faible certitude pour étendre le dépistage et la commercialisation agressive de tests de détection précoce multicancéreux soulèvent des questions sur les seuils de preuve utilisés pour la mise à jour des recommandations de dépistage existantes. »

Voici l’introduction de l’article publié dans le BMJ le 3 septembre 2024, à la suite des nouvelles recommandations américaines visant à étendre l’âge du dépistage.
Nous en parlions ici, ici, ici et ici.
l’USPSTF, le groupe de travail américain sur les services préventifs, a émis en effet des recommandations de début du dépistage du cancer du sein dès 40 ans, recommandations qui leur ont été beaucoup reprochées dans la communauté internationale car ne reposant sur aucune nouvelle étude scientifique, et exposant les femmes à beaucoup plus de méfaits que de bénéfices, tels que fausses alertes, biopsies inutiles, surdiagnostics et traitements excessifs inutiles.
Les réactions ont été nombreuses et d’autres organismes émettant des recommandations sur les soins préventifs (comme le GECSSP, groupe de travail canadien, ou le Centre international de recherche sur le cancer (CIRC ou IARC)) n’ont pas du tout suivi ces préconisations en matière de dépistage du cancer du sein.

Comme les auteurs le mentionnent, « depuis 2018, cinq des recommandations de dépistage du cancer mises à jour par l’US Preventive Services Task Force (USPSTF) ont inclus des modèles statistiques (sein, colorectal, poumon, col de l’utérus et prostate). Les cinq recommandations préconisent un dépistage plus intensif que la recommandation précédente, soit en recommandant des technologies de dépistage plus récentes, soit en élargissant la population éligible au dépistage. »
Il y a effectivement plusieurs « trucs » qui peuvent être mis en place pour contraindre davantage de sujets à se soumettre à des dépistage, et pour en faire faire trop, trop tôt, et trop facilement.
Lire aussi : https://www.cfp.ca/content/69/2/e33

« Par exemple, » citent les rédacteurs de l’article, »la recommandation de 2021 sur le dépistage du cancer colorectal a abaissé l’âge de départ de 50 à 45 ans sur la base d’un modèle de microsimulation de panels de patients hypothétiques »… » Plusieurs tests sanguins de dépistage de cancers multiples sont en cours de développement et de promotion sans essais contrôlés randomisés portant sur les résultats sanitaires. Bientôt, les organisations fondées sur des données probantes seront confrontées à des propositions d’intensification du dépistage à l’aide de ces nouvelles technologies. »
Nous avions réalisé un dossier plus étoffé sur les dépistages multi-cancers et sur les enjeux auxquels ils exposent.

GRADE

Comme cela est décrit dans l’article, les recommandations ne sont pas (ou en tous cas ne devraient pas être) émises au hasard. On emploie des méthodes « qui spécifient un seuil élevé de données probantes d’une certitude suffisante pour estimer le bénéfice net (l’équilibre entre les effets souhaitables et les effets indésirables dans le cadre GRADE (Grading of Recommendations Assessment, Development and Evaluation).
Ce seuil de preuve élevé inclut souvent l’exigence d’essais contrôlés randomisés (ECR) et/ou de preuves cohérentes provenant de plusieurs études de haute qualité avec des conceptions alternatives pour atteindre le degré de certitude des effets des résultats afin de permettre aux groupes de recommandation d’évaluer le bénéfice net avant de faire une recommandation qui incorpore les préférences des patients et l’impact sur l’équité en matière de santé. »

Comment ça marche ?

Prenons l’exemple du groupe canadien, sa méthodologie pour le dépistage du cancer du sein est très bien décrite en suivant le lien.
Ce cadre de référence qu’est le GRADE prend en compte la qualité des données probantes. Les essais randomisés (études faites en comparant des groupes d’individus attribués au hasard dans chaque groupe d’étude) sont considérés comme étant de haute qualité ; les études observationnelles, elle, comme étant de faible qualité (dans une échelle allant de haute à moyenne, faible et très faible qualité).
On tient compte dans l’évaluation du risque de biais, d’incohérences, d’imprécisions …

Le système GRADE intègre ainsi les données probantes certes, mais reconnaît aussi l’influence et l’importance d’autres facteurs qui dépassent les données probantes, à savoir les valeurs et les préférences des patients et l’équilibre entre les effets désirables et indésirables.
Les recommandations émises, se basant sur tous ces critères, sont ensuite classés en fortes, intermédiaires ou faibles. On peut adopter aussi une classifications de ces preuves en grade A, B ou C selon les modalités suivantes :
-une recommandation de grade A est fondée sur une preuve scientifique établie par des études de fort niveau de preuve (ECR, méta-analyses d’ECRs) ;
-une recommandation de grade B est fondée sur des études de niveau intermédiaire de preuve ( études comparatives non randomisées, études de cohortes etc..) ;
-une recommandation de grade C est fondée sur des études de moindre niveau de preuve ( études cas-témoin, séries de cas etc..) ;
-les recommandations D,E,I sont celles où il n’y pas de données probantes ou seulement des séries de cas entraînant une forte incertitude sur l’effet estimé, ou il s’agit carrément de non-recommandations.

Le problème soulevé par Kenneth Lin est ses co-auteurs est que malgré ce barème rigoureux, « le seuil de preuve nécessaire pour atteindre ce degré de certitude pour la mise à jour des programmes de dépistage établis pourrait bien être différent, et n’est pas spécifié dans les manuels de méthodes des groupes de recommandation que nous avons examinés. »
Et que « les organisations seront confrontées à des propositions d’intensification du dépistage à l’aide de ces nouvelles technologies. »
On ne sait donc pas si cette rigueur demandée est bien appliquée, et les auteurs redoutent que la mise en place de lignes directrices manque de transparence et subisse la poussée d' »innovations » allant vers plus de dépistages.

Les risques des variations des seuils de recommandation dans le sens d’un abaissement (des âges d’inclusion dans un dépistage par exemple) ou d’une augmentation ont des conséquences.

Adoption prématurée ou rejet prématuré

« Les propositions de mise à jour impliquent souvent un dépistage plus intensif, » expliquent les auteurs, « comme le dépistage d’une population plus large, l’augmentation de la sensibilité du dépistage ou l’utilisation d’une technologie de dépistage plus récente. Pour décider s’il convient de recommander un élargissement du dépistage, l’organisation fondée sur des données probantes doit évaluer le bénéfice net supplémentaire de l’élargissement, puis mettre en balance les deux erreurs que sont l’adoption prématurée et le rejet prématuré.
Nous utilisons le terme « adoption prématurée » pour désigner l’adoption d’une recommandation de dépistage actualisée dont le bénéfice net s’avère par la suite nul ou négatif. L’adoption prématurée entraîne un surdiagnostic et un surtraitement …
Nous utilisons le terme « rejet prématuré » pour désigner le rejet d’une proposition de stratégie de dépistage actualisée qui, selon des données ultérieures, présente un bénéfice net au moins modéré. Le rejet prématuré retarde les bénéfices pour l’individu et la population jusqu’à ce que des preuves supplémentaires soient produites. »
« Le fait de fixer le seuil de preuve à un niveau élevé augmente le risque de rejet prématuré mais diminue le risque d’adoption prématurée. En revanche, le fait de fixer le seuil de preuve à un niveau bas augmente le risque d’adoption prématurée tout en diminuant le risque de rejet prématuré. »

Concernant les recommandations émises par l’USPSTF, l’organisme étatsunien qui préconisait un abaissement de l’âge du dépistage du cancer du sein pour le proposer aux quadragénaires, l’article déplore qu’en utilisant un seuil de preuve plus bas (ici en basant l’évaluation du bénéfice net sur des études avec des résultats intermédiaires ou sur des exercices de modélisation), la recommandation résultante du groupe de travail était d’élargir le dépistage.
A contrario, lorsque le groupe de travail canadien ou le CIRC ont utilisé un seuil de preuve plus élevé, la recommandation qui en a résulté n’a pas élargi le dépistage aux âges plus bas.

Dépistage du cancer du sein à partir de 40 ans plutôt que 50 ans selon l’USPSTF, que s’est-il passé ?

Nous citons les termes de l’article :
« Pendant plus de 20 ans, l’USPSTF a constamment évalué le bénéfice net du dépistage du cancer du sein à 40 ans plutôt qu’à 50 ans, de manière à recommander que ce soit une décision individuelle de chaque femme plutôt qu’une recommandation universelle basée sur la population. En 2024, cependant, l’USPSTF a mis à jour son évaluation du bénéfice net pour recommander un dépistage universel à partir de 40 ans, en ne citant aucun nouvel essai contrôlé randomisé. »

« En utilisant le seuil de preuve le plus élevé, un seul ECR (essai randominé) avec des résultats de santé a étudié les différences supplémentaires entre le début du dépistage à 40 ans et à 50 ans.* L’étude n’a trouvé aucun bénéfice en termes de mortalité pour le début du dépistage à 40 ans. Ainsi, si l’on accepte cet unique essai randomisé, le bénéfice net serait évalué comme nul ou négatif …
* Nelson HD, Fu R, Cantor A, et al. Effectiveness of Breast Cancer Screening: systematic Review and Meta-analysis to Update the 2009 U.S. Preventive Services Task Force Recommendation. Ann Intern Med 2016;164:244–55.
En utilisant le deuxième seuil de preuve, il n’y a pas d’études comparatives avec des résultats intermédiaires.
En utilisant le troisième seuil de preuve, les modèles de l’USPSTF ont trouvé une plus grande réduction de la mortalité par cancer du sein en commençant à 40 ans, mais avec plus de faux positifs, plus de biopsies et plus de surdiagnostics. Principalement en raison du modèle statistique, qui a prédit un impact positif relativement plus important sur les résultats de santé chez les patientes noires, l’USPSTF en 2024 a évalué le bénéfice net de commencer à 40 ans plutôt qu’à 50 ans comme étant positif, ce qui a conduit à une recommandation positive mise à jour.

Ni le GECSSP (groupe canadien) ni le CIRC ne recommandent de commencer systématiquement la mammographie de dépistage à l’âge de 40 ans, mais préconisent plutôt un dépistage sélectif basé sur les préférences et les valeurs de chaque patiente.
Aucune de ces deux organisations n’a inclus de modèles statistiques dans leur évaluation des données probantes. Ainsi, le seuil de preuve utilisé par l’USPSTF 2024 diffère non seulement de celui du GECSSP et du CIRC, mais aussi de ses propres évaluations de preuves antérieures. »

Implications des différents seuils de preuve sur la certitude de la preuve et donc sur les recommandations

Cela démontre qu’il est important de bien placer le curseur pour trouver la bonne mesure entre l’adoption prématurée ou le rejet prématuré.

C’est ce qu’expliquent les auteurs :
« Si l’on utilisait le seuil de preuve le plus rigoureux pour obtenir des preuves suffisantes pour évaluer le bénéfice net, peu de recommandations pourraient être formulées. Cela augmenterait probablement la probabilité d’une erreur de rejet prématuré.
En revanche, si l’on abaissait le seuil de preuve pour inclure les jugements sur le bénéfice net fondés sur des données probantes avec des résultats intermédiaires, ou sur les seuls résultats des exercices de modélisation, il serait possible de formuler un nombre beaucoup plus important de recommandations.
Cependant, cela augmenterait probablement la probabilité d’adoption prématurée des changements proposés, dont les preuves ultérieures montreraient qu’ils ne sont pas nécessaires, qu’ils entraînent un gaspillage et qu’ils peuvent même être nuisibles. «
Cela signifie qu’en incluant dans l’évaluation de la pertinence d’un dépistage davantage d’études médiocres ou de la modélisation souvent source d’erreurs, on commet des lignes directrices dans un certain sens (ici plus de dépistages) dont on risque de se rendre compte ultérieurement à quel point ces nouvelles préconisations étaient nuisibles et coûteuses.
…
« …l’adoption d’un seuil acceptant des données probantes avec des résultats intermédiaires ou des informations provenant uniquement d’exercices de modélisation statistique entraîne un changement radical du niveau de certitude des données probantes. »
….
« Dans un article complémentaire, l’USPSTF a déclaré qu’elle ferait preuve d’une grande prudence lorsqu’elle émettrait une recommandation qui dépendrait des preuves liant les résultats intermédiaires et les résultats sur la santé, en raison des limites inhérentes aux preuves. »
….

« Les estimations par modèle des résultats sanitaires du dépistage peuvent être problématiques en raison de plusieurs facteurs, notamment les difficultés à modéliser l’histoire naturelle hétérogène des pathologies (c’est à dire la difficulté de tenir compte de la grande variabilité du développement cancéreux, NDLR), ce qui conduit à un surdiagnostic des lésions détectées par le dépistage … »

Que faire ?

» Le seuil de preuve pourrait être encore relevé en exigeant que ces études soient combinées à d’autres études de conception différente afin de produire des résultats cohérents en matière de santé (y compris les avantages et les inconvénients), telles que des études écologiques contrôlées ou de grandes études d’observation longitudinales de haute qualité analysées avec la rigueur des essais contrôlés randomisés. Les combinaisons de données probantes et l’évaluation critique du seuil de changement pourraient offrir une certitude « suffisante » quant à l’évaluation du bénéfice net pour permettre une mise à jour de la recommandation. » Ecrivent Lin et son équipe.
« Nous sommes préoccupés par l’absence de méthodes spécifiées et réfléchies incluant la fixation du seuil de preuve dans les manuels de méthodes des organisations fondées sur des données probantes que nous avons recherchées. »

Et les auteurs, en conséquence, de rajouter : « Il est important de continuer à surveiller les stratégies de dépistage au fil du temps pour s’assurer que les stratégies de dépistage recommandées sont actuelles et continuent à fournir un bénéfice net pour aujourd’hui. »

Ils concluent en proposant aux organismes d’évaluation de veiller à la rigueur méthodologique lors de la mise à jour des stratégies de dépistage.
Dans l’idéal disent-ils, « des preuves cohérentes provenant d’études bien menées et faisant appel à plusieurs modèles de recherche seraient nécessaires pour formuler des recommandations fortes, qu’elles soient positives ou négatives. Toutes ces études doivent faire l’objet d’une évaluation critique, en tenant compte du caractère direct et de la pertinence des données disponibles pour les systèmes et les pratiques de soins de santé actuels.
En outre, les stratégies de dépistage établies devraient être contrôlées afin de déterminer si les changements dans les tests de suivi diagnostique et les traitements rendent le dépistage moins bénéfique, ce qui permettrait de réduire l’intensité du dépistage. »
Autrement, il s’agit d’évaluer, par exemple dans le cas du dépistage du cancer du sein, si les évolutions thérapeutiques dont on sait qu’elles sont à l’origine de la diminution de mortalité par cancer du sein chez toutes les femmes, ne font pas que le dépistage devienne finalement beaucoup moins pertinent voire obsolète à terme, et doive être réduit en intensité dans la population à laquelle il est proposé.

« Les organisations fondées sur des données probantes devraient élaborer des méthodologies explicites et transparentes qui incluent la fixation a priori d’un seuil de preuves, intègrent les préférences des patients et améliorent l’équité en matière de santé.
Pour éviter le problème de l’adoption prématurée (ce qui est le cas pour les recommandations étatsuniennes d’abaisser l’âge du dépistage du cancer du sein, NDLR), le seuil de preuve ne doit pas être beaucoup plus bas que le seuil de recommandation initial du dépistage. »