Effet du dépistage par examen clinique des seins sur l’incidence et la mortalité du cancer du sein après 20 ans: essai contrôlé randomisé en grappes prospectif à Mumbai
https://www.bmj.com/content/372/bmj.n256
Dr C.Bour et
- Contribution de Dr M.Gourmelon pour le décryptage de la présentation des risques de mortalité. Annexe b
- Contribution de Dr V.Robert pour l’analyse statistique. Annexe c
27/02/2021
Trois essais randomisés comparatifs ont été menés, en Russie, Chine et au Royaume Uni [annexe a] réunissant presque 400 000 femmes au total, qui n’ont démontré ni diminution de mortalité par cancer du sein, ni diminution des mastectomies. En revanche les faux positifs étaient augmentés donnant lieu à des examens complémentaires et des biopsies avec résultats normaux, et ils occasionnaient aussi une augmentation de l’anxiété des femmes.
Il a été question également de faire des dépistages par des professionnels formés, le problème est la reproductibilité d’un opérateur à l’autre qui n’est pas bonne. Bref, la palpation clinique des seins en tant que méthode de dépistage de routine n’a pas été retenue, car l’auto-examen des seins ne s’avère pas être finalement une méthode efficace pour la détection précoce du cancer du sein. Et on ne sait toujours pas jusqu’à présent si le dépistage par examen clinique des seins peut réduire réellement la mortalité par cancer du sein
Un essai indien
Une nouvelle étude reprenant l’idée d’un examen clinique des seins comme dépistage de masse est réalisée par une équipe de chercheurs de Mumbai, qui publie les résultats de son essai clinique contrôlé randomisé sur 20 années.
L’objectif de l’étude était de tester l’efficacité d’un dépistage du cancer du sein par examen clinique pour réduire la mortalité par la maladie et pour réduire également le stade du cancer au moment du diagnostic, par rapport à l’absence de dépistage.
151 538 femmes âgées de 35 à 64 ans sans antécédent de cancer du sein ont participé à l’étude, un essai randomisé « en grappes ».
Voici ce qu’est un échantillonnage en grappes : on trouve des zones géographiques appropriées (par exemple une ville, une région, etc.). Un certain nombre de ces zones géographiques est ensuite sélectionné de manière aléatoire. Ce sont ces zones entières qui sont randomisées ou alors, dans chaque zone, un sous-groupe proportionnel de membres de la population étudiée, ces sous-groupes sont ensuite combinés en un « groupe- échantillon ».
Les femmes du groupe de dépistage (75 360) ont bénéficié de quatre cycles de dépistage par examen clinique des seins (réalisé par des professionnels de soins primaires formés) et de sensibilisation au cancer tous les deux ans. Les femmes du groupe témoin (76 178) ont bénéficié d’une sensibilisation au cancer et de huit cycles de surveillance active tous les deux ans.
On examine si, dans le groupe dépistage, le cancer trouvé est d’un stade moindre au moment du diagnostic par rapport aux femmes non dépistées, et bien sûr si la mortalité par la maladie a décru.
Les résultats principaux de l’étude sont les suivants :
- L’examen clinique des seins effectué tous les deux ans par des professionnels de soins primaires a considérablement réduit le stade du cancer du sein au moment du diagnostic.
- L’ examen clinique des seins a conduit à une réduction non significative de 15% de la mortalité globale par cancer du sein ; MAIS il s’agit d’une réduction relative, c’est à dire pour le groupe des dépistées par rapport au groupe des non dépistées (groupe témoin).
Voir : [annexe b] - Les auteurs concluent à une réduction significative de près de 30% de mortalité chez les femmes âgées de la tranche d’âge ≥ 50 ans. MAIS Il s’agit là d’une analyse de sous-ensemble faite post-hoc, non prévue dans le protocole d’étude initial, donc après avoir pris connaissance des données ; là aussi il ne s’agit pas de réduction absolue mais d’une réduction relative du risque en comparant deux groupes. Voir : [annexe b]
- Aucune réduction significative de la mortalité n’a été observée chez les femmes de moins de 50 ans.
Du point de vue des auteurs, ce qu’apporte l’essai de Mumbai :
- Dans cette étude de 20 ans, un examen clinique des seins effectué par des agents de santé formés à Mumbai a conduit à une réduction du cancer du sein au moment du diagnostic et à une réduction de la mortalité due à la maladie de près de 30% chez les femmes âgées de 50 ans et plus, mais sans réduction de la mortalité observée dans le groupe des femmes de moins de 50 ans.
- Une réduction de 5% de la mortalité toutes causes confondues a été observée dans le bras dépistage par rapport au bras témoin, mais qui n’était pas statistiquement significative.
- L’examen clinique des seins doit être envisagé pour le dépistage du cancer du sein dans les pays à revenu faible et intermédiaire.
Examen de l’étude sur le plan de sa solidité
Nous livrons ici l’analyse de Dr Robert, statisticien du groupe Cancer Rose, analyse que vous trouverez plus exhaustivement en annexe à la fin de l’article [annexe c].
Pour lui, les analyses post-hoc [1], reprises dans l’abstract et dans la conclusion, posent problème.
Nous résumons ses conclusions principales sur l’étude :
1-Réaliser des analyses post-hoc fait suspecter ou un manque de rigueur scientifique ou un manque d’objectivité, avec une propension de vouloir démontrer a posteriori, par une analyse non prévue dans le protocole d’étude au préalable et faite sur la base des données disponibles, à tout prix l’efficacité du dépistage par examen clinique des seins.
2-L’étude est présentée comme randomisée mais en fait il s’agit d’une randomisation par clusters (par groupes d’individus et non par individus). Les auteurs ne donnent aucune information sur la taille des clusters, ni sur leurs caractéristiques. Il est de ce fait impossible de savoir si la randomisation est suffisante ou pas pour rendre les groupes ‘dépisté’ et ‘contrôle’ comparables.
3-La manière dont sont attribués les décès (cause de décès par cancer du sein ou autre cause ?) est discutable. Lorsque deux médecins consultés pour déterminer la cause sont unanimes, la cause est retenue, mais s’il y a divergence un troisième avis est requis et la majorité des avis l’emporte ; un procédé rigoureux demanderait à éliminer le cas litigieux.
Autres remarques diverses
Forcément il y a un certain taux de surdiagnostics qui dilue, dans l’ensemble des cancers trouvés, le nombre des cancers plus avancés, dont la proportion apparaît ainsi moindre. Ce qui fait que, comme les résultats sont exprimés en pourcentage, on a l’impression qu’il y a davantage de cancers de stade plus précoce dans le groupe dépisté . Il est étonnant que le BMJ accepte cette présentation en pourcentage qui biaise les résultats. Et en effet il y a globalement davantage de femmes avec cancer du sein dans le bras dépistage (198) que dans le bras témoin (151).
(La présentation en pourcentage enjolive les données et donne une perception fictive de la réalité.
Ainsi dans l’annexe 4 du rapport de la concertation citoyenne[annexe d] (page 155), les citoyennes ont demandé une restitution honnête des données non pas en pourcentages mais avec des représentations graphiques des données chiffrées concernant le dépistage du cancer du sein.)
Ce qu’on constate essentiellement est que le résultat global n’est pas enthousiasmant, puisqu’il n’y a pas de diminution statistiquement significative de la mortalité par cancer du sein dans l’ensemble de la population dépistée.
Et il est toujours problématique, comme souligné par Dr Robert, d’avoir des résultats d’analyses réalisées après, une fois toutes les données en main, permettant de « choisir » ce qu’on souhaite mettre en avant, laissant ainsi planer le doute sur la recevabilité des résultats.
Bernard Duperray[2], dans son ouvrage « dépistage du cancer du sein, la grande illusion », mentionne l’étude de Shangaï où les résultats trouvés sont quasiment opposés à ceux de l’essai de Mumbai : « Dans un essai réalisé à Shangaï d’octobre 1989 à octobre 1991 sur près de 270 000 femmes, 130 000 ont été initiées à l’autopalpation sous surveillance médicale et comparées à un groupe témoin (non dépisté). Les taux cumulés de mortalité par cancer du sein après dix à onze ans de suivi étaient similaires dans les deux groupes …… [3].
Pour conclure
Cet essai indien a été publié semble montrer une diminution de la mortalité par cancer du sein dans le groupe autopalpation chez les femmes âgées de 50 ans et plus, mais pas chez les femmes plus jeunes. Ce résultat est cependant fragile, car en réalité, les femmes ont été tirées au sort non pas individuellement, mais en groupe (en « grappes »), et il n’y a eu que 20 groupes au total, pas tout à fait strictement comparables. On ne peut donc pas affirmer que l’efficacité de l’autopalpation des seins soit correctement démontrée.
Il est important de garder à l’esprit que cette étude a eu lieu dans un cadre très différent de nos populations occidentales. Les initiatives de palpation des femmes par un personnel formé dans un contexte comme Mumbai sont susceptibles de réduire la morbidité et le stade de cancers pour lesquels les femmes pourraient se présenter trop tardivement pour une prise en charge.
Les auteurs décrivent les difficultés[4] rencontrées pour mener à bien cet essai, notamment du point de vue du financement, quand l’Europe dans le même temps est capable de sacrifier 12 millions d’euros pour une étude ratée avant même d’avoir commencé, et qui n’apportera aucun renseignement exploitable, ni sur le surdiagnostic ni l’utilité du dépistage mammographique.[5]
Si cet article n’a pas de solidité scientifique, et qu’on ne peut affirmer formellement l’intérêt d’un dépistage organisé par examen clinique des seins, le non-intérêt de ce type de dépistage par examen clinique n’est pas démontré pour autant !
Un essai plus solide, à trois bras, pourrait être imaginé, avec un bras ‘ aucun-dépistage’.
Citons ici une ‘rapid response’ à la publication de cette étude[6] (Ismail Jatoi-Professor and Chief, Division of Surgical Oncology and Endocrine Surgery-University of Texas Health Science Center, San Antonio) : « …. le risque de surdiagnostic augmentera avec l’utilisation d’une technologie de dépistage plus moderne (c.-à-d. tomosynthèse, imagerie par résonance magnétique), ce qui augmente le taux de détection de cancers plus occultes (non palpables). »
… » Pris ensemble, les résultats de l’essai de Mumbai et du CNBSS[7] suggèrent qu’un essai clinique randomisant des femmes âgées de 50 ans et plus pour un dépistage par mammographie versus un dépistage par examen clinique des seins (ECS) est désormais justifié. Si un tel essai démontre qu’il n’y a aucun avantage supplémentaire au dépistage par mammographie au-delà de ce qui est réalisable avec le dépistage par ECS, alors le dépistage par ECS devrait remplacer la mammographie de dépistage comme méthode optimale de dépistage du cancer du sein. »
Ethiquement la réalisation d’un essai clinique randomisé testant le dépistage mammographique versus dépistage clinique serait justifié, en France malheureusement inenvisageable, puisque l’argument souvent opposé est qu’il est non-éthique de soustraire les femmes au dépistage mammographique. On semble considérer qu’il est plus éthique de convoquer les femmes de façon coercitive et insistante à un dépistage radiologique qui a failli….
Mais la pandémie et les problèmes à venir d’attribution des ressources en santé pourraient nous amener à repenser à ce genre d’essais dans le monde, notamment pour des populations peu favorisées, au lieu d’approfondir un dépistage mammographique décevant par des technologies que nous connaissons en occident, lesquelles favorisent de plus en plus les surdiagnostics.
Références
[1] Dans une étude scientifique, l’ analyse post hoc (du latin post hoc , «après ceci») consiste en des analyses statistiques qui ont été spécifiées après la consultation des données. Cela crée généralement un problème de test multiple car chaque analyse potentielle est en fait un test statistique . Plusieurs procédures de test sont parfois utilisées pour compenser, mais c’est souvent difficile voire impossible à faire avec précision. L’analyse a posteriori qui est menée et interprétée sans une prise en compte adéquate de ce problème est parfois appelée « dragage de données» par les critiques parce que les associations statistiques qu’elle trouve sont souvent fausses. (Wikipédia : https://en.wikipedia.org/wiki/Post_hoc_analysis )
[2] Bernard Duperray « dépistage du cancer du sein, la grande illusion »-éditions Thierry Souccar.
[3] THomas DB, gao Dl et al. Randomized trial of breast self-examination in Shanghai: nal results. Journal of the National Cancer Institute. 2002 Oct 2;94(19):1445-57.
Cox B. Variation in the effectiveness of breast screening by year of follow-up. Journal of the National Cancer Institute. Monographs. 1997;(22):69-72.
Retsky m. New concepts in breast cancer emerge from analyzing clinical data using numerical algorithms. International Journal of Environmental Research and Public Health. 2009 Jan;6(1):329-48.
[4] https://blogs.bmj.com/bmj/2021/02/24/the-story-of-the-mumbai-breast-screening-study/
[5] https://cancer-rose.fr/my-pebs/2019/06/10/argumentaire/
[6] https://www.bmj.com/content/372/bmj.n256/rr-1
[7] Miller AB, Wall C, Baines CJ, Sun P, To T, Narod SA. Twenty five year follow-up for breast cancer incidence and mortality of the Canadian National Breast Screening Study: randomised screening trial. BMJ. 2014;348:g366.
Annexes
[a]
[b] Explication du caractère trompeur des présentations des risques en pourcentage de réduction relative du risque de décéder. Dr M.Gourmelon
1-L’ examen clinique des seins a conduit à une réduction non significative de 15% de la mortalité globale par cancer du sein-
Les 15 % vienne du calcul relatif suivant :
mortalité par cancer du sein dans le groupe dépistage 213 morts, 251 dans le groupe contrôle.
251 -213 = 38
3800/251 = 15,13 %
c’est ainsi que l’on obtient 15 % de réduction relative de la mortalité par cancer du sein.
Mais quel est-il en absolu ?
213 morts pour 75360 femmes du groupe dépistage.
21300/75360 = 0,2826 % est donc le pourcentage absolu de décès de femmes par cancer du sein dans le groupe dépistage
251 morts pour 76178 femmes du groupe contrôle.
25100/76178 = 0,3295 % est le pourcentage absolu de décès de femmes par cancer du sein dans le groupe contrôle.
Nous avons donc : 0,3295 – 0,2826 = 0,0469 % arrondi à 0,05 % de décès de femmes en moins.
Le pourcentage relatif est donc de 15 %, et le pourcentage absolu de 0,05 %.
En effet le pourcentage absolu représente la réduction de mortalité des femmes entre le groupe dépistage et le groupe contrôle.
Le pourcentage relatif, lui exprime la différence entre le nombre total de morts dans le groupe dépistage et le groupe contrôle, une réduction pour un groupe non pour des individus.
Or ce qu’il est important de savoir pour une bonne information des femmes, c’est la réduction que ces dernières peuvent attendre du dépistage et non de savoir de combien le dépistage apporte de réduction dans le groupe dépistage par rapport au groupe non dépistage.
Mais pour « promouvoir » le dépistage il vaut mieux avancer un chiffre de réduction de 15 %, qui ne concerne pas les femmes directement mais qu’elles interpréteront ainsi, que 0,05 % qui est le chiffre réel de réduction qu’elle peuvent attendre en se soumettant au dépistage.
C’est tout la subtilité de présentation des chiffres dont la plupart des lecteurs des études n’auront pas conscience, mais que les auteurs, oui et que la concertation citoyenne de 2015 avait demandé que de telles présentations ne soient plus acceptées.
2-Ensuite de la même façon :
Les auteurs concluent à une réduction significative de près de 30% de mortalité chez les femmes âgées de la tranche d’âge ≥ 50 ans.
Les 30 % viennent du calcul suivant, de la même façon :
64 femmes de plus de 50 ans, mortes d’un cancer du sein dans le groupe dépistage, 93 dans le groupe contrôle.
Il y a donc une réduction des décès par cancer du sein de : 93-64 = 29
donc 2900/93 = 31,18 % de réduction relative de la mortalité chez les femmes de plus de 50 ans.
Mais qu’en est-il en réduction absolue :
64 femmes décédés sur 20965 femmes de plus de 50 ans du groupe dépistage.
6400/20965 = 0,3053 % soit la mortalité absolue par cancer du sein dans le groupe dépistage
93 femmes décédés sur 21909 femmes de plus de 50 ans du groupe contrôle
9300/21909 = 0,4245 %
soit 0,4245-0,3053 = 0,1192 %
Donc en absolu la réduction de mortalité des femmes par cancer du sein est de 0,12 %
De la même façon que précédemment, en calculant en% absolu, l’on exprime le risque de mortalité des femmes de plus de 50 ans et donc sa réduction, alors que de l’autre, le % relatif n’exprime qu’une réduction d’un groupe par rapport à un autre : la comparaison entre le groupe des femmes dépistés et le groupe des femmes non dépistés et en aucun cas la réduction de risque des femmes de plus de 50 ans elles-même.
3-Enfin, il en est de même:
Une réduction de 5% de la mortalité toutes causes confondues a été observée dans le bras dépistage par rapport au bras témoin, mais n’était pas statistiquement significative :
11853 décès toutes causes dans le groupe contrôle
11261 décès toutes causes dans le groupe dépistage
11853-11261= 592 décès en moins.
59200/11853= 4,9945 % donc 5 % de décès en moins entre le groupe dépistage et le groupe contrôle mais pas 5 % en moins de femmes décédées, car pour cela il faut calculer en pourcentage absolu.
Ce qui donne:
1126100/75360= 14,94 %
1185300/76178= 15,56 %
15,56-14,94 = 0,62 %
[c] Analyse Dr Robert
1. Avec chaque analyse post hoc (chaque comparaison par sous-groupes), on se donne une chance supplémentaire d’arriver par hasard à un résultat statistiquement significatif.
Ainsi, pour arriver presque à coup sûr à un résultat statistiquement significatif, il suffirait de créer les sous-groupes au hasard 100x de suite. Avec le seuil de significativité habituel de 0.05, on aurait un peu plus de 99 chance sur 100 que au moins 1 des 100 comparaisons par sous-groupes donne (par hasard puisque les sous-groupes ont été constitués sur une base aléatoire) une p.value <0.05 (autrement dit un résultat statistiquement significatif).
(NDLR : Ainsi on garde cette analyse qui semble positive selon les critères retenus par les auteurs et on peut ignorer les autres 99 études qui apparaissent négatives).
Ainsi les auteurs ne font pas état de 100 analyses post hoc mais seulement de 2 (une pour les moins de 50 ans et une pour les plus de 50. ans). Mais, avec les 2 post hoc + l’analyse principale (celle sans sous-groupe), cela donne quand même 3 « tickets » pour tenter d’avoir au moins un résultat statistiquement significatif. Le risque d’erreur dans la conclusion n’est donc plus de 0.05 mais d’environ 0.143.
Plus grave, on ne sait pas combien d’analyses post hoc ont été réellement pratiquées. Les auteurs affichent les résultats pour les sous-groupes moins de 50 ans et plus de 50 ans. Mais en fait, on ne sait pas combien de sous-groupes ils ont essayé avant d’arriver à un sous-groupe avec un résultat statistiquement significatif. Rien ne dit qu’ils n’ont pas essayé plus de 36 ans : sans succès ; puis plus de 37 ans : sans succès ; puis plus de 38 ans : sans succès ; … ; puis plus de 50 ans : bingo !!! p.value = 0.02 on peut publier.
Le problème c’est que, ce faisant, ils se seraient donnés 15 « tickets » pour avoir un résultat statistiquement significatif. Le risque d’erreur dans la conclusion ne serait donc plus 0.05 mais 0.537 (autrement dit plus d’1 chance sur 2 que la conclusion d’une diminution de la mortalité chez les femmes de plus de 50 ans soit le fait du hasard et d’une méthodologie statistique contestable).
Le fait que les auteurs aient fait des analyse post-hoc (peu importe le nombre) prouve :
– un manque de rigueur ou de connaissances statistiques
– un manque d’objectivité avec une envie forte de démontrer à tout prix l’efficacité du dépistage par palpation (et à partir de là, on a le droit de s’interroger sur l’honnêteté de l’étude).
2. L’étude est présentée comme randomisée mais en fait il s’agit d’une randomisation par clusters (par groupes d’individus et non par individus). Les auteurs précisent qu’il y a 20 clusters mais ne donnent aucune information sur la taille des clusters et l’hétérogénéité des facteurs de risque entre les différents clusters. Il est de ce fait impossible de savoir si la randomisation est suffisante ou pas pour rendre les groupes dépisté et contrôle comparables.
Pour bien comprendre l’importance du problème, prenons une situation caricaturale :
2 clusters, un à haut risque, l’autre à faible risque.
Dans cette situation, la randomisation ne change rien à la comparabilité des groupes. L’un va recevoir le cluster à haut risque et l’autre le cluster à faible risque. Randomisation ou pas, les 2 groupes ne seront pas comparables.
Si les clusters sont parfaitement identiques en terme de facteurs de risque, la randomisation est inutile. Quelle que soit la manière d’affecter les clusters à chaque groupe, il n’y aura de toute façon pas de problème de comparabilité puisque tous les clusters sont identiques en terme de facteurs de risque.
S’il y a une infinité de clusters, peu importe qu’ils soient identiques ou non en terme de risque, la randomisation va équilibrer la répartition des clusters à haut risque et à faible risque entre les 2 groupes.
Dans la pratique, on est toujours dans une situation intermédiaire, un nombre de clusters > 2 mais pas infini et des clusters pas parfaitement identiques en terme de risque. Pour juger si la randomisation par clusters est susceptible ou non de donner des groupes comparables, il faut donc disposer et du nombre de clusters et de l’hétérogénéité entre
les clusters.
3. La manière de décider si un décès est attribuable ou non au cancer du sein est assez curieuse.
Deux médecins donnent leur avis. Si les deux avis convergent, ces avis identiques déterminent l’attribution (OK avec ça).
Si les deux avis divergent, un 3ème avis est demandé et l’avis majoritaire détermine l’attribution. Et là, il y a un problème. La décision à la majorité c’est démocratique et bien adaptée à la politique mais ça n’a rien de scientifique. Si les avis des 2 premiers médecins divergent, c’est que la situation est ambiguë. Et il serait plus honnête de ne pas prendre en considération ces cas plutôt que de vouloir à tout prix lever l’ambiguïté par un 3ème avis pas forcément plus fiable que les deux premiers.
On a du mal à savoir combien de cas de désaccords il y a eu. Il y aurait 17% dans un groupe et 10% dans l’autre de cas où l’attribution de la cause du décès n’a pas pu être faite ; mais les chiffres sur la fréquence des cas où l’attribution a été faite malgré un avis contraire d’au moins un des médecins sont introuvables. C’est pourtant une information cruciale.
Au minimum, il aurait fallu vérifier la robustesse des conclusions par une étude de sensibilité prenant en compte les non attributions et les ambiguïtés de l’attribution de la cause des décès (curieusement, cela a été fait pour l’analyse du staging (analyse du stade du cancer au moment de son diagnostic) des cancers et pas pour l’analyse des décès par cancer ; dans le cas des décès cela enlève toute fiabilité aux conclusions).
[d] Rapport de concertation, voir page 155
🛈 Nous sommes un collectif de professionnels de la santé, rassemblés en association. Nous agissons et fonctionnons sans publicité, sans conflit d’intérêt, sans subvention. Merci de soutenir notre action sur HelloAsso.
🛈 We are an French non-profit organization of health care professionals. We act our activity without advertising, conflict of interest, subsidies. Thank you to support our activity on HelloAsso.