Efficacité comparative des placebos dans les essais d’antidépresseurs à court terme pour la dépression majeure : a secondary meta-analysis of placebo-controlled trials

Dans cette méta-analyse exploratoire secondaire de l’ensemble de données Cipriani, nous avons testé si les placebos des nouveaux antidépresseurs étaient plus efficaces que les placebos des médicaments plus anciens, l’amitriptyline et la trazodone. Il a été démontré que ces deux médicaments, ainsi que la clomipramine, sont moins bien tolérés que les antidépresseurs de nouvelle génération. Sur la base de la levée de l’insu des investigateurs documentée dans diverses études, nous avons donc émis l’hypothèse que les évaluateurs des résultats dans les essais de ces anciens médicaments étaient plus fréquemment levés en raison des effets secondaires marqués et observables de ces médicaments. Par conséquent, nous avons supposé que les évaluateurs des résultats sans insu sous-estimeraient, consciemment ou inconsciemment, la réponse aux placebos pour ces médicaments plus anciens. Conformément à notre raisonnement, nous avons constaté que les placebos d’amitriptyline et de trazodone étaient jugés moins efficaces que les placebos des antidépresseurs plus récents et mieux tolérés, comme les ISRS (citalopram, escitalopram, fluoxétine, sertraline), les IRSN (duloxétine, desvenlafaxine, venlafaxine), et en particulier l’antidépresseur atypique noradrénergique et sérotonergique spécifique (NaSSA) mirtazapine. La méthodologie des essais, les caractéristiques des échantillons et le taux d’essais positifs ayant considérablement changé au fil du temps, nous avons également contrôlé des covariables importantes telles que le centre d’étude, le schéma posologique, la durée de l’étude, la taille de l’échantillon, l’année de l’étude, le statut de publication et le parrainage. Bien que l’infériorité de l’amitriptyline-placebo ne soit pas restée significative (95% CrIs incluant zéro, nonobstant le fait qu’elle indique toujours une réponse plus faible) sauf par rapport à la mirtazapine-placebo, les différences pour la trazodone-placebo par rapport aux placebos de nouvelle génération sont restées significatives (95% CrIs excluant zéro).

Nos résultats sont compatibles avec l’hypothèse selon laquelle, en raison de la levée de l’insu, les évaluateurs des résultats ont pu surestimer la différence moyenne médicament-placebo pour les anciens antidépresseurs amitriptyline et trazodone. D’autres études soutiennent également l’idée que la levée de l’insu peut conduire à des évaluations exagérées de la réponse aux antidépresseurs par rapport au placebo. Par exemple, Khan et ses collègues ont constaté que la réponse moyenne aux traitements de la dépression était plus élevée lorsque les évaluateurs des résultats n’étaient pas en aveugle. La méta-analyse de Moncrieff et de ses collègues a révélé que la réponse aux TCA était faible par rapport aux placebos actifs (d = 0,17). De même, la méta-analyse de Greenberg et de ses collègues a révélé que la réponse aux ATC, évaluée par le clinicien, était faible (d = 0,25) dans les essais à trois bras  » à l’aveugle  » qui comportaient un contrôle actif en plus du contrôle placebo. De plus, dans ces essais à trois bras, la réponse aux TCA était proche de zéro (d = 0,06) lorsqu’elle était évaluée avec les auto-évaluations des patients, ce qui suggère que les évaluateurs de résultats voient des différences entre le médicament et le placebo que les patients ainsi évalués ne perçoivent pas personnellement.

Les présentes conclusions sont importantes pour l’interprétation de la réponse comparative à différents antidépresseurs telle que fournie par Cipriani et ses collègues . Dans leur supplément, Cipriani et ses collègues ont indiqué que l’ajustement de la probabilité de recevoir un placebo augmentait la réponse à l’amitriptyline, passant d’un OR = 2,13 à un OR frappant = 3,16 (augmentation de 48%). De même, pour la trazodone, cela a entraîné une augmentation de l’OR = 1,51 à l’OR = 1,97 (augmentation de 30 %). Ces résultats illustrent clairement que la réponse moyenne au traitement, tant pour l’amitriptyline que pour la trazodone, augmente considérablement lorsqu’ils sont comparés au placebo dans un essai à deux bras, probablement parce que l’inclusion d’un bras placebo permet aux évaluateurs de résultats de détecter beaucoup plus facilement quels participants ont reçu le médicament expérimental que dans un essai contrôlé actif.

Consistant avec notre hypothèse selon laquelle la levée de l’insu des évaluateurs des résultats dans les essais de médicaments plus anciens biaise la différence moyenne entre le médicament et le placebo, une méta-analyse de la réponse au placebo a montré que la réponse moyenne au placebo en 2005 était plus de deux fois plus importante que la réponse au placebo en 1980 lorsqu’elle était évaluée par les évaluateurs des résultats. Cependant, aucun changement dans le temps n’a été constaté pour les auto-évaluations des patients, ce qui confirme à nouveau nos conclusions détaillées ci-dessus selon lesquelles les évaluateurs de résultats évaluent les différences entre le médicament et le placebo différemment de ce que les patients perçoivent personnellement. Il est également important de souligner que si la réponse au placebo a considérablement augmenté au cours des années 1980, depuis environ 1991, la réponse moyenne au placebo est restée largement constante autour de 35-40% lorsque les changements dans les caractéristiques de conception des essais sont pris en compte .

Nous ne voyons aucune raison de supposer qu’il n’y a pas de levée de l’insu dans les essais d’antidépresseurs SSRI, SNRI ou NaSSA, bien que le biais soit vraisemblablement moins prononcé car les nouveaux médicaments sont mieux tolérés que les TCA . Par exemple, la mirtazapine, qui a un double mode d’action unique en tant qu’antidépresseur noradrénergique et sérotonergique spécifique, a des effets sédatifs en raison de son affinité avec les récepteurs de l’histamine à de faibles concentrations plasmatiques. Cet effet antihistaminique est toutefois compensé à des doses plus élevées par une augmentation de la transmission noradrénergique, ce qui réduit son effet sédatif. On considère en outre que la mirtazapine présente un risque plus faible d’effets indésirables anticholinergiques ou liés à la sérotonine, souvent associés à d’autres antidépresseurs (tels que la dysfonction sexuelle, les nausées, etc.), même inférieur à celui des ISRS, et qu’elle peut même améliorer certains effets secondaires lorsqu’elle est prise conjointement avec d’autres antidépresseurs .

Néanmoins, les antidépresseurs de nouvelle génération provoquent également des effets secondaires , ce qui explique pourquoi les taux d’abandon pour cause d’effets indésirables sont plus élevés pour les antidépresseurs de nouvelle génération que pour le placebo (mais restent bien sûr inférieurs aux taux d’abandon des anciens antidépresseurs) . Les cliniciens expérimentés peuvent donc encore être capables de deviner correctement si un participant reçoit un placebo ou un traitement actif. Dans la réanalyse de l’essai Hypericum Depression Trial, Chen et al. ont montré que les cliniciens étaient plus à même de deviner correctement le placebo que la sertraline ou l’hypericum. En outre, les effets secondaires étaient plus prononcés chez les participants pour lesquels les cliniciens ont deviné le traitement actif (ce qui indique une levée de l’insu en raison des effets secondaires), et les améliorations du traitement actif par rapport au placebo étaient plus importantes lorsque les cliniciens ont deviné le traitement actif. Nous suggérons donc que le biais de levée d’insu est également un problème dans les essais d’antidépresseurs plus récents, bien qu’il soit probablement moins prononcé que dans les essais d’antidépresseurs plus anciens moins bien tolérés.

Enfin, il est important de noter que notre analyse ne peut pas exclure complètement les explications alternatives. Par exemple, au lieu de la levée de l’insu, une autre raison pourrait être la transformation des protocoles d’essai au fil du temps. Pour ne citer qu’un exemple, les critères d’inclusion et d’exclusion des essais sur les antidépresseurs sont devenus plus restrictifs au fil du temps, ce qui signifie que les participants aux essais sont de moins en moins représentatifs. Bien que le contrôle de l’année d’étude réduise certainement en partie cet effet de confusion, il ne peut pas l’éliminer complètement. Pour confirmer notre hypothèse, une étude prospective préenregistrée est nécessaire. Étant donné que les effets secondaires qui sont observables pour un évaluateur de résultats même s’ils ne sont pas signalés par le patient (par ex, bouche sèche, tremblements, somnolence) sont vraisemblablement ceux qui causent la levée de l’aveuglement, il serait utile d’examiner si ces effets secondaires spécifiques (par rapport aux effets secondaires moins détectables tels que la dysfonction sexuelle et le manque d’appétit) conduisent à une identification correcte du traitement reçu et s’ils sont corrélés négativement avec les évaluations de la dépression dans le bras placebo.

La principale implication de notre étude est que la levée de l’aveuglement devrait être systématiquement évaluée et rapportée dans les essais d’antidépresseurs. Cela permettrait de contrôler statistiquement les effets de la levée de l’insu et il serait également possible de mener une étude de confirmation comme détaillé ci-dessus. Si notre hypothèse se confirme, cela impliquerait que les placebos inertes constituent un mauvais contrôle et que l’utilisation de placebos actifs devrait être reconsidérée. Une autre implication serait que les classements d’efficacité basés sur l’AMN doivent être interprétés avec prudence.

Limitations

Une limitation de la présente analyse est qu’elle n’était pas basée sur un protocole écrit, mais a simplement suivi les conclusions de Naudet et ses collègues.

Une autre limitation inhérente au présent ensemble de données est que les placebos ne peuvent être interprétés que sur la base de leurs comparaisons avec les antidépresseurs correspondants auxquels ils sont liés dans le réseau. Ici, nous nous sommes concentrés sur les placebos à simple comparaison, car les placebos à double comparaison sont difficiles à interpréter et ne sont donc présentés que dans le supplément. Il faut donc garder à l’esprit que 24% des essais incluant également des doubles-comparaisons n’ont pas été inclus dans la présente interprétation.

Une autre limitation concerne les preuves résumées dans ce NMA spécial placebo, dans la mesure où toutes les comparaisons entre placebos reposent uniquement sur des preuves indirectes, et non sur un mélange de comparaisons directes et indirectes comme pour la plupart des antidépresseurs ; bien que, dans les comparaisons de traitements mixtes, une partie principale des preuves est également souvent basée sur des preuves indirectes. L’hypothèse de cohérence, qui suppose que les effets entre les comparaisons directes et indirectes sont les mêmes, ne peut donc pas être vérifiée. Bien qu’il soit impossible, dans ce contexte de placebo, de vérifier cette hypothèse, on ne peut pas être sûr de la validité des comparaisons en considérant que les comparaisons indirectes peuvent ne pas être robustes et sujettes à la vibration des effets .

Une limitation méthodologique est le problème de la multiplicité dans le présent NMA. Les modèles standard de NMA ne tiennent généralement pas compte des comparaisons multiples dans l’estimation des effets relatifs des traitements, ce qui pourrait conduire à des déclarations exagérées et trop confiantes concernant les effets relatifs des traitements. La présente analyse a donc appliqué l’approximation bayésienne pour réduire ce problème décrit par Efthimiou et White, où les effets de traitement sont modélisés échangeables, et donc les estimations sont rétrécies loin des grandes valeurs.

Une limitation plus générale est que la dépendance à l’hypothèse de similarité qui suppose que tous les essais sont suffisamment similaires pour être regroupés ensemble. Cipriani et al. ont considéré que cette hypothèse était valide, mais certaines caractéristiques non mesurées auraient pu influencer nos résultats, telles que les différences entre les patients hospitalisés et les patients externes ou tout autre substitut de la gravité de la dépression à l’entrée dans l’étude.

La limitation plus générale est que la confiance en l’hypothèse de similarité qui suppose que tous les essais sont suffisamment similaires pour être regroupés.