Efficacia comparativa dei placebo in studi antidepressivi a breve termine per la depressione maggiore: a secondary meta-analysis of placebo-controlled trials

In questa meta-analisi esplorativa secondaria del dataset Cipriani abbiamo verificato se i placebo dei nuovi antidepressivi erano più efficaci dei placebo dei vecchi farmaci amitriptilina e trazodone. Questi due farmaci, insieme alla clomipramina, hanno dimostrato di essere meno ben tollerati degli antidepressivi di nuova generazione. Sulla base dello smascheramento degli investigatori documentato in vari studi, abbiamo quindi ipotizzato che i valutatori di risultato nelle prove di questi vecchi farmaci erano più frequentemente smascherati a causa degli effetti collaterali marcati e osservabili dei farmaci. Di conseguenza, abbiamo ipotizzato che i valutatori di risultato non ciechi avrebbero, consciamente o inconsciamente, sottovalutato la risposta al placebo per questi farmaci più vecchi. In linea con il nostro ragionamento, abbiamo trovato che i placebo di amitriptilina e trazodone sono stati valutati meno efficaci dei placebo dei più nuovi, meglio tollerati, antidepressivi, come gli SSRI (citalopram, escitalopram, fluoxetina, sertralina), SNRI (duloxetina, desvenlafaxina, venlafaxina), e in particolare l’antidepressivo atipico noradrenergico e serotoninergico specifico (NaSSA) mirtazapina. Poiché la metodologia di studio, le caratteristiche del campione e il tasso di studi positivi sono cambiati considerevolmente nel tempo, abbiamo anche controllato per importanti covariate come il centro di studio, il programma di dosaggio, la lunghezza dello studio, la dimensione del campione, l’anno di studio, lo stato di pubblicazione e la sponsorizzazione. Anche se l’inferiorità dell’amitriptilina-placebo non è rimasta significativa (95% CRI compreso zero, nonostante il fatto che ha ancora indicato una risposta inferiore) tranne che in relazione alla mirtazapina-placebo, le differenze per il trazodone-placebo rispetto alla nuova generazione-placebo è rimasta significativa (95% CRI escluso zero).

I nostri risultati sono compatibili con l’ipotesi che, a causa dello smascheramento, i valutatori di risultato possono aver sovrastimato la differenza media farmaco-placebo per i vecchi farmaci antidepressivi amitriptilina e trazodone. Altri studi supportano anche l’opinione che lo smascheramento può portare a valutazioni di risposta esagerate per gli antidepressivi rispetto al placebo. Per esempio, Khan e colleghi hanno scoperto che la risposta media ai trattamenti per la depressione era più alta quando i valutatori di risultato erano slegati. La meta-analisi di Moncrieff e colleghi ha trovato che la risposta ai TCA era scarsa se paragonata ai placebo attivi (d = 0,17). Allo stesso modo, una meta-analisi di Greenberg e colleghi ha trovato che la risposta valutata dal medico ai TCA era piccola (d = 0,25) negli studi a tre bracci “blinder” che contenevano un controllo attivo oltre al controllo con placebo. Inoltre, in questi studi a tre bracci la risposta ai TCA era vicina allo zero (d = 0,06) quando valutata con gli auto-rapporti dei pazienti, suggerendo che i valutatori di risultato vedono le differenze farmaco-placebo che i pazienti così valutati personalmente non percepiscono.

I presenti risultati sono importanti per l’interpretazione della risposta comparativa a diversi antidepressivi come fornito da Cipriani e colleghi. Nel loro supplemento, Cipriani e colleghi hanno riferito che l’aggiustamento per la probabilità di ricevere placebo ha aumentato la risposta all’amitriptilina da OR = 2.13 a un sorprendente OR = 3.16 (aumento del 48%). Allo stesso modo, per il trazodone, questo ha portato a un aumento da OR = 1,51 a OR = 1,97 (aumento del 30%). Questi risultati illustrano chiaramente che la risposta media al trattamento sia per l’amitriptilina che per il trazodone aumenta sostanzialmente quando sono stati confrontati con il placebo in uno studio a due bracci, presumibilmente perché l’inclusione di un braccio placebo rende molto più facile per i valutatori di risultati rilevare quali partecipanti hanno ricevuto il farmaco in sperimentazione rispetto a uno studio controllato attivo.

Consistente con la nostra ipotesi che lo smascheramento dei valutatori di esito negli studi di farmaci più vecchi distorce la differenza media farmaco-placebo, una meta-analisi della risposta al placebo ha dimostrato che la risposta media al placebo nel 2005 era più del doppio della risposta al placebo nel 1980 quando valutata dai valutatori di esito. Tuttavia, non è stato riscontrato alcun cambiamento nel tempo per le autovalutazioni dei pazienti, il che conferma ancora una volta i nostri risultati dettagliati sopra che i valutatori di risultati valutano le differenze farmaco-placebo in modo diverso da quello che i pazienti percepiscono personalmente. È anche importante sottolineare che, mentre la risposta al placebo è notevolmente aumentata nel corso degli anni ’80, dal 1991 circa la risposta media al placebo è rimasta in gran parte costante intorno al 35-40% quando si prendono in considerazione i cambiamenti nelle caratteristiche del disegno della sperimentazione.

Non vediamo alcuna ragione per assumere che non ci sia uno smascheramento nelle sperimentazioni di antidepressivi SSRI, SNRI, o NaSSA, anche se il bias è presumibilmente meno pronunciato in quanto i farmaci più recenti sono meglio tollerati dei TCA. Per esempio, la mirtazapina, che ha una doppia modalità d’azione unica come un antidepressivo noradrenergico e serotoninergico specifico, ha effetti sedativi dovuti alla sua affinità ai recettori dell’istamina a basse concentrazioni plasmatiche. Questo effetto antistaminico, tuttavia, è compensato a dosi più elevate da un aumento della trasmissione noradrenergica, che riduce il suo effetto sedativo. Si ritiene inoltre che la mirtazapina abbia un rischio inferiore di effetti avversi anticolinergici o legati alla serotonina spesso associati ad altri antidepressivi (come disfunzioni sessuali, nausea, ecc.), anche inferiore agli SSRI, e può effettivamente migliorare alcuni effetti collaterali quando viene assunta insieme ad altri antidepressivi.

Tuttavia, gli antidepressivi di nuova generazione causano anche effetti collaterali, ed è per questo che i tassi di abbandono a causa di eventi avversi sono più alti per gli antidepressivi di nuova generazione rispetto al placebo (ma naturalmente ancora inferiori ai tassi di abbandono dei vecchi antidepressivi). I clinici esperti possono quindi essere ancora in grado di indovinare correttamente se un partecipante riceve il placebo o il trattamento attivo. In accordo, nella ri-analisi dell’Hypericum Depression Trial, Chen et al. hanno mostrato che i clinici erano più bravi a indovinare correttamente il placebo che la sertralina o l’iperico. Inoltre, gli effetti collaterali erano più pronunciati tra i partecipanti per i quali i medici hanno indovinato il trattamento attivo (il che indica lo smascheramento dovuto agli effetti collaterali), e i miglioramenti sul trattamento attivo rispetto al placebo erano maggiori quando i medici indovinavano il trattamento attivo. Suggeriamo quindi che l’errore di accecamento è un problema anche nelle prove dei nuovi antidepressivi, anche se è probabilmente meno pronunciato rispetto alle prove dei vecchi antidepressivi mal tollerati.

Infine, è importante notare che la nostra analisi non può escludere completamente spiegazioni alternative. Per esempio, invece dello smascheramento, un’altra ragione potrebbe essere la trasformazione dei protocolli di prova nel tempo. Per citare solo un esempio, i criteri di inclusione ed esclusione dei trial antidepressivi sono diventati più restrittivi nel tempo, il che significa che i partecipanti ai trial sono sempre meno rappresentativi. Anche se il controllo dell’anno di studio certamente riduce in parte questo effetto di confondimento, non può eliminarlo del tutto. Per confermare la nostra ipotesi, è necessario uno studio prospettico preregistrato. Dato che gli effetti collaterali che sono osservabili per un valutatore di risultati anche quando non sono riportati dal paziente (ad es, bocca secca, tremore, sonnolenza, sonnolenza) sono presumibilmente quelli che causano lo smascheramento, varrebbe la pena di esaminare se questi specifici effetti collaterali (rispetto a quelli meno rilevabili come la disfunzione sessuale e l’inappetenza) portano alla corretta identificazione del trattamento ricevuto e se sono negativamente correlati con le valutazioni della depressione nel braccio placebo.

La principale implicazione del nostro studio è che lo smascheramento dovrebbe essere sistematicamente valutato e riportato negli studi antidepressivi. Questo permetterebbe di controllare statisticamente gli effetti dello smascheramento e sarebbe anche possibile condurre uno studio di conferma come descritto sopra. Se la nostra ipotesi è valida, ciò implicherebbe che i placebo inerti sono un cattivo controllo e quindi l’uso di placebo attivi dovrebbe essere riconsiderato. Un’altra implicazione sarebbe che le classifiche di efficacia basate su NMA devono essere interpretate con cautela.

Limitazioni

Una limitazione della presente analisi è che non era basata su un protocollo scritto, ma ha semplicemente seguito i risultati di Naudet e colleghi.

Un’altra limitazione inerente al presente set di dati è che i placebo possono essere interpretati solo sulla base dei loro confronti con i corrispondenti antidepressivi a cui sono legati nella rete. Qui, ci siamo concentrati sui placebo a singolo confronto, poiché i placebo a doppio confronto sono difficili da interpretare e quindi presentati solo nel supplemento. Va quindi tenuto presente che il 24% dei trial che includevano anche i doppi confronti non sono stati inclusi nella presente interpretazione.

Un’altra limitazione riguarda le prove riassunte in questo speciale placebo NMA, in quanto tutti i confronti tra placebo si basano solo su prove indirette, e non su una miscela di confronti diretti e indiretti come per la maggior parte degli antidepressivi; sebbene, nei confronti di trattamenti misti, una parte principale delle prove è spesso basata anche su prove indirette. L’ipotesi di coerenza, assumendo che gli effetti tra i confronti diretti e indiretti siano gli stessi, non può quindi essere verificata. Sebbene sia impossibile in questo contesto placebo verificare questa ipotesi, non si può essere sicuri della validità dei confronti considerando che i confronti indiretti possono non essere robusti e inclini alla vibrazione degli effetti.

Un limite metodologico è il problema della molteplicità nel presente NMA. I modelli NMA standard di solito non tengono conto dei confronti multipli nella stima degli effetti di trattamento relativi, il che potrebbe portare a dichiarazioni esagerate e troppo sicure riguardo agli effetti di trattamento relativi. La presente analisi ha quindi applicato l’approssimazione bayesiana per ridurre quel problema descritto da Efthimiou e White , dove gli effetti di trattamento sono modellati scambiabili, e quindi le stime sono ridotte dai grandi valori.

Un limite più generale è che l’affidamento sull’ipotesi di somiglianza che presuppone che tutti i trial siano abbastanza simili da essere messi insieme. Cipriani et al. considerano valida questa ipotesi, ma ancora alcune caratteristiche non misurate potrebbero aver influenzato i nostri risultati, come le differenze tra pazienti interni ed esterni o qualsiasi altro surrogato della gravità della depressione all’ingresso dello studio.