Comparative efficacy of placebo’s in short-term antidepressant trials for major depression: a secondary meta-analysis of placebo-controlled trials
In deze secundaire exploratieve meta-analyse van de Cipriani dataset hebben we getest of de placebo’s van nieuwere antidepressiva effectiever waren dan de placebo’s van de oudere middelen amitriptyline en trazodon. Van deze twee middelen, samen met clomipramine, is aangetoond dat ze minder goed worden verdragen dan de antidepressiva van de nieuwere generatie. Gebaseerd op de gedocumenteerde blindering van onderzoekers in verschillende studies , veronderstelden wij daarom dat uitkomstbeoordelaars in trials van deze oudere drugs vaker werden geblinddoekt vanwege de duidelijke en waarneembare bijwerkingen van de drugs. Bijgevolg veronderstelden wij dat de ongeblindeerde uitkomstbeoordelaars, bewust of onbewust, de respons op placebo’s voor deze oudere geneesmiddelen zouden onderschatten. In lijn met onze redenering vonden wij dat de amitriptyline- en trazodone-placebo’s minder effectief werden beoordeeld dan de placebo’s van de nieuwere, beter verdragen, antidepressiva, zoals SSRI’s (citalopram, escitalopram, fluoxetine, sertraline), SNRI’s (duloxetine, desvenlafaxine, venlafaxine), en in het bijzonder het atypische noradrenerge en specifiek serotonerge antidepressivum (NaSSA) mirtazapine. Omdat de methodologie van de onderzoeken, de kenmerken van de steekproeven en het percentage positieve onderzoeken in de loop van de tijd aanzienlijk zijn veranderd, hebben wij ook gecontroleerd voor belangrijke covariaten zoals onderzoekscentrum, doseringsschema, onderzoeksduur, steekproefgrootte, onderzoeksjaar, publicatiestatus en sponsorschap. Hoewel de inferioriteit van de amitriptyline-placebo niet significant bleef (95% CrI’s inclusief nul, niettegenstaande het feit dat het nog steeds een lagere respons aangaf) behalve in verhouding tot mirtazapine-placebo, bleven de verschillen voor de trazodone-placebo in vergelijking met de nieuwe-generatie-placebo’s significant (95% CrI’s exclusief nul).
Onze bevindingen zijn verenigbaar met de hypothese dat, als gevolg van unblindering, uitkomstbeoordelaars mogelijk het gemiddelde geneesmiddel-placebo verschil hebben overschat voor de oudere antidepressiva amitriptyline en trazodon. Andere studies ondersteunen ook de opvatting dat het loslaten van de blindering kan leiden tot overdreven responsbeoordelingen voor antidepressiva ten opzichte van placebo. Khan en collega’s ontdekten bijvoorbeeld dat de gemiddelde respons op depressiebehandelingen hoger was wanneer de uitkomstbeoordelaars niet geblindeerd waren. De meta-analyse van Moncrieff en collega’s vond dat de respons op TCA’s slecht was in vergelijking met actieve placebo’s (d = 0,17). Evenzo bleek uit een meta-analyse van Greenberg en collega’s dat de door de clinicus beoordeelde respons op TCA’s gering was (d = 0,25) in “blinder”-onderzoeken met drie armen die naast placebo-controle ook een actieve controle bevatten. Bovendien was in deze drie-armige trials de respons op de TCA’s dicht bij nul (d = 0,06) wanneer beoordeeld met zelfrapportages van patiënten, wat suggereert dat uitkomstbeoordelaars verschillen tussen drugs en placebo zien die de aldus beoordeelde patiënten persoonlijk niet waarnemen.
De huidige bevindingen zijn belangrijk voor de interpretatie van de vergelijkende respons op verschillende antidepressiva zoals gegeven door Cipriani en collega’s . In hun supplement rapporteerden Cipriani en collega’s dat het aanpassen voor de waarschijnlijkheid van het ontvangen van placebo de respons op amitriptyline verhoogde van OR = 2,13 tot een opvallende OR = 3,16 (48% toename). Evenzo resulteerde dit voor trazodon in een toename van OR = 1,51 tot OR = 1,97 (toename met 30%). Deze bevindingen illustreren duidelijk dat de gemiddelde behandelingsrespons voor zowel amitriptyline als trazodon aanzienlijk toeneemt wanneer ze worden vergeleken met placebo in een twee-armig onderzoek, vermoedelijk omdat het opnemen van een placebo-arm het voor uitkomstbeoordelaars veel gemakkelijker maakt om te detecteren welke deelnemers het onderzoeksgeneesmiddel kregen dan in een actief-gecontroleerd onderzoek.
Consistent met onze hypothese dat het loslaten van de blindering van uitkomstbeoordelaars in proeven met oudere geneesmiddelen het gemiddelde verschil tussen geneesmiddel en placebo vertekent, heeft een meta-analyse van de placebo-respons aangetoond dat de gemiddelde placebo-respons in 2005 meer dan twee keer zo groot was als de placebo-respons in 1980 wanneer deze werd beoordeeld door uitkomstbeoordelaars. Er werd echter geen verandering in de loop van de tijd gevonden voor de zelfbeoordelingen van patiënten, wat opnieuw onze bevindingen ondersteunt die hierboven zijn beschreven, namelijk dat uitkomstbeoordelaars de verschillen tussen geneesmiddelen en placebo anders beoordelen dan wat patiënten persoonlijk waarnemen. Het is ook belangrijk om te benadrukken dat, hoewel de placebo-respons in de jaren tachtig aanzienlijk is toegenomen, de gemiddelde placebo-respons sinds ongeveer 1991 grotendeels constant is gebleven rond 35-40% als rekening wordt gehouden met veranderingen in de opzet van onderzoeken. We zien geen reden om aan te nemen dat er geen blindering optreedt in onderzoeken met SSRI, SNRI of NaSSA antidepressiva, hoewel de bias waarschijnlijk minder uitgesproken is omdat de nieuwere middelen beter worden verdragen dan TCA’s. Zo heeft mirtazapine, dat een uniek dubbel werkingsmechanisme heeft als noradrenerg en specifiek serotonerg antidepressivum, sederende effecten als gevolg van zijn affiniteit met histaminereceptoren bij lage plasmaconcentraties. Dit antihistamine-effect wordt echter bij hogere doses tenietgedaan door een verhoogde noradrenerge transmissie, waardoor het sederende effect afneemt. Mirtazapine wordt verder geacht een lager risico te hebben op anticholinerge of serotonine-gerelateerde bijwerkingen die vaak geassocieerd worden met andere antidepressiva (zoals seksuele disfunctie, misselijkheid, enz.), zelfs lager dan SSRI’s, en kan in feite bepaalde bijwerkingen verbeteren wanneer het wordt ingenomen in combinatie met andere antidepressiva .
Niettemin veroorzaken antidepressiva van de nieuwe generatie ook bijwerkingen , en daarom zijn de uitvalpercentages als gevolg van bijwerkingen hoger voor antidepressiva van de nieuwe generatie dan voor placebo (maar natuurlijk nog steeds lager dan de uitvalpercentages van oudere antidepressiva) . Ervaren clinici kunnen dus nog steeds goed inschatten of een deelnemer een placebo of een actieve behandeling krijgt. In overeenstemming daarmee toonden Chen e.a. in de heranalyse van de Hypericum Depressie Proef aan dat clinici beter waren in het juist inschatten van placebo dan van sertraline of hypericum. Bovendien waren de bijwerkingen meer uitgesproken bij deelnemers bij wie de clinici de actieve behandeling hadden geraden (wat wijst op unblindering vanwege bijwerkingen), en waren de verbeteringen bij actieve behandeling ten opzichte van placebo groter wanneer de clinici de actieve behandeling hadden geraden. We suggereren daarom dat unblindering bias ook een probleem is in trials van nieuwere antidepressiva, hoewel het waarschijnlijk minder uitgesproken is dan in trials van de slechter verdragen oudere antidepressiva.
Ten slotte is het belangrijk op te merken dat onze analyse alternatieve verklaringen niet volledig kan uitsluiten. In plaats van unblindering zou een andere reden bijvoorbeeld de verandering van onderzoeksprotocollen in de loop van de tijd kunnen zijn. Om maar een voorbeeld te noemen: de in- en exclusiecriteria van antidepressiva trials zijn in de loop der tijd strenger geworden, wat betekent dat deelnemers aan trials steeds minder representatief zijn. Hoewel het controleren van het studiejaar dit verwarrende effect zeker gedeeltelijk vermindert, kan het het niet helemaal wegnemen. Om onze hypothese te bevestigen is een vooraf geregistreerde prospectieve studie nodig. Aangezien bijwerkingen die waarneembaar zijn voor een uitkomstbeoordelaar, zelfs wanneer ze niet door de patiënt worden gemeld (bijv, droge mond, tremor, slaperigheid, slaperigheid) vermoedelijk de veroorzakers van unblinding zijn, zou het de moeite waard zijn om te onderzoeken of deze specifieke bijwerkingen (in verhouding tot minder waarneembare bijwerkingen zoals seksuele disfunctie en gebrek aan eetlust) leiden tot correcte identificatie van de ontvangen behandeling en of ze negatief gecorreleerd zijn met depressiewaarderingen in de placebo-arm.
De belangrijkste implicatie van onze studie is dat unblinding systematisch zou moeten worden beoordeeld en gerapporteerd in antidepressiva trials. Dit zou het mogelijk maken om statistisch te controleren voor effecten van blindering en het zou ook mogelijk zijn om een bevestigende studie uit te voeren zoals hierboven beschreven. Als onze hypothese klopt, zou dit betekenen dat inerte placebo’s een slechte controle zijn en dat het gebruik van actieve placebo’s dus moet worden heroverwogen. Een andere implicatie zou zijn dat rangschikkingen van werkzaamheid op basis van NMA met voorzichtigheid moeten worden geïnterpreteerd.
Beperkingen
Een beperking van de huidige analyse is dat deze niet gebaseerd was op een geschreven protocol, maar slechts de bevindingen van Naudet en collega’s volgde.
Een andere beperking die inherent is aan de huidige dataset is dat de placebo’s alleen kunnen worden geïnterpreteerd op basis van hun vergelijkingen met de overeenkomstige antidepressiva waaraan ze in het netwerk zijn gebonden. Hier hebben we ons geconcentreerd op de placebo’s met één vergelijking, aangezien de placebo’s met twee vergelijkingen moeilijk te interpreteren zijn en daarom alleen in het supplement worden gepresenteerd. Men moet daarom in gedachten houden dat 24% van de trials die ook dubbele vergelijkingen bevatten, niet werden meegenomen in de huidige interpretatie.
Een andere beperking betreft het bewijsmateriaal dat is samengevat in deze speciale placebo NMA, in die zin dat alle vergelijkingen tussen placebo’s alleen berusten op indirect bewijsmateriaal, en niet op een mengeling van directe en indirecte vergelijkingen zoals voor de meeste antidepressiva; hoewel, in gemengde behandelingsvergelijkingen, een belangrijk deel van het bewijsmateriaal ook vaak berust op indirect bewijsmateriaal . De consistentiehypothese, die ervan uitgaat dat de effecten tussen directe en indirecte vergelijkingen gelijk zijn, kan derhalve niet worden geverifieerd. Hoewel het in deze placebo-context onmogelijk is deze hypothese te verifiëren, kan men niet zeker zijn van de geldigheid van de vergelijkingen, aangezien indirecte vergelijkingen mogelijk niet robuust zijn en gevoelig zijn voor trilling van effecten .
Een methodologische beperking is het probleem van multipliciteit in de huidige NMA. Standaard NMA-modellen houden gewoonlijk geen rekening met meervoudige vergelijkingen bij het schatten van relatieve behandelingseffecten, wat zou kunnen leiden tot overdreven en overmoedige uitspraken over relatieve behandelingseffecten. In de huidige analyse is daarom de Bayesiaanse benadering toegepast om dat door Efthimiou en White beschreven probleem te verminderen, waarbij behandelingseffecten uitwisselbaar worden gemodelleerd, en bijgevolg schattingen worden weggekrompen van grote waarden.
Een meer algemene beperking is dat wordt vertrouwd op de gelijksoortigheidshypothese die veronderstelt dat alle trials gelijksoortig genoeg zijn om te worden gepoold. Cipriani et al. beschouwden deze hypothese als geldig, maar toch kunnen sommige niet-gemeten kenmerken onze bevindingen hebben beïnvloed, zoals verschillen tussen in- en poliklinische patiënten of een ander surrogaat van depressie-ernst bij aanvang van de studie.