Analytische gevoeligheid, functionele gevoeligheid
Een van de fundamentele kenmerken van elke analytische methode is de kleinste concentratie die op betrouwbare wijze kan worden gemeten. Er zijn een aantal termen en concepten gebruikt om de laagste concentratie te beschrijven die een immunoassay kan rapporteren, en deze veelheid aan termen kan echt verwarrend zijn. Wat volgt is een bespreking van enkele van deze termen en hoe zij verband houden met het beantwoorden van de fundamentele vraag: Wat is de laagste concentratie die ik met deze test kan bepalen?
Analytische gevoeligheid
De formele definitie van analytische gevoeligheid is “de laagste concentratie die van achtergrondruis kan worden onderscheiden”. Deze concentratie wordt ook wel de detectielimiet van de bepaling genoemd, maar meestal wordt hiernaar verwezen met de term gevoeligheid. Gewoonlijk wordt deze waarde vastgesteld door replicaten te analyseren van een monster waarvan bekend is dat er geen analyt in aanwezig is. Vervolgens worden de gemeten tellingen (CPS) van deze replicaten gebruikt om een gemiddelde en standaardafwijking (SD) te berekenen. De analytische gevoeligheid wordt bepaald als de concentratie die overeenkomt met de gemiddelde tellingen van het nulmonster plus 2 SD voor immunometrische bepalingen, en het gemiddelde min 2 SD voor concurrerende bepalingen. Dit is wat wordt gepubliceerd in het gedeelte “Analytische gevoeligheid” van de IMMULITE® en IMMULITE® 2000 bijsluiters.
In de echte wereld heeft de analytische gevoeligheid slechts een beperkte praktische waarde. De echte beperking is dat voor elke bepaling de onnauwkeurigheid zeer snel toeneemt naarmate de concentratie afneemt. Dit verschijnsel wordt duidelijk wanneer men het precisieprofiel van de assay bekijkt; dit is een grafische voorstelling van hoe de onnauwkeurigheid van een assay verandert met de gemeten concentratie. (Zie de figuren 1 en 2 voor voorbeelden.)
Figuur 1. Representatief DPC-precisieprofiel.
Figuur 2. Representatief DPC-precisieprofiel. Merk op dat een functionele gevoeligheid in de orde van 0,01-0,02 µIU/mL per definitie vereist is voor een TSH-test van de “derde generatie”.1,2
Niet alleen bij de analytische gevoeligheid, maar zelfs bij concentraties die daar aanzienlijk boven liggen, kan de onnauwkeurigheid zo groot zijn dat de resultaten niet goed genoeg worden gereproduceerd om van werkelijk klinisch nut te zijn. Bijgevolg vertegenwoordigt de analytische gevoeligheid typisch niet de laagste meetbare concentratie die klinisch bruikbaar is.
Deze beperking van de analytische gevoeligheid is bij ons, voor RIA en IMMULITE, altijd aan de orde geweest en geldt voor alle methoden van alle fabrikanten. Aangezien patiëntenmonsters gewoonlijk niet in duplo worden uitgevoerd, is het gebrek aan reproduceerbaarheid bij routinetests wellicht niet direct zichtbaar. De algehele kwaliteit en bruikbaarheid van de resultaten worden echter wel beïnvloed. Daarom wordt de ondergrens van het rapportagebereik in de IMMULITE en IMMULITE 2000 software vaak ingesteld op een concentratie boven de analytische gevoeligheid. DPC stelt de rapportagegrenzen voor elke assay in op wat volgens een uitgebreide beoordeling het bereik is van effectieve en betrouwbare prestaties voor de assay, in verhouding tot het beoogde klinische gebruik.
De beperkingen van analytische gevoeligheid, voor het beschrijven van de ondergrens van klinisch effectieve assayprestaties, leidden tot de ontwikkeling van een ander concept.
Functionele gevoeligheid
Rongeveer tien jaar geleden ontwikkelde een groep onderzoekers die TSH-tests evalueerden, in reactie op de beperkte bruikbaarheid van analytische gevoeligheid als maatstaf voor de prestaties van een test, een concept dat zij functionele gevoeligheid noemden.1 Zij definieerden het als “de laagste concentratie waarbij een test klinisch bruikbare resultaten kan rapporteren”. Klinisch bruikbare resultaten voor TSH werden geacht een goede nauwkeurigheid te hebben met een dagelijkse CV van niet meer dan 20%. Hoewel deze keuze van CV-grens enigszins arbitrair was, waren de onderzoekers van mening dat, voor TSH, een CV van 20% de meeste onnauwkeurigheid was die voor klinische doeleinden kon worden getolereerd.1
Aangezien CV de standaardafwijking is, uitgedrukt als percentage van het gemiddelde, impliceert een CV van 20% dat de SD 20% van het gemiddelde zou zijn. Voor een monster met een TSH-concentratie van 0,1 µIU/mL, bijvoorbeeld, zou het bereik dat 95% van de verwachte resultaten van herhaalde analyse omvat ±40% (±2 SD) zijn, of 0,06 µIU/mL tot 0,14 µIU/mL.
Hoewel oorspronkelijk alleen ontwikkeld voor TSH-tests, zijn het concept van functionele gevoeligheid en het gebruik van een CV van 20% als de grens van klinische bruikbaarheid op grote schaal toegepast op andere immunoassays. Het concept heeft ingang gevonden omdat het het laboratorium een objectieve en klinisch zinvolle indicatie geeft van de praktische ondergrens van een assay.
Bij de ontwikkeling van een nieuwe assay volgt het DPC in wezen dezelfde aanpak, waarbij zowel de precisie als de nauwkeurigheid worden geëvalueerd om de concentraties vast te stellen waarbij de grenzen van de klinische bruikbaarheid waarschijnlijk zullen worden bereikt. Het software-rapportagegrensbereik is op deze evaluatie gebaseerd. Vooral voor concurrerende bepalingen is er gewoonlijk een aanzienlijk verschil tussen de analytische gevoeligheid en de onderste rapportagegrens. De rapportagegrens, zoals ingesteld in de IMMULITE- en IMMULITE 2000-software, vertegenwoordigt de aanbeveling van DPC voor de CLIA’88* “reportable range” – dat is het concentratiebereik waarbinnen de assayprestaties als geldig worden gedocumenteerd.
Verificatie van de assayprestaties
Momenteel is voor laboratoria die in de VS geautomatiseerde immunoassaysystemen gebruiken, het enige gevoeligheidsgerelateerde prestatiekenmerk dat volgens CLIA’88 door het laboratorium moet worden geverifieerd, de ondergrens van het rapporteerbare bereik. Sommige laboratoria kunnen er ook voor kiezen de functionele gevoeligheid van een nieuwe assay te schatten; en in het verleden hebben sommige laboratoria de analytische gevoeligheid willen verifiëren. Elk van deze beoordelingen is een ander experiment met andere protocollen en eisen. De eerste stap bestaat er dus in te beslissen wat moet worden geverifieerd, vervolgens het passende protocol te gebruiken en de gegevens dienovereenkomstig te evalueren.
Als een laboratorium ervoor kiest de analytische gevoeligheid te evalueren, is het doel meestal de waarde te verifiëren die voor die prestatiemaatstaf in de bijsluiter is vermeld. Het is van essentieel belang dat het monster dat voor een analytisch gevoeligheidsonderzoek wordt gebruikt, een echt nulconcentratiemonster is met een geschikte monstermatrix. Elk ander type monster kan de resultaten vertekenen. Het gebruikelijke protocol omvat de analyse van 20 replicaten van het nulmonster, gevolgd door de berekening van het gemiddelde en de SD van de CPS. De analytische gevoeligheid wordt geschat als de concentratie die gelijk is aan de gemiddelde tellingen van het nulmonster plus 2 SD voor immunometrische (“sandwich”) assays zoals TSH, of min 2 SD voor competitieve assays zoals T4. De technische dienst kan helpen bij de berekening van deze concentratie. Dit protocol levert een eerste schatting op, die gewoonlijk voldoende is voor vergelijking met de analytische gevoeligheid die in de bijsluiter wordt vermeld. Er zijn echter meerdere experimenten met verschillende partijen kit nodig om een robuuste en nauwkeurige beoordeling te krijgen.
Bij de beoordeling van de functionele gevoeligheid is het de bedoeling de laagste concentratie te bepalen die overeenkomt met een door het laboratorium gespecificeerd doel voor de dagelijkse (interassay) imprecisie, die de grens van het klinisch nut voor een bepaalde assay vertegenwoordigt. Gewoonlijk wordt een VC van 20% als doel gehanteerd, op basis van de oorspronkelijke toepassing van het concept op TSH. Deze VC is echter niet altijd de meest geschikte grens. Voor sommige tests kan een VC van meer dan 20% consistent zijn met klinisch betrouwbare en informatieve resultaten, terwijl voor andere tests een VC van minder dan 20% de grens van klinisch nut kan zijn. Het prestatiedoel moet voor elke assay worden vastgesteld, op basis van de beoogde klinische toepassing.
Nadat de dagelijkse VC is bepaald die de klinisch nuttige grens van de reproduceerbaarheid vertegenwoordigt, is de volgende stap de schatting van de concentratie waarbij de VC deze grens zou kunnen bereiken. Op basis van eerdere studies, gegevens uit de bijsluiter en schattingen op basis van het precisieprofiel van het assay, kan de technische dienst gewoonlijk helpen bij het vaststellen van een “doelbereik” van concentraties die de vooraf bepaalde CV-grens omspannen.
In het algemeen moet dit onderzoek worden uitgevoerd met gebruikmaking van verscheidene onverdunde patiëntenmonsters, of pools van patiëntenmonsters, met concentraties die het doelbereik omspannen. Deze monsters kunnen echter moeilijk te verkrijgen zijn. Redelijke alternatieven zijn onder meer patiëntenmonsters die zijn verdund tot concentraties binnen het doelbereik, of controlematerialen binnen of nabij dit bereik. Als een willekeurig type monster voor het onderzoek moet worden verdund, is het van cruciaal belang welk verdunningsmiddel wordt gebruikt. De routinemonsterverdunningsmiddelen zijn alleen bedoeld voor het verdunnen van monsters met een zeer hoge concentratie; voor sommige assays kunnen zij een meetbare, zij het zeer lage, schijnbare concentratie hebben. Het gebruik van deze verdunningsmiddelen kan de resultaten van het onderzoek vertekenen.
De monsters moeten herhaaldelijk worden geanalyseerd in een aantal verschillende runs, idealiter over een periode van dagen of weken, om de dag-tot-dag-precisie te beoordelen. (Een enkele run van 20 replicaten geeft geen geldige beoordeling van de functionele gevoeligheid). Bereken, nadat de gegevens zijn verzameld, de VC voor elk getest monster. De functionele gevoeligheid is de concentratie waarbij de VC de vooraf bepaalde grens bereikt. Deze concentratie kan door interpolatie uit de onderzoeksresultaten worden geschat, als zij niet toevallig samenvalt met een van de geteste niveaus.
Het verifiëren van de ondergrens van de te rapporteren reeks is een onderdeel van het proces van verificatie van de gehele te rapporteren reeks. Dit wordt gewoonlijk bereikt door het uitvoeren van een replicaatanalyse op een reeks van drie tot vijf monsters met bekende concentraties die het rapporteerbare bereik omvatten. Deze monsters kunnen worden verkregen met behulp van één monster met een concentratie in de buurt van de bovengrens van het bereik, dat vervolgens wordt verdund om extra monsters te verkrijgen die het gehele te rapporteren bereik bestrijken. De verkregen resultaten worden geëvalueerd voor zowel reproduceerbaarheid als herstel van verwachte waarden om te bepalen dat de prestaties van de assay voldoen aan de klinische bruikbaarheidsbehoeften over het rapporteerbare bereik.
Conclusie
Dus, waarom is de ondergrens van het software-rapportagegamma 1,0 µg/dL (13 nmol/L) terwijl de bijsluiter zegt dat de gevoeligheid 0,3 µg/dL (3,9 nmol/L) is? In dit voorbeeld is de test een concurrerende test en de onnauwkeurigheid van de test overschrijdt de klinisch bruikbare grenzen bij een concentratie die ver boven de analytische gevoeligheid ligt.
Als de onnauwkeurigheid zodanig is dat u niet met zekerheid kunt zeggen dat resultaten van, laten we zeggen, 0,4 µg/dL (5 nmol/L) en 0,7 µg/dL (9 nmol/L) in feite verschillend zijn, zou het dan niet beter zijn beide te rapporteren als ”
Ultimately, it is usually not the assay’s detection limit (analytical sensitivity) but rather the reproducibility of results which determines the lower limit of clinically reliable assay performance in routine practice.
1. Spencer CA. Thyroid profiling for the 1990s: free T4 estimate or sensitive TSH measurement. J Clin Immunoassay 1989; 12:82-9.
2. Spencer CA, et al. Interlaboratory/intermethod differences in functional sensitivity of immunometric assays of thyrotropin (TSH) and impact on reliability of measurement of subnormal concentrations of TSH. Clin Chem 1995;41:367-74. Herdruk (catalogusnummer ZD060) op aanvraag verkrijgbaar bij DPC.
*CLIA’88: de Amerikaanse wet op de verbetering van klinische laboratoria.