Sensibilità analitica, sensibilità funzionale
Una delle caratteristiche fondamentali di qualsiasi metodo analitico è la più piccola concentrazione che può essere misurata in modo affidabile. Un certo numero di termini e concetti sono stati usati per descrivere la concentrazione più bassa che un test immunologico può riportare, e questa molteplicità di termini può essere veramente confusa. Quello che segue è una discussione di alcuni di questi termini e come si riferiscono alla risposta alla domanda fondamentale: Qual è la concentrazione più bassa che posso riportare con questo test?
Sensibilità analitica
La definizione formale di sensibilità analitica è “la concentrazione più bassa che può essere distinta dal rumore di fondo”. Questa concentrazione è propriamente chiamata limite di rilevazione del test, ma è più comunemente indicata come sensibilità. In genere, questo valore viene stabilito analizzando le repliche di un campione che è noto per non avere alcun analita presente. Poi i conteggi misurati (CPS) da questi replicati sono usati per calcolare una media e una deviazione standard (SD). La sensibilità analitica è determinata come la concentrazione equivalente ai conteggi medi ottenuti dal campione zero più 2 SD per i test immunometrici, e la media meno 2 SD per i test competitivi. Questo è quanto pubblicato nella sezione “Sensibilità analitica” dei foglietti illustrativi di IMMULITE® e IMMULITE® 2000.
Nel mondo reale, la sensibilità analitica ha un valore pratico limitato. La vera limitazione è che, per qualsiasi saggio, l’imprecisione aumenta molto rapidamente al diminuire della concentrazione. Questo fenomeno è immediatamente evidente quando si osserva il profilo di precisione del test, che è una rappresentazione grafica di come l’imprecisione di un test cambia con la concentrazione misurata. (Vedere le figure 1 e 2 per esempi.)
Figura 1. Profilo di precisione DPC rappresentativo.
Figura 2. Profilo di precisione DPC rappresentativo. Si noti che la sensibilità funzionale nella regione di 0,01-0,02 µIU/mL è richiesta da un test TSH di “terza generazione” per definizione.1,2
Non solo alla sensibilità analitica, ma anche a concentrazioni significativamente superiori, l’imprecisione può essere così grande che i risultati non si riproducono abbastanza bene da essere di reale utilità clinica. Di conseguenza, la sensibilità analitica non rappresenta tipicamente la più bassa concentrazione misurabile che è clinicamente utile.
Questa limitazione della sensibilità analitica è sempre stata con noi, per RIA e IMMULITE, e si applica a tutti i metodi di tutti i produttori. Poiché i campioni dei pazienti non sono tipicamente eseguiti in repliche, la mancanza di riproducibilità può non essere immediatamente evidente nei test di routine. Tuttavia, la qualità complessiva e l’utilità dei risultati ne risentono. Questo è il motivo per cui il limite inferiore dell’intervallo di segnalazione nel software IMMULITE e IMMULITE 2000 è spesso impostato su una concentrazione superiore alla sensibilità analitica. DPC imposta i limiti di segnalazione per ogni test a quello che una valutazione globale suggerisce essere l’intervallo di prestazioni efficaci e affidabili per il test, relativamente al suo uso clinico previsto.
Le limitazioni della sensibilità analitica, per descrivere il limite inferiore delle prestazioni clinicamente efficaci del test, hanno portato allo sviluppo di un altro concetto.
Sensibilità funzionale
Circa un decennio fa, in reazione alla limitata utilità della sensibilità analitica come misura delle prestazioni del test, un gruppo di ricercatori che valutava i test del TSH ha sviluppato un concetto che hanno chiamato sensibilità funzionale.1 L’hanno definita come “la concentrazione più bassa alla quale un test può riportare risultati clinicamente utili”. I risultati clinicamente utili per il TSH sono stati considerati di buona precisione con un CV giornaliero non superiore al 20%. Sebbene questa scelta del limite CV fosse in qualche modo arbitraria, i ricercatori hanno ritenuto che, per il TSH, un CV del 20% fosse la massima imprecisione che potesse essere tollerata per scopi clinici.1
Siccome il CV è la deviazione standard espressa come percentuale della media, un CV del 20% implica che la SD sarebbe il 20% della media. Per un campione con una concentrazione di TSH di 0,1 µU/mL, ad esempio, l’intervallo che comprende il 95% dei risultati attesi dall’analisi ripetuta sarebbe di ±40% (±2 SD), ovvero da 0,06 µU/mL a 0,14 µU/mL.
Anche se originariamente sviluppato solo per i test del TSH, il concetto di sensibilità funzionale e l’uso di un CV del 20% come limite di utilità clinica sono stati ampiamente applicati ad altri test immunologici. Il concetto è stato accettato perché fornisce al laboratorio un’indicazione oggettiva e clinicamente significativa del limite inferiore pratico di un test.
Quando si sviluppa un nuovo test, DPC utilizza essenzialmente lo stesso approccio, valutando sia la precisione che l’accuratezza per stabilire le concentrazioni alle quali è probabile che vengano raggiunti i limiti di utilità clinica. L’intervallo di segnalazione del software si basa su questa valutazione. Soprattutto per i test competitivi, c’è di solito una differenza significativa tra la sensibilità analitica e il limite inferiore di segnalazione. L’intervallo di segnalazione, come impostato nel software IMMULITE e IMMULITE 2000, rappresenta la raccomandazione di DPC per l'”intervallo di segnalazione” CLIA’88*, che è l’intervallo di concentrazione in cui le prestazioni del test sono documentate come valide.
Verificare le prestazioni del test
Attualmente, per i laboratori che utilizzano sistemi di immunodosaggio automatizzati negli Stati Uniti, l’unica caratteristica di prestazione relativa alla sensibilità che la CLIA’88 richiede che sia verificata dal laboratorio è il limite inferiore dell’intervallo riportabile. Alcuni laboratori possono anche scegliere di stimare la sensibilità funzionale di un nuovo test; e, storicamente, alcuni hanno voluto verificare la sensibilità analitica. Ognuna di queste valutazioni è un esperimento diverso con protocolli e requisiti distinti. Quindi il primo passo è decidere cosa deve essere verificato e poi usare il protocollo appropriato e valutare i dati di conseguenza.
Se un laboratorio sceglie di valutare la sensibilità analitica, l’obiettivo è tipicamente quello di verificare il valore dato per quella misura di performance nel foglietto illustrativo. È essenziale che il campione utilizzato per uno studio di sensibilità analitica sia un vero campione a concentrazione zero con una matrice campione appropriata. Qualsiasi altro tipo di campione può falsare i risultati. Il protocollo usuale prevede il dosaggio di 20 repliche del campione zero, seguito dal calcolo della media e della DS del CPS. La sensibilità analitica è stimata come la concentrazione uguale alla media dei conteggi del campione zero più 2 SD per i test immunometrici (“sandwich”) come il TSH, o meno 2 SD per i test competitivi come il T4. I servizi tecnici possono aiutare a calcolare questa concentrazione. Questo protocollo fornisce una stima iniziale, che di solito è adeguata per il confronto con la sensibilità analitica elencata nel foglietto illustrativo. Tuttavia, sono necessari più esperimenti che comprendono diversi lotti di kit per ottenere una valutazione robusta e accurata.
Nella valutazione della sensibilità funzionale, lo scopo è quello di determinare la concentrazione più bassa corrispondente a un obiettivo specificato dal laboratorio per l’imprecisione giornaliera (inter-test) che rappresenta il limite di utilità clinica per un determinato test. Comunemente, un CV del 20% è stato utilizzato come obiettivo, sulla base dell’applicazione originale del concetto al TSH. Tuttavia, questo CV potrebbe non essere sempre il limite più appropriato. Per alcuni test, un CV superiore al 20% può essere coerente con risultati clinicamente affidabili e informativi, mentre per altri, un CV inferiore al 20% può rappresentare il limite dell’utilità clinica. L’obiettivo di prestazione deve essere fissato per ogni test, sulla base della sua applicazione clinica prevista.
Avendo determinato il CV giornaliero che rappresenta il limite di riproducibilità clinicamente utile, il passo successivo è quello di stimare la concentrazione alla quale il CV potrebbe raggiungere questo limite. Sulla base di studi precedenti, dei dati del foglietto illustrativo e delle stime fatte dal profilo di precisione del test, i servizi tecnici possono di solito aiutare a identificare un “intervallo target” di concentrazioni che si situa tra il limite CV predeterminato.
Idealmente, questo studio dovrebbe essere eseguito utilizzando diversi campioni di pazienti non diluiti, o gruppi di campioni di pazienti, con concentrazioni che abbracciano l’intervallo target. Tuttavia, questi campioni possono essere difficili da ottenere. Alternative ragionevoli includono campioni di pazienti diluiti fino a concentrazioni che coprono l’intervallo di destinazione, o materiali di controllo in o vicino a questo intervallo. Se c’è la necessità di diluire qualsiasi tipo di campione per lo studio, il diluente utilizzato è fondamentale. I diluenti per campioni di routine sono destinati solo alla diluizione di campioni a concentrazione molto alta; per alcuni saggi, possono avere una concentrazione apparente misurabile, anche se molto bassa. L’uso di questi diluenti può falsare i risultati dello studio.
I campioni dovrebbero essere analizzati ripetutamente su un numero di corse diverse, idealmente su un periodo di giorni o settimane, per valutare la precisione giornaliera. (Una singola corsa di 20 replicati non fornisce una valutazione valida della sensibilità funzionale). Dopo aver raccolto i dati, calcolare il CV per ogni campione testato. La sensibilità funzionale è la concentrazione alla quale il CV raggiunge il limite predeterminato. Questa concentrazione può essere stimata dai risultati dello studio per interpolazione, se non coincide con uno dei livelli testati.
La verifica del limite inferiore dell’intervallo riportabile è una parte del processo di verifica dell’intero intervallo riportabile. Questo è tipicamente realizzato eseguendo analisi replicate su una serie di tre-cinque campioni con concentrazioni note che coprono l’intervallo riportabile. Questi campioni possono essere ottenuti utilizzando un singolo campione, con una concentrazione vicina al limite superiore dell’intervallo, che viene poi diluito per ottenere ulteriori campioni che coprono l’intero intervallo riportabile. I risultati ottenuti sono valutati sia per la riproducibilità che per il recupero dei valori attesi per determinare che le prestazioni del test soddisfino le esigenze di utilità clinica in tutto l’intervallo riportabile.
Conclusione
Quindi, perché il limite inferiore dell’intervallo di segnalazione del software è 1,0 µg/dL (13 nmol/L) quando il foglietto illustrativo dice che la sensibilità è 0,3 µg/dL (3,9 nmol/L)? In questo esempio, il test è un test competitivo e l’imprecisione del test supera i limiti clinicamente utili ad una concentrazione ben superiore alla sensibilità analitica.
Se l’imprecisione è tale che non si può dire con certezza che risultati di, diciamo, 0,4 µg/dL (5 nmol/L) e 0,7 µg/dL (9 nmol/L) siano effettivamente diversi, non sarebbe meglio riportare entrambi come ”
In definitiva, di solito non è il limite di rilevamento del test (sensibilità analitica) ma piuttosto la riproducibilità dei risultati che determina il limite inferiore delle prestazioni clinicamente affidabili del test nella pratica di routine.
1. Spencer CA. Profilo tiroideo per gli anni ’90: stima della T4 libera o misurazione sensibile del TSH. J Clin Immunoassay 1989; 12:82-9.
2. Spencer CA, et al. Interlaboratory/intermethod differences in functional sensitivity of immunometric assays of thyrotropin (TSH) and impact on reliability of measurement of subnormal concentrations of TSH. Clin Chem 1995;41:367-74. Ristampa (numero di catalogo ZD060) disponibile da DPC su richiesta.
*CLIA’88: il Clinical Laboratory Improvement Act degli Stati Uniti.