Sensibilidad analítica, sensibilidad funcional

Una de las características fundamentales de cualquier método analítico es la concentración más pequeña que puede medirse con fiabilidad. Se han utilizado varios términos y conceptos para describir la concentración más baja que puede informar un inmunoensayo, y esta multiplicidad de términos puede ser realmente confusa. A continuación se analizan algunos de estos términos y su relación con la respuesta a la pregunta fundamental: ¿Cuál es la concentración más baja que puedo notificar con este ensayo?
Sensibilidad analítica
La definición formal de sensibilidad analítica es «la concentración más baja que puede distinguirse del ruido de fondo». Esta concentración se denomina propiamente límite de detección del ensayo, pero se denomina más comúnmente sensibilidad. Normalmente, este valor se establece ensayando réplicas de una muestra que se sabe que no tiene analito presente. A continuación, los recuentos medidos (CPS) de estas réplicas se utilizan para calcular una media y una desviación estándar (SD). La sensibilidad analítica se determina como la concentración equivalente a los recuentos medios obtenidos a partir de la muestra cero más 2 DE para los ensayos inmunométricos, y la media menos 2 DE para los ensayos competitivos. Esto es lo que se publica en la sección «Sensibilidad analítica» de los prospectos de IMMULITE® e IMMULITE® 2000.
En el mundo real, la sensibilidad analítica tiene un valor práctico limitado. La verdadera limitación es que, para cualquier ensayo, la imprecisión aumenta muy rápidamente a medida que disminuye la concentración. Este fenómeno es evidente cuando se observa el perfil de precisión del ensayo, que es una representación gráfica de cómo cambia la imprecisión de un ensayo con la concentración medida. (Véanse ejemplos en las Figuras 1 y 2.)

Figura 1. Perfil de precisión DPC representativo.

Figura 2. Perfil de precisión representativo del CPD. Nótese que la sensibilidad funcional en la región de 0,01-0,02 µIU/mL, se requiere de un ensayo de TSH de «tercera generación» por definición.1,2
No sólo en la sensibilidad analítica, sino incluso en concentraciones significativamente por encima de ella, la imprecisión puede ser tan grande que los resultados no se reproducen lo suficientemente bien como para ser de utilidad clínica real. En consecuencia, la sensibilidad analítica no suele representar la concentración medible más baja que es clínicamente útil.
Esta limitación de la sensibilidad analítica siempre ha estado con nosotros, para RIA e IMMULITE, y se aplica a todos los métodos de todos los fabricantes. Dado que las muestras de los pacientes no se suelen ejecutar en réplicas, la falta de reproducibilidad puede no ser fácilmente evidente en las pruebas de rutina. Sin embargo, la calidad general y la utilidad de los resultados se ven afectadas. Por ello, el límite inferior del intervalo de notificación en el software IMMULITE e IMMULITE 2000 suele fijarse en una concentración superior a la sensibilidad analítica. DPC establece los límites de notificación para cada ensayo a lo que una evaluación exhaustiva sugiere que es el rango de rendimiento efectivo y fiable para el ensayo, en relación con su uso clínico previsto.
Las limitaciones de la sensibilidad analítica, para describir el límite inferior del rendimiento clínicamente efectivo del ensayo, condujeron al desarrollo de otro concepto.
Sensibilidad funcional
Hace aproximadamente una década, como reacción a la limitada utilidad de la sensibilidad analítica como medida del rendimiento del ensayo, un grupo de investigadores que evaluaban los ensayos de TSH desarrollaron un concepto que denominaron sensibilidad funcional.1 Lo definieron como «la concentración más baja a la que un ensayo puede informar de resultados clínicamente útiles». Se consideró que los resultados clínicamente útiles para la TSH eran una buena precisión con un CV diario no superior al 20%. Aunque esta elección del límite de CV fue algo arbitraria, los investigadores consideraron que, para la TSH, un CV del 20% era la mayor imprecisión que podía tolerarse para fines clínicos.1
Dado que el CV es la desviación estándar expresada como un porcentaje de la media, un CV del 20% implica que la DE sería el 20% de la media. Para una muestra con una concentración de TSH de 0,1 µIU/mL, por ejemplo, el rango que abarca el 95% de los resultados esperados de la repetición del análisis sería de ±40% (±2 SD), o de 0,06 µIU/mL a 0,14 µIU/mL.
Aunque originalmente se desarrolló sólo para los ensayos de TSH, el concepto de sensibilidad funcional y el uso de un CV del 20% como límite de utilidad clínica se han aplicado ampliamente a otros inmunoensayos. El concepto ha ganado aceptación porque proporciona al laboratorio una indicación objetiva y clínicamente significativa del límite inferior práctico de un ensayo.
Cuando se desarrolla un nuevo ensayo, DPC utiliza esencialmente el mismo enfoque, evaluando tanto la precisión como la exactitud para establecer las concentraciones en las que es probable que se alcancen los límites de utilidad clínica. El rango de notificación del software se basa en esta evaluación. Especialmente en el caso de los ensayos competitivos, suele haber una diferencia significativa entre la sensibilidad analítica y el límite inferior de notificación. El rango de notificación, tal y como se establece en el software IMMULITE e IMMULITE 2000, representa la recomendación de DPC para el «rango notificable» de CLIA’88*, que es el rango de concentración sobre el que el rendimiento del ensayo se documenta como válido.
Verificación del rendimiento del ensayo
Actualmente, para los laboratorios que utilizan sistemas de inmunoensayo automatizados en los Estados Unidos, la única característica de rendimiento relacionada con la sensibilidad que CLIA’88 requiere que sea verificada por el laboratorio es el límite inferior del rango notificable. Algunos laboratorios también pueden optar por estimar la sensibilidad funcional de un nuevo ensayo; e, históricamente, algunos han querido verificar la sensibilidad analítica. Cada una de estas evaluaciones es un experimento diferente con protocolos y requisitos distintos. Por lo tanto, el primer paso es decidir qué es lo que se va a verificar y luego utilizar el protocolo apropiado y evaluar los datos en consecuencia.
Si un laboratorio decide evaluar la sensibilidad analítica, el objetivo suele ser verificar el valor dado para esa medida de rendimiento en el prospecto. Es esencial que la muestra utilizada para un estudio de sensibilidad analítica sea una muestra de verdadera concentración cero con una matriz de muestra apropiada. Cualquier otro tipo de muestra puede sesgar los resultados. El protocolo habitual consiste en ensayar 20 réplicas de la muestra cero, seguidas del cálculo de la media y la SD de la CPS. La sensibilidad analítica se estima como la concentración igual a la media de los recuentos de la muestra cero más 2 SD para los ensayos inmunométricos («sandwich») como la TSH, o menos 2 SD para los ensayos competitivos como la T4. Los servicios técnicos pueden ayudar a calcular esta concentración. Este protocolo proporciona una estimación inicial, que suele ser adecuada para la comparación con la sensibilidad analítica indicada en el prospecto. Sin embargo, son necesarios múltiples experimentos que abarquen varios lotes del kit para obtener una evaluación sólida y precisa.
Al evaluar la sensibilidad funcional, el objetivo es determinar la concentración más baja correspondiente a un objetivo especificado por el laboratorio para la imprecisión diaria (entre ensayos) que representa el límite de utilidad clínica para un ensayo determinado. Comúnmente, se ha utilizado un CV del 20% como objetivo, basado en la aplicación original del concepto a la TSH. Sin embargo, este CV puede no ser siempre el límite más apropiado. Para algunos ensayos, un CV superior al 20% puede ser coherente con resultados clínicamente fiables e informativos, mientras que para otros, un CV inferior al 20% puede representar el límite de la utilidad clínica. El objetivo de rendimiento debe establecerse para cada ensayo, basándose en su aplicación clínica prevista.
Una vez determinado el CV diario que representa el límite de utilidad clínica de la reproducibilidad, el siguiente paso es estimar la concentración en la que el CV podría alcanzar este límite. Sobre la base de estudios previos, datos del prospecto y estimaciones realizadas a partir del perfil de precisión del ensayo, los Servicios Técnicos normalmente pueden ayudar a identificar un «intervalo objetivo» de concentraciones que se sitúe entre el límite de CV predeterminado.
En principio, este estudio debería realizarse utilizando varias muestras de pacientes sin diluir, o grupos de muestras de pacientes, con concentraciones que abarquen el rango objetivo. Sin embargo, estas muestras pueden ser difíciles de obtener. Las alternativas razonables incluyen muestras de pacientes diluidas hasta concentraciones que abarquen el rango objetivo, o materiales de control en o cerca de este rango. Si es necesario diluir cualquier tipo de muestra para el estudio, el diluyente utilizado es fundamental. Los diluyentes de muestras de rutina están pensados sólo para diluir muestras de muy alta concentración; para algunos ensayos, pueden tener una concentración aparente medible, aunque muy baja. El uso de estos diluyentes puede sesgar los resultados del estudio.
Las muestras deben analizarse repetidamente en varias ejecuciones diferentes, idealmente durante un período de días o semanas, para evaluar la precisión diaria. (Una única ejecución de 20 réplicas no proporciona una evaluación válida de la sensibilidad funcional). Una vez recogidos los datos, calcule el CV de cada muestra analizada. La sensibilidad funcional es la concentración a la que el CV alcanza el límite predeterminado. Esta concentración puede estimarse a partir de los resultados del estudio por interpolación, si no coincide con uno de los niveles ensayados.
La verificación del límite inferior del rango notificable es una parte del proceso de verificación de todo el rango notificable. Esto se consigue normalmente realizando análisis replicados en una serie de tres a cinco muestras con concentraciones conocidas que abarcan el rango notificable. Estas muestras pueden obtenerse utilizando una sola muestra, con una concentración cercana al límite superior del rango, que luego se diluye para obtener muestras adicionales que abarquen todo el rango notificable. Los resultados obtenidos se evalúan tanto en lo que respecta a la reproducibilidad como a la recuperación de los valores esperados para determinar que el rendimiento del ensayo satisface las necesidades de utilidad clínica en todo el intervalo notificable.
Conclusión
Entonces, ¿por qué el límite inferior del rango de notificación del software es de 1,0 µg/dL (13 nmol/L) cuando el prospecto dice que la sensibilidad es de 0,3 µg/dL (3,9 nmol/L)? En este ejemplo, el ensayo es un ensayo competitivo y la imprecisión del ensayo excede los límites clínicamente útiles a una concentración muy por encima de la sensibilidad analítica.
Si la imprecisión es tal que no se puede decir con certeza que los resultados de, por ejemplo, 0,4 µg/dL (5 nmol/L) y 0,7 µg/dL (9 nmol/L) son de hecho diferentes, ¿no sería mejor informar de ambos como »
En última instancia, no suele ser el límite de detección del ensayo (sensibilidad analítica), sino más bien la reproducibilidad de los resultados lo que determina el límite inferior del rendimiento del ensayo clínicamente fiable en la práctica rutinaria.

1. Spencer CA. Perfiles tiroideos para la década de 1990: estimación de T4 libre o medición sensible de TSH. J Clin Immunoassay 1989; 12:82-9.
2. Spencer CA, et al. Interlaboratory/intermethod differences in functional sensitivity of immunometric assays of thyrotropin (TSH) and impact on reliability of measurement of subnormal concentrations of TSH. Clin Chem 1995;41:367-74. Reimpresión (número de catálogo ZD060) disponible en DPC previa solicitud.
*CLIA’88: la Ley de Mejora de los Laboratorios Clínicos de los Estados Unidos.