Validez de pruebas diagnósticas: Estudio de caso a partir de una prueba serológica para SARS-CoV-2

Contexto 

Esta edición del blog ha sido pensada como un ejercicio académico que abre la puerta al repaso de diversos temas de utilidad metodológica para quienes buscan herramientas de apoyo a la lectura e interpretación de literatura biomédica.
 
La validez hace referencia al grado en el cual los resultados de una medición se corresponden con el valor real. Generalmente, una nueva prueba diagnóstica se compara frente a un gold standard que se considera la mejor alternativa disponible para clasificar un fenómeno, con el fin de medir su validez y determinar así su utilidad práctica.
 
Para ilustrar la forma más habitual de evaluación de la validez de una prueba diagnóstica, vamos a presentar los resultados de un estudio que comparó un ensayo de quimioluminiscencia (CLIA) para la detección de anticuerpos IgM e IgG anti SARS-CoV-2 de Shenzhen YHLO Biotech Co, contra una prueba molecular de reacción en cadena de la polimerasa con transcriptasa inversa en tiempo real (RT-PCR en tiempo real) para RNA de SARS-Cov-2(1).

Fuente: Imagen tomada de freepik(2).


Caso de estudio 

El estudio en mención corresponde a un diseño de casos y controles retrospectivo llevado a cabo en adultos con sospecha de COVID-19 (fiebre o síntomas respiratorios y nexo epidemiológico) de un hospital de urgencias para enfermedades infecciosas (Hospital Xixi de Hangzhou) de la provincia de Zhejiang en China, entre enero y marzo de 2020(1).
 
La confirmación de infección viral en adultos con sospechosa de COVID-19 fue basada en el resultado de una prueba RT-PCR en tiempo real para RNA de SARS-Cov-2 realizada en muestras de hisopado oral o esputo. Los pacientes en quienes se excluyó la infección definieron el grupo control del estudio. La mediana de tiempo entre el inicio de los síntomas y la realización de las pruebas serológicas de anticuerpos (CLIA para IgM e IgG anti SARS-CoV-2) fue de 16 días(1). Tabla 1.
 

Tabla 1. Tablas de contingencia con los resultados de las RT-PCR en tiempo real y CLIA para SARS-CoV-2 en casos y controles, según inmunoglobulina detectada.

 

CLIA IgM

CLIA IgG

 

+

-

+

-

Total

RT-PCR

+

13

14

24

3

27

-

0

33

3

30

33

 

Total

13

47

27

33

60


VP

Verdaderos positivos

VN

Verdaderos negativos

FP

Falsos positivos

FN

Falsos negativos



¿Cuál fue la sensibilidad y especificidad del ensayo de quimioluminiscencia para SARS-CoV-2?

 

La sensibilidad (Se) es la probabilidad que tiene una prueba diagnóstica de dar resultados positivos en los sujetos enfermos (capacidad de identificar enfermos entre los enfermos)(3). Siguiendo los valores de la Tabla 1, ésta se calcula como se denota a continuación:

Se = VP/(VP+FN) 
Se (CLIA IgM) = 13/(13+14) = 13/27 =0,481 
Se (CLIA IgG) = 24/(24+3) = 24/27 = 0,888

Una Se de 0,481 y 0,888 quiere decir que el ensayo de quimioluminiscencia para IgM fue positivo en el 48,1% de los sujetos con COVID-19, mientras que el de quimioluminiscencia para IgG lo fue en el 88,8% de estos.
 
Entre tanto, la especificidad (Sp) es la probabilidad que tiene una prueba diagnóstica de dar resultados negativos en los sujetos que no tienen la enfermedad (capacidad de identificar sanos entre los sanos)(3), y se obtiene de la siguiente manera (ver valores de la Tabla 1):
 
Sp = VN/(VN+FP) 
Sp (CLIA IgM) = 33/(33+0) = 33/33 = 1 
Sp (CLIA IgG) = 30/(30+3) = 30/33 = 0,909

Una Sp de 1 y 0,909 significa que el ensayo de quimioluminiscencia para IgM fue negativo en el 100% de los sujetos sanos (sin COVID-19), mientras que el de quimioluminiscencia para IgG lo fue en el 90,9% de las ocasiones.
 

 

Factores que influyen en la sensibilidad y especificidad 

Los valores de sensibilidad y especificidad pueden verse influenciados por numerosos factores, tales como las características de la enfermedad (ej. estadio y espectro de la enfermedad), el proceso de medición (ej. cambios en el instrumento de medición) y la población, entre otros(3).
 
Por ejemplo, la probabilidad de clasificar erróneamente a un individuo es mayor cuando los valores de una variable continua (ej. presión arterial) son próximos al punto de corte definido para definir la enfermedad, lo que induce una cierta relación entre la prevalencia y la mala clasificación diagnóstica. En general, la sensibilidad mejora con la prevalencia, mientras que la especificidad desciende. Por el contrario, si el diagnóstico fuera en realidad dicotómico (sin error de medición), la sensibilidad y especificidad no variarían con la prevalencia(4). 

 

¿Cuáles fueron los valores predictivos del ensayo de quimioluminiscencia para SARS-CoV-2? 

El valor predictivo de la prueba positiva (PVp) es la probabilidad que tiene una prueba de detectar enfermos ante un resultado positivo de ésta(3). Siguiendo con el ejemplo de la Tabla 1, su valor se estimaría por la fórmula:
 
PVp = VP/(VP+FP) 
PVp (CLIA IgM) = 13/(13+0) = 13/13 = 1 
PVp (CLIA IgG) = 24/(24+3) = 24/27 = 0,808
 
Un PVp de 1 y 0,808 significa que de todos los resultados positivos obtenidos en los ensayo de quimioluminiscencia para IgM e IgG, el 100% y 80,8% correspondieron a sujetos con COVID-19 respectivamente.
 
Por su parte, el valor predictivo de la prueba negativa (PVn) se refiere a la probabilidad que tiene la prueba de detectar sanos cuando se obtiene un resultado negativo de la misma(3). Según los datos de la Tabla 1, su valor se obtendría de la fórmula:
 
PVn = VN/(VN+FN) 
PVn (CLIA IgM) = 33/(33+14) = 33/47 = 0,702
PVn (CLIA IgG) = 30/(30+3) = 30/33 = 0,909
 
Un PVn de 0,702 indica que el 70,2% de los sujetos con un resultado negativo en el ensayo de quimioluminiscencia para IgM no tenía COVID-19; mientras que un 90,9% de aquellos con un resultado negativo en el ensayo para IgG tampoco tenía la enfermedad. 


Prevalencia y valores predictivos 

Se sabe que los PVp y PVn son sensibles a los cambios en la prevalencia de una enfermedad y que, manteniendo constantes la Se y Sp, un aumento de la prevalencia: 1) incrementa el PVp, 2) aumenta en términos absolutos los falsos negativos, 3) disminuye en términos absolutos los falsos positivos y 4) reduce el PVn(3). Tabla 2.
 
Tabla 2. Valores predictivos de una prueba de glicemia (Se=0,85; Sp=0,90) para detectar diabetes aplicada a diferentes valores de prevalencia de esta enfermedad en una población de 10.000 personas.

 

Prevalencia

0,01

0,05

0,30

0,70

0,95

PVp

0,079

0,309

0,785

0,952

0,994

PVn

0,998

0,991

0,933

0,720

0,240

FP

990

950

700

300

50

FN

15

75

450

1.050

1.425

Fuente: Modificado de Delgado M et al., Estudios para pruebas diagnósticas y factores pronósticos, 2012(3). 

 

¿Cuáles fueron las razones de verosimilitud del ensayo de quimioluminiscencia para SARS-CoV-2? 

Las razones de verosimilitud (del inglés, likelihood ratios) de un resultado positivo (LRp) y de un resultado negativo (LRn) intentan resumir el significado conjunto de la sensibilidad y especificidad de una prueba. Cuanto mayor sea la LRp, mayor es la contribución de un resultado positivo de la prueba en el diagnóstico de la enfermedad. Mientras que, cuanto menor sea la LRn, mejor es la contribución de un resultado negativo de la prueba en la exclusión de la enfermedad(3).
 
Continuando con el ejemplo de la Tabla 1, la LRp se define así: 
 
LRp=Se/(1-Sp) 
LRp (CLIA IgM)=0,481/(1-0,999)=481 
LRp (CLIA IgG)=0,888/(1-0,909)=9,758

Una LRp de 481 significa que un resultado positivo en el ensayo de quimioluminiscencia para IgM fue mucho más probable en los sujetos con COVID-19 que en los sanos. Asimismo, la probabilidad de un resultado positivo en el ensayo de quimioluminiscencia para IgG fue 8,7 veces más probable en los casos que en los controles.
 
La interpretación de la LRp suele hacerse teniendo en cuenta la siguiente escala:
 

>10  

Excelente

5-10 

Buena

2-5  

Regular

1-2   

Pobre

 

Por su parte, la LRn se calcula como:

LRn=(1-Se)/Sp 
LRn (CLIA IgM)=(1- 0,481)/1=0,519
LRn (CLIA IgG)=(1-0,888)/0,909=0,123 

Los resultados probables de una LRn se mueven entre 1 y 0, siendo mejor cuanto más se acerca al cero.
 
Para facilitar la interpretación de los valores de LRn del ejercicio vamos a invertir su fórmula y decimos que la probabilidad de un resultado negativo en el ensayo de quimioluminiscencia para IgM en los sujetos sin COVID-19 fue 1,9 veces la observada en aquellos con la enfermedad, y que este mismo resultado (negativo) fue 7,1 veces más probable en los controles comparado con los casos cuando se trató del ensayo de quimioluminiscencia para IgG. 

 

Notas 

Mientras que una prueba diagnóstica con muy buena sensibilidad cobra gran importancia en condiciones de salud graves para las que existe un tratamiento disponible, ante la sospecha de una enfermedad de mal pronóstico sin opciones efectivas de tratamiento es ideal tener una prueba con una alta especificidad.
 
Los valores de sensibilidad y especificidad de una prueba no siempre son los mismos en contextos poblacionales distintos. Esto se relacionan con más frecuencia a variables clínicas y demográficas, estadio de la enfermedad o problemas de estandarización de la medición, entre otros.
 
Desde un punto de vista clínico, los valores predictivos de una prueba son más relevantes, dado que se parte del resultado de la prueba para definir la probabilidad de estar enfermo o sano según corresponda.
 
La prevalencia de una enfermedad afecta los valores predictivos de una prueba, teniendo éstas en general mejor desempeño ante valores altos de la prevalencia. De esta manera, prevalencias inferiores a un 50% generan los cambios más grandes en el PVp de una prueba.
 
En ámbitos  de atención especializados en los que la prevalencia de una enfermedad tiende a ser mayor per se, las pruebas con valores regulares o pobres en la LRn deben alertar a los profesionales por un posible aumento de los falsos negativos. 

 

Referencias 

1. Jin Y, Wang M, Zuo Z, Fan C, Ye F, Cai Z, et al. Diagnostic value and dynamic variance of serum antibody in coronavirus disease 2019. Int J Infect Dis. mayo de 2020;94:49-52.
2. Descarga gratis Ilustración de prueba de hisopo nasal para coronavirus [Internet]. Freepik. [citado 16 de septiembre de 2020]. Disponible en: https://www.freepik.es/vector-gratis/ilustracion-prueba-hisopo-nasal-coronavirus_8511049.htm
3. Delgao M, Llorca J, Doménech JM. Estudios para pruebas diagnósticas y factores pronósticos. 5a ed. Barcelona: Signo; 2012.
4. Brenner H, Gefeller O. Variation of sensitivity, specificity, likelihood ratios and predictive values with disease prevalence. Stat Med. 15 de mayo de 1997;16(9):981-91. 



Publicar un comentario

4 Comentarios

  1. Gracias Abel, veo que sigues siendo un profesor muy bueno.

    ResponderBorrar
    Respuestas
    1. Muchas gracias Teresa, espero seguir creciendo en ese sentido. Te mando los mejores recuerdos.

      Borrar
  2. Súper este artículo cuando hoy, el Covid-19, ha sido un reto para la humanidad. Mí pregunta sería cual de los Test usados en Colombia tendría el mejor grado de sensibilidad para dar un Diagnóstico más certero?

    ResponderBorrar
    Respuestas
    1. Según los lineamientos del Ministerio de Salud de Colombia, las pruebas serológicas de detección IgM/IgG (ELISA, inmunocromatográficas o quimioluminiscencia) deben garantizar como mínimo una sensibilidad del 85% y una especificidad del 90%, recomendándose la validación secundaria en población colombiano de los tests comercializados.

      Borrar