Sr. Editor: Hemos leído el artículo «Evaluación en condiciones de campo de una prueba serológica rápida para detección de an ticuerpos IgM e IgG contra SARS-CoV-2» de Vidal-Anzardo et al. 11. Vidal-Anzardo M, Solis G, Solari L, Minaya G, Ayala-Quintanilla B, Astete-cornejo J, et al. Evaluación en condiciones de campo de una prueba serológica rápida para detección de anticuerpos IgM e IgG contra SARS-CoV-2. Rev Peru Med Exp Salud Publica. 2020;37(2). doi: 10.17843/rpmesp.2020.372.5534.
https://doi.org/10.17843/rpmesp.2020.372... , el cual consideramos un valioso aporte a la evaluación de pruebas diagnósticas en circunstancias difíciles para el Perú. Sin embargo, luego de una minuciosa lectura crítica consideramos que el reporte de los resultados y la discusión de sus posibles sesgos pueden inducir a algunos errores de interpretación si no se realizan las precisiones del caso.
El primer problema radica en el término ambiguo «rendimiento diagnóstico», ya que éste -según la guía EP24-A2 del CLSI (Clinical-and-Laboratory-Standards-Institute)- agrupa un conjunto de indicadores: sensibilidad (SenDx) y especificidad (EspecDx) diagnósticas, valores predictivos (+/), likelihood ratios (+/-), odds ratio diagnóstico y curva ROC22. Kroll MH. EP24-A2. Assessment of the Diagnostic Accuracy of Laboratory Tests Using Receiver Operating Characteristic Curves [Internet]. Guideline-Second Edition; 2011 [citado el 10 de mayo de 2020]. Disponible en: https://clsi.org/standards/products/method-eva-luation/documents/ep24/.
https://clsi.org/standards/products/meth... . En cambio el indicador «rendimiento diagnóstico adicional» que el estudio 11. Vidal-Anzardo M, Solis G, Solari L, Minaya G, Ayala-Quintanilla B, Astete-cornejo J, et al. Evaluación en condiciones de campo de una prueba serológica rápida para detección de anticuerpos IgM e IgG contra SARS-CoV-2. Rev Peru Med Exp Salud Publica. 2020;37(2). doi: 10.17843/rpmesp.2020.372.5534.
https://doi.org/10.17843/rpmesp.2020.372... reporta para las pruebas serológicas (PS) es el número de positivos adicionales que se detectarían si se usaran ambas pruebas (PS + RT-PCR [reacción en cadena de la polimerasa con transcriptasa reversa, por sus siglas en inglés]), en lugar de solo RT-PCR dividido entre los positivos para PS+RT-PCR. Consideramos que, este indicador es poco útil porque se obtiene respecto al uso de ambas pruebas (situación que no ocurre en la práctica habitual), cuando la comparación debería darse contra un escenario donde solamente se pueda usar RT-PCR (situación realista). Por tal motivo, calculamos un indicador de positivos adicionales (Tabla 1) donde el uso de PS solas no aumentaría el número de positivos durante la primera semana en 50% como el estudio de Vidal-Anzardo et al. y recién a partir de la segunda semana se produciría este rendimiento adicional.
«Rendimiento diagnóstico adicional» según artículo original y modificaciones sugeridas para una apropiada evaluación del valor diagnóstica de la prueba serológica.
Un segundo aspecto problemático es la SenDx de las PS calculada usando el RT-PCR como estándar de oro, cuando este realmente es un estándar imperfecto en condiciones de campo; por lo que solo es posible calcular la sensibilidad relativa (porcentaje de acuerdo positivo entre la prueba índice y el estándar de referencia imperfecto), la especificidad relativa (porcentaje de acuerdo negativo entre las pruebas mencionadas) y el porcentaje de acuerdo total (PAT). Así, la SenDx de la PS que el artículo reporta es, en realidad, una sensibilidad relativa, y no absoluta, como podría interpretarse erróneamente. Una evaluación óptima hubiera requerido un estándar de oro más adecuado como cultivo celular bajo condiciones ideales de recolección y transporte; pero entendemos las limitaciones actuales para realizar dicha comparación.
Asimismo, los autores calculan la EspecDx usando un estándar diferente que no proviene de condiciones de campo, sino de una seroteca. Esta es pues una especificidad analítica (EspecAn) o evaluación de reacción cruzada; y en cambio los autores no reportan la especificidad relativa, que puede desprenderse de la Tabla 5 del estudio 33. Saah AJ, Hoover DR. "Sensitivity" and "specificity" reconsidered: The meaning of these terms in analytical and diagnostic settings. Ann of Intern Med. 1997;126(1):91-4. doi: 10.7326/0003-4819-126-1-199701010-00026.
https://doi.org/10.7326/0003-4819-126-1-... . Reportar selectivamente solo la EspecAn podría inducir al lector a pensar erróneamente que la proporción de falsos positivos de la PS es bajísima (1,1%), cuando realmente es mucho mayor si hubieran reportado al menos la especificidad relativa tal y como lo presentamos en la Tabla S1 del material suplementario. Asimismo, para toda la muestra, el PAT (79,2%) y el kappa (k = 0,21) fueron bajos, lo cual sugiere que, ambas pruebas miden aspectos distintos de la enfermedad (partícula viral y anticuerpo), por lo que una no debería reemplazar a la otra, sino complementarse. Esta complementariedad vendría de un algoritmo secuencial y no de uno simultáneo.
Finalmente, debemos resaltar la necesidad de contar con un tamaño de muestra suficiente (justificado por un cálculo apropiado) para estimar cualquier indicador de desempeño diagnóstico. Un inadecuado tamaño de muestra produce es timaciones imprecisas que resultan poco útiles 44. Leeflang MMG, Allerberger F. Sample size calculations for diagnostic studies. Clin Microbiol Infect. 2019;25(7):777-8. doi: 10.1016/j. cmi.2019.04.011.
https://doi.org/10.1016/j... . Asimismo, es importante discutir apropiadamente los sesgos y proble mas de aplicabilidad de este estudio. Dos revisores (PSB, JM) y un dirimente (RAC) aplicaron la herramienta QUADAS-2 Quality Assessment of Diagnostic Accuracy Studies 2 al es tudio original para valorar el riesgo de sesgo en estudios de pruebas diagnósticas 55. Whiting PF, Rutjes AWS, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, et al. Quadas-2: A revised tool for the quality assessment of diagnostic accuracy studies. Annals of Internal Medicine. 2011;155(8):529-36. doi: 10.7326/0003-4819-155-8-201110180-00009.
https://doi.org/10.7326/0003-4819-155-8-... y encontraron riesgos de sesgo altos o inciertos, así como problemas de aplicabilidad que debie ron advertirse a los lectores en la discusión de resultados. La evaluación se muestra en detalle en la Tabla S2 del material suplementario.
En conclusión, nuestro análisis evidencia que el desempeño diagnóstico de la PS en condiciones de campo es menor a lo reportado; que ambas pruebas estarían midiendo aspectos diferentes, siendo inadecuada su comparación; y que hubo niveles preocupantes de riesgo de sesgo y problemas de aplicabilidad de los resultados como para recomendar su uso en lugar de las pruebas moleculares, incluso en un contexto de emergencia. Por lo expuesto, consideramos importante realizar estas precisiones para que los lectores tengan una idea clara del valor de las PS en el contexto de la lucha contra la COVID-19, siguiendo las recomendaciones de la Organización Mundial de la Salud 66. World Health Organization. Laboratory testing for coronavirus disease 2019 (COVID-19) in suspected human cases [Internet]. Interim Guide; 2020 [citado el 10 de mayo de 2020]. Disponible en: https://apps.who.int/iris/handle/10665/331329.
https://apps.who.int/iris/handle/10665/3... .
REFERENCIAS BIBLIOGRÁFICAS
- 1Vidal-Anzardo M, Solis G, Solari L, Minaya G, Ayala-Quintanilla B, Astete-cornejo J, et al. Evaluación en condiciones de campo de una prueba serológica rápida para detección de anticuerpos IgM e IgG contra SARS-CoV-2. Rev Peru Med Exp Salud Publica. 2020;37(2). doi: 10.17843/rpmesp.2020.372.5534.
» https://doi.org/10.17843/rpmesp.2020.372.5534 - 2Kroll MH. EP24-A2. Assessment of the Diagnostic Accuracy of Laboratory Tests Using Receiver Operating Characteristic Curves [Internet]. Guideline-Second Edition; 2011 [citado el 10 de mayo de 2020]. Disponible en: https://clsi.org/standards/products/method-eva-luation/documents/ep24/
» https://clsi.org/standards/products/method-eva-luation/documents/ep24/ - 3Saah AJ, Hoover DR. "Sensitivity" and "specificity" reconsidered: The meaning of these terms in analytical and diagnostic settings. Ann of Intern Med. 1997;126(1):91-4. doi: 10.7326/0003-4819-126-1-199701010-00026.
» https://doi.org/10.7326/0003-4819-126-1-199701010-00026 - 4Leeflang MMG, Allerberger F. Sample size calculations for diagnostic studies. Clin Microbiol Infect. 2019;25(7):777-8. doi: 10.1016/j. cmi.2019.04.011.
» https://doi.org/10.1016/j - 5Whiting PF, Rutjes AWS, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, et al. Quadas-2: A revised tool for the quality assessment of diagnostic accuracy studies. Annals of Internal Medicine. 2011;155(8):529-36. doi: 10.7326/0003-4819-155-8-201110180-00009.
» https://doi.org/10.7326/0003-4819-155-8-201110180-00009 - 6World Health Organization. Laboratory testing for coronavirus disease 2019 (COVID-19) in suspected human cases [Internet]. Interim Guide; 2020 [citado el 10 de mayo de 2020]. Disponible en: https://apps.who.int/iris/handle/10665/331329
» https://apps.who.int/iris/handle/10665/331329
Fuentes de financiamiento:
Autofinanciado.
Material suplementario:
Citar como:
Maguiña JL, Soto-Becerra P, Hurtado-Roca Y, Araujo-Castillo RV. Las pruebas de laboratorio para la identificación de SARS-CoV-2 en tiempos de pandemia en el Perú: algunas precisiones acerca del «rendimiento diagnóstico». Rev Peru Med Exp Salud Publica. 2020;37(3):575-6. doi: https://doi.org/10.17843/rpmesp.2020.373.5802.
Tabla S1. Indicadores de rendimiento diagnóstico entre la prueba serológica rápida y la prueba RT-PCR que debieron ser reportados en el estudio original
Fechas de Publicación
- Publicación en esta colección
02 Dic 2020 - Fecha del número
Jul-Sep 2020
Histórico
- Recibido
15 Mayo 2020 - Acepto
27 Mayo 2020