The National Academies de USA y COVID-19: Utilidad de los datos (1)

En este informe de respuesta rápida publicado con fecha de junio se indica una Guía para los legisladores sobre el uso de los datos para entender la extensión y la propagación de COVID-19. Como siempre, las negritas son mías.

RESUMEN

La guía constará de 5 criterios que se aplicarán a 7 tipos de datos, para escoger el/los más adecuado/s antes de tomar una decisión política.

Los 5 criterios son:

Representatividad.
Sesgo.
Incertidumbre.
Errores en el muestreo.
Errores en la medida.

La importancia de cada criterio dependerá de la naturaleza de la decisión que se quiera tomar. Y cada tipo de datos tiene sus ventajas y limitaciones (o fortalezas y debilidades, como se dice ahora).

Esos datos se consideran como piezas de un puzle que sólo en conjunto permiten tener una visión clara sobre cómo se está expandiendo la enfermedad y su severidad. El mayor riesgo de usar sólo un tipo de datos es equivocarse en la extensión/propagación de la infección.

Los 7 tipos de datos y sus implicaciones son:

Casos confirmados: Es fácil de obtener pero con probabilidad de ser inferior al total de personas enfermas. Cuanto mayor sea el número de test, mayor utilidad tendrá este dato.
Hospitalizaciones: También es rápido de obtener, pero refleja sólo los casos más severos y que se expusieron al virus varias semanas antes de ingresar.
Visitas a urgencias: Son datos a nivel local y de rápido acceso, muy útiles al inicio del brote o para detectar un rebrote. Esas personas también habrían estado expuestas varias semanas antes de ir.
Muertes confirmadas: También representa el estado del brote varias semanas antes.
Incremento de muertes: Es uno de los mejores indicadores del impacto en la mortalidad, pero también teniendo en cuenta que refleja el estado varias semanas antes (desde que se produce la infección, hasta que los síntomas son graves y se produce la muerte, de forma imprevista o después de un ingreso hospitalario).
Proporción de positivos en los test virales: Puede no ser una medida adecuada de la prevalencia, pues influye mucho el criterio de muestreo. Si se hacen pruebas a personas mayoritariamente sintomáticas, suelen dar sobreestimaciones sobre la verdadera prevalencia. La proporción de positivos suele bajar a medida que aumenta el número de pruebas e incluye personas con síntomas leves y asintomáticos.
Estudios representativos de prevalencia: Serían los más adecuados para entender la prevalencia de la enfermedad (proporción de personas que tienen la enfermedad respecto al total de la población en estudio, según la definición de la RAE) en un determinado sector de la población/ zona geográfica/tipo de actividad... en un determinado momento.

INTRODUCCIÓN

Con el paso del tiempo se dispone cada vez de más información, pero en muchos formatos, fuentes y formas no siempre completas. Por tanto, comprender el tipo de datos y la información que se puede obtener de ellos es fundamental para tomar decisiones correctas.

Además de los 7 tipos de datos y los 5 criterios anteriormente indicados, en el informe también se tiene en cuenta:

Las precauciones que se deberían considerar al tomar decisiones basándose en datos "imperfectos".
Las precauciones y limitaciones específicas que aplican a los datos sobre COVID-19.

(Estos dos puntos quedan para el siguiente post).

Según el CDC USA, el período de incubación puede ser de hasta 14 días, con una mediana de 4-5 días desde la exposición hasta la aparición de los síntomas y considerando que los fallecimientos indicarían una infección varias semanas antes. Este período relativamente largo, junto con los casos asintomáticos, tiene influencia en la interpretación de los diferentes tipos de datos.

Determinar la prevalencia y los fallecimientos está muy influenciado por la disponibilidad y precisión de los test y su metodología. Aunque cada vez se hacen más pruebas, suelen ser mayoritariamente a personas con síntomas. Ahora ya se hacen más pruebas de anticuerpos, pero la calidad de los productos usados es muy variable: Depende de la sensibilidad y de la especificidad, dando lugar a más falsos positivos que falsos negativos (mejor que al revés) [además, aunque tener anticuerpos suele mejorar la resistencia a la infección, no hay datos suficientes para asegurar que no habrá reinfección ni tampoco se tiene claro cuál es el nivel de anticuerpos necesarios para conseguir inmunidad. En USA se espera que la prevalencia de anticuerpos vaya desde <5% hasta el 25%, de ahí que esperen más falsos positivos que falsos negativos. En los estudios de prevalencia en España, apenas se ha conseguido un 5%]. Hay grupos demográficos en USA (ancianos, negros, latinos, indios) que se han visto afectados en una forma totalmente desproporcionada (no debería sorprender en el país del supremacismo blanco y de la privatización salvaje de los servicios sanitarios y seguros médicos sólo para quien se los puede pagar, no?). Por eso el informe considera que en el análisis de los datos se debería incluir ese factor social, que se suele ignorar.

1. TIPOS DE DATOS UTILIZADOS PARA EVALUAR EL CURSO DE LA COVID-19

Se indican los 7 tipos de datos que se usan para evaluar la extensión y expansión de la COVID-19, recordando que algunos están muy correlacionados entre sí:

Nº de casos confirmados: Son los positivos a partir de ensayos virales o diagnosticados, usados como indicadores de los casos totales.
Hospitalizaciones: Incluyendo las camas de UCI ocupadas, como indicadoras de la tensión a la que se somete al sistema hospitalario y medida de los casos graves.
Visitas a urgencias: Indicaría la búsqueda de atención por parte de las personas que creen estar infectadas (aunque finalmente no lo estén) y que puede revelar otras sintomatologías relacionadas con COVID-19.
Muertes confirmada por COVID-19: Sería la base para estimar muertes asociadas a esta enfermedad.
Incremento de muertes (por cualquier causa): Se compara con ese dato en períodos de tiempo semejantes y anteriores. Permitiría determinar las muertes atribuibles directa o indirectamente a COVID-19.
Proporción de positivos en los test virales: Medida del numero total de personas actualmente infectadas.
Estudios representativos de prevalencia (incluyendo test virales y de anticuerpos): Se aplican a muestras representativas de una población determinada y proporcionan estimaciones del porcentaje de personas en esa población actualmente o previamente positivas en COVID-19.

Hay otros datos que podrían usarse en el futuro, como medir el SARS-CoV-2 en aguas residuales para detectar un rebrote, o datos de telefonía móvil para trazar el cumplimiento de las medidas de distanciamiento interpersonal.

2. CRITERIOS PARA EVALUAR LA FIABILIDAD Y VALIDEZ DE LOS DIFERENTES TIPOS DE DATOS

La validez de los datos depende de factores como el coste (en tiempo y dinero) de su recopilación a partir de fuentes diversas, el tratamiento de esos datos y su interpretación. Todo esto va variando a medida que hay más datos y los modelos son mejores. Por eso es fundamental reconocer las limitaciones que hay en cada momento para aplicar correctamente los 5 criterios establecidos:

Representatividad: La población analizada es representativa de la población de interés? Cada persona analizada lo es en la misma medida que el resto de esa población?
Sesgos: Hay factores sistemáticos que podrían causar una estimación incorrecta de los valores reales? Hay diferencias entre lo que se quiere informar y lo que se quiere medir?
Incertidumbre y errores en las medidas y en el muestreo: La incertidumbre está causada por una muestra demasiado pequeña? Se han duplicado medidas? Los test usados son precisos y fiables?
Temporalidad: Qué retraso hay entre la realización de las medidas y los informes? Las actualizaciones son consistentes? Todas las fuentes usan los mismos períodos de tiempo? La naturaleza de las mediciones cambia con el tiempo de tal manera que pueda influir en las estimaciones? Los eventos llevan la fecha de cuando ocurren o de cuando se registran?
Espacio: Los datos cubren diferentes áreas geográficas? Las áreas de especial interés están cubiertas? En todas las áreas geográficas se usan los mismos criterios de medida y clasificación? Se tiene en cuenta si las personas están fuera de su área geográfica habitual?

Nº de casos confirmados: Cumpliría sólo el criterio de la incertidumbre y de los errores de muestreo/medición.

Fácil de medir pero posiblemente daría una subestimación importante de la prevalencia de la enfermedad, dado que la mayoría de los afectados son asintomáticos y no todos son analizados.
La utilidad mejoraría al incrementarse el nº de test e incluir síntomas débiles y asintomáticos.

Hospitalizaciones: Cumpliría sólo el criterio de la incertidumbre y de los errores de muestreo/medición.

Datos fáciles de recoger y rápidamente disponibles a nivel local, con riesgo de gran variabilidad temporal.
Aunque sólo reflejan los casos más graves, su variación podría correlacionarse con el nº total de infecciones en esa comunidad.
Se debe tener en cuenta que hasta la hospitalización pueden pasar varias semanas.

Visitas a urgencias: Cumpliría sólo el criterio de la incertidumbre y de los errores de muestreo/medición.

Datos fáciles de recoger y rápidamente disponibles a nivel local.
Más útiles para detectar un brote en sus primeras etapas o para la evaluación de un posible rebrote.
Debe tenerse en cuenta que hasta la visita a urgencias pueden haber pasados semanas desde la infección.

Muertes confirmadas: Podría no cumplir ninguno de los criterios.

Su fiabilidad depende de identificar correctamente la causa de la muerte.
Hay que tener en cuenta que puede pasar un tiempo relativamente largo desde la infección hasta que se produce el fallecimiento.

Incremento de muertes: Podría no cumplir sólo el criterio del sesgo.

Se considera el mejor indicador de los considerados para evaluar el impacto en la mortalidad general de la pandemia.
Hay que tener en cuanta la posibilidad de error en la determinación de la causa de la muerte, por lo que incluiría tanto las muertes por COVID-19 como por otras causas.

Proporción de positivos en test virales: Podría no cumplir ninguno de los criterios.

Su adecuación para determinar la prevalencia dependerá del tipo y procedimiento de análisis. Si se aplica mayoritariamente a personas sintomáticas puede dar lugar a valores superiores a los reales.
Su fiabilidad aumentará al incrementarse el nº de test y ser aplicados a personas con síntomas leves y asintomáticos.

Estudios representativos de prevalencia: Podría no cumplir sólo el criterio de temporalidad.

Estos estudios son la mejor estrategia para entender la prevalencia de una enfermedad en una población determinada en un momento concreto.
No se pueden basar en resultados previos o ya disponibles, sino que son estudios específicos.
Se precisa tiempo para realizarlos, analizar los datos e interpretar los resultados.

El informe Mueller sobre la interferencia rusa en las elecciones USA de 2016 (2)

En mi experiencia escribiendo informes sé que en ocasiones hay que dedicar mucho tiempo para seleccionar las palabras que se van a escribir. Un informe como el de Mueller habrá sido analizado con microscopio antes de dar el visto bueno para su distribución. Aún así, está lleno de partes censuradas. Y se establecen definiciones totalmente arbitrarias con, posiblemente, un objetivo previamente definido. Mis conocimientos de la semántica y sintaxis norteamericana no son tan profundos como para garantizar una comprensión precisa de lo que está escrito. Por tanto, asumo la responsabilidad de los errores de interpretación y traducción. Siempre que tenga dudas, copiaré el texto exacto en inglés para que cada uno interprete lo que considere oportuno. Mis comentarios dentro de una cita van en cursiva y en otro color, para diferenciarlos claramente del texto literal o traducido. Salvo indicación específica, las negritas y cursivas son mías. En la Introducción al volumen 1 , ...

¡YO OPINO!

Buscar este blog

The National Academies de USA y COVID-19: Utilidad de los datos (1)

RESUMEN

INTRODUCCIÓN

1. TIPOS DE DATOS UTILIZADOS PARA EVALUAR EL CURSO DE LA COVID-19

2. CRITERIOS PARA EVALUAR LA FIABILIDAD Y VALIDEZ DE LOS DIFERENTES TIPOS DE DATOS

Etiquetas

Comentarios

Publicar un comentario

Entradas populares de este blog

El informe Mueller sobre la interferencia rusa en las elecciones USA de 2016 (2)

¡Qué jodidas son las hemerotecas!

Seguimos con el gobierno