Ir al contenido principal

The National Academies de USA y COVID-19: Utilidad de los datos (1)

En este informe de respuesta rápida publicado con fecha de junio se indica una Guía para los legisladores sobre el uso de los datos para entender la extensión y la propagación de COVID-19. Como siempre, las negritas son mías.

RESUMEN

La guía constará de 5 criterios que se aplicarán a 7 tipos de datos, para escoger el/los más adecuado/s antes de tomar una decisión política.

Los 5 criterios son:
  • Representatividad.
  • Sesgo.
  • Incertidumbre.
  • Errores en el muestreo.
  • Errores en la medida.

La importancia de cada criterio dependerá de la naturaleza de la decisión que se quiera tomar. Y cada tipo de datos tiene sus ventajas y limitaciones (o fortalezas y debilidades, como se dice ahora).

Esos datos se consideran como piezas de un puzle que sólo en conjunto permiten tener una visión clara sobre cómo se está expandiendo la enfermedad y su severidad. El mayor riesgo de usar sólo un tipo de datos es equivocarse en la extensión/propagación de la infección.

Los 7 tipos de datos y sus implicaciones son:
  • Casos confirmados: Es fácil de obtener pero con probabilidad de ser inferior al total de personas enfermas. Cuanto mayor sea el número de test, mayor utilidad tendrá este dato.
  • Hospitalizaciones: También es rápido de obtener, pero refleja sólo los casos más severos y que se expusieron al virus varias semanas antes de ingresar.
  • Visitas a urgencias: Son datos a nivel local y de rápido acceso, muy útiles al inicio del brote o para detectar un rebrote. Esas personas también habrían estado expuestas varias semanas antes de ir.
  • Muertes confirmadas: También representa el estado del brote varias semanas antes.
  • Incremento de muertes: Es uno de los mejores indicadores del impacto en la mortalidad, pero también teniendo en cuenta que refleja el estado varias semanas antes (desde que se produce la infección, hasta que los síntomas son graves y se produce la muerte, de forma imprevista o después de un ingreso hospitalario).
  • Proporción de positivos en los test virales: Puede no ser una medida adecuada de la prevalencia, pues influye mucho el criterio de muestreo. Si se hacen pruebas a personas mayoritariamente sintomáticas, suelen dar sobreestimaciones sobre la verdadera prevalencia. La proporción de positivos suele bajar a medida que aumenta el número de pruebas e incluye personas con síntomas leves y asintomáticos.
  • Estudios representativos de prevalencia: Serían los más adecuados para entender la prevalencia de la enfermedad (proporción de personas que tienen la enfermedad respecto al total de la población en estudio, según la definición de la RAE) en un determinado sector de la población/ zona geográfica/tipo de actividad... en un determinado momento.

INTRODUCCIÓN

Con el paso del tiempo se dispone cada vez de más información, pero en muchos formatos, fuentes y formas no siempre completas. Por tanto, comprender el tipo de datos y la información que se puede obtener de ellos es fundamental para tomar decisiones correctas.

Además de los 7 tipos de datos y los 5 criterios anteriormente indicados, en el informe también se tiene en cuenta:
  • Las precauciones que se deberían considerar al tomar decisiones basándose en datos "imperfectos".
  • Las precauciones y limitaciones específicas que aplican a los datos sobre COVID-19.
(Estos dos puntos quedan para el siguiente post).

Según el CDC USA, el período de incubación puede ser de hasta 14 días, con una mediana de 4-5 días desde la exposición hasta la aparición de los síntomas y considerando que los fallecimientos indicarían una infección varias semanas antes. Este período relativamente largo, junto con los casos asintomáticos, tiene influencia en la interpretación de los diferentes tipos de datos.

Determinar la prevalencia y los fallecimientos está muy influenciado por la disponibilidad y precisión de los test y su metodología. Aunque cada vez se hacen más pruebas, suelen ser mayoritariamente a personas con síntomas. Ahora ya se hacen más pruebas de anticuerpos, pero la calidad de los productos usados es muy variable: Depende de la sensibilidad y de la especificidad, dando lugar a más falsos positivos que falsos negativos (mejor que al revés) [además, aunque tener anticuerpos suele mejorar la resistencia a la infección, no hay datos suficientes para asegurar que no habrá reinfección ni tampoco se tiene claro cuál es el nivel de anticuerpos necesarios para conseguir inmunidad. En USA se espera que la prevalencia de anticuerpos vaya desde <5% hasta el 25%, de ahí que esperen más falsos positivos que falsos negativos. En los estudios de prevalencia en España, apenas se ha conseguido un 5%]. Hay grupos demográficos en USA (ancianos, negros, latinos, indios) que se han visto afectados en una forma totalmente desproporcionada (no debería sorprender en el país del supremacismo blanco y de la privatización salvaje de los servicios sanitarios y seguros médicos sólo para quien se los puede pagar, no?). Por eso el informe considera que en el análisis de los datos se debería incluir ese factor social, que se suele ignorar.

1. TIPOS DE DATOS UTILIZADOS PARA EVALUAR EL CURSO DE LA COVID-19

Se indican los 7 tipos de datos que se usan para evaluar la extensión y expansión de la COVID-19, recordando que algunos están muy correlacionados entre sí:
  • Nº de casos confirmados: Son los positivos a partir de ensayos virales o diagnosticados, usados como  indicadores de los casos totales.
  • Hospitalizaciones: Incluyendo las camas de UCI ocupadas, como indicadoras de la tensión a la que se somete al sistema hospitalario y medida de los casos graves.
  • Visitas a urgencias: Indicaría la búsqueda de atención por parte de las personas que creen estar infectadas (aunque finalmente no lo estén) y que puede revelar otras sintomatologías relacionadas con COVID-19.
  • Muertes confirmada por COVID-19: Sería la base para estimar muertes asociadas a esta enfermedad.
  • Incremento de muertes (por cualquier causa): Se compara con ese dato en períodos de tiempo semejantes y anteriores. Permitiría determinar las muertes atribuibles directa o indirectamente a COVID-19.
  • Proporción de positivos en los test virales: Medida del numero total de personas actualmente infectadas.
  • Estudios representativos de prevalencia (incluyendo test virales y de anticuerpos): Se aplican a muestras representativas de una población determinada y proporcionan estimaciones del porcentaje de personas en esa población actualmente o previamente positivas en COVID-19.

Hay otros datos que podrían usarse en el futuro, como medir el SARS-CoV-2 en aguas residuales para detectar un rebrote, o datos de telefonía móvil para trazar el cumplimiento de las medidas de distanciamiento interpersonal.

2. CRITERIOS PARA EVALUAR LA FIABILIDAD Y VALIDEZ DE LOS DIFERENTES TIPOS DE DATOS

La validez de los datos depende de factores como el coste (en tiempo y dinero) de su recopilación a partir de fuentes diversas, el tratamiento de esos datos y su interpretación. Todo esto va variando a medida que hay más datos y los modelos son mejores. Por eso es fundamental reconocer las limitaciones que hay en cada momento para aplicar correctamente los 5 criterios establecidos:
  • Representatividad: La población analizada es representativa de la población de interés? Cada persona analizada lo es en la misma medida que el resto de esa población?
  • Sesgos: Hay factores sistemáticos que podrían causar una estimación incorrecta de los valores reales? Hay diferencias entre lo que se quiere informar y lo que se quiere medir?
  • Incertidumbre y errores en las medidas y en el muestreo: La incertidumbre está causada por una muestra demasiado pequeña? Se han duplicado medidas? Los test usados son precisos y fiables?
  • Temporalidad: Qué retraso hay entre la realización de las medidas y los informes? Las actualizaciones son consistentes? Todas las fuentes usan los mismos períodos de tiempo? La naturaleza de las mediciones cambia con el tiempo de tal manera que pueda influir en las estimaciones? Los eventos llevan la fecha de cuando ocurren o de cuando se registran?
  • Espacio: Los datos cubren diferentes áreas geográficas? Las áreas de especial interés están cubiertas? En todas las áreas geográficas se usan los mismos criterios de medida y clasificación? Se tiene en cuenta si las personas están fuera de su área geográfica habitual?
Nº de casos confirmados: Cumpliría sólo el criterio de la incertidumbre y de los errores de muestreo/medición.
  • Fácil de medir pero posiblemente daría una subestimación importante de la prevalencia de la enfermedad, dado que la mayoría de los afectados son asintomáticos y no todos son analizados.
  • La utilidad mejoraría al incrementarse el nº de test e incluir síntomas débiles y asintomáticos.
Hospitalizaciones: Cumpliría sólo el criterio de la incertidumbre y de los errores de muestreo/medición.
  • Datos fáciles de recoger y rápidamente disponibles a nivel local, con riesgo de gran variabilidad temporal.
  • Aunque sólo reflejan los casos más graves, su variación podría correlacionarse con el nº total de infecciones en esa comunidad.
  • Se debe tener en cuenta que hasta la hospitalización pueden pasar varias semanas.
Visitas a urgencias: Cumpliría sólo el criterio de la incertidumbre y de los errores de muestreo/medición.
  • Datos fáciles de recoger y rápidamente disponibles a nivel local.
  • Más útiles para detectar un brote en sus primeras etapas o para la evaluación de un posible rebrote.
  • Debe tenerse en cuenta que hasta la visita a urgencias pueden haber pasados semanas desde la infección.
Muertes confirmadas: Podría no cumplir ninguno de los criterios.
  • Su fiabilidad depende de identificar correctamente la causa de la muerte.
  • Hay que tener en cuenta que puede pasar un tiempo relativamente largo desde la infección hasta que se produce el fallecimiento.
Incremento de muertes: Podría no cumplir sólo el criterio del sesgo.
  • Se considera el mejor indicador de los considerados para evaluar el impacto en la mortalidad general de la pandemia.
  • Hay que tener en cuanta la posibilidad de error en la determinación de la causa de la muerte, por lo que incluiría tanto las muertes por COVID-19 como por otras causas.
Proporción de positivos en test virales: Podría no cumplir ninguno de los criterios.
  • Su adecuación para determinar la prevalencia dependerá del tipo y procedimiento de análisis. Si se aplica mayoritariamente a personas sintomáticas puede dar lugar a valores superiores a los reales.
  • Su fiabilidad aumentará al incrementarse el nº de test y ser aplicados a personas con síntomas leves y asintomáticos.
Estudios representativos de prevalencia: Podría no cumplir sólo el criterio de temporalidad.
  • Estos estudios son la mejor estrategia para entender la prevalencia de una enfermedad en una población determinada en un momento concreto.
  • No se pueden basar en resultados previos o ya disponibles, sino que son estudios específicos.
  • Se precisa tiempo para realizarlos, analizar los datos e interpretar los resultados.

Comentarios

Entradas populares de este blog

¡Qué jodidas son las hemerotecas!

Pues sí. Hoy en día es mejor tener la boca calladita cuando hay grabadoras por ahí delante, que luego todo se publica y uno queda en ridículo. Bueno, nuestros queridos gobernantes tienen de todo menos sentido del ridículo . Recopilo lo que veo por ahí: Rajoy declaraba en El País el 16 de noviembre pasado (justito antes de las elecciones): "Yo no voy a subir los impuestos" (Es verdad, lo ha hecho su ministro de economía o el de hacienda, o a final se va a llevar la culpa el de interior). Pero ya le venía de antes este rojerío a Rajoy, porque en 2009 recoge el ABC: "Subir los impuestos sería la puntilla para las familias y un error estratosférico (como se nota la influencia de su primo...) que crearía más paro y recesión". Lo mismito que dice ahora Rubalcaba, pero en el 2009 se trataba de desgastar al gobierno. Sáenz Santamaría (la actual "hombre fuerte" del gobierno) soltaba en junio de 2011: "Es vergonzoso que el gobierno plantee sub...

El cambio climático y los cuñaos (negacionistas) 6

GILIPOLLEZ Nº 6: LOS MODELOS NO SON FIABLES (claro cuñao , los tuyos son mejores). Simular el comportamiento climático es muy complicado (aunque los cuñaos lo hacen en cualquier barra de bar o cena familiar y en dos patás ). De ahí que se precise gran potencia de cálculo y saber parametrizar correctamente (y también saber ponderar la influencia de cada uno de los múltiples factores que pueden intervenir). Una de las mejores maneras de comprobar la calidad de un modelo climático es si es capaz de reproducir el comportamiento pasado , antes de predecir la evolución futura. Y, por supuesto, comparar sus predicciones con las observaciones reales que se van obteniendo. Respecto a reproducir el pasado , parece claro que l os modelos sólo lo consiguen cuando tienen en cuenta el factor humano : https://skepticalscience.com/images/IPCC_model_vs_obs.gif Como se ve, la tendencia queda clavada . Sobre todo cuando a las causas naturales se les añade las causas antropogénic...

El informe Mueller sobre la interferencia rusa en las elecciones USA de 2016 (14)

IV. Lazos y contactos entre el gobierno ruso y la Campaña de Trump. El objetivo de la investigación era no saber si hubo que contactos, que los hubo: Era intentar averiguar: Si esa fue una tercera vía por la que los rusos intentaron influir en las elecciones. Si esos contactos incluyeron o resultaron en coordinación/conspiración, incluyendo proporcionar asistencia a la Campaña a cambio de un tratamiento favorable en el futuro. Tal como se señaló anteriormente, "...la investigación no estableció tal coordinación". A. DURANTE EL PERÍODO DE CAMPAÑA ELECTORAL (septiembre 2015- 8 de noviembre de 2016) El informe deja claro que personas y medios de comunicación conectadas con el gobierno ruso ya empezaron a tener interés en la Campaña de Trump en los meses posteriores a que anunciara en junio de 2015 su candidatura. Evidentemente, Trump ya era antes una figura pública tanto por sus negocios como por sus programas de TV. Por ello, también se investigaron sus asun...