¿Cómo entender el dato del número de contagios publicado diariamente?

La presente entrada tiene que ver con la interpretación de los datos oficiales de contagios diarios. Desde hace un tiempo las autoridades nos informan día a día del número de contagios confirmados por PCR (siglas en inglés de «Reacción en Cadena de la Polimersa»), los índices de contagio acumulados a 7 y 14 días, etc. Sin embargo hasta hace muy poco no se ha exigido que los números a tener en cuenta a la hora de tomar medidas no fuesen los del día del anuncio, sino los de al menos cinco días antes ¿a qué se debe esto? La respuesta es muy simple: a día de hoy solo se cuentan los casos confirmados de covid-19, es decir, los que hayan dado positivos tras haber sido sometidos a alguna de las pruebas diagnósticas fiables, las conocidas por PDIA (Pruebas Diagnósticas de Infección Activa), y hacer esas pruebas y conocer los resultados de las mismas no es instantáneo, se necesita un tiempo, tanto para hacerlas como para obtener los resultados y luego comunicarlos.  Pero el problema es todavía más complicado. Para dar la cifra oficial diaria se han de recopilar los datos de todos los laboratorios y hospitales donde se han realizado dichas pruebas y esto también requiere su tiempo, así que es esperable que haya un desfasase entre el número oficial que se comunica diariamente y el número real (siempre según PCR) de contagios detectados.

Para mostrar lo anterior vamos a utilizar los datos oficiales que publica la Junta de Andalucía en su web Informe COVID-19 en Andalucía, concretamente los datos de contagios detectados y confirmados (el número real de contagiados es imposible de saber, únicamente se puede estimar) en toda Andalucía, así como los de la provincia de Sevilla.

Tomemos, por ejemplo, los datos publicados el día 7 de noviembre del número de contagios detectados y confirmados comunicados hasta el 6 de noviembre y vamos representar en una gráfica los casos detectados y confirmados por PDIA diarios en Sevilla y Andalucía. Por razones que se verán más adelante vamos a mostrar dos gráficas. La de encima muestra los contagios hasta el día 31 de octubre (una semana antes del día que consultamos los datos) y la de debajo hasta el propio día 6.

 

Evolución de los contagios diarios detectados y confirmados por PDIA (según los datos publicados el día 7 de noviembre) hasta el 31 de octubre.
Evolución de los contagios diarios detectados y confirmados por PDIA (según los datos publicados el día 7 de noviembre) hasta el 6 de noviembre.

Un simple vistazo a ambos gráficos nos muestra una clara oscilación semanal (7 días) quizá relacionada con los retrasos, aunque hay una diferencia fundamental entre ambos. El primer gráfico muestra claramente una tendencia al alza semana tras semana (especialmente si nos finamos en los máximos) mientras que el segundo parece mostrar tras el último máximo una tendencia a la baja, lo cual se podría interpretar como una notable disminución de los contagios. Para evitar la fluctuación se suele usar un dato más uniforme, el número de casos acumulados en 14 días por cada cien mil habitantes (incidencia acumulada). Mostremos las correspondientes gráficas:

Evolución del índice de incidencia acumulada en 14 días por cien mil habitantes (según los datos publicados el día 7 de noviembre) hasta el 31 de octubre.
Evolución del índice de incidencia acumulada en 14 días por cien mil habitantes (según los datos publicados el día 7 de noviembre) hasta el 6 de noviembre.

Sin ninguna duda las gráficas anteriores inducen a pensar que los contagios realmente están disminuyendo, lo que sería una buena noticia. Nada más lejos de la realidad.

Para demostrar la inutilidad de usar los últimos datos publicados día a día vamos a comparar los datos de contagios que se publican un día dado con los publicados varios días después. Así pues, tomemos los datos publicados el 29 de octubre (que contiene los datos de contagios recogidos hasta el 28 de octubre) y  comparémoslos con los datos publicados el 7 de noviembre para Andalucía y Sevilla. En las siguientes gráficas mostramos los resultados de dicha comparación,

Evolución de los contagios diarios detectados y confirmados por PDIA hasta el 28 de octubre según los datos recogidos el 29/10 (rojo) y el 7/11 (azul) en Andalucía.
Evolución de los contagios diarios detectados y confirmados por PDIA hasta el 28 de octubre según los datos recogidos el 29/10 (rojo) y el 7/11 (azul) en Sevilla.

así como los de la correspondiente incidencia acumulada en 14 días por cien mil habitantes:

Evolución del índice de incidencia acumulada en 14 días por cien mil habitantes según los datos recogidos el 29/10 (rojo) y el 7/11 (azul) en Andalucía.
Evolución de índice de incidencia acumulada en 14 días por cien mil habitantes según los datos recogidos el 29/10 (rojo) y el 7/11 (azul) en Sevilla.

En la siguiente tabla mostramos la evolución del error (en tanto por ciento %) del índice acumulado en 14 días por cien mil habitantes en Andalucía y Sevilla:

Si representamos en una gráfica los datos de los errores recogidos en la tabla tenemos la siguiente figura:

Evolución del error del PDIA14 en la evolución de los datos de contagios Andalucía y Sevilla.

Tanto la tabla como las gráficas anteriores muestran un enorme desfase entre los datos publicados el 29 de octubre y los mismos datos actualizados el 7 de noviembre. Análisis similares de los datos recogidos entre el 16 de septiembre y el 7 de noviembre conducen a errores similares (esta vez en torno al 30%).

Todo lo anterior muestra, sin la más mínima posibilidad de duda, que no se pueden usar los datos el mismo día en que son publicados pues estos no reflejan la realidad de la evolución de la pandemia. Así que es natural la pregunta: ¿cuántos días debemos dejar pasar para poder fiarnos de los datos de contagios? Del ejemplo anterior queda claro que al menos debemos dejar pasar entre cinco y siete días.

Conclusión: Si usamos los datos de cada día, estos datos solo nos darán una estimación fiable de los casos detectados y confirmados entre 5 y 7 días antes de la fecha de la publicación de dichos datos, es decir, no podemos usar los datos publicados el último día si queremos saber como va la evolución de la pandemia hasta ese día. Necesitamos un tiempo para que los datos se consoliden, es decir, que se acerquen al número real de contagios detectados y confirmados. Obviamente ello implica que solo podremos conocer de manera razonablemente fiable las tasas de incidencia acumulada con el mismo retraso. Nuestros cálculos nos dicen que con los datos publicados cada día solo podemos conocer la situación real (con un margen de error menor del 5%) a partir de cinco días antes y nunca la del propio día.

Este hecho debe ser tenido en cuenta por las autoridades sanitarias, políticas y en especial por los medios de comunicación, que en la mayoría de los casos suelen usar el último dato oficial publicado que no refleja ni remotamente la realidad (un margen de error de más del 30% parece algo excesivo). Quizá por ello el Ministerio de Sanidad estableció en el documento titulado Actuaciones de respuesta coordinada para el control de la transmisión de COVID-19  (actualizado el 22 de octubre) que «Estas IA (índices acumulados) deberán calcularse con datos consolidados, sustrayendo los días en los que dicha consolidación se considere insuficiente», que en el caso andaluz, como hemos visto, son entre cinco y siete días.

Sobre Renato Álvarez Nodarse 84 Artículos
Catedrático de Análisis Matemático de la Universidad de Sevilla, mis áreas de interés son teoría de funciones especiales y aplicaciones en problemas de física matemática.

Sé el primero en comentar

Dejar una contestacion

Tu dirección de correo electrónico no será publicada.


*