El pasado miércoles se publicó el informe preliminar del estudio sero-epidemiológico ENE-COVID19 que desde el pasado 27 de abril llevan a cabo los Ministerios de Ciencia e Innovación y Sanidad. El estudio se basa en la medida de la prevalencia de infección por SARS-Cov2 (el coronavirus causante de la epidemia de Covid-19) mediante (diversos tipos de) test a una muestra aleatoria de la población (más de 60.000 personas).
Este informe preliminar sitúa el intervalo de confianza para el porcentaje de infectados reales por coronavirus en España entre el 4’7% y el 5’4% de la población, esto es, con una probabilidad de 0’95 el número de personas en España que han sido infectadas por el coronavirus hasta primeros de mayo está entre los 2.200.000 y los 2.500.000. Recuerdo que el número total de infectados detectados hasta el 17 de mayo no llega a los 280.000 (según las cifras oficiales que el Ministerio de Sanidad ha ido recabando de las comunidades autónomas).
Este estudio da la razón a los que desde el inicio de la epidemia venimos advirtiendo de que la cifra de infectados reales posiblemente era un orden de magnitud superior a la de infectados detectados (véanse las entradas ¿Cómo estimar el número de infectados reales… y Número de infectados reales…). Si tenemos en cuenta la evolución del número de muertes, y que entre infección y muerte, caso de producirse, transcurren en media más de dos semanas, podemos extrapolar estos datos a diversas fechas, obteniéndose la siguiente tabla (he estimado los infectados reales a día X teniendo en cuenta el total de muertes 16 días después del día X y tomando como referencia las cifras de infectados reales aportadas por el informe ENE-COVID19 y las muertes totales a fecha 17 de mayo).
Fecha Infectados detectados Estimación infectados reales
7 marzo 525 185.000-213.000
15 marzo 7.928 680.000-780.000
31marzo 95.923 1.530.000-1.765.000
15 abril 180.659 1.990.000-2.290.000
1 mayo 242.979 2.200.000-2.500.000
Afortunadamente, las medidas de contención tomadas por el gobierno a partir del 15 de marzo han sido más acordes con las estimaciones de las cifras de infectados reales que con la de infectados detectados.
Un inciso: he leído y escuchado en varios medios de comunicación que el estudio del Imperial College de finales de marzo sobredimensionó el número de infectados reales en España al situarlo en torno a los 7.000.000 de personas. Eso no es correcto. El Imperial College ofreció una estimación estadística del número de infectados; esto quiere decir que su conclusión no fue un número, sino un conjunto de números, cada uno de los cuales llevaba asociada una probabilidad de corresponder al número de infectados reales. De estos números el que tenía la probabilidad más alta era el de 7.000.000, pero esa probabilidad no era significativa, entre otras cosas porque el intervalo de confianza para el número de infectados reales en España del estudio del Imperial College daba una horquilla muy amplia: entre 1.800.000 y 19.000.000. El estudio ENE-COVID19 es también una estimación estadística, en este caso con un intervalo de confianza mucho más estrecho: de 2.200.000 a 2.500.000. En los comentarios que hice en este Blog al estudio del Imperial College, yo me inclinaba por la parte baja de su intervalo de confianza. Como muestra la tabla de arriba, se puede concluir que la parte baja del estudio del Imperial College (1.800.000 infectados reales a finales de marzo) es compatible con la parte alta del intervalo de confianza del informe ENE-COVID19 de los Ministerios de Ciencia y Sanidad (1.765.000 infectados reales a finales de marzo, según mi extrapolación). Por cierto, la actualización del estudio del Imperial College da un intervalo de confianza para el porcentaje de infectados reales en España a primeros de mayo de entre 4’44% y 7’07% de la población total (compatible, pues, con el que da el informe ENE-COVID19). Téngase en cuenta que la metodología de ambos estudios es totalmente diferente, siendo la del ENE-COVID19 mucho más fiable a priori al estar basada en el estudio sero-epidemiológico sobre una muestra aleatoria de la población (mientras que el Imperial College usa evolución del número de muertes).
Otra conclusión importante del estudio ENE-COVID19 es la gran heterogeneidad de la epidemia en las distintas provincias y regiones de España (poco tiene que ver el 2’7% de infectados reales en Sevilla con el 12% en Madrid). Esto también da la razón a los que desde el comienzo de la epidemia hemos venido insistiendo en este hecho crucial, y en la consecuencia obvia que implica: las medias de contención tendrían que ser diferentes en los distintos territorios. Eso no ocurrió así, aunque, al menos, es lo que está ocurriendo durante la desescalada. El estudio ENE-COVID19 sugiere que Madrid actuó como foco principal de la epidemia, lo que ha sido corroborado por otros estudios (por ejemplo: en la referencia [1], véase también esta entrada en Naukas, se correlaciona el pico de mortalidad por Covid-19 con el número de visitantes per cápita entre Madrid y cada provincia en la semana antes de declararse el confinamiento). Con este escenario, es bastante incomprensible la actitud de la Presidenta de la Comunidad de Madrid acusando al gobierno central de razones políticas para retrasar la desescalada en Madrid.
De los resultados preliminares del estudio ENE-COVID19 cabe sacar varias conclusiones.
La primera es que las medidas de confinamiento fueron totalmente necesarias. Además, han funcionado logrando contener una epidemia que había entrado en fase exponencial a primeros de marzo.
La segunda es que habrá que tomarse muy en serio las recomendaciones para evitar un rebrote. Como ya tuve ocasión de escribir en una entrada anterior, el que haya un nuevo brote, o lo que este tarde en llegar y su gravedad, dependerá no solo de que el gobierno acierte con las medidas sino de la responsabilidad con que la ciudadanía se comporte y de los hábitos que adopte.
Y la tercera es que será necesario extremar la capacidad de detectar precozmente el rebrote, mediante tests rápidos en centros de atención primaria, pero también haciendo estimaciones fiables de infectados reales y poner en cuarentena no sólo a los infectados detectados, sino también las cifras de infectados detectados, porque de otra forma el rebrote puede ser tan súbito como ha sido este primer brote. El 7 de marzo, con 525 infectados detectados, pocos, si alguien, pensaban que la epidemia estaba en pleno proceso exponencial y obligaría a confinar a la población tan sólo ocho días después. Otra hubiera sido la situación, si hubiéramos sido capaces de estimar que los infectados reales estaban ya entonces por los 200.000 mil.
Referencias
[1] Mattia Mazzoli, David Mateo, Alberto Hernando, Sandro Meloni, Jose Javier Ramasco (2020) «Effects of mobility and multi-seeding on the propagation of the COVID-19 in Spain» MedRxiv DOI:10.1101/2020.05.09.20096339
¿Se sabe a ciencia cierta la fiabilidad de los tests que han servido para hacer este estudio? Creo que se ha hecho con los tests rápidos que compró el gobierno y cuya fiabilidad fue bastante cuestionada. Si se han usado «varios tipos de tests» serán de distintos tipos de fabricantes, pero no PCR, por lo que he leído en otros foros donde al menos una doctora, implicada en la captura de datos, explicaba lo que sabía del asunto.
¿Cómo influye esa fiabilidad de los tests en la validez del estudio?
He leído que según la fórmula de Bayes, la probabilidad de que un paciente al que le da un resultado positivo en un test de COVID-19 tenga realmente el virus es de alrededor del 8%, si se dan las siguientes premisas:
la prueba tiene una fiabilidad del 80%, un índice de falsos positivos del 9,6% y se sabe (por otras pruebas más fiables) que en la población del país (el que sea) existe un 1% de infectados de COVID en ese momento.
¡Un 8% de probabilidad! Cuando cualquier lego (e incluso la mayoría de los médicos) la habría estimado en un prudente 75% (algo menos de la fiabilidad de la prueba) o, por lo menos, superior al 50%.
¿Qué nos dice esto de la fiabilidad global del estudio hecho por el gobierno?