Epidemiological and policy decision-making during the course of a pandemic depends heavily on the information available about the daily evolution of the actual number of infected people. A distinction must be made between the number of actual infections and the number of detected infections. Usually, it is the latter that is known (it is the one that appears in the daily statistics). But the number of detected infected can be quite different from the really important figure, the number of actual infected. There are many reasons for this difference. Firstly, a person infected on a given day may not show symptoms until a few days later; secondly, even if they do show symptoms, it may still take a few days before they go to the health services; thirdly, even if they do go to the health services, it may take a few days before they are diagnosed as infected, either because the tests to determine their infection are not available (this is what is happening these days in Spain), or because the results of these tests take some time to be known.
All of this applies to the current COVID-19 pandemic (to be precise: COVID-19 is the disease caused by the SARS-CoV-2 virus, although here we will use infected to mean infected by the virus). Indeed, updated information indicates that there was a large difference between those actually infected and those detected in the Chinese province of Hubei at the beginning of the epidemic (source: [1]).
In the above graph, the green columns show actual infected per day, and the orange columns show detected infected per day: the time lag of both columns is evident, with the number of detected infected lagging behind the actual number of infected by almost ten days.
For epidemiological and political decision-making (when to suspend rallies, educational activities, or when to apply severe confinement measures), it is essential not to confuse the number of detected infected with the actual number of infected. For example, in the case of Spain, decisions such as suspending the 8 March demonstrations were taken with detected infected numbers of a few hundred people (around 400 detected infected had accumulated by 6 March). Compared to what happened in Hubei, some 400 new infected were detected on 23 January, when the actual number of infected was around 2,500 on that day. Given the reasons given in Spain for not suspending the demonstrations, one tends to think that the number of detected infected outweighed the government’s estimates of the actual number of infected.
There are several statistical techniques that allow estimating the actual number of infected by knowing various distributions of data on the epidemic, whether on the number of detected infected or the number of deaths, their breakdown and any other relevant information (age and area distribution, outbreaks of infection, etc).
In order to make reliable estimates using these techniques in a country or region, accurate information on what has happened in comparable countries or regions (similar population, similar health systems, etc.) will help.
The data available from South Korea, which are very reliable because they have been dealing with the disease for more weeks than us and because they are leaders in the application of the COVID-19 test (even in an asymptomatic population), can be used to estimate the real number of affected people in countries such as Italy and Spain.
One such estimate can be made using the mortality ratio (in relation to those infected) by age measured in Korea (source: [2]); as of 22 March, these ratios are:
Age | Mortality ratio |
+80 | 10’84 |
70-79 | 5’35 |
60-69 | 1’51 |
50-59 | 0’37 |
40-49 | 0’09 |
30-39 | 0’11 |
(the ratio for under 30 is 0% and is not included).
We now need to know the number of deaths by age group in the area with which we are going to compare. Unfortunately we have been unable to find these data for Spain; from what I have read in some newspapers, it is not that they cannot be found, but rather that, incomprehensibly, they have not been available until today, 22 March. In any case, the data published today by the Ministry of Health by age correspond to 18,959 of the detected infected (60% of the total); as they are not global data but partial, the resulting estimates could be seriously biased. We hope to soon have global data that will allow us to apply our method to the Spanish case.
In the case of Andalusia, the number of deaths distributed by age is available (implicitly) in the daily bulletins of the Junta de Andalucía (source: [3]; data by age available until 24 March):
Age | Number of deaths in Andalusia as of 22 March |
+80 | 24 |
70-79 | 14 |
60-69 | 2 |
50-59 | 2 |
40-49 | 0 |
30-39 | 0 |
If we consider the mortality rates for South Korea, this gives us the following estimate of actual infected for Andalusia (as there are no deaths in Andalusia in the 30-49 segment, we will not get information there either).
Age | Estimated actual number of infected in Andalusia |
+80 | 221 |
70-79 | 261 |
60-69 | 132 |
50-59 | 540 |
TOTAL | 1.156 |
In order to know to what date this estimate of infected persons corresponds, it is now necessary to consider the average elapsed time between infection and death. For this figure, there are several estimates (source: [4]) ranging from two to four weeks. Since most of the deaths we are considering are of those over 50 with previous pathologies, we will take the lowest estimate: 14 days. This means that the estimate of 1,156 infected people over 50 for Andalusia corresponds to those who should have been infected 14 days ago (8 March).
From this data, the actual number of infected as of today (22 March) can be estimated, taking into account the doubling rate of the pandemic (the number of days it takes for the pandemic to double the number of infected). However, again, estimates for this figure and for this virus vary greatly and depend on the stage of development of the pandemic (something we do not know in the case of Andalusia). I have seen very reliable reports ([1]) that use the figure of 6.2 days as a doubling rate in the initial stages of the pandemic. This means that we would have to multiply by \(2^{14/6’2}=4’78\) the above estimate to calculate the number of infected over 50 for Andalusia as of today (22 March). This gives: 5,530. Now, we can consider that the pandemic is going 50% slower due to the effect of the week of confinement we have already had in Andalusia, that is, we consider that it will double every 10 days; in which case the factor to multiply by would be: \(2^{14/10}=2’63\), which results in: 3,050.
If we assume that those infected are equally distributed in Andalusia by age, and we take into account that those over 50 years of age make up 40% of the population, this gives
Estimated actual infected people in Andalusia as of 8 March | 2.890 |
Estimated actual infected people in Andalusia as of 22 March
(6.2 day doubling rate) |
13.825 |
Estimated actual infected people in Andalusia as of 22 March
(10 day doubling rate) |
7.627 |
Compare with the official figures of detected infected provided by Junta de Andalucía
Detected infected in Andalusia as of 8 March | ≈70 |
Detected infected as of 22 March | 1.725 |
For the reasons explained at the beginning of this entry, the estimates of those actually infected are much higher than those detected infected. If the above estimates are correct, there would be between 4 and 8 times more infected than detected infected in Andalusia. This is one of the reasons why it is necessary to take containment measures very seriously, because there are probably several thousand infected people who do not yet know they are infected, and if we were to live a normal life, the number of people affected would increase exponentially and the health system would soon collapse. I insist on “if the previous estimates are correct”, because extrapolating data from South Korea to Andalusia will very possibly introduce errors (South Korea has almost 7 times more population in an area slightly larger than Andalusia).
In any case, and with the worst-case estimate, we would be in a better scenario than the one that occurred in Hubei (figure 1), and therefore it is to be hoped that in Andalusia we can control the pandemic within two or three weeks, as happened in Hubei. Provided that, as they did in China, we take the containment measures very seriously.
Unfortunately, the situation in Italy shows a much less encouraging scenario. For Italy, data on deaths by age are available every day from the Istituto Superiore di Sanità: https://www.epicentro.iss.it/coronavirus/sars-cov-2-sorveglianza-dati
Those referring to 22 March are (source: [5])
Age | Number of deaths in Italy as of 22 march |
+80 | 2222 |
70-79 | 1585 |
60-69 | 469 |
50-59 | 138 |
40-49 | 38 |
30-39 | 12 |
By proceeding as above, we get an estimate for Italy of 171,612 actual infected persons over 30 on 8 March. As in the case of Andalusia, extrapolating data from South Korea to Italy will involve errors; for example, given the overcrowding that has affected Italian hospitals in recent days (especially in Lombardy), it is possible that their actual death rates are higher than those of Korea, where hospitals are better resourced; it is also necessary to take into account the more unstable stage of the epidemic in Italy compared to Korea, where the peak of infection was passed at the beginning of March. Taking this into account, and the fact that Italy has been under containment measures for two weeks, I have reduced the estimate of actual infected by 20% and assumed the best scenario (of the two scenarios considered above) for the epidemic’s doubling rate (10 days). We then have
Estimated actual infected in Italy as of 8 March | 181.707 |
Estimated actual infected in Italy as of 22 March
(10 day duplication rate) |
479.528 |
On the other hand, the numbers of detected infected are
Detected infected in Italy as of 8 March | 7.375 |
Detected infected in Italy as of 22 March | 52.796 |
(Update 25 March: On 24 March, Italy’s director of Civil Protection, Angelo Borrelli, said the actual number of infected in Italy would be around 600,000: https://www.abc.es/sociedad/abci-italia-habria-unos-600000-contagiados-segun-admite-proteccion-civil-202003241251_noticia.html)
If the above estimates are correct, the actual infected in Italy are an order of magnitude higher than detected infected.
What is important here is not so much the estimated number, but the order: in the case of Italy we are talking about several hundred thousand actual infected, which makes the scenario different from what happened in China, and suggests that many more weeks and more severe containment measures than those currently in place will be needed to control the epidemic in Italy.
Sources
[1] T. Pueyo, Coronavirus: Why You Must Act Now, (cuadro informativo del Journal of the American Medical Association, basado en datos de casos sin procesar del Chinese Center for Disease Control and Prevention)
https://medium.com/@tomaspueyo/coronavirus-act-today-or-people-will-die-f4d3d9cd99ca
[2] Korea Centers for Disease Control & Prevention https://www.cdc.go.kr/board/board.es?mid=a30402000000&bid=0030&act=view&list_no=366586&tag=&nPage=1)
[3] Consejería de Salud y Familias, Junta de Andalucía
[4] https://github.com/midas-network/COVID-19/tree/master/parameter_estimates/2019_novel_coronavirus
[5] Istituto Superiore di Sanità:
https://www.epicentro.iss.it/coronavirus/bollettino/Infografica_22marzo%20ITA.pdf
Estos son dos artículos donde se trabaja con lo que podrían ser datos más precisos. Se apunta a que el número de falsos positivos está siendo muy alto y, en particular, que la estimación de los asintómaticos no es realista ya que una proporción muy alta de ellos nunca estuvieron infectados.
https://cleantechnica.com/2020/03/21/iceland-is-doing-science-50-of-people-with-covid-19-not-showing-symptoms-50-have-very-moderate-cold-symptoms/?fbclid=IwAR31KACGZiPd6MpqJZEGmHmZXy9oRnI92rmqwVdR4r0H37HtJaWOlZIJOEM
https://pubmed.ncbi.nlm.nih.gov/32133832/
Pero de qué tipo de población se está hablando? Sanitarios? Gente que han tenido un contacto con alguien positivo? Que nivel de exposición tenía al estar en contacto?? Es que es todo tan o específico y depende de cada país de las circunstancias que hayan…
El artículo de pubmed ya ha sido retirado.
Este artículo ha sido retractado
Pues indique usted la referencia de donde ha sido y enlace para consultarlo, no se quede usted solo en su opinión, fundamente.
Quizás sea necesario conocer la distribución de la población por edad. No es igual en Corea que en España. La edad es clave, los jóvenes mueren menos. ¿o no?
Sí que tenéis datos por edades en la página del Ministerio de Sanidad: https://covid19.isciii.es
Hay un enlace debajo de las gráficas que se llama Informes COVID19 del CNE.
Por si is sirve para seguir trabajando en vuestros interesantes análisis… ¡Ánimo a todos!
Muchas gracias por su estudio. Arroja esperanza, algo fundamental en estos duros momentos. Espero que se cumpla su pronóstico.
Excelente artículo. Lamento que no use bien la notación decimal, punto o coma abajo.
Gracias por su estudio.
Quizás para tener una idea de la incidencia real del virus, y este dato no se si está disponible, podría compararse la mortalidad de los meses de enero, febrero, marzo,… de años anteriores con la de este año.
Muchas gracias por su publicación, es muy interesante.
Algunas preguntas:
1) ¿Alguna estimación sobre el número de infectados que se recuperan sin ser tratados?
2) ¿No es esa la clave para calcular la mortalidad real?
3) Dado que al parecer los tests están fallando como escopetas de feria, tanto en los falsos positivos como en los negativos, ¿alguna ponderación para las muertes atribuidas al covid-19? ¿Habéis comparado con la prevalencia de las enfermedades previas conocidas? ¿Se ha alterado la distribución?
4) Dado que la gente mayor, por la propia naturaleza, son las que más tienden a morirse y las que ademas acumulan más condiciones, que pueden además complicar su recuperación, pero que independientemente podían producir concluir en el mismo resultado, y dado que además ahora el triage hace que este segmento reciba menos atención, ¿algún tipo de ponderación aplicable para comparar el resultado si no hubiera un sistema sanitario saturado?.
5) ¿Habéis listado todas las variables que un buen tener influencia en la recuperación ? Desde número de doctores per capita, número de enfermeras per capita, protocolos de desinfección, etc.
Muy interesante. Ayer publicó la revista alemana Focus un artículo que quizás le pueda interesar en el que
La estadística Katharina Schüller exige pruebas representativas para el virus de la corona.
El artículo lo pueden leer en:
https://www.focus.de/gesundheit/news/es-grassiert-ungewissheit-repraesentative-tests-sollen-wahres-ausmass-in-deutschland-zeigen_id_11813688.html
pero si no entienden el alemán y me dan su correo electrónico les puedo enviar la traducción.
Saludos
Hola, estaba interesado en la traducción. Muchas gracias. Soy un profesor de la UPM
LLego a su blog desde el artículo de Sanpedro de El Pais.
Muchas gracias por explicar de manera clara y sencilla todo este baile de datos ofrecidos por los gobiernos y que confirman, si son extrapolables a todos los países, que está pandemia es algo muy serio y que los gobiernos deberían escuchar a los cientfícos YA.
Por cierto, ¿siguen Ustedes publicando ? ¿El gobierno central español está al corriento de todo esto?
Este analisis matemático realizado por verdaderos expertos con rigor cientifico demuestra que la Administracion del Estadotado y más concretamente el gobierno nos están engañando. Nos tratan como a parbulos al resto de ciudadanos más inteligentes que todos ellos. Se piensan que somos un pueblo ignorante y que ellos son los que dominan la materia. Muchos de nosotros hemos estudiado incando los codos, no como algunos de ellos que plagian sus texis y les regalaron sus titulaciones academicas.
Pues no demuestras haber hincado (con hache) mucho los codos a la hora de abordar tu tesis (con ese) doctoral. En fin, no se donde has estudiado párvulos (con uve) porque has olvidado todas las tildes. Por lo demás, genial tu comentario.
Es muy importante tener datos realistas sobre lo que está pasando. Muchísimas gracias por su aporte.
Me parece un razonamiento lógico y correcto. Gracias.
Un estudio de los más científicos que he podido leer acerca de los infectados reales enhorabuena
Hola,
Esto de las matemáticas está genial pero hay muchas trampas cuando se hace estadística de algo tan complejo y la impresión que dan los estudios (este y muchos otros) es que no parece tan grave. Simular una pandemia es extremadamente complejo. Las matemáticas ayudan pero hay muchísimos factores que se escapan y los resultados son (como está pasando) infinitamente dispares. Podría hacer usted un análisis bayesiano, por ejemplo. ¿por qué no? Aun así, la mejor simplificación es la que sigue. Existe un experimento controlado (Diamond princess) donde algo más de 700 personas dieron positivo (y TODOS fueron examinados). Aquí no hay casos ocultos. Es un experimento controlado (tenemos esa suerte). La tasa de mortalidad fue del 1.3%. En andalucía llevamos, curiosamente, 134 muertes. 130 corresponden a una tasa de mortalidad del 1.3%. Esto corresponde con algo más de 10000 casos (actualmente 3500) por lo que estamos un factor tres por debajo en casos detectados. Si suponemos que el 1.3% es una tasa de mortalidad media y que por supuesto se aplica a la “población” andaluza y obviando mil factores que pueden modificar la tasa de mortalidad. Aun así, es un órden de magnitud mayor que la gripe (para estas latitudes). Y la cosa es seria.
Por cierto, no creo (lo digo por la referencia 1) que esté muy bien lo que explican sobre las muertes producidas por la saturación del sistema (no se pueden tratar bien los casos en UCI). Al menos en Andalucía donde las UCI no están saturadas y se da un tratamiento adecuado a TODOS los infectados, a día de hoy.
Gracias por su esfuerzo.
Muy buen análisis, pero creo que falta considerar el número de personas que son infectadas y nunca se les llega a detectar el virus (porque no tienen síntomas o son muy leves y casi ni se dan cuenta). Me parece que en este análisis solo se considera el desfase entre el momento de contagio y la detección de la enfermedad, pero yo creo que hay un importante número de casos que nunca se llega a detectar, por lo que el número de contagiados es realmente todavía mayor de lo que se concluye aquí. difícil saber cuánto, eso sí…
Gracias por el desarrollo. Llevo indignado desde el principio por las cifras que se dan en los medios de infectados, a partir de tests con poca significación estadística (pocos, y a sintomáticos), cuando se dispone de números reales de muertos, días de incubación, y una tasa de mortandad, la de Corea del Sur, bastante aproximada.
Se confunde a la sociedad sin necesidad. Y se hace pensar que la probabilidad de contagiarse es menor, lo que va en contra de la seriedad con la que se tomen la profilaxis.
Gracias de nuevo, y ojalá los medios de comunicación se tomen más en serio el rigor de lo que transmiten.
Espero que el diagnóstico hecho sea eficiente y verdadero por que con el caos que estamos viviendo con las cifras nos estamos volviendo un poco incrédulos y la verdad es siempre la certera ¡¡ alguna vez se dicen mentiras piadosas !! Pero en este caso es mejor ir con la verdad por delante aunque algunos políticos se quieran cubrir las espaldas. Gracias de todos los modos y Un Saludo.
Excelente trabajo. Me alegra ver que coinciden con mi apreciación de que Corea es el monitor fiable de la tasa de infección en base a su mortalidad (1%). No me ha quedado claro si en el modelo que exponen interpretan como hago yo que los de edad <18 y buena parte del tramo superior (en su caso hasta 30 años) son de hecho inmunes totales primarios (excepto personas con patologías, incluso crípticas a los pacientes en el momento de su enfermedad/fallecimiento) a la infección y por lo tanto no los consideran en la tasa de infectados. También, me gustaría conocer su opinión sobre los datos publicados de mortalidad de Alemania (que a mi me parecen literalmente increíbles). Otro aspecto en el que me gustaría saber si han trabajado es en la definición matemática del umbral de mortalidad a partir del cual los muertos se producen simplemente por saturación del sistema sanitario o por pifias garrafales en el sistema de aislamiento de poblaciones frágiles (tipo los contagios en cadena en las residencias de ancianos). Yo, sin ninguna aproximación matemática, creo que la base de entrada sería el 4% de mortalidad de los chinos (aceptando que hay un sesgo en la diferencia entre Wuhan y la suma del resto de China), que p.e. Irán con sus datos cercanos al 8% (y con probable censura) sin duda expresa sobremortalidad por fallo del sistema sanitario, que los datos de Lombardía indican fallo grave del sistema sanitario; en resumen que por ser optimistas quizás el 6% marcaría el punto en el que el resto de muertos serían totalmente evitables en un escenario sanitario óptimo.
Antonio, me ha gustado mucho tu análisis.
Estamos recopilando datos a través de encuestas abiertas (con lo que eso implica de posibles sesgos y outliers): https://github.com/GCGImdea/coronasurveys
Ahí están los datos recopilados en varias encuestas en varios países, incluidos España e Italia (hoy hemos subido lo más recientes de España). Hay datos de encuestas en Twitter, pendientes de subirse, desde el 13 de marzo.
Muy interesante el artículo. Creo que también habría que tener en cuenta el “efecto rebote” que a corto/medio plazo provocan las medidas de confinamiento. Supongamos que el día del comienzo del confinamiento los infectados reales son N. Si cada infectado “cae” aleatoriamente en un hogar, y cada hogar español tiene una ocupación media de 2.5 personas (datos del INE de 2018), esas 2.5 personas se van a contagiar con casi total seguridad en poco tiempo. Luego a corto plazo el numero inicial de infectados N se convierte en N*2.5; puede parecer un factor de amplificación no muy grande pero si el N inicial era grande (como se sospecha), multiplicar por 2.5 supone un gran incremento en cifras netas. Es decir el confinamiento a corto/largo plazo tendrá un efecto (obviamente), pero a corto plazo, si no se toman medidas adicionales, tendrá un “efecto rebote”. Estoy en lo correcto?
Perdón, en la última frase quise decir “a medio/largo plazo”.
¿Podrían estimar a partir de estos datos cuándo pudo originarse la epidemia en España y/o Andalucía? Sé que de acuerdo a los modelos que dan en Nextstrain las epidemias se visibilizan entre 4 y 8 semanas después de su introducción. Pero estoy seguro de que debe haber modelos para predecir retroactivamente cuándo la epidemia pudo haberse originado a partir de los números de infectados reales y detectados que se conocen o se estiman
Se echa en falta este tipo de trabajos. Muchísimas gracias.
El MInisterio de Sanidad parece que ya está publicando los datos de fallecidos por franja de edad. https://www.mscbs.gob.es/profesionales/saludPublica/ccayes/alertasActual/nCov-China/documentos/Actualizacion_56_COVID-19.pdf
Gracias por ofrecer esperanza y datos objetivos, no parciales ni manipulados.
Hola soy médico y acabo de acceder a este blog por la publicación en el País … hace ya algún tiempo he venido usando la tasa de letalidad global de Corea 0.8 % … y aunque tu estimación por grupos de edad es mucho más precisa … simplemente utilizando la letalidad global me sale que se están diagnosticado en España la octava parte de los casos (aproximadamente).
Hace poco un amigo me decía que las cifras que están dando los alemanes son falsas … aplicando este simple cálculo y asumiendo que los alemanes están haciendo tests como los surcoreanos (Lo cual no es a bote pronto tan descabellado) … pues resultó que las cifras me cuadraron perfectamente y me sirvieron para decirle a mi amigo … que me fío absolutamente de los datos de los alemanes (principalmente porque como en Corea del Sur los casos detectados deben de estar bastante más cerca de los reales).
Me ha alegrado que salga una noticia por fin con esto … pero creo que van muy por detrás y no lo entiendo… cuando son cosas de lógica… que cualquier médico puede calcular sin grandes conocimientos matemáticos… ya no digo personas con conocimientos que pueden afinar muchísimo más… y que también hay muchísimos en nuestro país.
Un saludo.
Gracias por el estudio, muy interesante.
Una pregunta. Si la cuarentena se respeta, entiendo que la tasa de duplicación de la epidemia en días tiende a infinito, pues no habría contacto (excepto los que están en primera línea, un abrazo para todos). A la vez, si a esto se añade que la reproductividad del virus se reduce de forma notable con el buen tiempo, hablar de muchas más semanas en Italia sería un poco exagerado, no? Lo digo porque en España, que somos menos población, parece que la superamos en registros.
Leido el interesante trabajo de este cientifico quiero hacer dos comentarios para posible correccion del mismo.
1-La alta mortalidad de personas mayores de 65 años deberia dar un menor % de contaminacion con el virus en esas franjas. Es decir, el virus es mas efectivo en esas edades matando seres humanos, por lo que el ratio de contagio debe ser distinto al de edades menores.
2-el calculo de dias de tasa de duplicacion deberia ser partimentado segun tramos, ya que al principio el virus va creciendo de manera exponencial pero luego llega a meseta si se toman medidas de cuarentena previamente. En el caso de mi pais (Uruguay) el gobierno no decreto cuarentena legalmente pero promovio muchas acciones que han dado como resultado una cuarentena de facto. Eso ha hecho que la curva no sea exponencial. De todas maneras somos muy pocos habitantes (3.5 mill) y “todos nos conocemos” como decimos aca.
Resumiendo, si se toman estas medidas de proteccion de la sociedad, se deberia hacer un calculo parcializado segun dias y medidas tomadas. Creo que asi el calculo total seria mas acertado…..
Quiso ser un intento de aporte y no de generar polemica.
Vivi 10 años en barcelona y tengo ciudadania española.!!!! Les deseo lo mejor a mis compatriotas del otro lado del Atlantico!!! Fuerza!!!
Buenas tardes,
Muy interesante este estudio. Muchas gracias por aportar luz a todo ese amarillismo radiotelevisivo que está presente en la mayoría de hogares españoles.
Gracias también porque para personas con problemas de salud mental, como puede ser la depresión, es muy importante este conocimiento para no dejarse llevar por el amarillismo.
Mi madre te estará eternamente agradecida.
Un saludo
En la web de Sanidad ha empezado ya a publicarse los datos de fallecidos por edad. Pero se ve que no tiene la información a de todos los fallecidos. Solo tienen una cuarta parte.
Muchas gracias por el estudio, arroja más luz en los datos que lo que abundantemente nos bombardean los informativos.
Echo en falta un aspecto que me parece crucial, donde se analice con profundidad la incertidumbre, algo básico en teoría de errores. Quizá podría animarse en una extensión a hablar de este tema?
Al final, siendo algo bastante geométrico supongo que podríamos hablar que el número real de casos en Andalucía sería algo así como 13.825 (+ 25.000 o -5000) con un 95% de confianza.
Gracias por la investigación.
Hola, gracias por el artículo. Explica muy bien lo que nadie con el sentido común es capaz de entender. Mi duda sobre esta extrapolación me la gerera el indicador de “tasa de duplicación”. Desde que en este medio se muestran los gráficos por CCAA de esta tasa yo llevo varios días viendo mucha variabilidad .En Madrid a principios de semana era de 6,7 y ahora está en 4,5. Claramente esta tasa varía si se toma el número de fallecidos o el número de contagiados “detectados”, también varía mucho según el valor absouto. Cuanto mayor número de casos son lo que se tienen, también debe ser mayor es el número de casos que tiene que haber para ser doblado. En cifras bajas este ratio podría sesr más alto. Podría ser un buen referente el número de días que se ha tardado un fallecido en fallecer desde que fue contagiado ( si es que se hubiera conocido) ….
En cualquier caso, la conclusión es que los casos informados de contagio están muy por debajo de la realidad. Excelente artículo.
Un saludo
Muy buen análisis. Yo soy de Sevilla y actualmente vivo en Panamá, donde de momento el Ministerio está facilitando la información en su web. https://minsa.gob.pa/coronavirus-covid19 con contagios en todas las franjas de edad, una población de 4 millones (quizás algo más por migración) y una superficie como la de Andalucía. Esta cumpliendo una tasa de casos detectados entorno al 25% diario. Si en algún momento actualizas el análisis, quizás podrías hacer una estimación de como puede estar el número real por aquí. Muchas gracias.
Soy Profesor de la Universidad de Oviedo (Ingeniería Eléctrica). Con bastante desconocimiento sobre los métodos de estimación, cuando se publicaron por primera vez las curvas de evolución de infectados “oficiales” en España y e Italia, quizás 5 días después del brote en España, nos bastó con ver los dos gráficos para concluir que nos iba a pasar exactamente lo mismo y comenzamos a mantener distancias, mandar a los alumnos al fondo del aula en mi caso porque tenía a un familiar hospitalizado, y hacer alguna estimación con los datos de Italia y los nuestros que nos dejaron de piedra. Vuestra exposición no sólo es extraordinariamente clara sino indudablemente cierta. Os felicito y os doy las gracias por hacerlo público. Lo que nos seguimos preguntando los compañeros y yo es: “¿Dónde estaban los “expertos” que no fueron capaces de dar el grito de alarma, si vosotros los teníais claro y nosotros lo intuíamos? Por desgracia, ahora las críticas y el cabreo sirven de poco. Aquí tenemos la suerte de poder usar la energía “sobrante” en un proyecto con el Principado y algunas empresas para hacer un respirador funcional de verdad. El confinamiento pasa más rápido cuando baja la sensación de impotencia. Muchas gracias y cuidaos mucho. Vuestro enlace se va directamente al correo de todos mis alumnos 8-). Un abrazo desde el norte.
Enhorabuena por su análisis. En relación con esto, me gustaría saber su opinión sobre un tema que me preocupa. Si extrapolamos la letalidad de la enfermedad de los datos de Corea del Sur (1) a la pirámide de población española (2), asumiendo que ningún otro factor genético ni ambiental relevante tuviera influencia, esperaríamos una letalidad global en España del 1,25%. Si asumimos que los fallecimientos ocurren en su enorme mayoría más allá de las 2 semanas después del inicio de síntomas(3), tenemos que deducir que con 4.858 muertos actualmente en España, hace 14 días habría al menos 4.858 x 100 / 1,25 = 347.235 infectados (13 de marzo). Si además asumimos una tasa duplicación de casos de 4 días (que es muy conservadora, porque tanto los casos diagnosticados como los fallecidos se están duplicando más rápido), obtenemos una estimación de infectados actuales de 347.235 x 2^(14/4) = 3.928.524 casos. ¿Cree que puede ser cierto?
Saludos cordiales,
Ref:
1.-https://www.statista.com/statistics/1105088/south-korea-coronavirus-mortality-rate-by-age/
2.-https://www.populationpyramid.net/spain/2019/
3.-https://www.who.int/docs/default-source/coronaviruse/who-china-joint-mission-on-covid-19-final-report.pdf
Gran estudio, ¡enhorabuena!
Hay alguna explicación para los datos de China. Un pais con 1400 millones de personas que ha exportado la enfermedad al resto y todas sus cifras son relativamente bajas teniendo en cuenta la densidad de poblacion. Además con respuesta menos controlada al ser el primer país.La mortalidad no parece nada alta.
China raccionó muy rápidamente a la pandemia y además de una manera muy enérgica. Todas las regiones infestadas fueron rapidamente aisladas y a la población se les obligó a quedarse en sus casas 24 horas del dia y 7 dias a la semana. El ejército les llevaba alimentos y articulos de consumo diario y controlaba a rajatabla que la cuarentena se respetara. A las personas que violaban la cuarentena se las encerraba en sus casas soldando las puertas para que no pudieran ser abiertas. (dejando una ventanilla para la distribucion de alimentos)
En pocos dias construyeron además un hospital enorme solamente para pacientes de COVID-19.
Estimado, muy bueno el artículo!!!
Tengo una consulta:
Cuando se grafican los datos de infectados/recuperados/fallecidos por día, son números acumulados o nuevos casos? Cuando hablan de aplanar la curva, están pensando en la curva de los nuevos infectados por día? O en la cantidad de infectados que hay ese día?; acumulados con los infectados anteriores menos los recuperados y fallecidos.
Saluda atte. Bernardo Pintos desde Uruguay
También me gustaría darle las gracias por su estudio, que une rigor y claridad. En concreto, explica muy bien la importancia de disponer de estadísticas de fallecimiento desglosadas por edades.
Me gustaría consultarle si cree que el parámetro ‘tasa de duplicación’ podría aumentarse aún más (en días), considerando el efecto del confinamiento. ¿Cree que esta ‘tasa de duplicación’ podrá ‘calibrarse’ a partir de los datos de España cuando existe más información?
Muchas gracias.
Un motivo de sesgo en este tipo de análisis es que el número de ancianos muertos por desatención en España es muy elevado. La estimación en esta franja de edad estaría sobredimensionada.
No estoy nada de acuerdo. Si las personas se curan según su valor social como es la norma actual, los pensionistas no reciben tratamiento. Y sin tratiento se mueren. En otros países reciben tratamiento y sobreviven 80%. Hay que comparar los muertes solo entre las personas que reciben igual tratamiento aquí y en China. Más o menos los de edad 40 años y con alto estatus social.
¿Cuántos cargos electos con acceso a los tests y tratamiento temprano se han muerto? Independiente de la edad. Pues no creo que sobrepasa la cifra de Corea del Sur, donde todos recibían este trato.
El poder de la Bioestadistica menospreciado en España. Excelente artículo que deja claro que tan importante es el conocimiento de la Epidemiologia y la Salud Pública para tomar decisiones. Gracias por su trabajo, espero siga publicando más datos. Enhorabuena
Si las estimaciones que hace Ud. son aproximadamente correctas y hay 500.000 infectados en España, si cada 3 días se duplica el numero de infectados, en unos 15 días aproximadamente tendremos media España infectada y por tanto se alcanzará el pico de la transmisión de forma espontanea si el factor de transmisión es aproximadamente 2. Con un 1% de muertes y unos 22 millones de infectados, tendremos unos 220.000 muertos antes del verano. ¿Está Ud. de acuerdo?
Excelente análisis. Quizás los datos que se están facilitando desde los poderes públicos sea “conveniente” darlos de esta forma, pero parece esta claro que los datos son otros, cosa que demuestra el resultado de este estudio riguroso, pese pudiera que tenerse en cuenta más/distintos factores correctores.
Considero que las cosas debieran ser tratadas en esta linea de rigor. Gracias.
si suponemos que la distribución de los contagios es homogenea en todos los grupos de edad, nos encontramos que si comparamos la distribución de poblacion por edad (INE) con la distribución por edad de las personas ingresadas, (siempre tomando los datos incompletos disponibles), que existe una enorme población, mayor cuanto mas joven, que probablemente haya sufrido el contagio y no ha presentado síntomas o ha presentado síntomas leves, y que supone mas de un 75% de la población global. si adicionalmente estimamos que un 50% de la población mayor de 80 años pueda ser asintomática (dato inventado), nos encontraríamos con mas de un 87% de asintomáticos o con síntomas leves o dicho de otro modo con mas de 500.000 positivos a día de hoy
Buen artículo. Si nos basamos en los datos del crucero Diamond Princess, una situación única para extraer conclusiones, tenemos un total de 3600 personas a bordo. 712 casos confirmados, (algunos más que dieron positivo en sus paises al volver). De estos casos 10 fallecidos, el 1,4 %. Pero hay que añadir que el 80 % de los pasajeros (3000), tenían más de 60 años. Este segmento acumula los porcentajes de más del 90 % de los fallecidos en italia, aunque no sabemos cuantos eran mayores de 70 y 80. Unamos que durante la cuarentena en el barco, habría personas que pasaron la enfermedad de forma asintomática. Todo esto mezclado nos daria grosso modo (tras algunos cálculos muy imprecisos por la inexactitud de los datos), una mortalidad inusualmente baja extrapolada a una población normalizada en edad. ¿Somos optimistas y ponemos el 0,1% ? Por tanto 5.000 muertes podrían equivaler a 5 millones de infectados. ¿Ha estudiado usted este caso? Gracias.
Es un artículo muy importante ya que nos permitiría tomar decisiones frente a los sucesos que están ocurriendo en nuestro país.