Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile
Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 24 de Mayo.
La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 10 casos , para facilitar la comparación desde un punto de un punto de partida común.
Si vemos la serie total, podemos ver que la tasa de incremento diario prácticamente se ha mantenido constante en los últimos 28 días. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:
Con respecto a la tasa de casos totales del día vs del dia anterior, se usó el método STL para eliminar la fluctuación semanal. Se puede ver que Tarapacá, Antofagasta, Atacama, Valparaíso, O’Higgins y Magallanes muestran disminución de tasas. Arica y Parinacota, Coquimbo, Metropolitana, Maule, Ñuble, Biobío, Los Ríos, Los Lagos y la serie total muestran tasas ascendentes.
Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Se observa que 7 regiones se muestran desaceleradas, vs 7 que están aceleradas. La serie total se encuentra un tanto acelerada.
Se puede apreciar que la tendencia general de los últimos 5 días supera los 4000 casos, siendo las variaciones semanales atribuibles a las diferencias en muestreo por los fines de semana.
Usando escala logarítmica en el eje Y, se puede apreciar con mayor claridad el ciclo de 7 días alrededor de la tendencia, y como esta no ha variado en las últimas dos semanas.
Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.
Usando la tasa de casos nuevos diarios vs los del día anterior, se puede ver que Valparaíso, Tarapacá y Antofagasta muestran tasas cercanas a 1. La Metropolitana, Ñuble, Araucaía, Maule y la serie total se muestran aceleradas.
Para la predicción total se recorta la serie a partir de lo 50 casos.
Si observamos la predicción realizada hace 4 días, podemos ver que nuevamente T+AR(4) se acerca más al resultado observado que T+AR(1). Para ambos métodos se cumple el intervalo de confianza.
| casos | li | ls | |
|---|---|---|---|
| Observado | 73997 | NA | NA |
| Casos nuevos : Tendencia + AR(1) | 71380 | 63870 | 88045 |
| Casos nuevos: Tendencia + AR(4) | 73467 | 65531 | 89601 |
En una semana más los modelos predicen más de 100.000 casos.
## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.
| dia | casos | li | ls | |
|---|---|---|---|---|
| 73 | 84 | 78376 | 76466 | 81764 |
| 74 | 85 | 83335 | 79158 | 90897 |
| 75 | 86 | 87885 | 81289 | 100617 |
| 76 | 87 | 92890 | 83591 | 111496 |
| 77 | 88 | 97644 | 85635 | 122554 |
| 78 | 89 | 102770 | 87817 | 134593 |
| 79 | 90 | 107754 | 89867 | 146712 |
| dia | casos | li | ls | |
|---|---|---|---|---|
| 73 | 84 | 78602 | 76404 | 82807 |
| 74 | 85 | 83092 | 78470 | 92569 |
| 75 | 86 | 87573 | 80431 | 102803 |
| 76 | 87 | 92113 | 82379 | 113387 |
| 77 | 88 | 96759 | 84355 | 124313 |
| 78 | 89 | 101544 | 86382 | 135608 |
| 79 | 90 | 106492 | 88474 | 147306 |
Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.
El modelo cuadrático predice muchos menos casos (94322), que los modelos de tendencia AR(1) y AR(4), con 121911 y 121671 casos, respectivamente.
| fecha | Casos nuevo: Tendencia + AR(1) | Casos nuevo: Tendencia + AR(4) |
|---|---|---|
| 2020-05-25 | 79237 | 79082 |
| 2020-05-26 | 84907 | 84841 |
| 2020-05-27 | 91073 | 91066 |
| 2020-05-28 | 97795 | 97759 |
| 2020-05-29 | 105130 | 105063 |
| 2020-05-30 | 113145 | 113002 |
| 2020-05-31 | 121911 | 121671 |
| General: Cuadrático + AR(1) |
|---|
| 76755 |
| 79561 |
| 82416 |
| 85320 |
| 88272 |
| 91273 |
| 94322 |
El total de ventiladores ocupados muestra una máxima en la serie, con 2025 casos. El aumento de ventiladores totales en los últimos 4 días parece ser respuesta a la necesidad de contar con nuevos ventiladores, manteniéndose la cantidad de disponibles prácticamente igual.
| fecha | total | disponibles | ocupados |
|---|---|---|---|
| 2020-05-19 | 2130 | 455 | 1675 |
| 2020-05-20 | 2130 | 390 | 1740 |
| 2020-05-21 | 2130 | 332 | 1798 |
| 2020-05-22 | 2177 | 346 | 1831 |
| 2020-05-23 | 2250 | 336 | 1914 |
| 2020-05-24 | 2318 | 348 | 1970 |
| 2020-05-25 | 2347 | 322 | 2025 |
Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1135 casos.
| fecha | total |
|---|---|
| 2020-05-19 | 876 |
| 2020-05-20 | 904 |
| 2020-05-21 | 943 |
| 2020-05-22 | 986 |
| 2020-05-23 | 1062 |
| 2020-05-24 | 1090 |
| 2020-05-25 | 1135 |
Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir, como ha sido la tónica desde inicios de Mayo, a la Región Metropolitana.
En las otras regiones, destaca que Valparaíso supera hace 3 días a Antofagasta, que permanece prácticamente igual en el periodo. En tercer lugar se ubica Maule
Si observamos la serie de decesos por día, desde los 4 casos (se excluye Coquimbo), se observa un incremento importante en los últimos 14 días, siendo atribuible esto al aumento de decesos en la Región Metropolitana.
Si analizamos la tasa de decesos diarios, podemos ver que hoy supera los 40 casos diarios, siendo muy probable que observemos más de 50 casos en los próximos días.
Simplificaremos el modelo de decesos basados en casos, utilizando directamente el número de decesos contra el de casos. En las pruebas realizadas se puede observar que es necesario incrementar hasta el log 22 para llegar a resultados más fiables. Se puede ver que la predicción se basa fundamentalmente en los días con alto número de decesos, aunque se observa falta de linealidad.
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | -0.332 | 0.685 | -0.484 | 0.631 |
| L(chile.decesos.ts) | 0.548 | 0.15 | 3.658 | 0.001 |
| L(chile.casos.ts, 0:22)0 | -0.002 | 0.002 | -0.77 | 0.447 |
| L(chile.casos.ts, 0:22)1 | 0.007 | 0.003 | 2.471 | 0.018 |
| L(chile.casos.ts, 0:22)2 | -0.002 | 0.003 | -0.6 | 0.552 |
| L(chile.casos.ts, 0:22)3 | -0.001 | 0.003 | -0.306 | 0.761 |
| L(chile.casos.ts, 0:22)4 | 0 | 0.003 | -0.094 | 0.926 |
| L(chile.casos.ts, 0:22)5 | -0.003 | 0.003 | -0.791 | 0.434 |
| L(chile.casos.ts, 0:22)6 | 0.001 | 0.004 | 0.198 | 0.844 |
| L(chile.casos.ts, 0:22)7 | 0.001 | 0.004 | 0.183 | 0.855 |
| L(chile.casos.ts, 0:22)8 | 0.001 | 0.004 | 0.193 | 0.848 |
| L(chile.casos.ts, 0:22)9 | -0.005 | 0.004 | -1.257 | 0.217 |
| L(chile.casos.ts, 0:22)10 | 0.007 | 0.005 | 1.506 | 0.141 |
| L(chile.casos.ts, 0:22)11 | -0.002 | 0.005 | -0.503 | 0.618 |
| L(chile.casos.ts, 0:22)12 | 0.008 | 0.006 | 1.472 | 0.15 |
| L(chile.casos.ts, 0:22)13 | -0.008 | 0.007 | -1.212 | 0.233 |
| L(chile.casos.ts, 0:22)14 | 0.008 | 0.006 | 1.236 | 0.224 |
| L(chile.casos.ts, 0:22)15 | -0.002 | 0.008 | -0.242 | 0.81 |
| L(chile.casos.ts, 0:22)16 | 0.008 | 0.008 | 0.895 | 0.377 |
| L(chile.casos.ts, 0:22)17 | 0.001 | 0.008 | 0.092 | 0.927 |
| L(chile.casos.ts, 0:22)18 | -0.003 | 0.008 | -0.322 | 0.75 |
| L(chile.casos.ts, 0:22)19 | 0.003 | 0.008 | 0.426 | 0.673 |
| L(chile.casos.ts, 0:22)20 | -0.003 | 0.008 | -0.373 | 0.712 |
| L(chile.casos.ts, 0:22)21 | -0.001 | 0.008 | -0.07 | 0.945 |
| L(chile.casos.ts, 0:22)22 | -0.002 | 0.007 | -0.26 | 0.796 |
| 0.9355 |
Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford
Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general.
Para la serie de decesos, se mantiene el exceso de cifras con 1.
Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.