Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile
La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 8 casos al día de hoy, para facilitar la comparación desde un punto de un punto de partida común.
Si vemos la serie total, podemos ver que la tasa se ha estabilizado para las dos últimas dos semanas, más acelerada de la previa. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Con respecto a la tasa de casos totales del día vs del dia anterior, se ve como Tarapacá presenta una tasa de aumento superior al 10%, igual que Atacama y Coquimbo. Valparaíso y O’Higgins presentan tasas entre 5% y 10% en aumento, en tanto que la Metropolitana se encuentra en el mismo rango, pero en descenso. Biobío, que presentaba una disminución importante, ha aumentado su tasa de manera importante los últimos 5 días.
Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro, que es el caso de Aysén. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Debido a las aceleraciones observadas durante la última semana, 6 regiones se muestra más aceleradas que la semana anterior. Destaca que la Metropolitana ya se encuentra desacelerada respecto de la semana pasada.
Se mantiene la tendencia ascendente de la Región Metropolitana y la serie total.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Usando escala logarítmica en el eje Y, se puede comparar mejor los patrones de las regiones con menos casos. Se puede ver como los casos nuevos muestran un claro patrón exponencial para la Metropolitana y la total desde hace 20 días.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Si observamos la evolución en el resto de las regiones, podemos distinguir los siguientes tipos de patrones:
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Usando la tasa de casos nuevos diarios vs los del día anterior, con ventana de 7 días, se puede apreciar mejor la aceleración en Tarapacá, Valparaíso, Biobío y Araucanía, así como la desaceleración de la Maule, Metropolitana y la serie total. Ñuble se muestra estabilizado.
Para la predicción total se recorta la serie a partir de lo 50 casos.
Si observamos la predicción a 2 día plazo, se puede ver que el modelo cuadrático se queda corto por el límite superior del intervalo de confianza. Los modelos T+AR presentan intervalos de confianza correctos, siendo más cercano a lo observado T+AR(1).
| casos | li | ls | |
|---|---|---|---|
| Observado | 27219 | NA | NA |
| General: Cuadrático + AR(2) | 26561 | 26026 | 27096 |
| Casos nuevos : Tendencia + AR(1) | 26945 | 25695 | 29613 |
| Casos nuevos: Tendencia + AR(4) | 27023 | 25912 | 29064 |
En una semana más los modelos predicen entre 34418 y 35108 casos.
## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.
| dia | casos | li | ls | |
|---|---|---|---|---|
| 57 | 68 | 28442 | 27899 | 29419 |
| 58 | 69 | 29581 | 28515 | 31526 |
| 59 | 70 | 30706 | 29027 | 33998 |
| 60 | 71 | 31771 | 29505 | 36369 |
| 61 | 72 | 32821 | 29942 | 38891 |
| 62 | 73 | 33824 | 30358 | 41313 |
| 63 | 74 | 34811 | 30753 | 43778 |
| dia | casos | li | ls | |
|---|---|---|---|---|
| 57 | 68 | 28354 | 27790 | 29477 |
| 58 | 69 | 29426 | 28271 | 31868 |
| 59 | 70 | 30461 | 28718 | 34263 |
| 60 | 71 | 31473 | 29149 | 36635 |
| 61 | 72 | 32467 | 29571 | 38978 |
| 62 | 73 | 33449 | 29987 | 41294 |
| 63 | 74 | 34418 | 30398 | 43583 |
| dia | casos | li | ls | |
|---|---|---|---|---|
| 57 | 68 | 28285 | 27894 | 28675 |
| 58 | 69 | 29371 | 28818 | 29923 |
| 59 | 70 | 30477 | 29801 | 31154 |
| 60 | 71 | 31604 | 30823 | 32385 |
| 61 | 72 | 32752 | 31878 | 33625 |
| 62 | 73 | 33919 | 32963 | 34876 |
| 63 | 74 | 35108 | 34074 | 36141 |
Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.
El modelo cuadrático tiende a ser más optimista, con 34924 casos en una semana. El modelo de casos nuevos es más pesimista, pronosticando 39826 en una semana.
| dia | fecha | tipo | casos | |
|---|---|---|---|---|
| 68 | 68 | 2020-05-09 | Casos nuevo: Tendencia + AR(1) | 28632 |
| 69 | 69 | 2020-05-10 | Casos nuevo: Tendencia + AR(1) | 30169 |
| 70 | 70 | 2020-05-11 | Casos nuevo: Tendencia + AR(1) | 31825 |
| 71 | 71 | 2020-05-12 | Casos nuevo: Tendencia + AR(1) | 33607 |
| 72 | 72 | 2020-05-13 | Casos nuevo: Tendencia + AR(1) | 35525 |
| 73 | 73 | 2020-05-14 | Casos nuevo: Tendencia + AR(1) | 37593 |
| 74 | 74 | 2020-05-15 | Casos nuevo: Tendencia + AR(1) | 39826 |
| 75 | 68 | 2020-05-09 | General: Cuadrático + AR(2) | 28260 |
| 76 | 69 | 2020-05-10 | General: Cuadrático + AR(2) | 29322 |
| 77 | 70 | 2020-05-11 | General: Cuadrático + AR(2) | 30403 |
| 78 | 71 | 2020-05-12 | General: Cuadrático + AR(2) | 31503 |
| 79 | 72 | 2020-05-13 | General: Cuadrático + AR(2) | 32624 |
| 80 | 73 | 2020-05-14 | General: Cuadrático + AR(2) | 33764 |
| 81 | 74 | 2020-05-15 | General: Cuadrático + AR(2) | 34924 |
El total de ventiladores ocupados muestra nuevamente un máximo en la serie, llegando a 1276. Esto genera que la cantidad de ventiladores disponibles disminuye a 549.
| fecha | total | disponibles | ocupados |
|---|---|---|---|
| 2020-05-03 | 1825 | 674 | 1151 |
| 2020-05-04 | 1825 | 654 | 1174 |
| 2020-05-05 | 1825 | 640 | 1185 |
| 2020-05-06 | 1825 | 636 | 1189 |
| 2020-05-07 | 1825 | 627 | 1198 |
| 2020-05-08 | 1825 | 595 | 1230 |
| 2020-05-09 | 1825 | 549 | 1276 |
Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 544 casos.
| fecha | total |
|---|---|
| 2020-05-03 | 449 |
| 2020-05-04 | 464 |
| 2020-05-05 | 470 |
| 2020-05-06 | 486 |
| 2020-05-07 | 493 |
| 2020-05-08 | 508 |
| 2020-05-09 | 544 |
Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir, como ha sido la última semana, nuevamente a la Región Metropolitana.
En las otras regiones, destaca que hace 4 días el máximo número de camas UCI corresponde a Antofagasta.
Si observamos la serie de decesos por día, desde los 3 casos, se observa una disminución de la tasa en la Región Metropolitana en los últimos 6 días, así como una leve desaceleración en la curva total.
Si analizamos la tasa de decesos diarios, podemos observar un descenso a cerca de 7 por día.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Podemos hacer un modelo un poco bruto, en el cual modelamos el logaritmo del número de decesos por día +1 utilizando la cantidad de casos nuevos con lags de 0 a 14, más un autoregresivo sobre el mismo valor de decesos. Pordemos ver que los coeficients significativos son el 8 y el 12, lo que nos indica que la predicción de decesos del día de hoy no puede omitir los casos de hace más de una semana atrás.
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 0.53 | 0.113 | 4.706 | 0 |
| L(chile.decesos.ts) | 0.022 | 0.037 | 0.589 | 0.56 |
| L(chile.casos.ts, 0:14)0 | 0 | 0.001 | 0.716 | 0.478 |
| L(chile.casos.ts, 0:14)1 | 0.001 | 0.001 | 1.389 | 0.173 |
| L(chile.casos.ts, 0:14)2 | -0.001 | 0.001 | -1.443 | 0.158 |
| L(chile.casos.ts, 0:14)3 | 0 | 0.001 | -0.082 | 0.935 |
| L(chile.casos.ts, 0:14)4 | 0 | 0.001 | -0.51 | 0.613 |
| L(chile.casos.ts, 0:14)5 | -0.001 | 0.001 | -1.687 | 0.1 |
| L(chile.casos.ts, 0:14)6 | -0.001 | 0.001 | -0.966 | 0.341 |
| L(chile.casos.ts, 0:14)7 | 0.001 | 0.001 | 0.686 | 0.497 |
| L(chile.casos.ts, 0:14)8 | 0.004 | 0.001 | 2.775 | 0.009 |
| L(chile.casos.ts, 0:14)9 | -0.001 | 0.001 | -0.466 | 0.644 |
| L(chile.casos.ts, 0:14)10 | 0 | 0.001 | -0.318 | 0.752 |
| L(chile.casos.ts, 0:14)11 | 0.002 | 0.001 | 1.223 | 0.229 |
| L(chile.casos.ts, 0:14)12 | 0.005 | 0.001 | 3.194 | 0.003 |
| L(chile.casos.ts, 0:14)13 | -0.001 | 0.002 | -0.555 | 0.583 |
| L(chile.casos.ts, 0:14)14 | -0.002 | 0.001 | -1.783 | 0.083 |
Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford
En general, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general.
Para la serie de decesos, se mantiene el exceso de cifras con 1. No hay suficientes casos para revisar la distribución de segundo orden. Al igual que la serie de casos, la distribución de la sumaria tiene exceso de 7 y 8.
Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.