Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile
Representación gráfica de discursos del gobierno: https://rpubs.com/clbustos/613302
Evolución de distintos modelos explicativos: https://rpubs.com/clbustos/615858
Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 19 de Junio de 2020.
La serie de casos se hace hace partir de los 25 casos para facilitar la comparación desde un punto de un punto de partida común.
Si vemos la serie total, podemos ver que la tasa total (exponencial) se ha estabilizado en los últimos 25 días.
Zona Norte: En todas las series se observa una tasa sin variaciones en los últimos 25 días.
Zona Central. La Región Metropolitana ha estabilizado su tasa en los últimos 25 días, al igual que Valparaíso, Maule y Nuble. O’Higgins se observa acelerada.
Zona Sur: Biobío sigue mostrándose acelerada desde hace más de un mes. El resto de las Regiones se observa estabilizada al menos en los últimos 25 días.
Zona Austral: Aysén presenta un pequeño repunte en los últimos 5 días, en tanto Magallanes se muestra un tanto acelerado en los últimos 10 días.
Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Las únicas regiones no aceleradas respecto a la semana anterior son Araucanía, Aysén, Arica y Parinacota, Maule y Coquimbo.
Usando escala logarítmica en el eje Y, se puede apreciar que la incorporación de más de 30.000 casos de golpe genera que la tendencia diaria se calcule en cerca de 10.000 casos extra por día.
Una vez eliminada la tendencia, se puede determinar cuales son los días de la semana donde se observan más o menos casos. Debido al fuerte sesgo que generó la introducción de casos de golpe, se requiere tiempo para estabilizar el ciclo semanal.
Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.
Para la predicción total se recorta la serie a partir de lo 50 casos.
En una semana más los modelos predicen entre 283489 y 290354 casos.
| dia | casos | li | ls | |
|---|---|---|---|---|
| 99 | 110 | 245690 | 241260 | 254471 |
| 100 | 111 | 252080 | 244455 | 267248 |
| 101 | 112 | 259766 | 248125 | 283346 |
| 102 | 113 | 266767 | 251443 | 298121 |
| 103 | 114 | 274767 | 255097 | 315630 |
| 104 | 115 | 282288 | 258509 | 332210 |
| 105 | 116 | 290354 | 262117 | 350246 |
| dia | casos | li | ls | |
|---|---|---|---|---|
| 99 | 110 | 243939 | 240200 | 251728 |
| 100 | 111 | 252093 | 243935 | 269527 |
| 101 | 112 | 260788 | 247895 | 288621 |
| 102 | 113 | 269854 | 252020 | 308544 |
| 103 | 114 | 279227 | 256285 | 329144 |
| 104 | 115 | 288887 | 260680 | 350373 |
| 105 | 116 | 298826 | 265203 | 372219 |
| dia | casos | li | ls | |
|---|---|---|---|---|
| 99 | 110 | 243152 | 236808 | 249496 |
| 100 | 111 | 249647 | 240804 | 258490 |
| 101 | 112 | 256234 | 245558 | 266910 |
| 102 | 113 | 262911 | 250757 | 275065 |
| 103 | 114 | 269680 | 256281 | 283079 |
| 104 | 115 | 276539 | 262064 | 291015 |
| 105 | 116 | 283489 | 268068 | 298911 |
Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.
Ambos modelos predicen entre 303877 y 313586 casos para una semana más.
| fecha | Casos nuevo: Tendencia + AR(1) | Casos nuevo: Tendencia + AR(4) |
|---|---|---|
| 2020-06-20 | 245203 | 245765 |
| 2020-06-21 | 255034 | 253611 |
| 2020-06-22 | 265593 | 262462 |
| 2020-06-23 | 276726 | 271700 |
| 2020-06-24 | 288419 | 281934 |
| 2020-06-25 | 300694 | 292557 |
| 2020-06-26 | 313586 | 303877 |
Los ventiladores ocupados nuevamente tocan un máximo con 2703.
| fecha | total | disponibles | ocupados |
|---|---|---|---|
| 2020-06-14 | 2898 | 306 | 2592 |
| 2020-06-15 | 3017 | 391 | 2626 |
| 2020-06-16 | 3014 | 377 | 2637 |
| 2020-06-17 | 3014 | 356 | 2658 |
| 2020-06-18 | 3014 | 353 | 2661 |
| 2020-06-19 | 3014 | 322 | 2692 |
| 2020-06-20 | 3014 | 311 | 2703 |
Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1951.
| fecha | total |
|---|---|
| 2020-06-14 | 1715 |
| 2020-06-15 | 1723 |
| 2020-06-16 | 1727 |
| 2020-06-17 | 1794 |
| 2020-06-18 | 1845 |
| 2020-06-19 | 1911 |
| 2020-06-20 | 1951 |
Al analizar la serie por regiones, vemos que la ocupación principal claramente responde a la RM (96% de ocupación).
En las otras regiones, aparte de Valparaíso (87%), destaca Antofagasta (95%), Maule(88%) y Biobío (72%).
Si observamos la serie de decesos por día, podemos ver que pese a la introducción de muchos casos de golpe hace más de 10 días, la tendencia previa (exponencial) se ha mantenido estabilizada.
Si analizamos la tasa de decesos diarios, descontando el día que se reportaron 600 días por el cambio de metodología, la tasa sería cercana a los 200 casos diarios.
Considerando la existencia de un outlier muy fuerte, aplicaremos un modelo con log en el número de decesos. Podemos ver que ningún coeficiente es significativo, siendo el R² sobre el logaritmo de 0.77.
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 1.503 | 0.116 | 12.9 | 0 |
| L(chile.decesos.ts) | 0 | 0.002 | -0.189 | 0.851 |
| L(chile.casos.ts, 0:22)0 | 0 | 0 | -0.388 | 0.699 |
| L(chile.casos.ts, 0:22)1 | 0 | 0 | 0.161 | 0.873 |
| L(chile.casos.ts, 0:22)2 | 0 | 0 | 0.14 | 0.889 |
| L(chile.casos.ts, 0:22)3 | 0 | 0 | 0.047 | 0.962 |
| L(chile.casos.ts, 0:22)4 | 0 | 0 | 0.917 | 0.363 |
| L(chile.casos.ts, 0:22)5 | 0 | 0 | -0.69 | 0.493 |
| L(chile.casos.ts, 0:22)6 | 0 | 0 | 0.535 | 0.594 |
| L(chile.casos.ts, 0:22)7 | 0 | 0 | 1.594 | 0.116 |
| L(chile.casos.ts, 0:22)8 | 0 | 0 | -0.062 | 0.951 |
| L(chile.casos.ts, 0:22)9 | 0 | 0 | -0.548 | 0.586 |
| L(chile.casos.ts, 0:22)10 | 0 | 0 | -0.4 | 0.691 |
| L(chile.casos.ts, 0:22)11 | 0 | 0 | 0.303 | 0.763 |
| L(chile.casos.ts, 0:22)12 | 0 | 0 | 0.408 | 0.685 |
| L(chile.casos.ts, 0:22)13 | 0 | 0 | 0.387 | 0.7 |
| L(chile.casos.ts, 0:22)14 | 0 | 0 | -0.004 | 0.997 |
| L(chile.casos.ts, 0:22)15 | 0 | 0 | -0.763 | 0.448 |
| L(chile.casos.ts, 0:22)16 | 0.001 | 0 | 1.245 | 0.218 |
| L(chile.casos.ts, 0:22)17 | 0 | 0 | 0.428 | 0.67 |
| L(chile.casos.ts, 0:22)18 | 0 | 0 | 0.134 | 0.894 |
| L(chile.casos.ts, 0:22)19 | -0.001 | 0 | -1.043 | 0.301 |
| L(chile.casos.ts, 0:22)20 | 0 | 0.001 | -0.181 | 0.857 |
| L(chile.casos.ts, 0:22)21 | 0 | 0.001 | 0.24 | 0.811 |
| L(chile.casos.ts, 0:22)22 | 0 | 0 | -0.415 | 0.679 |
| 0.7631 |
Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford
Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6, 7 y 8 en el análisis general, como ha sido la norma durante el último mes.
Para la serie de decesos, se mantiene el exceso de cifras con 1.
Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.