Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile
Representación gráfica de discursos del gobierno: https://rpubs.com/clbustos/613302
Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 11 de Junio de 2020.
Nota técnica: Los últimos días han sido caóticos en términos de cambios en los criterios. Si revisan los gráficos de la evolución de los modelos de predicción, podrán hacerse una idea del impacto en las capacidad explicativa de los modelos simples que hemos realizado hasta el momento.
La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde hay 22 casos , para facilitar la comparación desde un punto de un punto de partida común.
Si vemos la serie total, podemos ver una lenta tendencia a la desaceleración en los últimos 20 días. Por regiones, se puede apreciar que:
Zona Norte: Antofagasta presenta una tendencia levemente acelerada desde hace 20 días. Tarapacá comienza a mostrar un ritmo desacelerado en los últimos 10 días. Arica y Parinacota, muestra un progresivo proceso de aceleración, desde hace aproximadamente 15 días. Atacama presenta una aceleración importante desde hace 10 días. Coquimbo mantiene una tasa constante bastante acelerada desde hace 10 días.
Zona Central. La Región Metropolitana muestra una típica curva de desaceleración desde hace 20 días. Valparaíso mantiene una tasa prácticamente constante desde hace 35 días. Ñuble mantiene una tasa un poco más acelerada, pero constante, en los últimos 20 días. Maule muestra una tasa constante hace 20 días. O’Higgins ya se muestra más acelerada que Maule desde hace unos 3 días.
Zona Sur: Biobío mantiene su tasa acelerada desde hace 25 días, superando a la Araucanía en el número de casos. Araucanía presenta una leve aceleración en estos últimos 20 días, al igual que Los Lagos. Los Ríos también se muestra acelerada en los últimos 20 días.
Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa muy desacelerado en los últimos 20 días.
Con respecto a la tasa de casos totales del día vs del dia anterior, se usó el método STL para eliminar la fluctuación semanal. Se puede claramente el descenso en Tarapacá, la Región Metropolitana, Magallanes y la serie total. Relativamente estables se muestran Arica y Parinacota, Antofagasta, Valparaíso, Maule, Ñuble, Biobío, La Araucanía, Los Ríos y Los Lagos.
Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Se observa que están aceleradas respecto a la semana anterior Coquimbo, O’Higgins, Atacama, Antofagasta, Los Ríos, Ñuble, Araucanía y Magallans. Todo el resto presentan leves desaceleraciones.
Se puede apreciar que en los últimos 20 días hay una tendencia a la desaceleración de nuevos casos, pero la tendencia de los últimos 5 días implica una nueva alza.
Usando escala logarítmica en el eje Y, se puede apreciar la ruptura de los últimos 5 días del patrón de estabilización de los casos nuevos para la serie de la Región Metropolitana y total.
Una vez eliminada la tendencia, se puede determinar cuales son los días de la semana donde se observan más o menos casos. Resalta que el lunes desde hace un mes presenta mucho menos caso que el resto de los días de la semana.
Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.
Usando la tasa de casos nuevos diarios vs los del día anterior, se pueden ver procesos de estabilización de tasa en Valparaíso, Metropolitana, Biobío, Maule, Tarapacá, Antofagasta y total.
Para la predicción total se recorta la serie a partir de lo 50 casos.
Si observamos la predicción realizada hace 1 día, podemos ver que hoy T+AR(1) se acerca más al valor esperado que T+AR(4). Para ambos métodos se cumple el intervalo de confianza, pero no para el modelo cuadrático.
| casos | li | ls | |
|---|---|---|---|
| Observado | 160846 | NA | NA |
| General: Cuadrático + AR(2) | 159986 | 157319 | 164858 |
| Casos nuevos : Tendencia + AR(1) | 160174 | 157615 | 164589 |
| Casos nuevos: Tendencia + AR(4) | 158705 | 157107 | 160304 |
En una semana más los modelos predicen entre 195735 y 211680 casos.
## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.
| dia | casos | li | ls | |
|---|---|---|---|---|
| 91 | 102 | 166877 | 164350 | 171225 |
| 92 | 103 | 173555 | 168115 | 183069 |
| 93 | 104 | 179854 | 171303 | 195519 |
| 94 | 105 | 186624 | 174679 | 209092 |
| 95 | 106 | 193193 | 177800 | 222919 |
| 96 | 107 | 200096 | 181047 | 237596 |
| 97 | 108 | 206908 | 184173 | 252438 |
| dia | casos | li | ls | |
|---|---|---|---|---|
| 91 | 102 | 167649 | 164581 | 173237 |
| 92 | 103 | 174560 | 167982 | 187281 |
| 93 | 104 | 181615 | 171320 | 202191 |
| 94 | 105 | 188840 | 174688 | 217693 |
| 95 | 106 | 196252 | 178122 | 233689 |
| 96 | 107 | 203862 | 181640 | 250152 |
| 97 | 108 | 211680 | 185250 | 267080 |
| dia | casos | li | ls | |
|---|---|---|---|---|
| 91 | 102 | 165631 | 163984 | 167279 |
| 92 | 103 | 170483 | 168153 | 172813 |
| 93 | 104 | 175401 | 172547 | 178255 |
| 94 | 105 | 180385 | 177090 | 183680 |
| 95 | 106 | 185435 | 181751 | 189119 |
| 96 | 107 | 190552 | 186516 | 194588 |
| 97 | 108 | 195735 | 191376 | 200094 |
Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.
Ambos modelos predicen entre 223302 y 229169 casos para una semana más.
| fecha | Casos nuevo: Tendencia + AR(1) | Casos nuevo: Tendencia + AR(4) |
|---|---|---|
| 2020-06-12 | 168684 | 167956 |
| 2020-06-13 | 177266 | 175730 |
| 2020-06-14 | 186457 | 184075 |
| 2020-06-15 | 196225 | 192978 |
| 2020-06-16 | 206578 | 202478 |
| 2020-06-17 | 217546 | 212580 |
| 2020-06-18 | 229169 | 223302 |
El total de ventiladores ocupados por primera vez desciende en los últimos 3 días. Sin embargo, esa disminución se acompaña también de los totales.
| fecha | total | disponibles | ocupados |
|---|---|---|---|
| 2020-06-06 | 2774 | 312 | 2462 |
| 2020-06-07 | 2823 | 328 | 2495 |
| 2020-06-08 | 2855 | 321 | 2534 |
| 2020-06-09 | 2906 | 313 | 2593 |
| 2020-06-10 | 2873 | 311 | 2562 |
| 2020-06-11 | 2876 | 331 | 2545 |
| 2020-06-12 | 2863 | 310 | 2553 |
Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1647.
| fecha | total |
|---|---|
| 2020-06-06 | 1524 |
| 2020-06-07 | 1558 |
| 2020-06-08 | 1581 |
| 2020-06-09 | 1577 |
| 2020-06-10 | 1590 |
| 2020-06-11 | 1618 |
| 2020-06-12 | 1647 |
Al analizar la serie por regiones, vemos que el decrecimiento en camas se puede atribuir a la saturación de la RM, que está a un 96% de capacidad. El crecimiento se explica ahora por Valparaíso, principalmente, que sigue a 86% de capacidad.
En las otras regiones, aparte de Valparaíso, destaca Antofagasta (93%) y Biobío (75%).
Recordemos que durante la última semana se han producido cambios fuertes en el reporte de decesos.
Si observamos la serie de decesos por día, podemos ver que el cambio en la metodología llevo a disminuir el número de fallecidos en la Región Metropolitana, y disminuir en el resto de las regiones.
Si analizamos la tasa de decesos diarios, descontando el día que se reportaron 600 días por el cambio de metodología, la tasa parece estabilizarse en cerca de 200 decesos diarios.
Considerando la existencia de un outlier muy fuerte, aplicaremos un modelo con log en el número de decesos. Podemos ver que ningún coeficiente es significativo, siendo el R² sobre el logaritmo de 0.77.
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 1.334 | 0.111 | 12.06 | 0 |
| L(chile.decesos.ts) | -0.002 | 0.003 | -0.867 | 0.39 |
| L(chile.casos.ts, 0:22)0 | 0 | 0 | 1.997 | 0.051 |
| L(chile.casos.ts, 0:22)1 | 0 | 0 | 0.983 | 0.33 |
| L(chile.casos.ts, 0:22)2 | 0 | 0 | 0.371 | 0.712 |
| L(chile.casos.ts, 0:22)3 | 0 | 0 | -0.35 | 0.728 |
| L(chile.casos.ts, 0:22)4 | 0 | 0 | 0.562 | 0.576 |
| L(chile.casos.ts, 0:22)5 | 0 | 0 | -1.091 | 0.28 |
| L(chile.casos.ts, 0:22)6 | 0 | 0 | -0.3 | 0.765 |
| L(chile.casos.ts, 0:22)7 | 0 | 0 | 0.029 | 0.977 |
| L(chile.casos.ts, 0:22)8 | 0 | 0 | -0.448 | 0.656 |
| L(chile.casos.ts, 0:22)9 | 0 | 0 | 0.189 | 0.851 |
| L(chile.casos.ts, 0:22)10 | 0 | 0 | -0.491 | 0.626 |
| L(chile.casos.ts, 0:22)11 | 0 | 0.001 | 0.483 | 0.631 |
| L(chile.casos.ts, 0:22)12 | 0 | 0.001 | -0.239 | 0.812 |
| L(chile.casos.ts, 0:22)13 | 0 | 0.001 | 0.667 | 0.508 |
| L(chile.casos.ts, 0:22)14 | 0 | 0.001 | 0.442 | 0.66 |
| L(chile.casos.ts, 0:22)15 | 0 | 0.001 | -0.461 | 0.647 |
| L(chile.casos.ts, 0:22)16 | 0 | 0.001 | 0.816 | 0.418 |
| L(chile.casos.ts, 0:22)17 | 0 | 0.001 | 0.447 | 0.656 |
| L(chile.casos.ts, 0:22)18 | 0 | 0.001 | 0.186 | 0.854 |
| L(chile.casos.ts, 0:22)19 | -0.001 | 0.001 | -0.807 | 0.423 |
| L(chile.casos.ts, 0:22)20 | 0 | 0.001 | 0.514 | 0.609 |
| L(chile.casos.ts, 0:22)21 | 0 | 0.001 | -0.623 | 0.536 |
| L(chile.casos.ts, 0:22)22 | 0 | 0.001 | 0.166 | 0.869 |
| 0.7735 |
Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford
Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6, 7 y 8 en el análisis general, como ha sido la norma durante el último mes.
Para la serie de decesos, se mantiene el exceso de cifras con 1.
Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.