Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Representación gráfica de discursos del gobierno: https://rpubs.com/clbustos/613302

Evolución de distintos modelos explicativos: https://rpubs.com/clbustos/615858

Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 19 de Junio de 2020.

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa total (exponencial) se ha estabilizado en los últimos 25 días.

  • Zona Norte: En todas las series se observa una tasa sin variaciones en los últimos 25 días.

  • Zona Central. La Región Metropolitana ha estabilizado su tasa en los últimos 25 días, al igual que Valparaíso, Maule y Nuble. O’Higgins se observa acelerada.

  • Zona Sur: Biobío sigue mostrándose acelerada desde hace más de un mes. El resto de las Regiones se observa estabilizada al menos en los últimos 25 días.

  • Zona Austral: Aysén presenta un pequeño repunte en los últimos 5 días, en tanto Magallanes se muestra un tanto acelerado en los últimos 10 días.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Las únicas regiones no aceleradas respecto a la semana anterior son Araucanía, Aysén, Arica y Parinacota, Maule y Coquimbo.

Casos nuevos

Usando escala logarítmica en el eje Y, se puede apreciar que la incorporación de más de 30.000 casos de golpe genera que la tendencia diaria se calcule en cerca de 10.000 casos extra por día.

Una vez eliminada la tendencia, se puede determinar cuales son los días de la semana donde se observan más o menos casos. Debido al fuerte sesgo que generó la introducción de casos de golpe, se requiere tiempo para estabilizar el ciclo semanal.

Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta, Tacapacá (posible mitigación), O’Higgins, Valparaíso (posible mitigación).
  • Mitigación incompleta con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Coquimbo, Biobío, Maule, Araucanía, Los Ríos y Ñuble, Arica y Parinacota, Atacama y Los Lagos, Magallanes.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático bajo procesos estables. El día de hoy se elimina, porque no converge.

En una semana más los modelos predicen entre 283489 y 290354 casos.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
99 110 245690 241260 254471
100 111 252080 244455 267248
101 112 259766 248125 283346
102 113 266767 251443 298121
103 114 274767 255097 315630
104 115 282288 258509 332210
105 116 290354 262117 350246
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
99 110 243939 240200 251728
100 111 252093 243935 269527
101 112 260788 247895 288621
102 113 269854 252020 308544
103 114 279227 256285 329144
104 115 288887 260680 350373
105 116 298826 265203 372219
General: Modelo cuadrático : total
  dia casos li ls
99 110 243152 236808 249496
100 111 249647 240804 258490
101 112 256234 245558 266910
102 113 262911 250757 275065
103 114 269680 256281 283079
104 115 276539 262064 291015
105 116 283489 268068 298911

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

Ambos modelos predicen entre 303877 y 313586 casos para una semana más.

fecha Casos nuevo: Tendencia + AR(1) Casos nuevo: Tendencia + AR(4)
2020-06-20 245203 245765
2020-06-21 255034 253611
2020-06-22 265593 262462
2020-06-23 276726 271700
2020-06-24 288419 281934
2020-06-25 300694 292557
2020-06-26 313586 303877

Ventiladores y Casos en UCI

Los ventiladores ocupados nuevamente tocan un máximo con 2703.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-06-14 2898 306 2592
2020-06-15 3017 391 2626
2020-06-16 3014 377 2637
2020-06-17 3014 356 2658
2020-06-18 3014 353 2661
2020-06-19 3014 322 2692
2020-06-20 3014 311 2703

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1951.

Uso de camas UCI Covid-19
fecha total
2020-06-14 1715
2020-06-15 1723
2020-06-16 1727
2020-06-17 1794
2020-06-18 1845
2020-06-19 1911
2020-06-20 1951

Al analizar la serie por regiones, vemos que la ocupación principal claramente responde a la RM (96% de ocupación).

En las otras regiones, aparte de Valparaíso (87%), destaca Antofagasta (95%), Maule(88%) y Biobío (72%).

Decesos

Si observamos la serie de decesos por día, podemos ver que pese a la introducción de muchos casos de golpe hace más de 10 días, la tendencia previa (exponencial) se ha mantenido estabilizada.

Si analizamos la tasa de decesos diarios, descontando el día que se reportaron 600 días por el cambio de metodología, la tasa sería cercana a los 200 casos diarios.

Modelo dinámico linear de decesos basado en casos

Considerando la existencia de un outlier muy fuerte, aplicaremos un modelo con log en el número de decesos. Podemos ver que ningún coeficiente es significativo, siendo el R² sobre el logaritmo de 0.77.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.503 0.116 12.9 0
L(chile.decesos.ts) 0 0.002 -0.189 0.851
L(chile.casos.ts, 0:22)0 0 0 -0.388 0.699
L(chile.casos.ts, 0:22)1 0 0 0.161 0.873
L(chile.casos.ts, 0:22)2 0 0 0.14 0.889
L(chile.casos.ts, 0:22)3 0 0 0.047 0.962
L(chile.casos.ts, 0:22)4 0 0 0.917 0.363
L(chile.casos.ts, 0:22)5 0 0 -0.69 0.493
L(chile.casos.ts, 0:22)6 0 0 0.535 0.594
L(chile.casos.ts, 0:22)7 0 0 1.594 0.116
L(chile.casos.ts, 0:22)8 0 0 -0.062 0.951
L(chile.casos.ts, 0:22)9 0 0 -0.548 0.586
L(chile.casos.ts, 0:22)10 0 0 -0.4 0.691
L(chile.casos.ts, 0:22)11 0 0 0.303 0.763
L(chile.casos.ts, 0:22)12 0 0 0.408 0.685
L(chile.casos.ts, 0:22)13 0 0 0.387 0.7
L(chile.casos.ts, 0:22)14 0 0 -0.004 0.997
L(chile.casos.ts, 0:22)15 0 0 -0.763 0.448
L(chile.casos.ts, 0:22)16 0.001 0 1.245 0.218
L(chile.casos.ts, 0:22)17 0 0 0.428 0.67
L(chile.casos.ts, 0:22)18 0 0 0.134 0.894
L(chile.casos.ts, 0:22)19 -0.001 0 -1.043 0.301
L(chile.casos.ts, 0:22)20 0 0.001 -0.181 0.857
L(chile.casos.ts, 0:22)21 0 0.001 0.24 0.811
L(chile.casos.ts, 0:22)22 0 0 -0.415 0.679
R² Ajustado
0.7631

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6, 7 y 8 en el análisis general, como ha sido la norma durante el último mes.

Para la serie de decesos, se mantiene el exceso de cifras con 1.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.