Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Representación gráfica de discursos del gobierno: https://rpubs.com/clbustos/613302

Evolución de distintos modelos explicativos: https://rpubs.com/clbustos/615858

Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 22 de Junio de 2020.

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa total (exponencial) se ha estabilizado en los últimos 25 días.

  • Zona Norte: Se puede apreciar una leve desaceleración en Tacapacá, Coquimbo, Arica y Parinacota y Atacama. Hay una leve aceleración en Antofagasta.

  • Zona Central. La Región Metropolitana ha estabilizado su tasa en los últimos 25 días, al igual que Valparaíso, Maule y Nuble. O’Higgins se observa acelerada.

  • Zona Sur: Biobío sigue mostrándose acelerada desde hace más de un mes. El resto de las Regiones se observa estabilizada al menos en los últimos 25 días.

  • Zona Austral: Aysén presenta un pequeño repunte en los últimos 5 días, en tanto Magallanes se muestra un tanto acelerado en los últimos 12 días.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Las regiones que se muestran aceleradas son Los Lagos, Maule, Biobío y Antofagasta.

Casos nuevos

Usando escala logarítmica en el eje Y, se puede apreciar que la incorporación de más de 30.000 casos de golpe genera que la tendencia diaria se calcule en cerca de 10.000 casos extra por día en la serie total, aunque los datos diarios oscilan entre 3500 y 5500 casos nuevos diarios.

Una vez eliminada la tendencia, se puede determinar cuales son los días de la semana donde se observan más o menos casos. Debido al fuerte sesgo que generó la introducción de casos de golpe, se requiere tiempo para estabilizar el ciclo semanal.

Si observamos la evolución en el resto de las regiones, podemos distinguir dos tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta, Tacapacá (posible mitigación), O’Higgins, Valparaíso (posible mitigación).
  • Mitigación incompleta con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Coquimbo, Biobío, Maule, Araucanía, Los Ríos y Ñuble, Arica y Parinacota, Atacama y Los Lagos, Magallanes.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático bajo procesos estables.

Si observamos la predicción realizada hace 3 días, podemos ver que el modelo cuadrático es el que más se acerca. En todos los casos, el intervalo de confianza se satisface.

  casos li ls
Observado 250767 NA NA
Casos nuevos: Tendencia + AR(4) 259766 248125 283346
Casos nuevos : Tendencia + AR(1) 260788 247895 288621
General: Cuadrático + AR(2) 256234 245558 266910

En una semana más los modelos predicen entre 285224 y 303284 casos.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
102 113 255598 253208 260324
103 114 260245 255525 269646
104 115 265118 257819 279997
105 116 269976 260063 290520
106 117 275011 262317 301766
107 118 280073 264552 313228
108 119 285224 266794 325067
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
102 113 256462 253496 262652
103 114 263287 256570 277807
104 115 270736 259890 294520
105 116 278550 263366 312084
106 117 286610 266951 330207
107 118 294863 270621 348764
108 119 303284 274366 367700
General: Modelo cuadrático : total
  dia casos li ls
102 113 257220 250939 263502
103 114 263763 255024 272502
104 115 270395 259863 280926
105 116 277115 265148 289082
106 117 283924 270754 297094
107 118 290822 276619 305025
108 119 297808 282702 312913

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

Ambos modelos predicen entre 299528 y 316763 casos para una semana más.

fecha Casos nuevo: Tendencia + AR(1) Casos nuevo: Tendencia + AR(4)
2020-06-23 257525 256542
2020-06-24 265880 262519
2020-06-25 275070 268867
2020-06-26 284808 275780
2020-06-27 295007 283246
2020-06-28 305654 291152
2020-06-29 316763 299528

Ventiladores y Casos en UCI

Los ventiladores ocupados nuevamente tocan un máximo con 2765.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-06-17 3014 356 2658
2020-06-18 3014 353 2661
2020-06-19 3014 322 2692
2020-06-20 3014 311 2703
2020-06-21 3018 302 2716
2020-06-22 3018 284 2734
2020-06-23 3022 257 2765

Si analizamos la serie total de pacientes en UCI para Covid-19, se observan 2009, 5 casos menos que ayer correspondiente al máximo de la serie.

Uso de camas UCI Covid-19
fecha total
2020-06-17 1794
2020-06-18 1845
2020-06-19 1911
2020-06-20 1951
2020-06-21 1996
2020-06-22 2014
2020-06-23 2009

Al analizar la serie por regiones, vemos que la ocupación principal claramente responde a la RM (95% de ocupación).

En las otras regiones, aparte de Valparaíso (82%), destaca Antofagasta (93%), Maule(88%) y Biobío (78%).

Decesos

Si observamos la serie de decesos por día, a partir de los 5 casos, podemos ver que pese a la introducción de muchos casos de golpe hace más de 10 días, la tendencia previa (exponencial) se ha mantenido estable.

Si analizamos la tasa de decesos diarios, descontando el día que se reportaron 600 días por el cambio de metodología, la tasa sería cercana a los 170 casos diarios. Se aprecia claramente el patrón semanal, con bajos reportes para los días lunes y martes.

Modelo dinámico linear de decesos basado en casos

Considerando la existencia de un outlier muy fuerte, aplicaremos un modelo con log en el número de decesos. Podemos ver que ningún coeficiente es significativo, siendo el R² sobre el logaritmo de 0.77.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.536 0.113 13.63 0
L(chile.decesos.ts) -0.001 0.002 -0.548 0.585
L(chile.casos.ts, 0:22)0 0 0 -0.226 0.822
L(chile.casos.ts, 0:22)1 0 0 0.584 0.561
L(chile.casos.ts, 0:22)2 0 0 0.327 0.745
L(chile.casos.ts, 0:22)3 0 0 -0.106 0.916
L(chile.casos.ts, 0:22)4 0 0 0.158 0.875
L(chile.casos.ts, 0:22)5 0 0 -1.026 0.308
L(chile.casos.ts, 0:22)6 0 0 -3.332 0.001
L(chile.casos.ts, 0:22)7 0.001 0 2.241 0.028
L(chile.casos.ts, 0:22)8 0 0 0.146 0.885
L(chile.casos.ts, 0:22)9 0 0 -0.395 0.694
L(chile.casos.ts, 0:22)10 0 0 -0.305 0.761
L(chile.casos.ts, 0:22)11 0 0 0.426 0.672
L(chile.casos.ts, 0:22)12 0 0 0.653 0.516
L(chile.casos.ts, 0:22)13 0 0 0.914 0.364
L(chile.casos.ts, 0:22)14 0 0 -0.379 0.706
L(chile.casos.ts, 0:22)15 0 0 -0.844 0.402
L(chile.casos.ts, 0:22)16 0.001 0 1.257 0.213
L(chile.casos.ts, 0:22)17 0 0 0.878 0.383
L(chile.casos.ts, 0:22)18 0 0 -0.234 0.815
L(chile.casos.ts, 0:22)19 0 0 -0.859 0.393
L(chile.casos.ts, 0:22)20 0 0 -0.694 0.49
L(chile.casos.ts, 0:22)21 0 0.001 0.677 0.501
L(chile.casos.ts, 0:22)22 0 0 -0.702 0.485
R² Ajustado
0.7666

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6, 7 y 8 en el análisis general, como ha sido la norma durante el último mes. Destaca en la distribución de sumas el exceso de 3, así como el déficit desde 6 a 9.

Para la serie de decesos, se mantiene el exceso de cifras con 1.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.