Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 24 de Mayo.

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 12 casos , para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa de incremento diario prácticamente se ha mantenido constante en el último mes. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta se ve desacelerada desde hace 15 días. Tarapacá sigue acelerada, pero con una leve desaceleración. Arica y Parinacota, que se caracterizaba por una baja tasa, muestra una nueva tasas más acelerada desde hace una semana. Coquimbo mantiene una tasa estable desde hace 20 días. Atacama también muestra una tasa estable desde hace 15 días.
  • Zona Central. La Región Metropolitana parece mantener la misma tasa de crecimiento hace aproximadamente un mes. Valparaíso parece mantener una tasa estable en los últimos 20 días. Ñuble y Maule muestran aceleración durante la última semana, siendo mayor para Maule. O’Higgins en el último mes había comenzado a acelerar, pero presenta desaceleración en la última semana.
  • Zona Sur: Biobío muestra un ritmo estable de incremento de casos desde hace 2 semanas, superior al periodo previo, lo que puede implicar que en menos de una semana supere a los casos de la Araucanía. Los Ríos se muestra acelerado hace una semana. El resto de las regiones se ve relativamente estable
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa muy desacelerado en los últimos 15 días.

Con respecto a la tasa de casos totales del día vs del dia anterior, se usó el método STL para eliminar la fluctuación semanal. Se puede ver que Tarapacá, Antofagasta, Atacama, Valparaíso, O’Higgins y Magallanes muestran disminución de tasas. Coquimbo, Valparaíso y Biobío muestran tasas constantes.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Al igual que ayer, se observa que 7 regiones se muestran desaceleradas, vs 7 que están aceleradas. La serie total se encuentra un tanto acelerada.

Casos nuevos

Se puede apreciar que la tendencia general en la última semana supera los 4000 casos, en tanto que en la Región Metropolitana se encuentra entre 3000 y 4000.

Usando escala logarítmica en el eje Y, se puede apreciar con mayor claridad el ciclo de 7 días alrededor de la tendencia, y como esta no ha variado en las últimas dos semanas.

Un ejercicio interesante es observar cuales son los días de la semana donde se observan más o menos casos, al eliminar la tendencia. Desde hace un mes, los días con valores superiores son el martes, miércoles y jueves, en tanto que lunes, domingo, sábado y viernes tienden a presentar valores inferiores.

Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta (posible mitigación), Tacapacá, O’Higgins, Valparaíso.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Solo se observa Magallanes.
  • Mitigación incompleta con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Coquimbo, Biobío, Maule, Araucanía, Los Ríos y Ñuble, Arica y Parinacota, Atacama y Los Lagos.

Usando la tasa de casos nuevos diarios vs los del día anterior, se puede ver que la Metropolitana ha comenzado un ciclo de desaceleración. Valparaíso y Araucanía han comenzado a estabilizarse en 1, mientras que el resto de las regiones oscila de manera importante.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático bajo procesos estables. El día de hoy se elimina, porque no converge.

Si observamos la predicción realizada hace 5 días, podemos ver que nuevamente T+AR(4) se acerca más al resultado observado que T+AR(1). Para ambos métodos se cumple el intervalo de confianza.

  casos li ls
Observado 77961 NA NA
Casos nuevos : Tendencia + AR(1) 74797 65298 96221
Casos nuevos: Tendencia + AR(4) 77511 67229 99232

En una semana más los modelos predicen más de 100.000 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
74 85 82697 80642 86329
75 86 86848 82907 93933
76 87 91598 85144 104021
77 88 95968 87166 113466
78 89 100805 89259 124643
79 90 105402 91229 135372
80 91 110372 93287 147370
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
74 85 81959 80059 85579
75 86 86035 81945 94388
76 87 90220 83791 103880
77 88 94538 85657 113866
78 89 99004 87572 124282
79 90 103632 89550 135113
80 91 108431 91597 146363

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

El modelo cuadrático predice muchos menos casos (99140), que los modelos de tendencia AR(1) y AR(4), con 127253 y 127376 casos, respectivamente.

Table continues below
fecha Casos nuevo: Tendencia + AR(1) Casos nuevo: Tendencia + AR(4)
2020-05-26 83139 83308
2020-05-27 88970 89041
2020-05-28 95358 95377
2020-05-29 102324 102452
2020-05-30 109918 110062
2020-05-31 118204 118364
2020-06-01 127253 127376
General: Cuadrático + AR(1)
80836
83762
86737
89763
92839
95964
99140

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra una máxima en la serie, con 2041 casos. Se observa un nivel de ventiladores disponibles relativamente parejo los últimos 6 días, por efecto del aumento de ventiladores disponibles.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-20 2130 390 1740
2020-05-21 2130 332 1798
2020-05-22 2177 346 1831
2020-05-23 2250 336 1914
2020-05-24 2318 348 1970
2020-05-25 2347 322 2025
2020-05-26 2370 329 2041

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1202 casos. El crecimiento desde el 1º de Mayo es prácticamente exponencial.

Uso de camas UCI Covid-19
fecha total
2020-05-20 904
2020-05-21 943
2020-05-22 986
2020-05-23 1062
2020-05-24 1090
2020-05-25 1135
2020-05-26 1202

Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir, como ha sido la tónica desde inicios de Mayo, a la Región Metropolitana.

En las otras regiones, destaca el crecimiento de Valparaíso, que supera el máximo histórico de Araucanía, llegando a un 84% de ocupación. Antofagasta se ha estabilizado en cerca de un 80% de utilización.

Decesos

Si observamos la serie de decesos por día, desde los 4 casos (se excluye Coquimbo), se observa un incremento importante en los últimos 14 días, siendo atribuible esto al aumento de decesos en la Región Metropolitana. Preocupa en la última semana la aceleración de decesos en Valparaíso, que se acerca a la tasa de la RM.

Si analizamos la tasa de decesos diarios, podemos ver que se ha estabilizado entre 40 y 50 casos diarios en los últimos 6 días.

Modelo dinámico linear de decesos basado en casos

Simplificaremos el modelo de decesos basados en casos, utilizando directamente el número de decesos contra el de casos. En las pruebas realizadas se puede observar que es necesario incrementar hasta el log 22 para llegar a resultados más fiables. Se puede ver que la predicción se basa fundamentalmente en los días con alto número de decesos, aunque se observa falta de linealidad. Es interesante notar que el único predictor significativo (que daña el modelo si se elimina), es el número de decesos el día previo.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.261 0.657 -0.397 0.694
L(chile.decesos.ts) 0.527 0.14 3.771 0.001
L(chile.casos.ts, 0:22)0 -0.002 0.002 -0.71 0.482
L(chile.casos.ts, 0:22)1 0.007 0.003 2.525 0.016
L(chile.casos.ts, 0:22)2 -0.001 0.003 -0.49 0.627
L(chile.casos.ts, 0:22)3 -0.002 0.003 -0.563 0.577
L(chile.casos.ts, 0:22)4 0 0.003 -0.118 0.906
L(chile.casos.ts, 0:22)5 -0.003 0.003 -0.798 0.43
L(chile.casos.ts, 0:22)6 0.001 0.003 0.308 0.76
L(chile.casos.ts, 0:22)7 0 0.004 -0.032 0.975
L(chile.casos.ts, 0:22)8 0.001 0.004 0.185 0.854
L(chile.casos.ts, 0:22)9 -0.005 0.004 -1.264 0.214
L(chile.casos.ts, 0:22)10 0.008 0.004 1.866 0.07
L(chile.casos.ts, 0:22)11 -0.002 0.004 -0.397 0.694
L(chile.casos.ts, 0:22)12 0.007 0.005 1.526 0.135
L(chile.casos.ts, 0:22)13 -0.009 0.006 -1.464 0.152
L(chile.casos.ts, 0:22)14 0.008 0.006 1.38 0.176
L(chile.casos.ts, 0:22)15 0 0.006 0.051 0.959
L(chile.casos.ts, 0:22)16 0.007 0.008 0.815 0.42
L(chile.casos.ts, 0:22)17 0 0.008 0.011 0.991
L(chile.casos.ts, 0:22)18 -0.002 0.008 -0.267 0.791
L(chile.casos.ts, 0:22)19 0.004 0.007 0.532 0.598
L(chile.casos.ts, 0:22)20 -0.002 0.008 -0.272 0.787
L(chile.casos.ts, 0:22)21 -0.002 0.007 -0.306 0.761
L(chile.casos.ts, 0:22)22 -0.002 0.007 -0.263 0.794
R² Ajustado
0.9428

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general.

Para la serie de decesos, se mantiene el exceso de cifras con 1.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.