Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Representación gráfica de discursos del gobierno: https://rpubs.com/clbustos/613302

Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 3 de Junio de 2020.

Nota técnica: Los últimos días han sido caóticos en términos de cambios en los criterios. Si revisan los gráficos de la evolución de los modelos de predicción, podrán hacerse una idea del impacto en las capacidad explicativa de los modelos simples que hemos realizado hasta el momento.

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde hay 22 casos , para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver una lenta tendencia a la desaceleración en los últimos 20 días. Por regiones, se puede apreciar que:

  • Zona Norte: Antofagasta presenta una tendencia a la aceleración en los últimos 4 días. Tarapacá comienza a mostrar un ritmo desacelerado en los últimos 10 días. Arica y Parinacota, muestra un progresivo proceso de aceleración, desde hace aproximadamente 15 días. Atacama presenta una aceleración importante desde hace 10 días. Coquimbo mantiene una tasa constante bastante acelerada desde hace 10 días.
  • Zona Central. La Región Metropolitana muestra una típica curva de desaceleración desde hace 20 días. Valparaíso mantiene una tasa prácticamente constante desde hace 35 días. Ñuble mantiene una tasa un poco más acelerada, pero constante, en los últimos 20 días. Maule muestra una tasa constante hace 20 días. O’Higgins prácticamente presenta la misma evolución del Maule, con un retraso de 10 días.
  • Zona Sur: Biobío mantiene su tasa acelerada desde hace 25 días, superando a la Araucanía en el número de casos. Araucanía presenta una leve aceleración en estos últimos 20 días, al igual que Los Lagos. Los Ríos también se muestra acelerada en los últimos 20 días.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa muy desacelerado en los últimos 20 días.

Con respecto a la tasa de casos totales del día vs del dia anterior, se usó el método STL para eliminar la fluctuación semanal. Se puede claramente el descenso en Tarapacá, la Región Metropolitana, Magallanes y la serie total. Relativamente estables se muestran Arica y Parinacota, Antofagasta, Valparaíso, Maule, Ñuble, Biobío, La Araucanía, Los Ríos y Los Lagos.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Se observa que están aceleradas respecto a la semana anterior Ñuble, Araucanía, Los Ríos, Antofagasta, Atacama, O’Higgins y Coquimbo. Todo el resto presentan leves desaceleraciones.

Casos nuevos

Se puede apreciar que en los últimos 20 días hay una tendencia a la desaceleración de nuevos casos, tanto en la serie total como en la Metropolitana. Es importante reconocer que la fluctuación por día es muy relevante.

Usando escala logarítmica en el eje Y, se puede apreciar con mayor claridad la estabilización en la tasa de casos nuevos. Se puede observar que esta desaceleración ha sido estable en la Región Metropolitana durante estos 20 días, siendo la más larga de todo el periodo.

Una vez eliminada la tendencia, se puede determinar cuales son los días de la semana donde se observan más o menos casos. Se observa un fuerte cambio en el último mes, siendo el día miércoles el que actualmente representa la tendencia.

Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta, Tacapacá (posible mitigación), O’Higgins, Valparaíso.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Solo se observa Magallanes.
  • Mitigación incompleta con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Coquimbo, Biobío, Maule, Araucanía, Los Ríos y Ñuble, Arica y Parinacota, Atacama y Los Lagos.

Usando la tasa de casos nuevos diarios vs los del día anterior, se pueden ver procesos de estabilización de tasa en Valparaíso, Metropolitana, Biobío, Maule, Tarapacá, Antofagasta y total.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático bajo procesos estables. El día de hoy se elimina, porque no converge.

En una semana más los modelos predicen entre 196992 y 200254 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
90 101 160174 157615 164589
91 102 165937 160856 174840
92 103 172069 163952 186982
93 104 178072 166939 199050
94 105 184345 169911 212290
95 106 190569 172828 225567
96 107 196992 175765 239616
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
90 101 159986 157319 164858
91 102 166142 160334 177425
92 103 172535 163343 191013
93 104 179151 166407 205295
94 105 185980 169551 220127
95 106 193015 172782 235447
96 107 200254 176103 251226

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

Ambos modelos predicen entre 211000 y 218000 casos para una semana más.

fecha Casos nuevo: Tendencia + AR(1) Casos nuevo: Tendencia + AR(4)
2020-06-11 161134 160476
2020-06-12 169132 167461
2020-06-13 177822 175040
2020-06-14 187112 183201
2020-06-15 196985 191950
2020-06-16 207456 201295
2020-06-17 218560 211237

Ventiladores y Casos en UCI

El total de ventiladores ocupados por primera vez desciende en los últimos 2 días. Sin embargo, la disminución también del número de ventiladores totales hace dudar del motivo de esta baja.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-06-05 2767 327 2440
2020-06-06 2774 312 2462
2020-06-07 2823 328 2495
2020-06-08 2855 321 2534
2020-06-09 2906 313 2593
2020-06-10 2873 311 2562
2020-06-11 2876 331 2545

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1618.

Uso de camas UCI Covid-19
fecha total
2020-06-05 1521
2020-06-06 1524
2020-06-07 1558
2020-06-08 1581
2020-06-09 1577
2020-06-10 1590
2020-06-11 1618

Al analizar la serie por regiones, vemos que el decrecimiento en camas se puede atribuir a la saturación de la RM, que está a un 95% de capacidad. El crecimiento se explica ahora por Valparaíso, principalmente, que sigue a 86% de capacidad.

En las otras regiones, aparte de Valparaíso, destaca Antofagasta y Biobío.

Decesos

Recordemos que durante la última semana se han producido cambios fuertes en el reporte de decesos.

Si observamos la serie de decesos por día, podemos ver que el cambio en la metodología llevo a disminuir el número de fallecidos en la Región Metropolitana, y disminuir en el resto de las regiones.

Si analizamos la tasa de decesos diarios, descontando el día que se reportaron 600 días por el cambio de metodología, la tasa parece estabilizarse en cerca de 200 decesos diarios.

Modelo dinámico linear de decesos basado en casos

Considerando la existencia de un outlier muy fuerte, aplicaremos un modelo con log en el número de decesos. Podemos ver que ningún coeficiente es significativo, siendo el R² sobre el logaritmo de 0.7648.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.348 0.111 12.15 0
L(chile.decesos.ts) -0.003 0.003 -0.988 0.327
L(chile.casos.ts, 0:22)0 0 0 1.406 0.165
L(chile.casos.ts, 0:22)1 0 0 1.291 0.202
L(chile.casos.ts, 0:22)2 0 0 0.093 0.927
L(chile.casos.ts, 0:22)3 0 0 0.255 0.8
L(chile.casos.ts, 0:22)4 0 0 0.42 0.676
L(chile.casos.ts, 0:22)5 -0.001 0 -1.339 0.186
L(chile.casos.ts, 0:22)6 0 0.001 -0.023 0.982
L(chile.casos.ts, 0:22)7 0 0 0.005 0.996
L(chile.casos.ts, 0:22)8 0 0 -0.539 0.592
L(chile.casos.ts, 0:22)9 0 0 -0.161 0.873
L(chile.casos.ts, 0:22)10 0 0.001 -0.057 0.954
L(chile.casos.ts, 0:22)11 0 0.001 0.344 0.732
L(chile.casos.ts, 0:22)12 0 0.001 -0.115 0.909
L(chile.casos.ts, 0:22)13 0 0.001 0.427 0.671
L(chile.casos.ts, 0:22)14 0 0.001 0.618 0.539
L(chile.casos.ts, 0:22)15 0 0.001 -0.331 0.742
L(chile.casos.ts, 0:22)16 0 0.001 0.849 0.4
L(chile.casos.ts, 0:22)17 0.001 0.001 0.898 0.373
L(chile.casos.ts, 0:22)18 0 0.001 -0.479 0.634
L(chile.casos.ts, 0:22)19 0 0.001 -0.381 0.705
L(chile.casos.ts, 0:22)20 0.001 0.001 0.655 0.516
L(chile.casos.ts, 0:22)21 -0.001 0.001 -0.895 0.375
L(chile.casos.ts, 0:22)22 0 0.001 -0.179 0.858
R² Ajustado
0.7648

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6, 7 y 8 en el análisis general, como ha sido la norma durante el último mes.

Para la serie de decesos, se mantiene el exceso de cifras con 1.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.