Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 30 de Mayo.

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 17 casos , para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa de incremento diario prácticamente se ha mantenido constante en los últimos 30 días. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta se ve desacelerada desde hace 15 días. Tarapacá presenta desde hace 15 días un ritmo relativamente constante. Arica y Parinacota, que se caracterizaba por una baja tasa, muestra desde hace más de 15 días una nueva tasa, constante, más acelerada. Coquimbo muestra un proceso de aceleración en los últimos 20 días. Atacama mantiene un ritmo constante, relativamente bajo, desde hace 20 días.
  • Zona Central. La Región Metropolitana parece mantener la misma tasa de crecimiento hace aproximadamente un mes. Valparaíso parece mantener una tasa estable en los últimos 30 días. Ñuble mantiene una tasa un poco más acelerada, pero constante, en los últimos 15 días. Maule ha comenzado ha acelerar en los últimos 20 días. O’Higgins, finalmente, mantiene un ritmo establece desde hace 10 días.
  • Zona Sur: Biobío comienza a mostrarse acelerada desde hace 20 días, en tanto que los Ríos desde hace 10. Araucanía y los Lagos, si bien presentan tasas mayores que hace 10 días, se muestra un poco más estable.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa muy desacelerado en los últimos 15 días.

Con respecto a la tasa de casos totales del día vs del dia anterior, se usó el método STL para eliminar la fluctuación semanal. Se puede ver tasas estabilizadas en Arica y Parinacota, Atacama, Ñuble, Araucanía y Los Lagos. Se muestran en crecimiento Coquimbo, Biobío y Aysén (por unos pocos casos). Con tasas es descenso vemos a Tarapacá, Antofagasta, Atacama, Valparaíso, Metropolitana, O’Higgins, Maule, Los Ríos y la tasa total.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior.Hoy, aparecen como aceleradas Biobío, Aysén y Coquimbo, en tanto que el resto se muestran desaceleradas.

Casos nuevos

Se puede apreciar que en la última 10 días hay una tendencia a la desaceleración de nuevos casos, tanto en la serie total como en la Metropolitana.

Usando escala logarítmica en el eje Y, se puede apreciar con mayor claridad la estabilización en la tasa de casos nuevos. Es de esperar que no se repita el ciclo mayor, que muestra aceleraciones y desaceleraciones cada 10 días.

Se puede observar cuales son los días de la semana donde se observan más o menos casos, al eliminar la tendencia. Parece que los días que mejor reflejan la tendencia son domingo y lunes.

Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta (posible mitigación), Tacapacá, O’Higgins, Valparaíso.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Solo se observa Magallanes.
  • Mitigación incompleta con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Coquimbo, Biobío, Maule, Araucanía, Los Ríos y Ñuble, Arica y Parinacota, Atacama y Los Lagos.

Usando la tasa de casos nuevos diarios vs los del día anterior, se pueden ver procesos de estabilización de tasa en Valparaíso, Metropolitana, Biobío y Tarapacá. Con tasas descendentes tenemos a Ñuble, Araucanía y Maule.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático bajo procesos estables. El día de hoy se elimina, porque no converge.

Si observamos la predicción realizada hace 6 días, podemos ver que hoy T+AR(1) se acerca más al valor esperado que T+AR(4). De todos modos, en ambos casos se mantiene el intervalo de confianza.

  casos li ls
Observado 99688 NA NA
Casos nuevos : Tendencia + AR(1) 101544 86382 135608
Casos nuevos: Tendencia + AR(4) 102770 87817 134593

En una semana más los modelos predicen entre 106492 y 107754 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
79 90 104454 102424 107991
80 91 109474 105208 117043
81 92 114446 107608 127340
82 93 119625 110063 138267
83 94 124812 112377 149899
84 95 130181 114745 162070
85 96 135595 117063 174717
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
79 90 104611 102323 108889
80 91 109667 104721 119545
81 92 114881 107084 131048
82 93 120274 109485 143168
83 94 125863 111953 155822
84 95 131660 114504 168989
85 96 137674 117149 182671

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

Ambos modelos predicen cerca de 157000 casos para una semana más.

fecha Casos nuevo: Tendencia + AR(1) Casos nuevo: Tendencia + AR(4)
2020-05-31 105884 105612
2020-06-01 112858 112470
2020-06-02 120468 120063
2020-06-03 128709 128301
2020-06-04 137623 137181
2020-06-05 147264 146729
2020-06-06 157700 157005

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra una máxima en la serie, con 2263 casos, llevando el número de disponibles a 313.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-25 2347 322 2025
2020-05-26 2370 329 2041
2020-05-27 2417 331 2086
2020-05-28 2479 346 2133
2020-05-29 2518 345 2173
2020-05-30 2544 345 2173
2020-05-31 2576 313 2263

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1383. Desde el 28 de Mayo se observa una disminución del ritmo de crecimiento del número de pacientes.

Uso de camas UCI Covid-19
fecha total
2020-05-25 1135
2020-05-26 1202
2020-05-27 1251
2020-05-28 1289
2020-05-29 1350
2020-05-30 1371
2020-05-31 1383

Al analizar la serie por regiones, vemos que el decrecimiento en camas se puede atribuir a la saturación de la RM, que está a un 97% de capacidad. El crecimiento se explica ahora por Valparaíso, principalmente, que está a 84% de capacidad.

En las otras regiones, aparte de Valparaíso, destaca Antofagasta, Maule y Biobío.

Decesos

Si observamos la serie de decesos por día, desde los 4 casos (se excluye Coquimbo), ya se observa un proceso de desaceleración respecto del incremento brusco observado hace 20 días.

Si analizamos la tasa de decesos diarios, vemos que la tendencia se acerca a los 50 decesos diarios.

Modelo dinámico linear de decesos basado en casos

Simplificaremos el modelo de decesos basados en casos, utilizando directamente el número de decesos contra el de casos. En las pruebas realizadas se puede observar que es necesario incrementar hasta el log 22 para llegar a resultados más fiables. Como coeficientes significativos tenemos el número de decesos del día anterior y el lag 11.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.118 0.611 -0.193 0.848
L(chile.decesos.ts) 0.426 0.141 3.021 0.004
L(chile.casos.ts, 0:22)0 0.001 0.002 0.328 0.744
L(chile.casos.ts, 0:22)1 0.004 0.003 1.438 0.158
L(chile.casos.ts, 0:22)2 0.002 0.003 0.713 0.48
L(chile.casos.ts, 0:22)3 -0.002 0.003 -0.767 0.448
L(chile.casos.ts, 0:22)4 -0.001 0.003 -0.271 0.788
L(chile.casos.ts, 0:22)5 -0.002 0.003 -0.585 0.561
L(chile.casos.ts, 0:22)6 0 0.003 -0.095 0.925
L(chile.casos.ts, 0:22)7 0.001 0.003 0.343 0.734
L(chile.casos.ts, 0:22)8 -0.004 0.003 -1.111 0.273
L(chile.casos.ts, 0:22)9 0 0.004 0.114 0.91
L(chile.casos.ts, 0:22)10 0 0.003 -0.117 0.908
L(chile.casos.ts, 0:22)11 0.006 0.003 2.117 0.04
L(chile.casos.ts, 0:22)12 0 0.003 -0.09 0.928
L(chile.casos.ts, 0:22)13 -0.004 0.005 -0.792 0.433
L(chile.casos.ts, 0:22)14 0.003 0.004 0.651 0.518
L(chile.casos.ts, 0:22)15 0.007 0.005 1.527 0.134
L(chile.casos.ts, 0:22)16 0.006 0.005 1.085 0.284
L(chile.casos.ts, 0:22)17 -0.006 0.005 -1.087 0.283
L(chile.casos.ts, 0:22)18 0.005 0.006 0.844 0.403
L(chile.casos.ts, 0:22)19 -0.001 0.006 -0.085 0.933
L(chile.casos.ts, 0:22)20 0.002 0.006 0.352 0.726
L(chile.casos.ts, 0:22)21 -0.003 0.007 -0.43 0.669
L(chile.casos.ts, 0:22)22 -0.003 0.007 -0.477 0.635
R² Ajustado
0.9589

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general.

Para la serie de decesos, se mantiene el exceso de cifras con 1.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.