Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 8 casos al día de hoy, para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa se ha estabilizado para las dos últimas dos semanas, más acelerada de la previa. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta presenta una leve desaceleración en los últimos 5 días. Tarapacá se muestra muy acelerado en la última semana y ha logrado la cantidad de casos equivalente al día 32 desde el caso 25. Arica y Parinacota mantiene su ciclo descendente. Coquimbo mantiene su aceleración desde la última semana.
  • Zona Central. La Región Metropolitana muestra una tasa más alta que la semana pasada, pero muestra una pequeña desaceleración los dos últimos días. Valparaíso mantiene su curva de aceleración desde hace dos semanas. Ñuble y Maule se observan estabilizados. O’Higgins en los últimos 10 días muestra una progresiva aceleración.
  • Zona Sur: Se observan curvas de mitigación en todas las regiones, aunque Biobío muestra aceleración en los últimos 5 días.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa una aceleración de la tasa en la última semana.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Con respecto a la tasa de casos totales del día vs del dia anterior, se ve como Tarapacá presenta una tasa de aumento superior al 10%, igual que Atacama y Coquimbo. Valparaíso y O’Higgins presentan tasas entre 5% y 10% en aumento, en tanto que la Metropolitana se encuentra en el mismo rango, pero en descenso. Biobío, que presentaba una disminución importante, ha aumentado su tasa de manera importante los últimos 5 días.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro, que es el caso de Aysén. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Debido a las aceleraciones observadas durante la última semana, 6 regiones se muestra más aceleradas que la semana anterior. Destaca que la Metropolitana ya se encuentra desacelerada respecto de la semana pasada.

Casos nuevos

Se mantiene la tendencia ascendente de la Región Metropolitana y la serie total.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Usando escala logarítmica en el eje Y, se puede comparar mejor los patrones de las regiones con menos casos. Se puede ver como los casos nuevos muestran un claro patrón exponencial para la Metropolitana y la total desde hace 20 días.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Si observamos la evolución en el resto de las regiones, podemos distinguir los siguientes tipos de patrones:

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta, Tacapacá.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Maule, Araucanía, Los Lagos, Ñuble, Atacama, Los Ríos.
  • Mitigación (incompleta) con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Arica y Parinacota, O’Higgins, Valparaíso, Coquimbo, Magallanes, Biobío.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Usando la tasa de casos nuevos diarios vs los del día anterior, con ventana de 7 días, se puede apreciar mejor la aceleración en Tarapacá, Valparaíso, Biobío y Araucanía, así como la desaceleración de la Maule, Metropolitana y la serie total. Ñuble se muestra estabilizado.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático.

Si observamos la predicción a 2 día plazo, se puede ver que el modelo cuadrático se queda corto por el límite superior del intervalo de confianza. Los modelos T+AR presentan intervalos de confianza correctos, siendo más cercano a lo observado T+AR(1).

  casos li ls
Observado 27219 NA NA
General: Cuadrático + AR(2) 26561 26026 27096
Casos nuevos : Tendencia + AR(1) 26945 25695 29613
Casos nuevos: Tendencia + AR(4) 27023 25912 29064

En una semana más los modelos predicen entre 34418 y 35108 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
57 68 28442 27899 29419
58 69 29581 28515 31526
59 70 30706 29027 33998
60 71 31771 29505 36369
61 72 32821 29942 38891
62 73 33824 30358 41313
63 74 34811 30753 43778
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
57 68 28354 27790 29477
58 69 29426 28271 31868
59 70 30461 28718 34263
60 71 31473 29149 36635
61 72 32467 29571 38978
62 73 33449 29987 41294
63 74 34418 30398 43583
General: Modelo cuadrático : total
  dia casos li ls
57 68 28285 27894 28675
58 69 29371 28818 29923
59 70 30477 29801 31154
60 71 31604 30823 32385
61 72 32752 31878 33625
62 73 33919 32963 34876
63 74 35108 34074 36141

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

El modelo cuadrático tiende a ser más optimista, con 34924 casos en una semana. El modelo de casos nuevos es más pesimista, pronosticando 39826 en una semana.

  dia fecha tipo casos
68 68 2020-05-09 Casos nuevo: Tendencia + AR(1) 28632
69 69 2020-05-10 Casos nuevo: Tendencia + AR(1) 30169
70 70 2020-05-11 Casos nuevo: Tendencia + AR(1) 31825
71 71 2020-05-12 Casos nuevo: Tendencia + AR(1) 33607
72 72 2020-05-13 Casos nuevo: Tendencia + AR(1) 35525
73 73 2020-05-14 Casos nuevo: Tendencia + AR(1) 37593
74 74 2020-05-15 Casos nuevo: Tendencia + AR(1) 39826
75 68 2020-05-09 General: Cuadrático + AR(2) 28260
76 69 2020-05-10 General: Cuadrático + AR(2) 29322
77 70 2020-05-11 General: Cuadrático + AR(2) 30403
78 71 2020-05-12 General: Cuadrático + AR(2) 31503
79 72 2020-05-13 General: Cuadrático + AR(2) 32624
80 73 2020-05-14 General: Cuadrático + AR(2) 33764
81 74 2020-05-15 General: Cuadrático + AR(2) 34924

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra nuevamente un máximo en la serie, llegando a 1276. Esto genera que la cantidad de ventiladores disponibles disminuye a 549.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-03 1825 674 1151
2020-05-04 1825 654 1174
2020-05-05 1825 640 1185
2020-05-06 1825 636 1189
2020-05-07 1825 627 1198
2020-05-08 1825 595 1230
2020-05-09 1825 549 1276

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 544 casos.

Uso de camas UCI Covid-19
fecha total
2020-05-03 449
2020-05-04 464
2020-05-05 470
2020-05-06 486
2020-05-07 493
2020-05-08 508
2020-05-09 544

Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir, como ha sido la última semana, nuevamente a la Región Metropolitana.

En las otras regiones, destaca que hace 4 días el máximo número de camas UCI corresponde a Antofagasta.

Decesos

Si observamos la serie de decesos por día, desde los 3 casos, se observa una disminución de la tasa en la Región Metropolitana en los últimos 6 días, así como una leve desaceleración en la curva total.

Si analizamos la tasa de decesos diarios, podemos observar un descenso a cerca de 7 por día.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Modelo dinámico linear de decesos basado en casos

Podemos hacer un modelo un poco bruto, en el cual modelamos el logaritmo del número de decesos por día +1 utilizando la cantidad de casos nuevos con lags de 0 a 14, más un autoregresivo sobre el mismo valor de decesos. Pordemos ver que los coeficients significativos son el 8 y el 12, lo que nos indica que la predicción de decesos del día de hoy no puede omitir los casos de hace más de una semana atrás.

  Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.53 0.113 4.706 0
L(chile.decesos.ts) 0.022 0.037 0.589 0.56
L(chile.casos.ts, 0:14)0 0 0.001 0.716 0.478
L(chile.casos.ts, 0:14)1 0.001 0.001 1.389 0.173
L(chile.casos.ts, 0:14)2 -0.001 0.001 -1.443 0.158
L(chile.casos.ts, 0:14)3 0 0.001 -0.082 0.935
L(chile.casos.ts, 0:14)4 0 0.001 -0.51 0.613
L(chile.casos.ts, 0:14)5 -0.001 0.001 -1.687 0.1
L(chile.casos.ts, 0:14)6 -0.001 0.001 -0.966 0.341
L(chile.casos.ts, 0:14)7 0.001 0.001 0.686 0.497
L(chile.casos.ts, 0:14)8 0.004 0.001 2.775 0.009
L(chile.casos.ts, 0:14)9 -0.001 0.001 -0.466 0.644
L(chile.casos.ts, 0:14)10 0 0.001 -0.318 0.752
L(chile.casos.ts, 0:14)11 0.002 0.001 1.223 0.229
L(chile.casos.ts, 0:14)12 0.005 0.001 3.194 0.003
L(chile.casos.ts, 0:14)13 -0.001 0.002 -0.555 0.583
L(chile.casos.ts, 0:14)14 -0.002 0.001 -1.783 0.083

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

En general, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general.

Para la serie de decesos, se mantiene el exceso de cifras con 1. No hay suficientes casos para revisar la distribución de segundo orden. Al igual que la serie de casos, la distribución de la sumaria tiene exceso de 7 y 8.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.