Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 8 casos al día de hoy, para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa se ha estabilizado para las dos últimas dos semanas, más acelerada de la previa. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta presenta una leve desaceleración en los últimos 7 días. Tarapacá se muestra muy acelerado en la última semana, presentando prácticamente el mismo ritmo que Antofagasta hace aproximadamente 11 días durante los últimos 3 días. Arica y Parinacota mantiene su ciclo descendente. Coquimbo mantiene su aceleración desde la última semana. Atacama sigue prácticamente el mismo desarrollo inicial de Tarapacá y Antofagasta.
  • Zona Central. La Región Metropolitana muestra una tasa más alta que la semana pasada, pero parece haber estabilizado en los últmos 3 días. Valparaíso mantiene su curva de aceleración desde hace dos semanas. Ñuble y Maule se observan estabilizados. O’Higgins en los últimos 11 días muestra una progresiva aceleración.
  • Zona Sur: Se observan curvas de mitigación en todas las regiones, excepto en Biobío que muestra aceleración en los últimos 6 días.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa que la tasa está prácticamente estable hace 21 días.

Con respecto a la tasa de casos totales del día vs del dia anterior, se observan ascensos tasas cercanas al 10% diario de aumento en Coquimbo y O’Higgins. Antofagasta presenta una disminución constante, en tanto que Valparaíso y particularmente la Metropolitana presenta descenso los últimos días. Biobío parece estabilizarse cerca de un 4% diario. Atacama se muestra acelerado, con un incremento diario cercano al 15%.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro, que es el caso de Aysén. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Debido a las aceleraciones observadas durante la última semana, 8 regiones se muestra más aceleradas que la semana anterior. Destaca que la Metropolitana ya se encuentra desacelerada respecto de la semana pasada, al igual que Antofagasta.

Casos nuevos

Se mantiene la tendencia ascendente de la Región Metropolitana y la serie total.

Usando escala logarítmica en el eje Y, se puede comparar mejor los patrones de las regiones con menos casos. Se puede ver como los casos nuevos muestran un claro patrón exponencial para la Metropolitana y la total desde hace 21 días.

Si observamos la evolución en el resto de las regiones, podemos distinguir los siguientes tipos de patrones:

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta (puede que empiece ciclo de mitigación), Tacapacá.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Araucanía, Ñuble, Los Ríos.
  • Mitigación (incompleta) con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Arica y Parinacota, O’Higgins, Valparaíso, Coquimbo, Magallanes, Biobío, Atacama, Maule, Los Lagos.

Usando la tasa de casos nuevos diarios vs los del día anterior, con ventana de 7 días, se puede apreciar el progresivo descenso de Metropolitana y Maule, así como de la serie total, así como el ascenso de Valparaíso, Biobío y Araucanía.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático.

Si observamos la predicción a 4 día plazo, se puede ver que el modelo cuadrático durante toda la semana se ha quedado corto por el límite superior del intervalo de confianza. Los modelos T+AR presentan intervalos de confianza correctos, siendo más cercano a lo observado T+AR(4).

  casos li ls
Observado 30063 NA NA
General: Cuadrático + AR(2) 28617 27860 29374
Casos nuevos : Tendencia + AR(1) 28969 26555 34377
Casos nuevos: Tendencia + AR(4) 29274 26919 34091

En una semana más los modelos predicen entre 37718 y 38627 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
59 70 31536 30888 32694
60 71 32699 31523 34823
61 72 34034 32136 37733
62 73 35159 32644 40221
63 74 36392 33161 43162
64 75 37478 33613 45772
65 76 38627 34075 48631
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
59 70 31208 30642 32329
60 71 32324 31146 34799
61 72 33422 31624 37321
62 73 34509 32091 39848
63 74 35586 32553 42366
64 75 36656 33010 44869
65 76 37719 33463 47356
General: Modelo cuadrático : total
  dia casos li ls
59 70 31208 30796 31619
60 71 32374 31799 32950
61 72 33562 32865 34260
62 73 34772 33975 35569
63 74 36003 35121 36885
64 75 37256 36300 38212
65 76 38530 37509 39552

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

El modelo cuadrático tiende a ser más optimista, con 38437 casos en una semana. El modelo de casos nuevos es más pesimista, pronosticando 44008 en una semana.

  dia fecha tipo casos
70 70 2020-05-11 Casos nuevo: Tendencia + AR(1) 31601
71 71 2020-05-12 Casos nuevo: Tendencia + AR(1) 33304
72 72 2020-05-13 Casos nuevo: Tendencia + AR(1) 35142
73 73 2020-05-14 Casos nuevo: Tendencia + AR(1) 37119
74 74 2020-05-15 Casos nuevo: Tendencia + AR(1) 39245
75 75 2020-05-16 Casos nuevo: Tendencia + AR(1) 41536
76 76 2020-05-17 Casos nuevo: Tendencia + AR(1) 44008
77 70 2020-05-11 General: Cuadrático + AR(2) 31196
78 71 2020-05-12 General: Cuadrático + AR(2) 32351
79 72 2020-05-13 General: Cuadrático + AR(2) 33526
80 73 2020-05-14 General: Cuadrático + AR(2) 34722
81 74 2020-05-15 General: Cuadrático + AR(2) 35940
82 75 2020-05-16 General: Cuadrático + AR(2) 37178
83 76 2020-05-17 General: Cuadrático + AR(2) 38437

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra una máxima, con 1275.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-05 1825 640 1185
2020-05-06 1825 636 1189
2020-05-07 1825 627 1198
2020-05-08 1825 595 1230
2020-05-09 1825 549 1276
2020-05-10 1825 550 1275
2020-05-11 1912 606 1306

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 574 casos.

Uso de camas UCI Covid-19
fecha total
2020-05-05 470
2020-05-06 486
2020-05-07 493
2020-05-08 508
2020-05-09 544
2020-05-10 565
2020-05-11 574

Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir, como ha sido la tónica durante los últimos 10 días, a la Región Metropolitana.

En las otras regiones, destaca que hace 6 días el máximo número de camas UCI corresponde a Antofagasta.

Decesos

Si observamos la serie de decesos por día, desde los 3 casos, se observa que las tasa de crecimiento ha permanecido prácticamente constante desde hace unas semana.

Si analizamos la tasa de decesos diarios, podemos observar un descenso a cerca de 8 por día.

Modelo dinámico linear de decesos basado en casos

Podemos hacer un modelo no muy sofistacado, en el cual modelamos el logaritmo del número de decesos por día +1 utilizando la cantidad de casos nuevos con lags de 0 a 14, más un autoregresivo sobre el mismo valor de decesos. Pordemos ver ningún coeficiente es significativo. El R² ajustado es 0.68.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.659 0.12 5.479 0
L(chile.decesos.ts) 0.042 0.04 1.054 0.299
L(chile.casos.ts, 0:14)0 0 0.001 -0.048 0.962
L(chile.casos.ts, 0:14)1 0.001 0.001 1.499 0.142
L(chile.casos.ts, 0:14)2 0 0.001 -0.375 0.71
L(chile.casos.ts, 0:14)3 0 0.001 -0.334 0.74
L(chile.casos.ts, 0:14)4 -0.001 0.001 -1.159 0.254
L(chile.casos.ts, 0:14)5 -0.001 0.001 -1.291 0.205
L(chile.casos.ts, 0:14)6 0 0.001 0.475 0.638
L(chile.casos.ts, 0:14)7 0.001 0.001 1.01 0.319
L(chile.casos.ts, 0:14)8 0 0.001 0.461 0.647
L(chile.casos.ts, 0:14)9 -0.002 0.001 -1.705 0.096
L(chile.casos.ts, 0:14)10 0.001 0.001 0.809 0.424
L(chile.casos.ts, 0:14)11 0.001 0.001 0.699 0.489
L(chile.casos.ts, 0:14)12 0.003 0.002 1.994 0.053
L(chile.casos.ts, 0:14)13 0 0.002 -0.212 0.833
L(chile.casos.ts, 0:14)14 0 0.001 0.004 0.997
R² Ajustado
0.6813

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

En general, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general, al igual que los últimos dos días.

Para la serie de decesos, se mantiene el exceso de cifras con 1. No hay suficientes casos para revisar la distribución de segundo orden. Al igual que la serie de casos, la distribución de la sumaria tiene exceso de 7 y 8.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.