Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde no hay casos nuevos en los últimos días, para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que mantiene un ritmo más acelerado que la semana pasada, pero que parece haberse estabilizado. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta presenta una leve desaceleración en los últimos 4 días. Tarapacá se muestra muy acelerado en la última semana y podría superar el ritmo de Antofagasta. Arica y Parinacota claramente se observa en ciclo descendente. Coquimbo muestra aceleración desde la última semana.
  • Zona Central. La Región Metropolitana muestra una tasa más alta que la semana pasada, pero muestra una pequeña desaceleración el día de hoy. Valparaíso presenta una curva de aceleración que se inicia desde hace dos semanas. Ñuble y Maule se observan estabilizados. O’Higgins en los últimos 10 días muestra una progresiva aceleración.
  • Zona Sur: Se observan curvas de mitigación en todas las regiones, aunque Biobío muestra aceleración en los últimos 4 días.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa una curva clara de mitigación, aunque no se logra disminuir de forma relevante la tasa de casos nuevos.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Con respecto a la tasa de casos totales del día vs del dia anterior, se observan aceleradas Tarapacá, Coquimbo, Valparaíso, O’Higgins y Biobío. La Región Metropolitana comienza a evidencia un descenso desde hace 7 días, y la tasa total se encuentra cercana al aumento de 5% diario.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro, que es el caso de Aysén. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Debido a las aceleraciones observadas durante la última semana, 7 regiones se muestra más aceleradas que la semana anterior.

Casos nuevos

Se mantiene la tendencia ascendente de la Región Metropolitana y la serie total.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Usando escala logarítmica en el eje Y, se puede comparar mejor los patrones de las regiones con menos casos. Se puede ver como los casos nuevos muestran un claro patrón exponencial para la Metropolitana y la total, apreciándose incluso un cierto grado de aceleración.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Si observamos la evolución en el resto de las regiones, podemos distinguir los siguientes tipos de patrones:

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta, Tacapacá.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Maule, Araucanía, Los Lagos, Ñuble, Atacama, Los Ríos.
  • Mitigación (incompleta) con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Arica y Parinacota, O’Higgins, Valparaíso, Coquimbo, Magallanes, Biobío.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Usando la tasa de casos nuevos diarios vs los del día anterior, con ventana de 7 días, se puede apreciar mejor la aceleración en Valparaíso, Biobío y Araucanía, así como la desaceleración de la Metropolitana y la serie total.

En el caso del Maule y Tarapacá, se observan fuertes oscilaciones en las tasas, con tendencias recientes a la desaceleración.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático.

Si observamos la predicción a 1 día plazo, se puede ver que el modelo cuadrático se queda corto por el límite superior del intervalo de confianza. Los modelos T+AR presentan intervalos de confianza correctos, siendo más cercano a lo observado T+AR(1).

  casos li ls
Observado 25972 NA NA
General: Cuadrático + AR(2) 25561 25183 25940
Casos nuevos : Tendencia + AR(1) 25833 25202 27106
Casos nuevos: Tendencia + AR(4) 25644 25169 26500

En una semana más los modelos predicen entre 30200 y 35400 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
56 67 27530 26836 28781
57 68 28882 27564 31294
58 69 30322 28213 34489
59 70 31602 28781 37368
60 71 32938 29329 40630
61 72 34156 29825 43618
62 73 35411 30317 46822
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
56 67 27177 26574 28385
57 68 28283 27066 30869
58 69 29333 27517 33317
59 70 30349 27947 35716
60 71 31343 28366 38075
61 72 32321 28777 40399
62 73 33286 29183 42694
General: Modelo cuadrático : total
  dia casos li ls
56 67 27002 26612 27392
57 68 28052 27500 28604
58 69 29122 28446 29797
59 70 30212 29431 30992
60 71 31321 30449 32194
61 72 32451 31496 33407
62 73 33601 32569 34634

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

El modelo cuadrático tiende a ser más optimista, con 33491 casos en una semana. El modelo de casos nuevos es más pesimista, pronosticando 38248 en una semana.

  dia fecha tipo casos
67 67 43959 Casos nuevo: Tendencia + AR(1) 27376
68 68 43960 Casos nuevo: Tendencia + AR(1) 28867
69 69 43961 Casos nuevo: Tendencia + AR(1) 30470
70 70 43962 Casos nuevo: Tendencia + AR(1) 32197
71 71 43963 Casos nuevo: Tendencia + AR(1) 34059
72 72 43964 Casos nuevo: Tendencia + AR(1) 36071
73 73 43965 Casos nuevo: Tendencia + AR(1) 38248
74 67 43959 General: Cuadrático + AR(2) 26989
75 68 43960 General: Cuadrático + AR(2) 28025
76 69 43961 General: Cuadrático + AR(2) 29080
77 70 43962 General: Cuadrático + AR(2) 30154
78 71 43963 General: Cuadrático + AR(2) 31247
79 72 43964 General: Cuadrático + AR(2) 32360
80 73 43965 General: Cuadrático + AR(2) 33491

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra nuevamente un máximo en la serie, llegando a 1230. Esto contrarresta la cantidad de ventiladores extras que se agregaron hace 7 días.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-02 1825 709 1116
2020-05-03 1825 674 1151
2020-05-04 1825 654 1174
2020-05-05 1825 640 1185
2020-05-06 1825 636 1189
2020-05-07 1825 627 1198
2020-05-08 1825 595 1230

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 508 casos.

Uso de camas UCI Covid-19
fecha total
2020-05-02 425
2020-05-03 449
2020-05-04 464
2020-05-05 470
2020-05-06 486
2020-05-07 493
2020-05-08 508

Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir nuevamente a la Región Metropolitana.

En las otras regiones, destaca que hace 3 días se observa que el número de camas UCI en Antofagasta, supera a las de la Araucanía, que ya va en constante descenso. Disminuye también la cantidad de camas utilizadas en Magallanes, siendo mayor la cantidad de camas en Biobío y Valparaíso.

Decesos

Si observamos la serie de decesos por día, desde los 4 casos, se observa una disminución de la tasa en la Región Metropolitana en los últimos tres días, así como una leve desaceleración en la curva total.

Si analizamos la tasa de decesos diarios, podemos observar un descenso a cerca de 7 por día.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

En general, podemos ver que hay un exceso de 1 en el análisis general, y aparece en la sumatoria un número importante de 8

Para la serie de decesos, se mantiene el exceso de cifras con 1. No hay suficientes casos para revisar la distribución de segundo orden. Al igual que la serie de casos, la distribución de la sumaria tiene exceso de 7 y 8.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.