Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde no hay casos nuevos en los últimos días, para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que se encuentra acelerada en los últimos 5 días. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta, Tarapacá, y Atacama presentan clásicas curvas de ascenso sin moderación evidente; Tarapacá se muesta muy acelerada. Arica y Parinacota ha presentado ciclos de aceleración y desaceleración, estando actualmente en uno descendente. Si bien Coquimbo que se había mostrado estable, se observa una aceleración durante la última semana que parece haber sido controlada.
  • Zona Central. La Región Metropolitana muestra una evidente aceleración la última semana. Valparaíso también muestran aceleración en la última semana, solo que menos marcada. Ñuble y Maule se observan estabilizados. O’Higgins en los últimos 10 días muestra una progresiva aceleración.
  • Zona Sur: Se observan curvas de mitigación en todas las regiones, aunque Bio-bío muestra una pequeña aceleración en los últimos 3 días.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa una curva clara de mitigación.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Con respecto a la serie de casos totales de día vs el anterior, en general se observan desaceleraciones en las dstintas regiones para los últimos días, excepto Valparaíso, Metropolitana, Biobío y Aysén. La serie total se ve también un tanto acelerada.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro, que es el caso de Aysén. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Debido a las aceleraciones observadas durante la última semana, 7 regiones se muestra más aceleradas que la semana anterior.

Casos nuevos

Se mantiene la tendencia ascendente de la Región Metropolitana y la serie total.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Usando la escala a logarítmica, se puede comparar mejor los patrones de las regiones con menos casos. Se puede ver como los casos nuevos muestran un claro patrón exponencial para la Metropolitana y la total.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Si observamos la evolución en el resto de las regiones, podemos distinguir los siguientes tipos de patrones:

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta, Tacapacá.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Maule, Araucanía, Los Lagos, Ñuble, Atacama, Los Ríos.
  • Mitigación (incompleta) con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Arica y Parinacota, O’Higgins, Valparaíso, Coquimbo, Magallanes, Biobío.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Usando la tasa de casos nuevos diarios vs los del día anterior, con ventana de 7 días, se puede apreciar ya como constante las oscilaciones de la tasa de casos nuevos para Valparaíso, que en promedio supera al 1. La Metropolitana había presentado de forma consistente un incremento de los casos nuevos en las últimas 2 semanas, pero hoy se comienza a apreciar una leve disminución. Biobío muestra un aumento reciente en la tasa, que estaba en franco descenso. Araucanía tiende a bajar el número de casos nuevos por días, pero muestra importantes oscilaciones.

En el caso del Maule y Tarapacá, se observan fuertes oscilaciones en las tasas, con una tendencia al alza en Tarapacá.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático.

En estos momentos, las predicciones de todos los modelos dan resultados muy similares, entre 31800 y 32285 casos en una semana.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
55 66 25644 25169 26500
56 67 27023 25912 29064
57 68 28036 26368 31314
58 69 29274 26919 34091
59 70 30238 27315 36440
60 71 31364 27776 39191
61 72 32285 28139 41531
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
55 66 25833 25202 27106
56 67 26945 25695 29613
57 68 27979 26137 32033
58 69 28969 26555 34377
59 70 29932 26960 36665
60 71 30875 27356 38911
61 72 31803 27746 41121
General: Modelo cuadrático : total
  dia casos li ls
55 66 25561 25183 25940
56 67 26561 26026 27096
57 68 27579 26924 28235
58 69 28617 27860 29374
59 70 29674 28828 30521
60 71 30750 29823 31677
61 72 31846 30844 32847

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

El modelo cuadrático tiende a ser más optimista, con 31675 casos en una semana. El modelo de casos nuevos es más pesimista, pronosticando 35988 en una semana.

  dia fecha tipo casos
66 66 43958 Casos nuevo: Tendencia + AR(1) 25912
67 67 43959 Casos nuevo: Tendencia + AR(1) 27304
68 68 43960 Casos nuevo: Tendencia + AR(1) 28793
69 69 43961 Casos nuevo: Tendencia + AR(1) 30393
70 70 43962 Casos nuevo: Tendencia + AR(1) 32117
71 71 43963 Casos nuevo: Tendencia + AR(1) 33978
72 72 43964 Casos nuevo: Tendencia + AR(1) 35988
73 66 43958 General: Cuadrático + AR(2) 25539
74 67 43959 General: Cuadrático + AR(2) 26516
75 68 43960 General: Cuadrático + AR(2) 27511
76 69 43961 General: Cuadrático + AR(2) 28524
77 70 43962 General: Cuadrático + AR(2) 29556
78 71 43963 General: Cuadrático + AR(2) 30606
79 72 43964 General: Cuadrático + AR(2) 31675

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra nuevamente un máximo en la serie, llegando a 1198.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-01 1710 612 1098
2020-05-02 1825 709 1116
2020-05-03 1825 674 1151
2020-05-04 1825 654 1174
2020-05-05 1825 640 1185
2020-05-06 1825 636 1189
2020-05-07 1825 627 1198

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 493 casos.

Uso de camas UCI Covid-19
fecha total
2020-05-01 428
2020-05-02 425
2020-05-03 449
2020-05-04 464
2020-05-05 470
2020-05-06 486
2020-05-07 493

Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir nuevamente a la Región Metropolitana.

En las otras regiones, destaca que hace dos días se observa que el número de camas UCI en Antofagasta, supera a las de la Araucanía, que ya va en constante descenso.

Decesos

Si observamos la serie de decesos por día, desde los 3 casos, se observa una disminución de la tasa en la Región Metropolitana en los últimos tres días, así como una leve desaceleración en la curva total.

Si analizamos la tasa de decesos diarios, podemos observar un descenso a cerca de 7 por día.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

En general, podemos ver que hay un exceso de 1 en el análisis general, y aparece en la sumatoria un número importante de 8

Para la serie de decesos, se mantiene el exceso de cifras con 1. No hay suficientes casos para revisar la distribución de segundo orden. Al igual que la serie de casos, la distribución de la sumaria tiene exceso de 7, 8 y 9.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.