Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 8 casos al día de hoy, para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa se ha estabilizado para las dos últimas dos semanas, más acelerada de la previa. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta presenta una leve desaceleración en los últimos 6 días. Tarapacá se muestra muy acelerado en la última semana, presentando prácticamente el mismo ritmo que Antofagasta hace aproximadamente 10 días. Arica y Parinacota mantiene su ciclo descendente. Coquimbo mantiene su aceleración desde la última semana.
  • Zona Central. La Región Metropolitana muestra una tasa más alta que la semana pasada, pero parece haber estabilizado su tasa. Valparaíso mantiene su curva de aceleración desde hace dos semanas. Ñuble y Maule se observan estabilizados. O’Higgins en los últimos 10 días muestra una progresiva aceleración.
  • Zona Sur: Se observan curvas de mitigación en todas las regiones, aunque Biobío muestra aceleración en los últimos 5 días.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa que la tasa está prácticamente estable hace 20 días.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Con respecto a la tasa de casos totales del día vs del dia anterior, se observan ascensos tasas cercanas al 10% diario de aumento en Coquimbo y O’Higgins. Antofasta presenta una disminución constante, en tanto que Valparaíso y la Metropolitana presentan un leve descenso los últimos días.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro, que es el caso de Aysén. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Debido a las aceleraciones observadas durante la última semana, 6 regiones se muestra más aceleradas que la semana anterior. Destaca que la Metropolitana ya se encuentra desacelerada respecto de la semana pasada.

Casos nuevos

Se mantiene la tendencia ascendente de la Región Metropolitana y la serie total.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Usando escala logarítmica en el eje Y, se puede comparar mejor los patrones de las regiones con menos casos. Se puede ver como los casos nuevos muestran un claro patrón exponencial para la Metropolitana y la total desde hace 20 días.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Si observamos la evolución en el resto de las regiones, podemos distinguir los siguientes tipos de patrones:

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta (puede que empiece ciclo de mitigación), Tacapacá.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Maule, Araucanía, Los Lagos, Ñuble, Los Ríos.
  • Mitigación (incompleta) con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Arica y Parinacota, O’Higgins, Valparaíso, Coquimbo, Magallanes, Biobío, Atacama.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Usando la tasa de casos nuevos diarios vs los del día anterior, con ventana de 7 días, se puede apreciar el progresivo descenso de Metropolitana y Maule, así como de la serie total, así como el ascenso de Valparaíso, Biobío y Araucanía.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático.

Si observamos la predicción a 3 día plazo, se puede ver que el modelo cuadrático nuevamente se queda corto por el límite superior del intervalo de confianza. Los modelos T+AR presentan intervalos de confianza correctos, siendo más cercano a lo observado T+AR(4).

  casos li ls
Observado 28866 NA NA
General: Cuadrático + AR(2) 27579 26924 28235
Casos nuevos : Tendencia + AR(1) 27979 26137 32033
Casos nuevos: Tendencia + AR(4) 28036 26368 31314

En una semana más los modelos predicen entre 37212 y 38044 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
58 69 30163 29588 31195
59 70 31687 30415 34005
60 71 32950 30991 36775
61 72 34350 31620 39893
62 73 35569 32126 42822
63 74 36870 32664 45976
64 75 38044 33131 48922
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
58 69 30288 29581 31694
59 70 31592 30165 34607
60 71 32832 30699 37486
61 72 34035 31210 40320
62 73 35218 31710 43118
63 74 36388 32203 45892
64 75 37549 32693 48648
General: Modelo cuadrático : total
  dia casos li ls
58 69 29994 29578 30409
59 70 31143 30556 31730
60 71 32314 31594 33033
61 72 33506 32676 34336
62 73 34720 33791 35648
63 74 35955 34938 36972
64 75 37212 36113 38311

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

El modelo cuadrático tiende a ser más optimista, con 37044 casos en una semana. El modelo de casos nuevos es más pesimista, pronosticando 42968 en una semana.

  dia fecha tipo casos
69 69 2020-05-10 Casos nuevo: Tendencia + AR(1) 30483
70 70 2020-05-11 Casos nuevo: Tendencia + AR(1) 32193
71 71 2020-05-12 Casos nuevo: Tendencia + AR(1) 34031
72 72 2020-05-13 Casos nuevo: Tendencia + AR(1) 36011
73 73 2020-05-14 Casos nuevo: Tendencia + AR(1) 38150
74 74 2020-05-15 Casos nuevo: Tendencia + AR(1) 40463
75 75 2020-05-16 Casos nuevo: Tendencia + AR(1) 42968
76 69 2020-05-10 General: Cuadrático + AR(2) 29972
77 70 2020-05-11 General: Cuadrático + AR(2) 31098
78 71 2020-05-12 General: Cuadrático + AR(2) 32246
79 72 2020-05-13 General: Cuadrático + AR(2) 33414
80 73 2020-05-14 General: Cuadrático + AR(2) 34603
81 74 2020-05-15 General: Cuadrático + AR(2) 35813
82 75 2020-05-16 General: Cuadrático + AR(2) 37044

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra se mantiene prácticamente igual al de ayer, con 1275 casos.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-04 1825 654 1174
2020-05-05 1825 640 1185
2020-05-06 1825 636 1189
2020-05-07 1825 627 1198
2020-05-08 1825 595 1230
2020-05-09 1825 549 1276
2020-05-10 1825 550 1275

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 565 casos.

Uso de camas UCI Covid-19
fecha total
2020-05-04 464
2020-05-05 470
2020-05-06 486
2020-05-07 493
2020-05-08 508
2020-05-09 544
2020-05-10 565

Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir, como ha sido la última semana, nuevamente a la Región Metropolitana.

En las otras regiones, destaca que hace 5 días el máximo número de camas UCI corresponde a Antofagasta.

Decesos

Si observamos la serie de decesos por día, desde los 3 casos, se observa una disminución de la tasa en la Región Metropolitana en la última semana.

Si analizamos la tasa de decesos diarios, podemos observar un descenso a cerca de 7.5 por día.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Modelo dinámico linear de decesos basado en casos

Podemos hacer un modelo no muy sofistacado, en el cual modelamos el logaritmo del número de decesos por día +1 utilizando la cantidad de casos nuevos con lags de 0 a 14, más un autoregresivo sobre el mismo valor de decesos. Pordemos ver que el único coeficiente significativo es el del día 12, perdiendo su importancia el del día 8 de ayer. El R² ajustado es 0.70.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.623 0.118 5.293 0
L(chile.decesos.ts) 0.022 0.04 0.544 0.59
L(chile.casos.ts, 0:14)0 0 0.001 0.056 0.956
L(chile.casos.ts, 0:14)1 0.001 0.001 1.87 0.069
L(chile.casos.ts, 0:14)2 0 0.001 -0.628 0.534
L(chile.casos.ts, 0:14)3 -0.001 0.001 -1.018 0.315
L(chile.casos.ts, 0:14)4 0 0.001 -0.272 0.787
L(chile.casos.ts, 0:14)5 -0.001 0.001 -1.627 0.112
L(chile.casos.ts, 0:14)6 0 0.001 0.447 0.658
L(chile.casos.ts, 0:14)7 0 0.001 -0.106 0.916
L(chile.casos.ts, 0:14)8 0.001 0.001 1.048 0.302
L(chile.casos.ts, 0:14)9 0 0.001 0.013 0.99
L(chile.casos.ts, 0:14)10 0 0.001 0.307 0.76
L(chile.casos.ts, 0:14)11 0.001 0.001 0.407 0.687
L(chile.casos.ts, 0:14)12 0.004 0.002 2.565 0.015
L(chile.casos.ts, 0:14)13 0 0.002 0.027 0.978
L(chile.casos.ts, 0:14)14 -0.001 0.001 -0.804 0.426
R² Ajustado
0.7029

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

En general, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general, al igual que ayer.

Para la serie de decesos, se mantiene el exceso de cifras con 1. No hay suficientes casos para revisar la distribución de segundo orden. Al igual que la serie de casos, la distribución de la sumaria tiene exceso de 7 y 8.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.