Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI.

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 8 casos desde hace 10 días, para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa de incremento diario prácticamente se ha mantenido constante en las últimas dos semanas. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta vuelve a mostrarse acelerada en los últimos 6 días, tras un proceso de desaceleración de un tiempo similar. Tarapaca, que había mantenido el mismo ritmo de Antofagasta durante más de una semana, presenta ya una tasa más acelerada. Arica y Parinacota mantiene su ciclo descendente. Coquimbo mantiene su aceleración desde hace dos semanas, pero con una leve desaceleración en los últimos 3 días. Atacama se encuentra en un patrón estable hace 5 días.
  • Zona Central. La Región Metropolitana parece mantener la misma tasa de crecimiento hace aproximadamente 3 semanas. Valparaíso sigue manteniendo una curva de aceleración progresiva durante el mismo periodo. Ñuble y Maule se observaban estabilizados hasta hace una semana atrás, pero están comenzando a acelerar. O’Higgins en las últimas dos semanas muestra una progresiva aceleración.
  • Zona Sur: Se observan leves aceleraciones en Biobío y Los Lagos en la última semana; se observa que la tasa de crecimiento se estabilizó en un valor un tanto superior a la tasa previa menor. Los Ríos y Araucanía parecen estar estables.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa muy desacelerado en la última semana.

Con respecto a la tasa de casos totales del día vs del dia anterior, se puede ver en general procesos de desaceleración reciente, de aproximadamente tres días en todas las regiones, excepto en Tarapacá (ascedente), Atacama (estabilizado), Ñuble (ascendente), Biobío (estabilizado).

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro, que es el caso de Aysén. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. El día de hoy se puede observar desaceleradas Coquimbo, Tarapacá, Atacama, Arica y Parinacota y Magallanes.

Casos nuevos

El día de hoy, se puede apreciar una cierta estabilización en el número de casos nuevos en los últims 4 días, en una media de 2350 para el total y 1930 para la Metropolitana.

Usando escala logarítmica en el eje Y, se puede observar con mayor claridad la medición del día de ayer era una fluctuación sobre la tendencia ascendente, que parece estar comenzando a estabilizarse.

Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta, Tacapacá, O’Higgins, Valparaíso.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Los Ríos, Magallanes y Arica y Parinacota, Atacama, Los Lagos.
  • Mitigación (incompleta) con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Coquimbo, Biobío, Maule, Araucanía y Ñuble.

Usando la tasa de casos nuevos diarios vs los del día anterior, con ventana de 7 días, se puede que Valparaíso , Metropolitana, Biobío, Tarapacá y la Araucanía lentamente están estabilizando la aceleración, a niveles levemente sobre 1. Maule, Tarapacá y Ñuble se observan con tasas crecimientes de aceleración.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático bajo procesos estables. El día de hoy se elimina, porque no converge.

Si observamos la predicción realizada hace 2 día, podemos observar al igual que ayer que el modelo T+AR(1) está más cerca que T+AR(4), lo cual se debe probablemente a que T+AR(4) considera los fuertes ascensos de los últimos días, señalando un valor mayor. De todas maneras, recordemos que el modelo T+AR(4) tiende a generar mejores predicciones al analizar la serie completa semanal.

  casos li ls
Observado 43781 NA NA
Casos nuevos : Tendencia + AR(1) 43854 41598 48620
Casos nuevos: Tendencia + AR(4) 44473 42217 48634

En una semana más los modelos predicen entre 58136 y 58661 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
65 76 45714 44853 47265
66 77 47954 46056 51440
67 78 49907 46952 55694
68 79 52072 47930 60487
69 80 54040 48760 65155
70 81 56156 49644 70214
71 82 58136 50445 75108
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
65 76 45976 44901 48084
66 77 48096 45857 52783
67 78 50186 46759 57625
68 79 52273 47645 62546
69 80 54376 48531 67535
70 81 56503 49425 72596
71 82 58661 50331 77734

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

El modelo cuadrático tiende a ser más optimista, con 56008 casos en una semana, 2000 casos menos que lo predicho por las series total con T+AR. Los modelos de tendencia AR(1) y AR(4) presentan predicciones más cercanas, con 68109 y 67658 casos, respectivamente.

  dia fecha tipo casos
76 76 2020-05-17 Casos nuevo: Tendencia + AR(1) 46428
77 77 2020-05-18 Casos nuevo: Tendencia + AR(1) 49336
78 78 2020-05-19 Casos nuevo: Tendencia + AR(1) 52495
79 79 2020-05-20 Casos nuevo: Tendencia + AR(1) 55923
80 80 2020-05-21 Casos nuevo: Tendencia + AR(1) 59647
81 81 2020-05-22 Casos nuevo: Tendencia + AR(1) 63697
82 82 2020-05-23 Casos nuevo: Tendencia + AR(1) 68109
83 76 2020-05-17 Casos nuevo: Tendencia + AR(4) 46289
84 77 2020-05-18 Casos nuevo: Tendencia + AR(4) 49093
85 78 2020-05-19 Casos nuevo: Tendencia + AR(4) 52242
86 79 2020-05-20 Casos nuevo: Tendencia + AR(4) 55644
87 80 2020-05-21 Casos nuevo: Tendencia + AR(4) 59334
88 81 2020-05-22 Casos nuevo: Tendencia + AR(4) 63328
89 82 2020-05-23 Casos nuevo: Tendencia + AR(4) 67658
90 76 2020-05-17 General: Cuadrático + AR(1) 45436
91 77 2020-05-18 General: Cuadrático + AR(1) 47122
92 78 2020-05-19 General: Cuadrático + AR(1) 48838
93 79 2020-05-20 General: Cuadrático + AR(1) 50585
94 80 2020-05-21 General: Cuadrático + AR(1) 52362
95 81 2020-05-22 General: Cuadrático + AR(1) 54170
96 82 2020-05-23 General: Cuadrático + AR(1) 56008

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra una máxima en la serie, con 1561 casos. El porcentaje de ventiladores disponibles vuelve a su nivel de 3 días atrás, con la incorporación de 218 ventiladores nuevos.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-11 1912 606 1306
2020-05-12 1912 582 1330
2020-05-13 1912 553 1359
2020-05-14 1912 515 1397
2020-05-15 1912 419 1493
2020-05-16 1912 414 1498
2020-05-17 2130 569 1561

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 769 casos.

Uso de camas UCI Covid-19
fecha total
2020-05-11 574
2020-05-12 604
2020-05-13 642
2020-05-14 663
2020-05-15 711
2020-05-16 751
2020-05-17 769

Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir, como ha sido la tónica durante los últimos 17 días, a la Región Metropolitana.

En las otras regiones, destaca que hace 13 días el máximo número de camas UCI corresponde a Antofagasta. Valparaíso es la segunda región con más camas UCI ocupadas, seguida por la Araucanía.

Decesos

Si observamos la serie de decesos por día, desde los 4 casos (se excluye Tarapacá y Coquimbo), se observa un incremento importante en los últimos 5 días.

Si analizamos la tasa de decesos diarios, podemos ver un incremento muy importante en los últimos tres días, superando los 20 decesos diarios. Es posible que la media se instale en cerca de 30 los próximos días.

Modelo dinámico linear de decesos basado en casos

Simplificaremos el modelo de decesos basados en casos, utilizando directamente el número de decesos contra el de casos. Se puede apreciar, como ha sido la tónica en estos días, que el número de decesos del día de hoy se asocia de manera significativa a la cantidad de casos hace 5 y 12 días. Se debe hacer notar que el nivel de precisión del modelo varía bastante de acuerdo al número de casos predicho, siendo mayor para un número de casos alto (sobre 20), vs con menos casos.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.408 0.511 2.753 0.009
L(chile.decesos.ts) 0.072 0.148 0.487 0.629
L(chile.casos.ts, 0:14)0 -0.002 0.002 -1.291 0.203
L(chile.casos.ts, 0:14)1 0.003 0.002 1.473 0.148
L(chile.casos.ts, 0:14)2 0 0.002 0.032 0.975
L(chile.casos.ts, 0:14)3 0.004 0.002 1.597 0.117
L(chile.casos.ts, 0:14)4 -0.002 0.003 -0.886 0.381
L(chile.casos.ts, 0:14)5 -0.009 0.003 -2.574 0.013
L(chile.casos.ts, 0:14)6 -0.003 0.003 -0.828 0.412
L(chile.casos.ts, 0:14)7 0.005 0.004 1.251 0.218
L(chile.casos.ts, 0:14)8 0.003 0.004 0.717 0.477
L(chile.casos.ts, 0:14)9 -0.003 0.004 -0.753 0.456
L(chile.casos.ts, 0:14)10 0.003 0.004 0.805 0.425
L(chile.casos.ts, 0:14)11 -0.006 0.004 -1.519 0.136
L(chile.casos.ts, 0:14)12 0.016 0.005 3.433 0.001
L(chile.casos.ts, 0:14)13 0.002 0.006 0.274 0.785
L(chile.casos.ts, 0:14)14 0.007 0.004 1.635 0.109
R² Ajustado
0.8847

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

En general, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general, al igual que la última semana.

Para la serie de decesos, se mantiene el exceso de cifras con 1. No hay suficientes casos para revisar la distribución de segundo orden.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.