Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Representación gráfica de discursos del gobierno: https://rpubs.com/clbustos/613302

Asumiendo que los procesos de cambio de los parámetros de la pandemia son lentos, cualquier cambio brusco en un modelo predictivo podría indicar cambios en la forma de medición o en parámetros de atención. Por tanto, se tiene a disposición un análisis gráfico de los cambios en la capacidad predictiva y los coeficientes para distintos modelos de regresión con datos disponibles: https://rpubs.com/clbustos/615858.

Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 2 de Junio de 2020.

Nota técnica: en el informe diario del 2 de Junio del MINSAL no se presentaron datos de fallecimientos para el día 1 de Junio, por los usuales cambios de criterio a los que nos tiene acostumbrados el Ministerio. El valor que se presenta en los análisis es un estimado lineal, en aquellos casos donde la cifra cambio entre el día 1 y 3 de Junio.

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 17 casos , para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver una pequeña desaceleración para la última semana en la serie total. Por regiones, se puede apreciar que:

  • Zona Norte: Antofagasta se ve desacelerada desde hace 20 días. Tarapacá presenta desde hace casi 20 días un ritmo relativamente constante. Arica y Parinacota, que se caracterizaba por una baja tasa, muestra desde hace 20 días una nueva tasa, constante, más acelerada. Coquimbo muestra un proceso de aceleración en los últimos 30 días. Atacama mantiene un ritmo constante, relativamente bajo, desde hace más de 20 días.
  • Zona Central. La Región Metropolitana comienza a mostrar un leve descenso en el número de casos. Valparaíso mantiene una tasa constante desde hace 30 días. Ñuble mantiene una tasa un poco más acelerada, pero constante, en los últimos 20 días. Maule muestra una tasa más acelerada que la previa desde hace más de 20 días. O’Higgins, finalmente, mantiene un ritmo establece desde hace 15 días.
  • Zona Sur: Biobío comienza a mostrarse acelerada desde hace 25 días, en tanto que la aceleración de hace dos semanas de los Ríos parece haberse detenido. Araucanía y los Lagos, si bien presentan tasas mayores que hace 15 días, se muestra un poco más estable.
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa muy desacelerado en los últimos 15 días.

Con respecto a la tasa de casos totales del día vs del dia anterior, se usó el método STL para eliminar la fluctuación semanal. Se puede ver tasas estabilizadas en Arica y Parinacota, Valparaíso, Atacama, Ñuble, Araucanía, Maule y Los Lagos. Se muestran en crecimiento Arica y Parinacota (leve), Biobío (sostenido). Con tasas es descenso vemos a Tarapacá, Antofagasta, Metropolitana, O’Higgins, Los Ríos y la tasa total.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Hoy, aparecen como aceleradas Biobío, Valparaíso, Arica y Parinacota y Atacama, en tanto que el resto se muestran desaceleradas.

Casos nuevos

Se puede apreciar que en los últimos 15 días hay una tendencia a la desaceleración de nuevos casos, tanto en la serie total como en la Metropolitana.

Usando escala logarítmica en el eje Y, se puede apreciar con mayor claridad la estabilización en la tasa de casos nuevos. Se puede observar que esta desaceleración es comparable a la que se produjo con las primeras medidas, a fines de Marzo.

Una vez eliminada la tendencia, se puede determinar cuales son los días de la semana donde se observan más o menos casos. El día domingo ha sufrido fuertes fluctuaciones en el último es, siendo el día que parece mejor representar la tendencia el sábado.

Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta (posible mitigación), Tacapacá, O’Higgins, Valparaíso.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Solo se observa Magallanes.
  • Mitigación incompleta con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Coquimbo, Biobío, Maule, Araucanía, Los Ríos y Ñuble, Arica y Parinacota, Atacama y Los Lagos.

Usando la tasa de casos nuevos diarios vs los del día anterior, se pueden ver procesos de estabilización de tasa en Valparaíso, Metropolitana, Araucanía y Tarapacá.Se pueden ver fuertes oscilaciones en Maule y Ñuble.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático bajo procesos estables. El día de hoy se elimina, porque no converge.

Si observamos la predicción realizada hace 3 días, podemos ver que hoy T+AR(4) se acerca más al valor esperado que T+AR(1). De todos modos, en ambos casos se mantiene el intervalo de confianza.

  casos li ls
Observado 113628 NA NA
Casos nuevos : Tendencia + AR(1) 114881 107084 131048
Casos nuevos: Tendencia + AR(4) 114446 107608 127340

En una semana más los modelos predicen entre 146310 y 154187 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
82 93 117558 115891 120452
83 94 122533 118666 129375
84 95 126799 120747 138115
85 96 131828 123164 148582
86 97 136382 125222 158656
87 98 141500 127514 170089
88 99 146310 129600 181174
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
82 93 118777 116392 123219
83 94 124134 118954 134421
84 95 129704 121509 146565
85 96 135489 124119 159388
86 97 141495 126811 172787
87 98 147726 129596 186725
88 99 154187 132482 201195

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

Ambos modelos predicen cerca de 170.000 casos para una semana más.

fecha Casos nuevo: Tendencia + AR(1) Casos nuevo: Tendencia + AR(4)
2020-06-03 120118 119478
2020-06-04 127493 126034
2020-06-05 135531 133430
2020-06-06 144194 141494
2020-06-07 153502 150232
2020-06-08 163502 159655
2020-06-09 174250 169754

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra una máxima en la serie, con 24909 casos, llevando el número de disponibles a 330, nuevamente por el aumento de ventiladores totales.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-28 2479 346 2133
2020-05-29 2518 345 2173
2020-05-30 2544 345 2173
2020-05-31 2576 313 2263
2020-06-01 2604 286 2318
2020-06-02 2739 340 2399
2020-06-03 2739 330 2409

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1475.

Uso de camas UCI Covid-19
fecha total
2020-05-28 1289
2020-05-29 1350
2020-05-30 1371
2020-05-31 1383
2020-06-01 1446
2020-06-02 1451
2020-06-03 1475

Al analizar la serie por regiones, vemos que el decrecimiento en camas se puede atribuir a la saturación de la RM, que está a un 97% de capacidad. El crecimiento se explica ahora por Valparaíso, principalmente, que sigue a 84% de capacidad.

En las otras regiones, aparte de Valparaíso, destaca Antofagasta, Maule y Biobío.

Decesos

Recordemos que la cifra de decesos para el día 2 de Junio surge de interpolación lineal de los datos regionales.

Si observamos la serie de decesos por día, desde los 4 casos (se excluye Coquimbo), se observa un proceso de desaceleración respecto del incremento brusco observado hace 20 días en la Región Metropolitana, y más leve en la serie total.

Si analizamos la tasa de decesos diarios, vemos un brusco paso de 60 a cerca de 80, asumimos que por el cambio de criterio del MINSAL.

Modelo dinámico linear de decesos basado en casos

Simplificaremos el modelo de decesos basados en casos, utilizando directamente el número de decesos contra el de casos. En las pruebas realizadas se puede observar que es necesario incrementar hasta el log 22 para llegar a resultados más fiables. Como coeficientes significativos tenemos el número de decesos del día anterior y el lag 11.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.232 0.581 -0.398 0.692
L(chile.decesos.ts) 0.428 0.134 3.189 0.003
L(chile.casos.ts, 0:22)0 0 0.002 -0.006 0.995
L(chile.casos.ts, 0:22)1 0.003 0.002 1.724 0.092
L(chile.casos.ts, 0:22)2 0.003 0.003 1.126 0.266
L(chile.casos.ts, 0:22)3 -0.002 0.003 -0.724 0.473
L(chile.casos.ts, 0:22)4 -0.002 0.003 -0.711 0.481
L(chile.casos.ts, 0:22)5 -0.002 0.003 -0.836 0.408
L(chile.casos.ts, 0:22)6 0.001 0.003 0.235 0.816
L(chile.casos.ts, 0:22)7 0.001 0.003 0.217 0.83
L(chile.casos.ts, 0:22)8 -0.005 0.003 -1.404 0.167
L(chile.casos.ts, 0:22)9 -0.001 0.003 -0.158 0.875
L(chile.casos.ts, 0:22)10 0.001 0.003 0.275 0.785
L(chile.casos.ts, 0:22)11 0.007 0.003 2.567 0.014
L(chile.casos.ts, 0:22)12 0.001 0.003 0.4 0.691
L(chile.casos.ts, 0:22)13 -0.005 0.003 -1.572 0.123
L(chile.casos.ts, 0:22)14 0.003 0.003 1.028 0.309
L(chile.casos.ts, 0:22)15 0.008 0.004 1.97 0.055
L(chile.casos.ts, 0:22)16 0.007 0.005 1.401 0.168
L(chile.casos.ts, 0:22)17 -0.008 0.005 -1.482 0.145
L(chile.casos.ts, 0:22)18 0.002 0.005 0.425 0.673
L(chile.casos.ts, 0:22)19 0.002 0.005 0.332 0.742
L(chile.casos.ts, 0:22)20 0.006 0.005 1.06 0.295
L(chile.casos.ts, 0:22)21 0 0.005 -0.07 0.945
L(chile.casos.ts, 0:22)22 -0.008 0.005 -1.704 0.095
R² Ajustado
0.974

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general.

Para la serie de decesos, se mantiene el exceso de cifras con 1.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.