Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile
Representación gráfica de discursos del gobierno: https://rpubs.com/clbustos/613302
Asumiendo que los procesos de cambio de los parámetros de la pandemia son lentos, cualquier cambio brusco en un modelo predictivo podría indicar cambios en la forma de medición o en parámetros de atención. Por tanto, se tiene a disposición un análisis gráfico de los cambios en la capacidad predictiva y los coeficientes para distintos modelos de regresión con datos disponibles: https://rpubs.com/clbustos/615858.
Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 2 de Junio de 2020.
Nota técnica: en el informe diario del 2 de Junio del MINSAL no se presentaron datos de fallecimientos para el día 1 de Junio, por los usuales cambios de criterio a los que nos tiene acostumbrados el Ministerio. El valor que se presenta en los análisis es un estimado lineal, en aquellos casos donde la cifra cambio entre el día 1 y 3 de Junio.
La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 17 casos , para facilitar la comparación desde un punto de un punto de partida común.
Si vemos la serie total, podemos ver una pequeña desaceleración para la última semana en la serie total. Por regiones, se puede apreciar que:
Con respecto a la tasa de casos totales del día vs del dia anterior, se usó el método STL para eliminar la fluctuación semanal. Se puede ver tasas estabilizadas en Arica y Parinacota, Valparaíso, Atacama, Ñuble, Araucanía, Maule y Los Lagos. Se muestran en crecimiento Arica y Parinacota (leve), Biobío (sostenido). Con tasas es descenso vemos a Tarapacá, Antofagasta, Metropolitana, O’Higgins, Los Ríos y la tasa total.
Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Hoy, aparecen como aceleradas Biobío, Valparaíso, Arica y Parinacota y Atacama, en tanto que el resto se muestran desaceleradas.
Se puede apreciar que en los últimos 15 días hay una tendencia a la desaceleración de nuevos casos, tanto en la serie total como en la Metropolitana.
Usando escala logarítmica en el eje Y, se puede apreciar con mayor claridad la estabilización en la tasa de casos nuevos. Se puede observar que esta desaceleración es comparable a la que se produjo con las primeras medidas, a fines de Marzo.
Una vez eliminada la tendencia, se puede determinar cuales son los días de la semana donde se observan más o menos casos. El día domingo ha sufrido fuertes fluctuaciones en el último es, siendo el día que parece mejor representar la tendencia el sábado.
Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.
Usando la tasa de casos nuevos diarios vs los del día anterior, se pueden ver procesos de estabilización de tasa en Valparaíso, Metropolitana, Araucanía y Tarapacá.Se pueden ver fuertes oscilaciones en Maule y Ñuble.
Para la predicción total se recorta la serie a partir de lo 50 casos.
Si observamos la predicción realizada hace 3 días, podemos ver que hoy T+AR(4) se acerca más al valor esperado que T+AR(1). De todos modos, en ambos casos se mantiene el intervalo de confianza.
| casos | li | ls | |
|---|---|---|---|
| Observado | 113628 | NA | NA |
| Casos nuevos : Tendencia + AR(1) | 114881 | 107084 | 131048 |
| Casos nuevos: Tendencia + AR(4) | 114446 | 107608 | 127340 |
En una semana más los modelos predicen entre 146310 y 154187 casos.
## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.
| dia | casos | li | ls | |
|---|---|---|---|---|
| 82 | 93 | 117558 | 115891 | 120452 |
| 83 | 94 | 122533 | 118666 | 129375 |
| 84 | 95 | 126799 | 120747 | 138115 |
| 85 | 96 | 131828 | 123164 | 148582 |
| 86 | 97 | 136382 | 125222 | 158656 |
| 87 | 98 | 141500 | 127514 | 170089 |
| 88 | 99 | 146310 | 129600 | 181174 |
| dia | casos | li | ls | |
|---|---|---|---|---|
| 82 | 93 | 118777 | 116392 | 123219 |
| 83 | 94 | 124134 | 118954 | 134421 |
| 84 | 95 | 129704 | 121509 | 146565 |
| 85 | 96 | 135489 | 124119 | 159388 |
| 86 | 97 | 141495 | 126811 | 172787 |
| 87 | 98 | 147726 | 129596 | 186725 |
| 88 | 99 | 154187 | 132482 | 201195 |
Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.
Ambos modelos predicen cerca de 170.000 casos para una semana más.
| fecha | Casos nuevo: Tendencia + AR(1) | Casos nuevo: Tendencia + AR(4) |
|---|---|---|
| 2020-06-03 | 120118 | 119478 |
| 2020-06-04 | 127493 | 126034 |
| 2020-06-05 | 135531 | 133430 |
| 2020-06-06 | 144194 | 141494 |
| 2020-06-07 | 153502 | 150232 |
| 2020-06-08 | 163502 | 159655 |
| 2020-06-09 | 174250 | 169754 |
El total de ventiladores ocupados muestra una máxima en la serie, con 24909 casos, llevando el número de disponibles a 330, nuevamente por el aumento de ventiladores totales.
| fecha | total | disponibles | ocupados |
|---|---|---|---|
| 2020-05-28 | 2479 | 346 | 2133 |
| 2020-05-29 | 2518 | 345 | 2173 |
| 2020-05-30 | 2544 | 345 | 2173 |
| 2020-05-31 | 2576 | 313 | 2263 |
| 2020-06-01 | 2604 | 286 | 2318 |
| 2020-06-02 | 2739 | 340 | 2399 |
| 2020-06-03 | 2739 | 330 | 2409 |
Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 1475.
| fecha | total |
|---|---|
| 2020-05-28 | 1289 |
| 2020-05-29 | 1350 |
| 2020-05-30 | 1371 |
| 2020-05-31 | 1383 |
| 2020-06-01 | 1446 |
| 2020-06-02 | 1451 |
| 2020-06-03 | 1475 |
Al analizar la serie por regiones, vemos que el decrecimiento en camas se puede atribuir a la saturación de la RM, que está a un 97% de capacidad. El crecimiento se explica ahora por Valparaíso, principalmente, que sigue a 84% de capacidad.
En las otras regiones, aparte de Valparaíso, destaca Antofagasta, Maule y Biobío.
Recordemos que la cifra de decesos para el día 2 de Junio surge de interpolación lineal de los datos regionales.
Si observamos la serie de decesos por día, desde los 4 casos (se excluye Coquimbo), se observa un proceso de desaceleración respecto del incremento brusco observado hace 20 días en la Región Metropolitana, y más leve en la serie total.
Si analizamos la tasa de decesos diarios, vemos un brusco paso de 60 a cerca de 80, asumimos que por el cambio de criterio del MINSAL.
Simplificaremos el modelo de decesos basados en casos, utilizando directamente el número de decesos contra el de casos. En las pruebas realizadas se puede observar que es necesario incrementar hasta el log 22 para llegar a resultados más fiables. Como coeficientes significativos tenemos el número de decesos del día anterior y el lag 11.
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | -0.232 | 0.581 | -0.398 | 0.692 |
| L(chile.decesos.ts) | 0.428 | 0.134 | 3.189 | 0.003 |
| L(chile.casos.ts, 0:22)0 | 0 | 0.002 | -0.006 | 0.995 |
| L(chile.casos.ts, 0:22)1 | 0.003 | 0.002 | 1.724 | 0.092 |
| L(chile.casos.ts, 0:22)2 | 0.003 | 0.003 | 1.126 | 0.266 |
| L(chile.casos.ts, 0:22)3 | -0.002 | 0.003 | -0.724 | 0.473 |
| L(chile.casos.ts, 0:22)4 | -0.002 | 0.003 | -0.711 | 0.481 |
| L(chile.casos.ts, 0:22)5 | -0.002 | 0.003 | -0.836 | 0.408 |
| L(chile.casos.ts, 0:22)6 | 0.001 | 0.003 | 0.235 | 0.816 |
| L(chile.casos.ts, 0:22)7 | 0.001 | 0.003 | 0.217 | 0.83 |
| L(chile.casos.ts, 0:22)8 | -0.005 | 0.003 | -1.404 | 0.167 |
| L(chile.casos.ts, 0:22)9 | -0.001 | 0.003 | -0.158 | 0.875 |
| L(chile.casos.ts, 0:22)10 | 0.001 | 0.003 | 0.275 | 0.785 |
| L(chile.casos.ts, 0:22)11 | 0.007 | 0.003 | 2.567 | 0.014 |
| L(chile.casos.ts, 0:22)12 | 0.001 | 0.003 | 0.4 | 0.691 |
| L(chile.casos.ts, 0:22)13 | -0.005 | 0.003 | -1.572 | 0.123 |
| L(chile.casos.ts, 0:22)14 | 0.003 | 0.003 | 1.028 | 0.309 |
| L(chile.casos.ts, 0:22)15 | 0.008 | 0.004 | 1.97 | 0.055 |
| L(chile.casos.ts, 0:22)16 | 0.007 | 0.005 | 1.401 | 0.168 |
| L(chile.casos.ts, 0:22)17 | -0.008 | 0.005 | -1.482 | 0.145 |
| L(chile.casos.ts, 0:22)18 | 0.002 | 0.005 | 0.425 | 0.673 |
| L(chile.casos.ts, 0:22)19 | 0.002 | 0.005 | 0.332 | 0.742 |
| L(chile.casos.ts, 0:22)20 | 0.006 | 0.005 | 1.06 | 0.295 |
| L(chile.casos.ts, 0:22)21 | 0 | 0.005 | -0.07 | 0.945 |
| L(chile.casos.ts, 0:22)22 | -0.008 | 0.005 | -1.704 | 0.095 |
| 0.974 |
Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford
Como ha sido la tónica desde que se implementó este análisis, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general.
Para la serie de decesos, se mantiene el exceso de cifras con 1.
Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.