NOTA: Lo que presento aquí es un ejemplo de como realizar análisis de series de tiempo, usando datos de la evolución total de casos disponible en fuentes públicas en internet. No tiene ninguna validez epidemiológica, ya que eso requería un modelo de la diseminación de la enfermedad. En particular, las predicciones son solo válidas en cuanto no existan cambios en las políticas públicas; si los hay, se esperaría que (ojalá) las predicciones fuesen incorrectas.
Una primera forma de analizar los datos es mirar las tasas de crecimiento en función de la aparición del primer caso. Resulta muy difícil establecer comparaciones razonables, particularmente porque la diseminación de enfermedades suele presentar una distribución exponencial.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Si mostramos el gráfico considerando el logaritmo de los casos, es más fácil visualizar la evolución en cada país. En el caso de Italia, se puede observar el explosivo crecimiento entre el día 5 a 10, lo sostenido del crecimiento en España, así como lo estable de las curvas para Chile y Brasil.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Ahora bien, se puede observar que existen diferencias notables por país en la detección de los primeros casos, que dificulta comparar la evolución de cada país. Por tanto, visualicemos los datos desde el momento en que cada país tiene al menos 20 casos.
Desde esta perspectiva, se puede observar claramente como la curva de Italia es mucho más fuerte que la del resto de los países durante los primeros 16 días; gracias a las medidas de contención, podemos ver que esta curva ha disminuido. Pareciera que estas medidas permitirían que España lograra un número de casos similar al largo plazo que Italia.
Las curvas de Chile y Brasil son muy similares. Sin embargo, debemos considerar que la población de España (46.6 millones) es más de 2 veces mayor que la chilena (18 millones) y que la brasileña es un orden de magnitud mayor (209.3 millones). Por tanto, la evolución de Chile considerando la población total es extremadamente preocupante.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Si utilizamos una regresión exponencial, podemos ver que esta se ajusta bastante bien a la curva chilena y brasileña, más no a las españolas e italianas, que ya presentan efectos de las medidas de mitigación. Considerando el periodo comprendido desde que chile tiene 20 casos, el porcentaje de aumento diario llega a un 46%.
Se puede calcular la proporción de casos de un día respecto a los del día anterior, para estimar la tasa de crecimiento de la enfermedad. Como existen variaciones por día, se calcula el promedio por día usando media movil con una ventana de 3 días. Se grafica con una línea el 46% de crecimiento diario estimado para Chile en el periodo. Se puede apreciar claramente que España ha tenido mayor variabilidad en la tasa de nuevos casos, vs Italia que muestra un descenso sostenido.
NOTA: Nuevamente, les recuerdo que aquí se presentan, como ejemplo, dos metodologías para interpretar los datos. No tiene validez epidemiologica.
Una forma sencilla de extrapolar la información es utilizando una regresión exponencial. Como pudimos observar previamente, esta predicción se ajusta bien a los datos de Brasil y Chile, donde las medidas de mitigación/supresión llevan poco tiempo, vs las de España e Italia, donde las medidas de mitigación/supresión llevan más tiempo.
Otro método común para analizar series de tiempo es el modelo autorregresivo integrado de media móvil(ARIMA), el cual está diseñado para encontrar patrones en los datos que permita generar predicciones en el futuro. En nuestro caso, tras ajustar la serie de casos nuevos con un modelo exponencial, se ajustan lo que sobra de la predicción por un modelo AR(1) para todos los países. Esto es, se corrige la predicción de la tendencia consideando el valor del día previo; en Chile, por ejemplo, el reporte de casos de un día suele ser menor tras un reporte mayor a lo esperado el día previo, y viceversa.
Como podemos ver en los gráficos, el modelo exponencial y tendencia+AR(1) es muy similar para Chile y Brasil. En el caso de España e Italia, el modelo exponencial tiende a predecir mayores valores que el AR(1) con un evidente desajuste con respecto a los datos reales, lo que nos indicaría que este modelo no resulta válido para la serie completa.
A continuación, se presentan las predicciones para los próximos 7 días, usando tendencia de datos nuevos + AR(1), que tiende a ser bastante sensible a la evolución de los últimos días. Considerando lo breve de la escala de tiempo, el intervalo de confianza se vuelve muy grande pasado tres días para Chile y Brasil, no así para los países con línea de tiempo mayores.
## $Chile
##
##
## dia casos li ls
## --- ---- -------- ------- ------------
## 10 18 684.73 464.78 2476.24
## 11 19 936.06 476.96 7664.37
## 12 20 1443.76 485.67 37253.87
## 13 21 2078.52 489.01 157949.72
## 14 22 3192.97 490.54 967279.27
## 15 23 4749.01 491.02 6047039.51
## 16 24 7312.81 491.17 50436101.55
##
## $Italia
##
##
## dia casos li ls
## --- ---- --------- --------- ----------
## 29 35 46209.23 43826.44 50625.98
## 30 36 51950.76 46769.14 61828.33
## 31 37 58046.61 49762.61 74241.82
## 32 38 64538.72 52809.51 88074.74
## 33 39 71387.04 55871.52 103391.33
## 34 40 78566.68 58920.15 120299.64
## 35 41 86040.56 61924.73 138890.90
##
## $España
##
##
## dia casos li ls
## --- ---- --------- --------- ----------
## 23 35 22438.53 19567.91 30836.24
## 24 36 27642.04 21187.96 47549.66
## 25 37 33762.41 22906.35 69348.59
## 26 38 40884.74 24691.88 97758.86
## 27 39 49086.18 26510.23 134750.43
## 28 40 58431.35 28325.56 182858.70
## 29 41 68968.21 30102.47 245340.95
##
## $Brasil
##
##
## dia casos li ls
## --- ---- -------- ------- -------------
## 13 25 836.99 640.90 4.394646e+04
## 14 26 1077.45 641.21 2.301598e+05
## 15 27 1394.36 641.31 1.229829e+06
## 16 28 1795.82 641.33 7.533250e+06
## 17 29 2299.51 641.34 5.558439e+07
## 18 30 2920.62 641.34 4.938601e+08
## 19 31 3674.83 641.34 5.278530e+09
Ahora, la predicción por método exponencial, que tiende a funcionar bien para procesos sin cambios recientes.
## $Chile
##
##
## dia casos li ls
## --- ---- -------- -------- ---------
## 10 18 638.81 438.97 929.63
## 11 19 932.55 626.95 1387.11
## 12 20 1361.35 893.18 2074.92
## 13 21 1987.33 1269.80 3110.33
## 14 22 2901.14 1802.04 4670.60
## 15 23 4235.14 2553.65 7023.83
## 16 24 6182.54 3614.35 10575.57
##
## $Italia
##
##
## dia casos li ls
## --- ---- ---------- ---------- ----------
## 29 35 96765.09 33439.80 280010.1
## 30 36 122921.65 42159.25 358396.6
## 31 37 156148.58 53128.63 458931.1
## 32 38 198357.07 66922.98 587922.5
## 33 39 251974.94 84263.06 753490.0
## 34 40 320086.24 106052.00 966084.6
## 35 41 406608.69 133421.16 1239163.4
##
## $España
##
##
## dia casos li ls
## --- ---- ---------- ---------- ----------
## 23 35 36064.21 24314.52 53491.79
## 24 36 49726.63 33377.00 74085.08
## 25 37 68564.88 45802.80 102638.74
## 26 38 94539.72 62835.44 142240.73
## 27 39 130354.78 86176.73 197180.47
## 28 40 179737.86 118155.23 273417.43
## 29 41 247829.05 161956.50 379232.92
##
## $Brasil
##
##
## dia casos li ls
## --- ---- -------- -------- ---------
## 13 25 936.58 616.25 1423.42
## 14 26 1281.88 831.22 1976.89
## 15 27 1754.50 1119.50 2749.69
## 16 28 2401.37 1505.72 3829.77
## 17 29 3286.72 2022.75 5340.52
## 18 30 4498.50 2714.41 7455.20
## 19 31 6157.05 3639.12 10417.12
El modelo ARIMA(1,1,0) más deriva mantiene la tendencia del modelo exponencial, pero corrigiendo los errores estándar en función de la inestabilidad de las mediciones contiguas.
## $Chile
##
##
## dia casos li ls
## --- ---- -------- -------- ---------
## 10 18 679.88 500.41 923.70
## 11 19 944.67 676.65 1318.86
## 12 20 1405.38 936.39 2109.25
## 13 21 2011.02 1292.53 3128.90
## 14 22 2942.09 1805.84 4793.28
## 15 23 4250.31 2518.64 7172.58
## 16 24 6184.46 3533.11 10825.48
##
## $Italia
##
##
## dia casos li ls
## --- ---- ---------- --------- -----------
## 29 35 48182.81 35167.84 66014.39
## 30 36 57746.10 29003.23 114973.82
## 31 37 70559.86 22833.50 218043.41
## 32 38 87808.31 17415.34 442730.47
## 33 39 111178.36 12996.47 951075.92
## 34 40 143086.72 9556.96 2142292.13
## 35 41 187017.92 6961.52 5024149.72
##
## $España
##
##
## dia casos li ls
## --- ---- ---------- --------- ----------
## 23 35 24500.97 19334.59 31047.86
## 24 36 33478.67 23627.28 47437.59
## 25 37 45775.61 29684.37 70589.53
## 26 38 62592.52 37820.49 103589.96
## 27 39 85587.93 48610.54 150693.54
## 28 40 117031.51 62863.55 217874.63
## 29 41 160026.93 81671.20 313557.50
##
## $Brasil
##
##
## dia casos li ls
## --- ---- -------- -------- ---------
## 13 25 887.09 592.37 1328.45
## 14 26 1192.77 715.35 1988.81
## 15 27 1614.71 876.88 2973.37
## 16 28 2182.60 1090.76 4367.38
## 17 29 2951.21 1368.86 6362.73
## 18 30 3990.19 1729.31 9206.95
## 19 31 5395.04 2195.86 13255.12
Fuentes de información: