¿Cuanto se tarda en llegar a una salida de la situación? Trazaremos los casos frente al las altas y fallecimientos.
ggplot(data,aes(x=Fecha))+geom_line(aes(y=casos,color="Casos"))+geom_line(aes(y=salidas,color="Salidas"))+theme_tufte()
Cabe notar que las primeras salidas no se dieron hasta pasar más de dos semanas desde los primeros casos, lo que posiblemente quiere decir que hay muchas altas que no se están teniendo en cuenta (o fallecimientos).
También la correlación
ccf(data$casos,data$salidas,na.action = na.pass)
Esta correlación indica que hay una correlación positiva entre casos en lags de -4 a 0; los casos preceden a las salidas hasta por 4 días, y luego una negativa entre salidas y casos que era inicialmente entre 4 y 8 días, y ahora es entre 7 y 11 dias. Ni el desplazamiento ni la correlación negativa es fácil de interpretar.
Una de los parámetros que es interesante conocer es el cambio con respecto al día anterior. Empezaremos por los casos nuevos
ggplot(data,aes(x=Fecha,y=Casos.nuevos),na.rm = TRUE)+geom_line()+geom_point()+theme_tufte()
Las nuevas altas por día
ggplot(data,aes(x=Fecha,y=Altas.nuevas),na.rm = TRUE)+geom_line()+theme_tufte()
Hay una curiosa periodicidad en este gráfico. Vamos a analizar la autocorrelación:
acf(data$Altas.nuevas,na.action = na.pass)
Mientras que hasta el día 20 aparecía una cierta periodicidad de unos dos días, a partir del día 21 prácticamente ha desaparecido. Hay una cierta correlación cada tres días, pero es muy débil.
Los nuevos fallecimientos por día
ggplot(data,aes(x=Fecha,y=Fallecimientos.nuevos),na.rm = TRUE)+geom_line()+theme_tufte()
que también aparentan tener una cierta periodicidad, como se puede ver en el siguiente gráfico de correlación
acf(data$Fallecimientos.nuevos,na.action = na.pass)
Esta es de uno o incluso dos días, pero la situación puede cambiar en el futuro, aunque en los últimos días es bastante estable.
Desde mediados de marzo se publican también las hospitalizaciones, aunque de forma bastante irregular.
ggplot(data,aes(x=Fecha,y=hospitalizados),na.rm = TRUE)+geom_point()+geom_line()+theme_tufte()
## Warning: Removed 22 rows containing missing values (geom_point).
## Warning: Removed 21 row(s) containing missing values (geom_path).
Esta es la autocorrelación de casos, es decir, la relación que hay entre los casos un día y el siguiente:
acf(data$casos)
Pero también puede ser interesante ver cuál es la autocorrelación de esta serie temporal, como influyen los casos cada día en los siguientes.
acf(data$Casos.nuevos,na.action = na.pass)
Esta es la correlación entre casos y fallecimientos
ccf(data$casos,data$fallecimientos,na.action = na.pass)
Parece que el el lag, que era inicalmente entre uno y dos días, se ha ampliado ahora hasta los 4 días.
Y entre casos y curaciones
ccf(data$casos,data$altas,na.action = na.pass)
En este caso hay también un lag de un día; los casos de cada día están correlacionados con las altas del siguiente.
Una veremos como se correlaciona los datos de ingresos en la UCI
ccf(data$casos,data$ingresos_uci,na.action = na.pass)
Y entre ingresos en la UCI y fallecimientos
ccf(data$ingresos_uci,data$fallecimientos,na.action = na.pass)
Quizás sea más interesante establecer correlaciones entre diferencias, porque los datos acumulados tienen más información.
ccf(data$Casos.nuevos,data$Fallecimientos.nuevos,na.action = na.pass)
ccf(data$Casos.nuevos,data$Uci.nuevos,na.action = na.pass)
ccf(data$Casos.nuevos,data$Altas.nuevas,na.action = na.pass)
O quizás el dato más revelador:
ccf(data$Uci.nuevos,data$Fallecimientos.nuevos,na.action = na.pass)
Los fallecimientos predicen ingresos en la UCI durante los dos días siguinetes, y al revés. Aparentemente, esa es la duración de tiempo en la UCI.
Este fichero está generado a partir de los datos elaborados por Datadista y tiene una licencia libre. Se puede generar con nuevos datos usando el script en este repositorio.