Análisis de salidas

¿Cuanto se tarda en llegar a una salida de la situación? Trazaremos los casos frente al las altas y fallecimientos.

ggplot(data,aes(x=Fecha))+geom_line(aes(y=casos,color="Casos"))+geom_line(aes(y=salidas,color="Salidas"))+theme_tufte()

Cabe notar que las primeras salidas no se dieron hasta pasar más de dos semanas desde los primeros casos, lo que posiblemente quiere decir que hay muchas altas que no se están teniendo en cuenta (o fallecimientos).

También la correlación

ccf(data$casos,data$salidas,na.action = na.pass)

Esta correlación indica que hay una correlación positiva entre casos en lags de -4 a 0; los casos preceden a las salidas hasta por 4 días, y luego una negativa entre salidas y casos que era inicialmente entre 4 y 8 días, y ahora es entre 7 y 11 dias. Ni el desplazamiento ni la correlación negativa es fácil de interpretar.

Análisis inicial

Una de los parámetros que es interesante conocer es el cambio con respecto al día anterior. Empezaremos por los casos nuevos

ggplot(data,aes(x=Fecha,y=Casos.nuevos),na.rm = TRUE)+geom_line()+geom_point()+theme_tufte()

Las nuevas altas por día

ggplot(data,aes(x=Fecha,y=Altas.nuevas),na.rm = TRUE)+geom_line()+theme_tufte()

Hay una curiosa periodicidad en este gráfico. Vamos a analizar la autocorrelación:

acf(data$Altas.nuevas,na.action = na.pass)

Mientras que hasta el día 20 aparecía una cierta periodicidad de unos dos días, a partir del día 21 prácticamente ha desaparecido. Hay una cierta correlación cada tres días, pero es muy débil.

Los nuevos fallecimientos por día

ggplot(data,aes(x=Fecha,y=Fallecimientos.nuevos),na.rm = TRUE)+geom_line()+theme_tufte()

que también aparentan tener una cierta periodicidad, como se puede ver en el siguiente gráfico de correlación

acf(data$Fallecimientos.nuevos,na.action = na.pass)

Esta es de uno o incluso dos días, pero la situación puede cambiar en el futuro, aunque en los últimos días es bastante estable.

Desde mediados de marzo se publican también las hospitalizaciones, aunque de forma bastante irregular.

ggplot(data,aes(x=Fecha,y=hospitalizados),na.rm = TRUE)+geom_point()+geom_line()+theme_tufte()
## Warning: Removed 22 rows containing missing values (geom_point).
## Warning: Removed 21 row(s) containing missing values (geom_path).

Autocorrelaciones

Esta es la autocorrelación de casos, es decir, la relación que hay entre los casos un día y el siguiente:

acf(data$casos)

Pero también puede ser interesante ver cuál es la autocorrelación de esta serie temporal, como influyen los casos cada día en los siguientes.

acf(data$Casos.nuevos,na.action = na.pass)

Esta es la correlación entre casos y fallecimientos

ccf(data$casos,data$fallecimientos,na.action = na.pass)

Parece que el el lag, que era inicalmente entre uno y dos días, se ha ampliado ahora hasta los 4 días.

Y entre casos y curaciones

ccf(data$casos,data$altas,na.action = na.pass)

En este caso hay también un lag de un día; los casos de cada día están correlacionados con las altas del siguiente.

Una veremos como se correlaciona los datos de ingresos en la UCI

ccf(data$casos,data$ingresos_uci,na.action = na.pass)

Y entre ingresos en la UCI y fallecimientos

ccf(data$ingresos_uci,data$fallecimientos,na.action = na.pass)

Correlación entre diferencias

Quizás sea más interesante establecer correlaciones entre diferencias, porque los datos acumulados tienen más información.

ccf(data$Casos.nuevos,data$Fallecimientos.nuevos,na.action = na.pass)

ccf(data$Casos.nuevos,data$Uci.nuevos,na.action = na.pass)

ccf(data$Casos.nuevos,data$Altas.nuevas,na.action = na.pass)

O quizás el dato más revelador:

ccf(data$Uci.nuevos,data$Fallecimientos.nuevos,na.action = na.pass)

Los fallecimientos predicen ingresos en la UCI durante los dos días siguinetes, y al revés. Aparentemente, esa es la duración de tiempo en la UCI.

Reconocimientos

Este fichero está generado a partir de los datos elaborados por Datadista y tiene una licencia libre. Se puede generar con nuevos datos usando el script en este repositorio.