#Establecer folder de trabajo
setwd("~/proba")
#Cargar las bibliotecas con el paquete pacman
library(pacman)
library(gifski)
library(gganimate)
## Loading required package: ggplot2
p_load(readr,tidyverse,plotly)
#Leer datos de la direccion general de epidemiologia (DGE)
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")
#Dar formato a los datos diarios de Mexico
Mexico <- t(datos[datos$nombre=="MEXICO" ,])
Mexico <- as.vector(Mexico)
Mexico <- Mexico [4:153] #Filtrar datos
Mexico <- as.numeric(Mexico) #Para convertir a numerico
Mexico <- as.vector(Mexico)
cMexico <- cumsum(Mexico) #Datos acumulados
plot(Mexico) #Grafico de puntos de datos absolutos

summary(Mexico)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0 0.0 20.5 131.3 231.5 669.0
boxplot(Mexico)

hist(Mexico)

#Dar formato a los datos diarios de Zacatecas
Zac <- t(datos[datos$nombre=="ZACATECAS" ,])
Zac <- as.vector(Zac)
Zac <- Zac [4:153] #Filtrar datos
Zac <- as.numeric(Zac) #Para convertir a numerico
Zac <- as.vector(Zac)
cZac <- cumsum(Zac) #Datos acumulados
plot(Zac)

plot(cZac)

#Construir un vector de Fechas
Fecha <- seq( from = as.Date ("2020-01-12"), to = as.Date("2020-06-09"), by= "day")
#Crear un arreglo matricial (marco de datos "data frame", "tibble")
MeZac <- data.frame(Fecha, Mexico, Zac) #Datos absolutos
cMeZac <- data.frame(Fecha, Mexico, Zac) #Datos acumulados
#Grafica para Sonora de datos absolutos con ggplot
ggplot(data = MeZac)+
ggtitle("Casos Diarios COVID-19 en Mexico (DGE)") +
geom_line(mapping = aes(x= Fecha, y= Mexico))

ggplot(data = MeZac)+
ggtitle("Casos Diarios COVID-19 en Zacatecas (DGE)") +
geom_line(mapping = aes(x= Fecha, y= Zac))

#Animacion grafica comparativa de frecuencias acumuladas por fechas para los
#estados de Sonora y Sinaloa
#En este caso podemos observar y comparar como el estado con mas contagiados que
#es Mexico sube drasticamente a partir de mayo ya que no se implementaron las medidas
#de salud necesarias, por otra parte, Zacatecas, el estados con menos contagiados,
#no sube mucho por lo que singifica que la cantidad de contagiados es muy poca
ggplot(data=MeZac)+
geom_line(aes(Fecha, cMexico, colour = 'Mexico')) +
geom_line(aes(Fecha, cZac, colour = 'Zacatecas')) +
xlab('Fecha') +
ylab('Casos diarios acumulados') +
labs(colour = 'Estados') +
transition_reveal(Fecha)

#Dentro de esta ultima imagen ya podemos observar claramente el estado mas contagiado
#contra el estado con menos contagios, en Mexico la cantidad de enfermos sube de manera
#muy drastica y no parece tener fin, mientras que en Zacatecas solo sube un poco
#y se mantiene estable.
gMeZac <- ggplot(data=cMeZac) +
ggtitle("COVID-19 en Mexico y Zacatecas") +
geom_line(aes(Fecha, cMexico, colour = 'Mexico')) +
geom_line(aes(Fecha, cZac, colour = 'Zacatecas')) +
xlab('Fecha') +
ylab('Casos diarios acumulados') +
labs(colour = 'Estados')
gMeZac

ggplotly (gMeZac)
#Quise escoger estos dos estados ya que me parece interesante comparar los dos
#extremos de la situacion nacional, de manera que tenemos al estado con mas
#contagios y al estado mas sano. Dentro de las graficas podemos observar como
#Mexico sube mientras que Zacatecas permanece muy bajo y sin sobresalir.