#Establecer folder de trabajo 
setwd("~/proba")

#Cargar las bibliotecas con el paquete pacman 

library(pacman)
library(gifski)
library(gganimate)
## Loading required package: ggplot2
p_load(readr,tidyverse,plotly)

#Leer datos de la direccion general de epidemiologia (DGE)

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")

#Dar formato a los datos diarios de Mexico
Mexico <- t(datos[datos$nombre=="MEXICO" ,])
Mexico <- as.vector(Mexico)
Mexico <- Mexico [4:153] #Filtrar datos
Mexico <- as.numeric(Mexico) #Para convertir a numerico
Mexico <- as.vector(Mexico)
cMexico <- cumsum(Mexico) #Datos acumulados

plot(Mexico) #Grafico de puntos de datos absolutos

summary(Mexico)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0     0.0    20.5   131.3   231.5   669.0
boxplot(Mexico)

hist(Mexico)

#Dar formato a los datos diarios de Zacatecas
Zac <- t(datos[datos$nombre=="ZACATECAS" ,])
Zac <- as.vector(Zac)
Zac <- Zac [4:153] #Filtrar datos
Zac <- as.numeric(Zac) #Para convertir a numerico
Zac <- as.vector(Zac)
cZac <- cumsum(Zac) #Datos acumulados

plot(Zac)

plot(cZac)

#Construir un vector de Fechas
Fecha <- seq( from = as.Date ("2020-01-12"), to = as.Date("2020-06-09"), by= "day")

#Crear un arreglo matricial (marco de datos "data frame", "tibble")
MeZac <- data.frame(Fecha, Mexico, Zac) #Datos absolutos
cMeZac <- data.frame(Fecha, Mexico, Zac) #Datos acumulados

#Grafica para Sonora de datos absolutos con ggplot

ggplot(data = MeZac)+
  ggtitle("Casos Diarios COVID-19 en Mexico (DGE)") +
  geom_line(mapping = aes(x= Fecha, y= Mexico)) 

ggplot(data = MeZac)+
  ggtitle("Casos Diarios COVID-19 en Zacatecas (DGE)") +
  geom_line(mapping = aes(x= Fecha, y= Zac)) 

#Animacion grafica comparativa de frecuencias acumuladas por fechas para los
#estados de Sonora y Sinaloa

#En este caso podemos observar y comparar como el estado con mas contagiados que
#es Mexico sube drasticamente a partir de mayo ya que no se implementaron las medidas 
#de salud necesarias, por otra parte, Zacatecas, el estados con menos contagiados,
#no sube mucho por lo que singifica que la cantidad de contagiados es muy poca
ggplot(data=MeZac)+
  geom_line(aes(Fecha, cMexico, colour = 'Mexico')) +
  geom_line(aes(Fecha, cZac, colour = 'Zacatecas')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour = 'Estados') +
  transition_reveal(Fecha)

#Dentro de esta ultima imagen ya podemos observar claramente el estado mas contagiado
#contra el estado con menos contagios, en Mexico la cantidad de enfermos sube de manera
#muy drastica y no parece tener fin, mientras que en Zacatecas solo sube un poco
#y se mantiene estable.

gMeZac <- ggplot(data=cMeZac) +
  ggtitle("COVID-19 en Mexico y Zacatecas") +
  geom_line(aes(Fecha, cMexico, colour = 'Mexico')) +
  geom_line(aes(Fecha, cZac, colour = 'Zacatecas')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour = 'Estados')
gMeZac

ggplotly (gMeZac)
#Quise escoger estos dos estados ya que me parece interesante comparar los dos
#extremos de la situacion nacional, de manera que tenemos al estado con mas
#contagios y al estado mas sano. Dentro de las graficas podemos observar como
#Mexico sube mientras que Zacatecas permanece muy bajo y sin sobresalir.