#ejercicio 5
setwd("~/PyE")

#cargar las bibliotecas con el paquete pacman
library(pacman)
p_load(readr, tidyverse, plotly, gganimate, gifski)

#Leer datos de la direccion general de epidemiologia(DGE)
#tomados de :
#https://coronavirus.gob.mx/datos/#DownZCSV

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")

#dar formato a los datos diarios (absolutos) de Sonora

Sonora <- t(datos[datos$nombre=="SONORA" ,])
Sonora <- as.vector(Sonora)
Sonora <- Sonora[4:153] #filtrar datos
Sonora <- as.numeric(Sonora)#para convertir a numerico
Sonora <- as.vector(Sonora)
cSonora <- cumsum(Sonora)

#estadistica descriptiva
#figura 1
plot(Sonora) #grafico de puntos 

plot(cSonora)

summary(Sonora)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    1.00   22.07   17.75  182.00
boxplot(Sonora)

hist(Sonora)

#dar formato a los datos diarios (absolutos) de Sinaloa

Sinaloa <- t(datos[datos$nombre=="SINALOA" ,])
Sinaloa <- as.vector(Sinaloa)
Sinaloa <- Sinaloa[4:153] #filtrar datos
Sinaloa <- as.numeric(Sinaloa)#para convertir a numerico
Sinaloa <- as.vector(Sinaloa)
cSinaloa <- cumsum(Sinaloa)

plot(Sinaloa)

plot(cSinaloa)

#Construir un vector de fechas
Fecha <- seq( from = as.Date("2020-01-12"), to = as.Date("2020-06-09"), by= "day")

#Crear un arreglo matricial (marco de datos "data frame", "tibble")
SonSin <- data.frame(Fecha, Sonora, Sinaloa)
cSonSin <- data.frame(Fecha, cSonora, cSinaloa)

#grafica para sonora de datos absolutos con ggplot

ggplot(data = SonSin)+
  ggtitle("Casos diarios Covid-19 en Sonora (DGE)")+
  geom_line(mapping = aes(x=Fecha, y=Sonora))

#grafica para sinaloa de datos absolutos con ggplot
ggplot(data = SonSin)+
  ggtitle("Casos diarios Covid-19 en Sonora (DGE)")+
  geom_line(mapping = aes(x=Fecha, y=Sinaloa))

#animacion grafica comparativa de frecuencias acumuladas
#por fechas para los estados de Sonora y Sinaloa

ggplot(data= cSonSin)+
  geom_line(aes(Fecha, cSinaloa, colour= 'Sinaloa'))+
  geom_line(aes(Fecha, cSonora, colour= 'Sonora'))+
  xlab('Fecha')+
  ylab('Casos diarios acumulados')+
  labs(colour="Estados")+
  transition_reveal(Fecha)

gSinSon <- ggplot(data= cSonSin)+
  ggtitle('COVID-19 en Sonora y Sinaloa')+
  geom_line(aes(Fecha, cSinaloa, colour= 'Sinaloa'))+
  geom_line(aes(Fecha, cSonora, colour= 'Sonora'))+
  xlab('Fecha')+
  ylab('Casos diarios acumulados')+
  labs(colour="Estados")

ggplotly(gSinSon)