#ejercicio 5
setwd("~/PyE")
#cargar las bibliotecas con el paquete pacman
library(pacman)
p_load(readr, tidyverse, plotly, gganimate, gifski)
#Leer datos de la direccion general de epidemiologia(DGE)
#tomados de :
#https://coronavirus.gob.mx/datos/#DownZCSV
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")
#dar formato a los datos diarios (absolutos) de Sonora
Sonora <- t(datos[datos$nombre=="SONORA" ,])
Sonora <- as.vector(Sonora)
Sonora <- Sonora[4:153] #filtrar datos
Sonora <- as.numeric(Sonora)#para convertir a numerico
Sonora <- as.vector(Sonora)
cSonora <- cumsum(Sonora)
#estadistica descriptiva
#figura 1
plot(Sonora) #grafico de puntos

plot(cSonora)

summary(Sonora)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 1.00 22.07 17.75 182.00
boxplot(Sonora)

hist(Sonora)

#dar formato a los datos diarios (absolutos) de Sinaloa
Sinaloa <- t(datos[datos$nombre=="SINALOA" ,])
Sinaloa <- as.vector(Sinaloa)
Sinaloa <- Sinaloa[4:153] #filtrar datos
Sinaloa <- as.numeric(Sinaloa)#para convertir a numerico
Sinaloa <- as.vector(Sinaloa)
cSinaloa <- cumsum(Sinaloa)
plot(Sinaloa)

plot(cSinaloa)

#Construir un vector de fechas
Fecha <- seq( from = as.Date("2020-01-12"), to = as.Date("2020-06-09"), by= "day")
#Crear un arreglo matricial (marco de datos "data frame", "tibble")
SonSin <- data.frame(Fecha, Sonora, Sinaloa)
cSonSin <- data.frame(Fecha, cSonora, cSinaloa)
#grafica para sonora de datos absolutos con ggplot
ggplot(data = SonSin)+
ggtitle("Casos diarios Covid-19 en Sonora (DGE)")+
geom_line(mapping = aes(x=Fecha, y=Sonora))

#grafica para sinaloa de datos absolutos con ggplot
ggplot(data = SonSin)+
ggtitle("Casos diarios Covid-19 en Sonora (DGE)")+
geom_line(mapping = aes(x=Fecha, y=Sinaloa))

#animacion grafica comparativa de frecuencias acumuladas
#por fechas para los estados de Sonora y Sinaloa
ggplot(data= cSonSin)+
geom_line(aes(Fecha, cSinaloa, colour= 'Sinaloa'))+
geom_line(aes(Fecha, cSonora, colour= 'Sonora'))+
xlab('Fecha')+
ylab('Casos diarios acumulados')+
labs(colour="Estados")+
transition_reveal(Fecha)

gSinSon <- ggplot(data= cSonSin)+
ggtitle('COVID-19 en Sonora y Sinaloa')+
geom_line(aes(Fecha, cSinaloa, colour= 'Sinaloa'))+
geom_line(aes(Fecha, cSonora, colour= 'Sonora'))+
xlab('Fecha')+
ylab('Casos diarios acumulados')+
labs(colour="Estados")
ggplotly(gSinSon)