setwd("~/PROBABILIDAD Y ESTADISTICA (R Studio)")

#cargar las bibliotecas en el paquete pacman
library(pacman)
library(gifski)
library(gganimate)
## Loading required package: ggplot2
p_load(readr, tidyverse, plotly)

#leer datos de la direccion general de epidemiologia (DEG)

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")

#Dar formato a los datos (absolutos) de Queretaro
Queretaro <- t(datos[datos$nombre=="QUERETARO" ,])
Queretaro <- as.vector(Queretaro)
Queretaro <- Queretaro[4:153] #Filtrar datos
Queretaro <- as.numeric(Queretaro) #Para convertir a numerico
Queretaro <- as.vector(Queretaro)
cQueretaro <- cumsum(Queretaro) #Datos acumulados diarios

#estadistica descriptiva
#figura 1
plot(Queretaro) #grafico de puntos de datos

summary(Queretaro)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    1.50    8.38    9.00   60.00
boxplot(Queretaro)

hist(Queretaro)

#Dar formato a los datos (absolutos) de Zacatecas
Zacatecas <- t(datos[datos$nombre=="ZACATECAS" ,])
Zacatecas <- as.vector(Zacatecas)
Zacatecas <- Zacatecas[4:153] #Filtrar datos
Zacatecas <- as.numeric(Zacatecas) #Para convertir a numerico
Zacatecas <- as.vector(Zacatecas)
cZacatecas <- cumsum(Zacatecas) #Datos acumulados diarios

plot(Zacatecas)
plot(Zacatecas)

#construir un vector de flechas
Fecha <- seq( from = as.Date("2020-01-12"), to = as.Date("2020-06-09"), by= "day")

#crear un arreglo matricial (marco de datos "data frame", "tibble")
QueZac <- data.frame(Fecha, Queretaro, Zacatecas) #Datos absolutos
cQueZac <- data.frame(Fecha, cQueretaro, cZacatecas) #datos acumulados

#Grafica para Queretaro de datos absolutos de ggplot
ggplot(data = QueZac) +
  ggtitle("Casos diarios COVID-19 en Queretaro (DGE)") +
  geom_line(mapping = aes(x= Fecha, y= Queretaro))

#Grafica para Zacatecas de datos absolutos de ggpplot
ggplot(data = QueZac) +
  ggtitle("Casos diarios COVID-19 en Zacatecas (DGE)") +
  geom_line(mapping = aes(x= Fecha, y= Zacatecas))

#animacion grafica comparativa de frecuencias acumuladas 
#por fechas para los estados de Sonora y Sinaloa

gSonSin <- ggplot(data=cQueZac)+
  geom_line(aes(Fecha, cZacatecas, colour = 'Zacatecas')) +
  geom_line(aes(Fecha, cQueretaro, colour = 'Queretaro')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour ='Estados')

gSonSin <- ggplot(data=cQueZac)+
  geom_line(aes(Fecha, cZacatecas, colour = 'Zacatecas')) +
  geom_line(aes(Fecha, cQueretaro, colour = 'Queretaro')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour ='Estados')

ggplotly(gSonSin)
#Me intereso comparar estos estados ya que son ya que no estoy informado bien de lugares del sur
#que haya habido contagios y confirmados y tal es el caso de Queretaro que su incremento en casos
#son mas que en Zacatecas de abril a lo que estamos actualmente.