#Ejercicio 5
setwd("~/Probabilidad y Estadistica")

#cargar las bibliotecas con el paquete pacman
library(pacman)
library(gifski)
library(gganimate)
## Loading required package: ggplot2
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
p_load(readr,tidyverse,plotly)

#Leer datos de la dirección general de epidemiologÃa (DGE)

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")

#dar formato a los datos diarios (absolutos) de Sonora
Queretaro <- t(datos[datos$nombre=="QUERETARO" ,])
Queretaro <- as.vector(Queretaro)
Queretaro <- Queretaro[4:153] #filtrar datos
Queretaro <- as.numeric(Queretaro) #para convertir a numérico
Queretaro <- as.vector(Queretaro)
cQueretaro <- cumsum(Queretaro) #Datos acumulados diarios

#estadÃstica descriptiva
#figura 1 
plot(Queretaro)  #gráfico de puntos de datos absolutos

summary(Queretaro)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    1.50    8.38    9.00   60.00
boxplot(Queretaro)

hist(Queretaro)

#dar formato a los datos diarios (absolutos) de Durango
Durango <- t(datos[datos$nombre=="DURANGO" ,])
Durango<- as.vector(Durango)
Durango <- Durango [4:153] #filtrar datos
Durango <- as.numeric(Durango) #para convertir a numE©rico
Durango<- as.vector(Durango)
cDurango <- cumsum(Durango) #Datos acumulados diarios

plot(Durango)

plot(cDurango)

#Construir un vector de Fechas
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-06-09"), by= "day")

#crear un arreglo matricial (marco de datos "data frame", "tibble")
QueDur <- data.frame(Fecha, Queretaro, Durango) #datos absolutos
cQueDur <- data.frame(Fecha, cQueretaro, cDurango) #datos acumulados

#grafica para Queretaro de datos absolutos con ggplot
ggplot(data = QueDur) +
  ggtitle("Casos diarios COVID-19 en Queretaro (DGE)") +
  geom_line (mapping = aes(x= Fecha, y= Queretaro))

#grafica para Durango de datos absolutos con ggplot
ggplot(data = QueDur) +
  ggtitle("Casos diarios COVID-19 en Durango (DGE)") +
  geom_line (mapping = aes(x= Fecha, y= Durango))

#animacion grafica comparativa de frecuencias acumuladas
#por fechas para los estados de Queretaro y Durango
#codificados por color 

ggplot(data=cQueDur)+
  geom_line(aes(Fecha, cDurango, colour = 'Durango')) +
  geom_line(aes(Fecha, cQueretaro, colour = 'Queretaro')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour ='Estados') +
  transition_reveal(Fecha)

gQueDur <- ggplot(data=cQueDur)+
  ggtitle('COVID-19 en Queretaro y Durango') +
  geom_line(aes(Fecha, cDurango, colour = 'Durango')) +
  geom_line(aes(Fecha, cQueretaro, colour = 'Queretaro')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour ='Estados') 

gQueDur

ggplotly(gQueDur)
#Esta grafica indica los casos de COVID-19
#en 2 estados diferentes, los cuales son Durango y Queretaro
#en el periodo Enero-12-2020 a Junio-9-2020.
#Dada la grafica, Queretaro muestra aun mas casos de COVID-19
#en comparacion a Durango