setwd("~/PROBABILIDAD Y ESTADISTICA 2020")

#cargar las bibliotecas con el paquete pacman
library(pacman)
library(gifski)
library(gganimate)
## Loading required package: ggplot2
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
p_load(readr,tidyverse,plotly)

#Leer datos de la direccion general de epidemiologia  (DGE)
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")

#dar formato a los datos diarios (absolutos) de Jalisco
Jalisco <- t(datos[datos$nombre=="JALISCO" ,])
Jalisco <- as.vector(Jalisco)
Jalisco <- Jalisco[4:153] #filtrar datos
Jalisco <- as.numeric(Jalisco) #para convertir a numerico
Jalisco <- as.vector(Jalisco)
cJalisco <- cumsum(Jalisco) #Datos acumulados diarios

#estadistica descriptiva
#figura 1 
plot(Jalisco)  #grafico de puntos de datos absolutos

summary(Jalisco)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    5.00   21.45   21.50  207.00
boxplot(Jalisco)

hist(Jalisco)

#dar formato a los datos diarios (absolutos) de Puebla 
Puebla <- t(datos[datos$nombre=="PUEBLA" ,])
Puebla <- as.vector(Puebla)
Puebla <- Puebla [4:153] #filtrar datos
Puebla <- as.numeric(Puebla) #para convertir a numerico
Puebla <- as.vector(Puebla)
cPuebla <- cumsum(Puebla) #Datos acumulados diarios

plot(Puebla)  #grafico de puntos de datos absolutos

plot(cPuebla)

#Construir un vector de Fechas
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-06-09"), by= "day")

#crear un arreglo matricial (marco de datos "data frame", "tibble")
JaPu <- data.frame(Fecha, Jalisco, Puebla) #datos absolutos
cJaPu <- data.frame(Fecha, cJalisco, cPuebla) #datos acumulados

#grafica para Jalisco de datos absolutos con ggplot
ggplot(data = JaPu) +
  ggtitle("Casos diarios COVID-19 en Jalisco (DGE)") +
  geom_line (mapping = aes(x= Fecha, y= Jalisco))

#grafica para Puebla de datos absolutos con ggplot
ggplot(data = JaPu) +
  ggtitle("Casos diarios COVID-19 en Puebla (DGE)") +
  geom_line (mapping = aes(x= Fecha, y= Puebla))

#Animación gráfica comparativa de frecuencias acumuladas
#por fechas para los estados de Jalisco y Puebla
#codificado por color

ggplot(data = cJaPu) + 
  ggtitle('COVID-19 en Jalisco y Puebla') +
  geom_line(aes(Fecha, cJalisco, colour = 'Jalisco')) +
  geom_line(aes(Fecha, cPuebla, colour = 'Puebla')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour = "Estados") 

#transition_reveal(Fecha)

gJaPu <- ggplot(data = cJaPu) +
  ggtitle('COVID-19 en Jalisco y Puebla') +
  geom_line(aes(Fecha, cJalisco, colour = 'Jalisco')) +
  geom_line(aes(Fecha, cPuebla, colour = 'Puebla')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour = "Estados")

#ggplotly(gJaPu)