#U1A7
setwd("~/VERANOPYE")

#Cargar las bibliotecas con el paquete pacman
library(pacman)
p_load(readr, tidyverse, plotly, gganimate, gifski)

#Leer datos de la direccion general de epidemiología
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")

#Dar formato a los datos diarios (absolutos) de Jalisco
Jalisco <- t(datos[datos$nombre=="JALISCO" , ])
Jalisco <- as.vector(Jalisco)
Jalisco <- Jalisco[4:153]
Jalisco <- as.numeric(Jalisco)
Jalisco <- as.vector(Jalisco)
cJalisco <- cumsum(Jalisco) #Datos acumulados diarios

#Figura 1
plot(Jalisco) #Gráfico de puntos de datos absolutos

summary(Jalisco)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    5.00   21.45   21.50  207.00
boxplot(Jalisco)

hist(Jalisco)

#Dar formato a los datos diarios (absolutos) de Nuevo Leon
NuevoLeon <- t(datos[datos$nombre=="NUEVO LEON" , ])
NuevoLeon <- as.vector(NuevoLeon)
NuevoLeon <- NuevoLeon[4:153]
NuevoLeon <- as.numeric(NuevoLeon)
NuevoLeon <- as.vector(NuevoLeon)
cNuevoLeon <- cumsum(NuevoLeon) #Datos acumulados diarios

plot(NuevoLeon)

plot(cNuevoLeon)

#Construir un vector de fechas
Fecha <- seq(from=as.Date("2020-01-12"), to=as.Date("2020-06-09"), by="day")

#Crear un arreglo matricial (marco de datos "data frame", "tibble")
JalLeon <- data.frame(Fecha, Jalisco, NuevoLeon) #Datos absolutos
cJalLeon <- data.frame(Fecha, cJalisco, cNuevoLeon) #Datos acumulados

#Gráfica para Jalisco de datos absolutos con ggplot
ggplot(data=JalLeon) +
  ggtitle("Casos diarios COVID-19 en Jalisco (DGE)") +
  geom_line(mapping=aes(x=Fecha,y=Jalisco))

#Gráfica para Nuevo Leon de datos absolutos con ggplot
ggplot(data=JalLeon) +
  ggtitle("Casos diarios COVID-19 en Nuevo Leon (DGE)") +
  geom_line(mapping=aes(x=Fecha,y=NuevoLeon))

#Animación Gráfica comparativa de frecuencias acumuladas
#por fechas para Jalisco y Nuevo León

ggplot(data=cJalLeon) +
  geom_line(aes(Fecha, cNuevoLeon, colour='Nuevo Leon')) +
  geom_line(aes(Fecha, cJalisco, colour='Jalisco')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour='Estados') +
  transition_reveal(Fecha)

gJalLeon <- ggplot(data=cJalLeon) +
  ggtitle('COVID-19 en Nuevo Leon y Jalisco') +
  geom_line(aes(Fecha, cJalisco, colour='Jalisco')) +
  geom_line(aes(Fecha, cNuevoLeon, colour='Nuevo Leon')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour='Estados')

ggplotly(gJalLeon)
#CONCLUSIÓN:
#Se eligieron Jalisco y Nuevo León, porque son los estados con las capitales más importantes y pobladas en México (Monterrey y Guadalara), y así observar como han estado llevando la situación de la pandemia de COVID-19.
#En las gráficas se observa que ambos estados estuvieron teniendo los mismos contagios con casi la misma velocidad hasta el 20 de mayo, donde de ahí se desprenden y Jalisco continúa creciendo mucho más rápido que Nuevo León.
#Esto quiere decir que en Nuevo León se han estado llevando a cabo las mejores medidas y tratos para el COVID-19, a pesar de que ambas ciudades cuentan con las mismas capacidades.
#Actualmente Jalisco cuenta con 3218 infectados, mientras que Nuevo Leon cuenta con 2010 infectados. Lo cual es una gran diferencia, ya que ambos llevaban el mismo crecimiento.
#Nuevo Leon primero llegará a aplanar la curva antes que Jalisco.