#Introduccion
#En el siguiente ejercicio se busca utilizar nuevos comandos 
#para la elaboracion de graficas precisas que indiquen
#el incremento de COVID-19 en zonas de Mexico
#Trabajaremos con los estados de Baja California Norte y Colima
setwd("~/VERANOPYE")

#Cargar las bibliotecas con el paquete pacman
library(pacman)
library(gifski)
library(gganimate)
## Loading required package: ggplot2
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
p_load(readr,tidyverse,plotly)

#Leer datos de la direccion general de epidemiologia (DGE)

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")

#dar formato a los datos diarios (absolutos) de Baja California
BajaCalifornia <- t(datos[datos$nombre=="BAJA CALIFORNIA" ,])
BajaCalifornia <- as.vector(BajaCalifornia)
BajaCalifornia <- BajaCalifornia[4:153] #filtrar datos
BajaCalifornia <- as.numeric(BajaCalifornia) #para convertir a numerico
BajaCalifornia <- as.vector(BajaCalifornia)
cBajaCalifornia <- cumsum(BajaCalifornia) #Datos acumulados diarios

#estadistica descriptiva
#figura 1 
plot(BajaCalifornia)  #grafico de puntos de datos absolutos

summary(BajaCalifornia)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    7.00   41.98   85.75  183.00
boxplot(BajaCalifornia)

hist(BajaCalifornia)

#dar formato a los datos diarios (absolutos) de Colima
Colima <- t(datos[datos$nombre=="COLIMA" ,])
Colima <- as.vector(Colima)
Colima <- Colima [4:153] #filtrar datos
Colima <- as.numeric(Colima) #para convertir a numerico
Colima <- as.vector(Colima)
cColima <- cumsum(Colima) #Datos acumulados diarios

plot(Colima)

plot(cColima)

#Construir un vector de Fechas
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-06-09"), by= "day")

#crear un arreglo matricial (marco de datos "data frame", "tibble")
BajaCol <- data.frame(Fecha, BajaCalifornia, Colima) #datos absolutos
cBajaCol <- data.frame(Fecha, cBajaCalifornia, cColima) #datos acumulados

#grafica para Baja California de datos absolutos con ggplot
ggplot(data = BajaCol) +
  ggtitle("Casos diarios COVID-19 en Baja California (DGE)") +
  geom_line (mapping = aes(x= Fecha, y= BajaCalifornia))

#grafica para Colima de datos absolutos con ggplot
ggplot(data = BajaCol) +
  ggtitle("Casos diarios COVID-19 en Colima (DGE)") +
  geom_line (mapping = aes(x= Fecha, y= Colima))

#animacion grafica comparativa de frecuencias acumuladas
#por fechas para los estados de Baja California y Colima
#codificados por color 

ggplot(data=cBajaCol)+
  geom_line(aes(Fecha, cColima, colour = 'Colima')) +
  geom_line(aes(Fecha, cBajaCalifornia, colour = 'Baja California')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour ='Estados') +
  transition_reveal(Fecha)

gBajaCol <- ggplot(data=cBajaCol)+
  ggtitle('COVID-19 en Baja California y Colima') +
  geom_line(aes(Fecha, cColima, colour = 'Colima')) +
  geom_line(aes(Fecha, cBajaCalifornia, colour = 'Baja California')) +
  xlab('Fecha') +
  ylab('Casos diarios acumulados') +
  labs(colour ='Estados') 

gBajaCol

ggplotly(gBajaCol)
#Conclusion
#Pudimos notar que el brote de COVID-19 en ambos lugares 
#(Baja California y Colima) comenzo a mediadios de marzo,
#principios de abril y ascendio paulatimanete.
#Se vieron mas afectadoe n el mes de mayo (en ambos lugares).
#Baja California Norte a sido el mas afectado con un total de 
#mas de 6000 casos.