#U1A7
setwd("~/PyE")
#cargar las bibliotecas con el paquete pacman
library(pacman)
p_load(readr, tidyverse, plotly, gganimate, gifski)
#Leer datos de la direccion general de epidemiologia(DGE)
#tomados de :
#https://coronavirus.gob.mx/datos/#DownZCSV
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")
#dar formato a los datos diarios (absolutos) de Chihuahua
Chihuahua <- t(datos[datos$nombre=="CHIHUAHUA" ,])
Chihuahua <- as.vector(Chihuahua)
Chihuahua <- Chihuahua[4:153] #filtrar datos
Chihuahua <- as.numeric(Chihuahua)#para convertir a numerico
Chihuahua <- as.vector(Chihuahua)
cChihuahua <- cumsum(Chihuahua)
#estadistica descriptiva
#figura 1
plot(Chihuahua) #grafico de puntos del numero de casos diarios

plot(cChihuahua) #grafico de puntos de los casos acumulados

summary(Chihuahua)#al ser un modelo de crecimiento exponencial los datos como media,mediana,moda
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 1.00 13.09 25.00 61.00
#no son muy utiles
boxplot(Chihuahua)#igual, la caja de bigotes tampoco es muy util.

hist(Chihuahua)

#dar formato a los datos diarios (absolutos) de Coahuila
Coahuila <- t(datos[datos$nombre=="COAHUILA" ,])
Coahuila <- as.vector(Coahuila)
Coahuila <- Coahuila[4:153] #filtrar datos
Coahuila <- as.numeric(Coahuila)#para convertir a numerico
Coahuila <- as.vector(Coahuila)
cCoahuila <- cumsum(Coahuila)
plot(Coahuila)#grafico de puntos del numero de casos diarios

plot(cCoahuila)#grafico de puntos de los casos acumulados

#Construir un vector de fechas
Fecha <- seq( from = as.Date("2020-01-12"), to = as.Date("2020-06-09"), by= "day")
#Crear un arreglo matricial (marco de datos "data frame", "tibble")
ChiCoah <- data.frame(Fecha, Chihuahua, Coahuila)
cChiCoah <- data.frame(Fecha, cChihuahua, cCoahuila)
#grafica para Chihuahua de datos absolutos con ggplot
ggplot(data = ChiCoah)+
ggtitle("Casos diarios Covid-19 en Chihuahua (DGE)")+
geom_line(mapping = aes(x=Fecha, y=Chihuahua))

#se puede observar como los casos diarios han estado disminuyendo estos ultimos dias
#grafica para Coahuila de datos absolutos con ggplot
ggplot(data = ChiCoah)+
ggtitle("Casos diarios Covid-19 en Coahuila (DGE)")+
geom_line(mapping = aes(x=Fecha, y=Coahuila))

#se observa como de un pico de casos diarios bajo a casi nulos casos diarios.
#animacion grafica comparativa de frecuencias acumuladas
#por fechas para los estados de Chihuahua y Coahuila
ggplot(data= cChiCoah)+
geom_line(aes(Fecha, cChihuahua, colour= 'Chihuahua'))+
geom_line(aes(Fecha, cCoahuila, colour= 'Coahuila'))+
xlab('Fecha')+
ylab('Casos diarios acumulados')+
labs(colour="Estados")+
transition_reveal(Fecha)

gChiCoah <- ggplot(data= cChiCoah)+
ggtitle('COVID-19 en Chihuahua y Coahuila')+
geom_line(aes(Fecha, cChihuahua, colour= 'Chihuahua'))+
geom_line(aes(Fecha, cCoahuila, colour= 'Coahuila'))+
xlab('Fecha')+
ylab('Casos diarios acumulados')+
labs(colour="Estados")
ggplotly(gChiCoah)
#decidi comparar estos dos estados ya que son estados vecinos y por lo tanto
#ambos son estados fronterizos. Chihuahua cuenta con 8 cruces fronterizos, es
#el estado mas grande del paĆs pero es el tercer menos densamente poblado.
#en cambio Coahuila cuenta con 1 cruce fronterizo, el tercer estado mas grande
#y el septimo menos densamente poblado. A causa de esto yo me imagine que
#chihuahua hubiera tenido un crecimiento exponencial mayor al inicio, por
#la gran cantidad de cruces fronterizos.
#pero al analizar las graficas se puede observar como en las primeras semanas la cantidad
#de casos nuevos diarios fueron mayores en coahuila. Pero en la ultima semana de abril,
#el crecimiento exponencial de coahuila disminuyo, y el de chihuahua aumento bastante y no
#ha dejado de aumentar.