#estabñecer datos
setwd("~/PyE verano 2020")

#cargar las bibliotecas con el pacman
library(pacman)
library(gifski)
library(gganimate)
## Loading required package: ggplot2
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
p_load(readr, tidyverse, plotly)

#leer datos de la direccion general de epidemiologia (DGE)

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200609.csv")

#dar formatoa los datos absolutos diarios de tabasco
tabasco<- t(datos[datos$nombre=="TABASCO" ,])
tabasco <- as.vector(tabasco)
tabasco <- tabasco[4:153] #filtrar datos a usar 
tabasco <- as.numeric(tabasco) #para convertir de caracter a numerico
tabasco <- as.vector(tabasco)
ctabasco <- cumsum(tabasco)#datos acumulados diarios

#estadistica descriptiva para tabasco de casos confirmados

#figura 1 
plot(tabasco) #grafica de puntos de datos absolutos

summary(tabasco)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    3.00   38.33   65.00  220.00
hist(tabasco)

plot(ctabasco)

#comparacion de contagiados entre tabasco y yucatan
#formato de datos absolutos confirmados de yucatan
yucatan <- t(datos[datos$nombre=="YUCATAN" ,])
yucatan <- as.vector(yucatan)
yucatan <- yucatan[4:153] #filtrar datos 
yucatan <- as.numeric(yucatan) #para convertir de caracter a numerico
yucatan <- as.vector(yucatan)
cyucatan <- cumsum(yucatan)#datos acumulados diarios

#estadistica descriptiva de casos confirmados en yucatan
#figura 2
plot(yucatan)

plot(cyucatan)

summary(yucatan)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    4.00   14.63   27.00   70.00
hist(yucatan)

#vector de fecha
fecha <- seq(from= as.Date("2020-01-12"), to= as.Date("2020-06-09"),by= "day")

#data frame de tabasco y yucatan, datos absolutos y acumulados
tayu <- data.frame(fecha, tabasco, yucatan) #datos aabsoolutos
ctayu <- data.frame(fecha, ctabasco, cyucatan) #datos acumulados

#figura 3 grfafica ggplot para tabasco en datos absolutos. representacion de casos diarios de covid-19 en forma grafica 
ggplot(data = tayu) +
  ggtitle("CASOS DIARIOS DE COVID-19 EN TABASCO") +
  geom_line(mapping = aes(x= fecha, y= tabasco)) # en esta grafica se ve como empiesa la ola en el mes de abril

#figura 4 grfafica ggplot para yucatan en datos absolutos. representacion de casos diarios de covid-19 en forma grafica 
ggplot(data = tayu) +
  ggtitle("CASOS DIARIOS DE COVID-19 EN YUCATAN") +
  geom_line(mapping = aes(x= fecha, y= yucatan)) # en esta grafica se ve como empiesa la ola a mediadios del mes de marzo

#♦animacion 1, grafica comparativa de frecuencia absoluta de casos confirmados de COVID-19 diarios en los estados
#de tabasco y yucatan codificados por color
ggplot(data = tayu) +
  geom_line(aes(fecha, tabasco, colour= 'tabasco')) +
  geom_line(aes(fecha, yucatan, colour= 'yucatan')) +
  xlab('fecha') +
  ylab('casos diarios absolutos') +
  labs(colour = "estados") +
  transition_reveal(fecha)

#animacion 2, grafica comparativa de frecuencia acumulada de casos confirmados de COVID-19 diarios en los estados
#de tabasco y yucatan codificados por color
ggplot(data = ctayu) +
  geom_line(aes(fecha, ctabasco, colour= 'tabasco')) +
  geom_line(aes(fecha, cyucatan, colour= 'yucatan')) +
  xlab('fecha') +
  ylab('casos diarios absolutos') +
  labs(colour = "estados") +
  transition_reveal(fecha)

#animacion 3, grafica idicadora de cada punto dia a dia de tabasco y yucatan en frecuencia absoluta
gsonsin <- ggplot(data = tayu) +
  ggtitle('COVID-19 en tabasco y yucatan') +
  geom_line(aes(fecha, tabasco, colour= 'tabasco')) +
  geom_line(aes(fecha, yucatan, colour= 'yucatan')) +
  xlab('fecha') +
  ylab('casos diarios absolutos') +
  labs(colour = "estados") 

ggplotly(gsonsin)
#animacion 4, grafica idicadora de cada punto dia a dia de tabasco y yucatan en frecuencias acumuladas
gsonsin <- ggplot(data = ctayu) +
  ggtitle('COVID-19 en tabasco y yucatan') +
  geom_line(aes(fecha, ctabasco, colour= 'tabasco')) +
  geom_line(aes(fecha, cyucatan, colour= 'yucatan')) +
  xlab('fecha') +
  ylab('casos diarios acumulados') +
  labs(colour = "estados") 

ggplotly(gsonsin)
#datos sacados de (url)
# https://coronavirus.gob.mx/datos/#DOView

#conclusion
#podemos obsrvar graficamente como tabasco tubo una mayor ola de contagios, y se puede obsrvar como fue creciendo mucho 
#mas tabasco tubo mas contagios que yucatan. estas graficas nos ayudan visual mente a entender lo que esta pasando
#en distintos estados con la pandemia que es el COVID-19.