setwd("~/PROBABILIDAD Y ESTADISTICA (R Studio)")
#Analizar series d tiempo acumulados de datos
#de COVID-19 en Canada utilizando el repositorio de JHU
#Bblioteca
library(readr)
library(tidyverse)
## -- Attaching packages ------------------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.1 v dplyr 1.0.0
## v tibble 3.0.1 v stringr 1.4.0
## v tidyr 1.1.0 v forcats 0.5.0
## v purrr 0.3.4
## -- Conflicts --------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(gganimate)
library(gifski)
#declaracion de variables
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
#leer los archivos CSV de los URL
datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
#filtrar datos para mexico
conf_can <- t(datos_conf[datos_conf$Country.Region=="Canada" ,])
decesos_can <- t(datos_decesos[datos_decesos$Country.Region=="Canada" ,])
recuperados_can <- t(datos_recuperados[datos_recuperados$Country.Region=="Canada" ,])
#primer figura acumulada
plot(conf_can)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

#crear un vector de fecha con formato: dia-mes-años
fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-06-08"), by ="day")
#formatear datos confirmados
vec1 <- as.vector(conf_can) #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) #ransformar a numericos
confirmados <- as.vector(num1) #vector numerico
#formatear datos decesos
vec1 <- as.vector(decesos_can) #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) #ransformar a numericos
decesos <- as.vector(num1) #vector numerico
#formatear datos Recuperados
vec1 <- as.vector(recuperados_can) #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) #ransformar a numericos
recuperados <- as.vector(num1) #vector numerico
#para construir un marco de datos
datos1 <- data.frame(fecha, confirmados, decesos, recuperados)
#figura 2 de casos confirmados en Canada
#utilizando ggplot
ggplot(data=datos1) +
geom_line(mapping = aes(x = fecha, y = confirmados))

#Figura 3 de decesos
ggplot(data=datos1) +
geom_line(mapping = aes(x = fecha, y = decesos))

#Figura 4 de Recuperados
ggplot(data=datos1) +
geom_line(mapping = aes(x = fecha, y = recuperados))

#animacion simple
ggplot(data=datos1) +
ggtitle("casos confirmados acumulados COVID-19 en Canada") +
geom_line(mapping = aes(x = fecha, y = recuperados)) +
transition_reveal(fecha)

#fIGURA #5 multi ejes
ggplot(data=datos1) +
geom_line(aes(x=fecha, y=confirmados, color="red")) +
geom_line(aes(x=fecha, y=decesos, color="blue")) +
geom_line(aes(x=fecha, y=recuperados, color="green")) +
ylab("COVID-19 Canada") + xlab("fecha")

ggplot(data=datos1) +
geom_line(aes(x=fecha, y=confirmados, color='red')) +
geom_line(aes(x=fecha, y=decesos, color='blue')) +
geom_line(aes(x=fecha, y=recuperados, color='green')) +
ylab('COVID-19 Canada') + xlab('fecha') +
transition_reveal(fecha)

#Grafica interactiva
gcov <- ggplot(data=datos1) +
geom_line(aes(x=fecha, y=confirmados, color='red')) +
geom_line(aes(x=fecha, y=decesos, color='blue')) +
geom_line(aes(x=fecha, y=recuperados, color='green')) +
ylab('COVID-19 Canada') + xlab('fecha')
ggplotly(gcov)
#En Canada se observa que el numero de decesos es poco y va disminuyendo, no ha muerto tanta gente en si, en confirmados tambien va aumentando de abril en adelante pero es muy poco ya que la gente toma sus medidas tal como la grafica verde de los recuperados, que va creciendo desde abril en adelante en lo personal y en mi mas humilde opinion, Canada esta tomando sus medidas y cuidados y estan dando el tratamiento necesario para enfrentar la enfermedad del COVID-19