##Tercer ejercicio de estadistica aplicada

##Analisis de datos abiertos de covid 19

el objetivo de este ejercicio es analizar el crecimiento de los contagiados, recuperados, fallecidos por covid 19 en México

#Importar * importar biliotecas

Se importaron las librerias readr, tidyverse, plotly, gifski y gganime para elaborar las gráficas de confirmados, recuperados y los decesos por COVID-19

library(readr)
library(tidyverse)
## -- Attaching packages ------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.2     v dplyr   1.0.2
## v tibble  3.0.3     v stringr 1.4.0
## v tidyr   1.1.1     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts --------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(gifski)
library(gganimate)

Se importan los links donde vienen las cifras de manera global de los pacientes confirmados y recuperados ademas de los decesos por COVID-19

url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

este comando descargara los archivos a la computadora Se procede a leer los datos de las url que importamos

datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)

En esta etapa filtramos los datos que eran globales y solo tomaremos los que contengan como Pais o Region a México

conf_mex <- t(datos_conf [datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos [datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados [datos_recuperados$Country.Region=="Mexico" ,])

Ordenar los datos

Aqui se ordenan los datos que pasan de estar de manera lineal a formato de tabla de manera vertical

Visualización de reconocimiento

Esto con una gráfica sencilla para conocer como se comportan los datos para ordenarlos

plot(conf_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

*Ordenar y transformar los datos

Aqui nos dispondremos a ordenar y transformar los datos de manera que tomaremos desde el dia 22 de Enero del 2020 hasta el dia 07 de Septiembre de 2020 habiendo pasado un total de 234 dias

#Vector de Fecha
Fecha = seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-07"), by = 'day')

vec1 <- as.vector(conf_mex)
vec2 <-vec1[5:234]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)

#decesos 
vec1 <- as.vector(dec_mex)
vec2 <-vec1[5:234]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)

#recuperados
vec1 <- as.vector(rec_mex)
vec2 <-vec1[5:234]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)

#Construir un data frame (marco de datos)
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

###Visualizar A continuación se presentan 3 graficas simples elaboradas con ggplot para confirmados, recuperados y decesos

De color rojo se muestra la gráfica de confirmados, de color verde la gráfica de recuperados y de color negro la gráfica de los decesos

ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados), colour="red") +
  ggtitle("Caos acumulados confirmados de COVID-19 en México, al dia 7/09/2020")

ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Recuperados), colour="green") +
  ggtitle("Caos acumulados recuperados de COVID-19 en México, al dia 7/09/2020")

ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Decesos), colour="black") +
  ggtitle("Caos acumulados decesos de COVID-19 en México, al dia 7/09/2020")

#Grafico animado

El objetivo de realizar animaciones de trancision temporal es ilustrar la manera en la que han crecido los casos confirmados de covid-19

La gráfica animada muestra el crecimiento de los casos por COVID-19 en México de color rojo

ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados), colour="red") +
  ggtitle("Caos acumulados confirmados de COVID-19 en México, 
          al dia 7/09/2020") + 
  transition_reveal(Fecha)

* Grafico interactivo en conjunto

Esta gráfica interactiva te muestra el numero de pacientes confirmados, recuperados y los decesos mediante vayas avanzando en medida de las fechas que cumplen un lapso entre el 22 de Enero de 2020 y el 7 de Septiembre de 2020

gcov <- ggplot(data=datos1) + 
  geom_line(aes(x=Fecha, y=Confirmados), colour="red") +
  geom_line(aes(x=Fecha, y=Recuperados), colour="green") + 
  geom_line(aes(x=Fecha, y=Decesos), colour="black") + 
  ggtitle("Casos acumulados de COVID-19 en México, al dia
          07/09/2020") + xlab("Fecha") + 
  transition_reveal(Fecha)
ggplotly(gcov)

con ayuda de las librerias que importamos fue más fácil recolectar, filtrar e interpretar los datos que deseaba conocer y asi pasarlo a gráficas para visualizar el comportamiento que tienen con el rango de fechas que se establecio.