##Tercer ejercicio de estadistica aplicada
##Analisis de datos abiertos de covid 19
el objetivo de este ejercicio es analizar el crecimiento de los contagiados, recuperados, fallecidos por covid 19 en México
#Importar * importar biliotecas
Se importaron las librerias readr, tidyverse, plotly, gifski y gganime para elaborar las gráficas de confirmados, recuperados y los decesos por COVID-19
library(readr)
library(tidyverse)
## -- Attaching packages ------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.2 v dplyr 1.0.2
## v tibble 3.0.3 v stringr 1.4.0
## v tidyr 1.1.1 v forcats 0.5.0
## v purrr 0.3.4
## -- Conflicts --------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(gifski)
library(gganimate)
Se importan los links donde vienen las cifras de manera global de los pacientes confirmados y recuperados ademas de los decesos por COVID-19
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
este comando descargara los archivos a la computadora Se procede a leer los datos de las url que importamos
datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
En esta etapa filtramos los datos que eran globales y solo tomaremos los que contengan como Pais o Region a México
conf_mex <- t(datos_conf [datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos [datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados [datos_recuperados$Country.Region=="Mexico" ,])
Aqui se ordenan los datos que pasan de estar de manera lineal a formato de tabla de manera vertical
Visualización de reconocimiento
Esto con una gráfica sencilla para conocer como se comportan los datos para ordenarlos
plot(conf_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción
*Ordenar y transformar los datos
Aqui nos dispondremos a ordenar y transformar los datos de manera que tomaremos desde el dia 22 de Enero del 2020 hasta el dia 07 de Septiembre de 2020 habiendo pasado un total de 234 dias
#Vector de Fecha
Fecha = seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-07"), by = 'day')
vec1 <- as.vector(conf_mex)
vec2 <-vec1[5:234]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)
#decesos
vec1 <- as.vector(dec_mex)
vec2 <-vec1[5:234]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)
#recuperados
vec1 <- as.vector(rec_mex)
vec2 <-vec1[5:234]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)
#Construir un data frame (marco de datos)
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)
###Visualizar A continuación se presentan 3 graficas simples elaboradas con ggplot para confirmados, recuperados y decesos
De color rojo se muestra la gráfica de confirmados, de color verde la gráfica de recuperados y de color negro la gráfica de los decesos
ggplot(data = datos1) +
geom_line(mapping = aes(x = Fecha, y = Confirmados), colour="red") +
ggtitle("Caos acumulados confirmados de COVID-19 en México, al dia 7/09/2020")
ggplot(data = datos1) +
geom_line(mapping = aes(x = Fecha, y = Recuperados), colour="green") +
ggtitle("Caos acumulados recuperados de COVID-19 en México, al dia 7/09/2020")
ggplot(data = datos1) +
geom_line(mapping = aes(x = Fecha, y = Decesos), colour="black") +
ggtitle("Caos acumulados decesos de COVID-19 en México, al dia 7/09/2020")
#Grafico animado
El objetivo de realizar animaciones de trancision temporal es ilustrar la manera en la que han crecido los casos confirmados de covid-19
La gráfica animada muestra el crecimiento de los casos por COVID-19 en México de color rojo
ggplot(data = datos1) +
geom_line(mapping = aes(x = Fecha, y = Confirmados), colour="red") +
ggtitle("Caos acumulados confirmados de COVID-19 en México,
al dia 7/09/2020") +
transition_reveal(Fecha)
* Grafico interactivo en conjunto
Esta gráfica interactiva te muestra el numero de pacientes confirmados, recuperados y los decesos mediante vayas avanzando en medida de las fechas que cumplen un lapso entre el 22 de Enero de 2020 y el 7 de Septiembre de 2020
gcov <- ggplot(data=datos1) +
geom_line(aes(x=Fecha, y=Confirmados), colour="red") +
geom_line(aes(x=Fecha, y=Recuperados), colour="green") +
geom_line(aes(x=Fecha, y=Decesos), colour="black") +
ggtitle("Casos acumulados de COVID-19 en México, al dia
07/09/2020") + xlab("Fecha") +
transition_reveal(Fecha)
ggplotly(gcov)
con ayuda de las librerias que importamos fue más fácil recolectar, filtrar e interpretar los datos que deseaba conocer y asi pasarlo a gráficas para visualizar el comportamiento que tienen con el rango de fechas que se establecio.