U1A3 DISTRIBUCIONES DE FRECUENCIA y COVID-19

Para esto, utilizamos datos de la universidad Johns Hopkins

Importación de paquetes

library(readr) #leer datos
##library(plotly) #graficos interactivos
library(tidyverse) #ciencia de datos
## -- Attaching packages -------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v dplyr   1.0.2
## v tibble  3.0.3     v stringr 1.4.0
## v tidyr   1.1.1     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts ----------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
##library(gganimate) #animación gráfica
##library(gifski) #creador de gifs

Lectura de datos

  • Los datos se leerán desde el repositorio de JHSU
##Links en los que están los datos de los casos confimados, decesos y recuperados.
url_conf <-"https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv" 

url_decesos <-"https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"

url_recuperados <-"https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
  • Leer archivos .csv de las URL
##Instrucciones para leer los datos de las url
datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
  • Extraer datos para México
##Se filtran los datos solamente para Sri Lanka
conf_sl <- t(datos_conf[datos_conf$Country.Region =="Sri Lanka" ,])
dec_sl <- t(datos_decesos[datos_decesos$Country.Region =="Sri Lanka" ,])
rec_sl <- t(datos_recuperados[datos_recuperados$Country.Region =="Sri Lanka" ,])

ORDENAR Y TRANSFORMAR

*Figura 1 Primer gráfico simple de confirmados de COVID-19 al 9 Septiembre de 2020 para Sri Lanka

plot(conf_sl)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

Figura 2 Segundo gráfico simple de decesos de COVID-19 al 4 Septiembre de 2020 para Sri Lanka

plot(dec_sl)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

*Figura 3 Primer gráfico simple de recuperados de COVID-19 al 4 Septiembre de 2020 para Sri Lanka

plot(rec_sl)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

#Elaborar un vector de fechas
Fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-04"), by="day")

#Transformación de datos a vectores
#Confirmados
vec1 <- as.vector(conf_sl) #METER LOS DATOS A UN VECTOR
vec2 <- vec1[5:231] #USAR EL VEC1 PARA AGARRAR EL RANGO DESEADO
num1 <- as.numeric(vec2) #CONVERTIR EL VECTOR A ARREGLO NUMÉRICO
confirmados <- as.vector(num1) #CONVERTIR LOS VALORES DEL ARREGLO EN UN VECTOR

vec1 <- as.vector(dec_sl) #METER LOS DATOS A UN VECTOR
vec2 <- vec1[5:231] #USAR EL VEC1 PARA AGARRAR EL RANGO DESEADO
num1 <- as.numeric(vec2) #CONVERTIR EL VECTOR A ARREGLO NUMÉRICO
decesos <- as.vector(num1) #CONVERTIR LOS VALORES DEL ARREGLO EN UN VECTOR

vec1 <- as.vector(rec_sl) #METER LOS DATOS A UN VECTOR
vec2 <- vec1[5:231] #USAR EL VEC1 PARA AGARRAR EL RANGO DESEADO
num1 <- as.numeric(vec2) #CONVERTIR EL VECTOR A ARREGLO NUMÉRICO
recuperados <- as.vector(num1) #CONVERTIR LOS VALORES DEL ARREGLO EN UN VECTOR

#Ordenar los datos en un data frame, marco de datos, matriz.

datos1 <- data.frame(Fecha, confirmados, decesos, recuperados)

##Visualizar Figura 4 confirmados

ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = confirmados))

##Redacción Personal

##Se puede observar que antes de todo se pusieron tablas sencillas con ggplot, que automaticamente arrojan la gráfica con su magnitud de interés y referencia por defecto, luego se ordenan en matriz estos datos para poder manipularlos y desplegarlos como se deseen.

##En este análisis anterior aprecia de manera clara como se toca cada parte de lo que dice Wickam en su libro R para la ciencia de datos, sobre el ciclo de importar, ordenar, comprender (transformar, visualizar, ordenar) y comunicar, en este caso se hizo con los datos del COVID-19 en Sri Lanka.