U1A3 DISTRIBUCIONES DE FRECUENCIA Y COVID-19

El objetivo de este ejercicio es analizar la frecuencia con la que ocurren los contagios, recuperaciones y muertes por COVID-19 en Canadá.

Para esto, utilizamos datos de la universidad de Jhons Hopkins

Importar

Importar paquetes

library(readr) #Leer datos
#library(plotly) #gráficos interactivos
library(tidyverse) #ciencia de datos
## -- Attaching packages -------------------------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v dplyr   1.0.2
## v tibble  3.0.3     v stringr 1.4.0
## v tidyr   1.1.1     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts ----------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
#library(gganimate) #Animaciones gráficas
#library(gifski) #Fabricar GIF

Importar URLS de datos

  • Los datos se leerán desde el repositorio de JHSU
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"

url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"

url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

Importar a archivo local los datos de URL

  • Leer archivos .csv de las url
datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
  • Extraer datos para México
conf_can <- t (datos_conf[datos_conf$Country.Region=="Canada" ,])

dec_can <- t (datos_decesos[datos_decesos$Country.Region=="Canada" ,])

rec_can <- t (datos_recuperados[datos_recuperados$Country.Region=="Canada" ,])

ORDENAR Y TRANSFORMAR

plot(rec_can)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

#Elaborar un vector de fechas
Fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-03"), by="day" )

#Transformación de datos a vectores

#confirmados
vec1 <- as.vector(conf_can) #A vector
vec2 <- vec1[5:230] #filtrar
num1 <- as.numeric(vec2) #a numérico
Confirmados <- as.vector(num1) #A vector numérico

#Decesos
vec1 <- as.vector(dec_can)
vec2 <- vec1[5:230]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)

#Recuperados
vec1 <- as.vector(rec_can)
vec2 <- vec1[5:230]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)

#Ordenar los datos en un data frame, marco de datos, matriz

datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

Visualizar

ggplot(data=datos1)+
  geom_line(mapping = aes(x= Fecha, y= Confirmados))

ggplot(data=datos1)+
  geom_line(mapping = aes(x= Fecha, y= Decesos))

ggplot(data=datos1)+
  geom_line(mapping = aes(x= Fecha, y= Recuperados))

Redacción personal.