Tercer ejercicio de estadística aplicada

Análisis de datos abiertos de covid 19

El objetivo de este ejercicio es analizar el crecimiento de los contagiados, recuperados, fallecidos por COVID-19 en México

Importar

  • Importar biblotecas
library(readr)
library(tidyverse)
## -- Attaching packages ------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.2     v dplyr   1.0.2
## v tibble  3.0.3     v stringr 1.4.0
## v tidyr   1.1.1     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts --------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(gifski)
library(gganimate)
  • Importar datos
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
  • Leer el archivo .csv de las URL

este comando descargará los archivos a la computadora a archivos separados por comas

datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
  • Extraer los datos para México
conf_mex <- t(datos_conf [datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos [datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados [datos_recuperados$Country.Region=="Mexico" ,])

Ordenar los datos

  • visuzalización de reconocimiento Esto con una gráfica sencilla para conocer cómo se comportan los datos para ordenarlos
plot(conf_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

plot(rec_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

plot(dec_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

  • ordenar y transformar los datos
#Vector de Fecha
Fecha = seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-06"), by = 'day')

#Casos confirmados
vec1 <- as.vector(conf_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)

#decesos 
vec1 <- as.vector(dec_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)

#recuperados
vec1 <- as.vector(rec_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)

#construir data frame (marco de datos)

datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

Visualizar

  • A continuación se presentan 3 gráficas simples elaboradas con ggplot para Confirmados, Recuperados, decesos e COVID-19 en México, al día 06/09/20
#Figura 2 Confirmados ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados)) +
  ggtitle("Casos acumulados confirmados de COVID-19 en México, al día 06/09/20")

#Figura 3 Recuperados ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Recuperados)) +
  ggtitle("Casos acumulados de recuperados de COVID-19 en México, al día 06/09/20")

#Figura 4 Decesos ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Decesos)) +
  ggtitle("Casos acumulados de Decesos de COVID-19 en México, al día 06/09/20")

  • Gráfico animado

El objetivo de realizar animacione de transición temporal es ilustrar la manera en la que han crecido los casos confirmados de COVID-19.

ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados)) +
  ggtitle("Casos acumulados confirmados de COVID-19 en México, al día 06/09/20") +
  transition_reveal(Fecha)

  • Gráfico interactivo en conjunto
#Gráfica multiejes 
gcov <- ggplot(data=datos1) +
  geom_line(aes(x=Fecha, y=Confirmados), colour="red") +
  geom_line(aes(x=Fecha, y=Decesos), colour="green") +
  geom_line(aes(x=Fecha, y=Recuperados), colour="blue") +
  ggtitle("Casos acumulados de COVID-19 en México, al día 06/09/20") +
  ylab("COVID-19 en méxico") + xlab("Mes")
gcov

  • Gráfico interactivo con plotly
ggplotly(gcov)

Con este ejercicio aprendimos el uso de R markdown que nos permite tener nuestras lineas de codigo de manera legible y ordenada en un archivo html. Ademas de importar datos desde bases proporcionadas por sitios, de las cuales podemos sustraer informacion especifica sobre regiones y fechas especificas Al final, se presentan los datos que queriamos obtener. Ademas implementamos el uso de graficos animados, que van creciendo al pasar el tiempo, así podemos visualizar el cecimiento progresivo, tambien hemos cambiado colores de cada linea, asi podremos identificar cada una de ellas, y hacerlo mas facil de interpretar.