tercer ejercicio de estadistica aplicada

Analisis de datos abiertos de covid 19

El objetivo de este ejecicio es analizar el crecimiento de los contagiados,recuperados,fallecidos por COVID-19 en Mexico

importamos

*impotar bibloteca

library(readr)
library(tidyverse)
## -- Attaching packages -------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v dplyr   1.0.2
## v tibble  3.0.3     v stringr 1.4.0
## v tidyr   1.1.1     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts ----------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
  • Importar datos
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

*Leer el archivo .csv de las URL

este comando descarga los archivos a la computadora a archivos separados por comas

datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
  • Extraer los datos para mexico
conf_mex <- t(datos_conf [datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos [datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados [datos_recuperados$Country.Region=="Mexico" ,])

Ordenar los datos

  • Visuzacion de reconocimiento Esto con una graficasencilla para conocer como se comportan los datos para ordenarlos
plot(conf_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

plot(rec_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

plot(dec_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

Ordenar y transformar los datos

#Vector de Fecha
Fecha = seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-06"), by = 'day')

#Casos confirmados
vec1 <- as.vector(conf_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)

#decesos 
vec1 <- as.vector(dec_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)

#recuperados
vec1 <- as.vector(rec_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)

#construir data frame  (marco de datos)
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

Visualizar

  • A continuacion se presentan 3 graficas simples elaboradas con ggplot para confirmados, Recuperados, decesos e COVID-19 en Mexico
#Figura 2 Confirmados ggplot

ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados)) +
  ggtitle("Casos acumulados confirmados de COVID-19 en M攼㸹xico, al d攼㹤a 06/09/20")

#Figura 3 recuperados ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Recuperados)) +
  ggtitle("Casos acumulados de recuperados de COVID-19 en M攼㸹xico, al d攼㹤a 06/09/20")

 #Figura 4  decesos  ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Decesos)) +
  ggtitle("Casos acumulados de Decesos de COVID-19 en M攼㸹xico, al d攼㹤a 06/09/20") 

  • Grafico animado

El objetivo de realizar animacione de transicion temporatl es ilustrar la manera en la que cercido los casos confirmados de COVID-19

ggplot(data = datos1) + geom_line(mapping = aes(x = Fecha, y = Confirmados)) + ggtitle("Casos acumulados confirmados de COVID-19 en M攼㸹xico, al d攼㹤a 06/09/20")

FRAME 100(100%) finalizing encoding ... done!

  • Grafico interactivo en conjunto
#Gr攼㸱fica multiejes 
gcov <- ggplot(data=datos1) +
  geom_line(aes(x=Fecha, y=Confirmados), colour="red") +
  geom_line(aes(x=Fecha, y=Decesos), colour="green") +
  geom_line(aes(x=Fecha, y=Recuperados), colour="blue") +
  ggtitle("Casos acumulados de COVID-19 en M攼㸹xico, al d攼㹤a 06/09/20") +
  ylab("COVID-19 en m攼㸹xico") + xlab("Mes")
gcov