RTALLERSALUD

Ian Salas López

15/2/2021

TALLER DE CIENCIA DE DATOS APLICADA A SALUD PÚBLICA Y EPIDEMIOOGÍA

Acerca de este documento

Este es un documento que explica demanera demostrativa una forma de procesar datos abiertos oficiales de México y convertirlos en análisis y visualizaciones que puedan ser útiles para los ciudadanos ante la pandemia por COVID-19

  • El análisis fue realizado con el objetivo de difundir y democratizar el uso y análisis de datos en México para de esta forma crear una masa crítica que nos permita tomar mejores decisiones en lo colectivo con mejores herramientas y mérodos.

  • El código aquí usado está escrito en lenguaje de programación abierto R y puede ser descargado y así como también sus datos en los hipervínculos que se encuentran abajo.

Este es un taller gratuito de ciencia de datos (data science) con una duración de 3 horas y media, en el cual se pretende introducir al público al tema del análisis de las métricas de salud pública así como la evolución modelación de la pandemia de COVID-19 usando datos oficiales.

*En este taller se verán 3 ejercicios

  1. Datos globales de Jhons Hopkins University
  2. Datos de coronavirus.gob.mx para Sonora y Sinaloa
  3. Datos de enfermedades críticas de Sonora

Importación de paquetes / bibliotecas

setwd("~/Estadistica")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")

Descarga de este código

para fines de reproducibilidad se incluye todo el cósigo para su descarga

xfun::embed_file("RTALLERSALUD.Rmd")

Download RTALLERSALUD.Rmd

Datos globales de Jhons Hopkins University para México

De lo general a lo particular

Datos obtenidos de:

“Coronavirus COVID-19 Global Cases by the Center for Systems Science and Engineering (CSSE) at Jhons Hopkins University (JHU)”} https://coronavirus.jhu.edu/map.html

Importar datos de JHU

Establecemoslos datos crudos hacia las variables que creamos y creamos lastablas segpun los parámetros que queremos saber en donde estánlos decesos y recuperados (En este caso “Mexico”)

url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"



url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"



url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)

conf_mex <- t(datos_conf[datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos[datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados[datos_recuperados$Country.Region=="Mexico" ,])

Formatear datos

  • Eliminar campos no utilizables
  • Formatear las fechas
  • Crear unmarco de datos (data frame)
Fecha <- seq(from = as.Date("2020-01-22"), to= as.Date("2021-02-14"),by="day")
##casos
vec1 <- as.vector(conf_mex)
vec2 <- vec1[5:394]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)
##decesos
vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:394]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)
##recuperados
vec1 <- as.vector(rec_mex)
vec2 <- vec1[5:394]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)

##Generación de marco de datos (data frame)
datos1 <- data.frame(Fecha ,Confirmados ,Decesos ,Recuperados)

Graficación de datos

A continuación se presentan visualizaciones que representan los datos de confirmados, decesos y recuperados para Mexico

Gráfica estática

gcov <- ggplot(data = datos1) + 
  geom_line(aes(Fecha, Confirmados, colour="Confirmados")) +
  geom_line(aes(Fecha, Decesos, colour="Decesos")) +
  geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en Mexico") +
  labs(colour="casos") +
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
  scale_y_continuous(labels = comma)
gcov

Gráfica interactiva

Uso del paquete “plotly”

ggplotly(gcov)

Gráfica animada

  ggplot(data = datos1) + 
  geom_line(aes(Fecha, Confirmados, colour="Confirmados")) +
  geom_line(aes(Fecha, Decesos, colour="Decesos")) +
  geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en Mexico") +
  labs(colour="casos") +
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
  scale_y_continuous(labels = comma) +
  transition_reveal(Fecha)