Taller de Ciencia de Datos Aplicada a Salud Pública y Epidemiología

A continuación en este documento se presentara un analisis de datos acerca de la salud publica en México y como esta ha ido evolucionando con el pasar de los años para aplicarlas en diversas situaciones, como en este caso para la pandemia de COVID 19.

El objetivo de este análisis es difundir y democratizar el uso y análisis de los datos en México para crear una masa crítica que nos permita tomar mejores decisiones en lo colectivo con mejores herramientas y métodos.

Ejercicios

*Se llevaran a cabo los siguientes 3 ejercicios:

  1. Datos globales de Johns Hopkins University para México.
  2. Datos de Coronavirus.gob.mx en Sonora y Sinaloa.
  3. Datos de enfermedades crónicas en Sonora.

Importación de paquetes

setwd("~/EALMV9") #Directorio de trabajo
library(pacman) #Para importar la biblioteca "Pacman"
p_load("base64enc","htmltools","mime","xfun","prettydoc","readr","knitr","DT","dplyr","ggplot2","plotly","gganimate","gifski","scales")

Datos Globales de John Hopkins University para México.

Los datos obtenidos son a traves de un flujo que va de lo general a los particular

“Coronavirus COVID - 19 Global Cases by the center for systems Science and Engineering (CSSE) at Johns Hopkins University (JHU)” https://coronavirus.jhu.edu/map.html

Importar datos de JHU

# Informacion utiles que se consideran como datos crudos de confirmados, de decesos y de recuperados

url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"

url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"

url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

#Leer los archivos .csv que se encuentran en las URL's

datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)

#Definición de las variables

conf_mex <- t(datos_conf[datos_conf$Country.Region =="Mexico" ,])
dec_mex <- t(datos_decesos[datos_decesos$Country.Region =="Mexico" ,])
rec_mex <- t(datos_recuperados[datos_recuperados$Country.Region =="Mexico" ,])

Formatear Datos

  • Eliminar Campos no utilizables.
  • Formatear las Fechas.
  • Crear un Marco de Datos (data frame)
Fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-12-18"), by = "day"  )


# Casos confirmados 
vec1 <- as.vector(conf_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2) 
Confirmados <- as.vector(num1)

#Descesos 
vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2) 
Decesos <- as.vector(num1)

#Recuperados
vec1 <- as.vector(rec_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2) 
Recuperados <- as.vector(num1)

#Generación de un marco de datos (data frame)

datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

Grafiación de datos

Para el siguente apártado se presentaran visualizaciones donde los datos de confirmados, decesos y recuperados se representen para México

Gráfica Animada

gcov <- ggplot(data = datos1) +
  geom_line(aes(Fecha, Confirmados, colour = "Confirmados")) +
  geom_line(aes(Fecha, Decesos, colour = "Decesos")) +
  geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
  xlab("Fecha") +
  ylab("COVID 19 en México") +
  labs(colour="casos") +
  ggtitle("Casos de COVID 19 en México (Fuente: JHU CSSE") +
  scale_y_continuous(labels = comma) + 
  transition_reveal(Fecha)
gcov

Gráfica Interactiva

Se usa el paquete “plotly”

ggplotly(gcov)

Gráfica Estatica

gcov <- ggplot(data = datos1) +
  geom_line(aes(Fecha, Confirmados, colour = "Confirmados")) +
  geom_line(aes(Fecha, Decesos, colour = "Decesos")) +
  geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
  xlab("Fecha") +
  ylab("COVID 19 en México") +
  labs(colour="casos") +
  ggtitle("Casos de COVID 19 en México (Fuente: JHU CSSE") +
  scale_y_continuous(labels = comma) 
gcov

3. Datos de Enfermedades Crónicas en Sonora

“Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018”

  • El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.

Importar Datos

datos2 <- read.csv("Diagnosticos18.csv", encoding= "latin1")
class(datos2)
## [1] "data.frame"
head(datos2)
##     Estado Jurisdicción             Uneme       CLUES Cve.Persona Genero
## 1 Guerrero     ACAPULCO UNEME EC ACAPULCO GRSSA012354  GuACUN2751  Mujer
## 2 Guerrero     ACAPULCO UNEME EC ACAPULCO GRSSA012354  GuACUN5442  Mujer
## 3 Guerrero     ACAPULCO UNEME EC ACAPULCO GRSSA012354  GuACUN5995  Mujer
## 4 Guerrero     ACAPULCO UNEME EC ACAPULCO GRSSA012354  GuACUN6110 Hombre
## 5 Guerrero     ACAPULCO UNEME EC ACAPULCO GRSSA012354  GuACUN6113 Hombre
## 6 Guerrero     ACAPULCO UNEME EC ACAPULCO GRSSA012354  GuACUN5995  Mujer
##   Cve.Diagnóstico   Diagnóstico Fecha.Diagnótico
## 1           E11.9      Diabetes       08/01/2018
## 2           E11.9      Diabetes       08/01/2018
## 3           E11.9      Diabetes       08/01/2018
## 4           E11.9      Diabetes       08/01/2018
## 5           E11.9      Diabetes       08/01/2018
## 6           E78.6 Dislipidemias       08/01/2018

Tabla Interactiva de Datos de Enfermedades Crónicas

datatable(datos2)
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html

Formato de Datos

SonoraS <- t(datos2[datos2$Estado == "Sonora", ])
SonoraS <- (datos2[datos2$Estado == "Sonora", ])

Graficación

#Grafico Agrupado
ggplot(SonoraS, aes(fill=Jurisdicción, y=Diagnóstico)) +
  geom_bar(position = "dodge", stat = "count") +
  xlab ("Numero de casos") +
  ylab ("Diagnóstico") +
  ggtitle("Enfermedades cronicas en Sonora, 2018 (CENAPRECE)")