Taller de Ciencia de Datos Aplicada a Salud Pública y Epidemiología
A continuación en este documento se presentara un analisis de datos acerca de la salud publica en México y como esta ha ido evolucionando con el pasar de los años para aplicarlas en diversas situaciones, como en este caso para la pandemia de COVID 19.
El objetivo de este análisis es difundir y democratizar el uso y análisis de los datos en México para crear una masa crítica que nos permita tomar mejores decisiones en lo colectivo con mejores herramientas y métodos.
Ejercicios
*Se llevaran a cabo los siguientes 3 ejercicios:
- Datos globales de Johns Hopkins University para México.
- Datos de Coronavirus.gob.mx en Sonora y Sinaloa.
- Datos de enfermedades crónicas en Sonora.
Importación de paquetes
setwd("~/EALMV9") #Directorio de trabajo
library(pacman) #Para importar la biblioteca "Pacman"
p_load("base64enc","htmltools","mime","xfun","prettydoc","readr","knitr","DT","dplyr","ggplot2","plotly","gganimate","gifski","scales")Datos Globales de John Hopkins University para México.
Los datos obtenidos son a traves de un flujo que va de lo general a los particular
“Coronavirus COVID - 19 Global Cases by the center for systems Science and Engineering (CSSE) at Johns Hopkins University (JHU)” https://coronavirus.jhu.edu/map.html
Importar datos de JHU
# Informacion utiles que se consideran como datos crudos de confirmados, de decesos y de recuperados
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
#Leer los archivos .csv que se encuentran en las URL's
datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
#Definición de las variables
conf_mex <- t(datos_conf[datos_conf$Country.Region =="Mexico" ,])
dec_mex <- t(datos_decesos[datos_decesos$Country.Region =="Mexico" ,])
rec_mex <- t(datos_recuperados[datos_recuperados$Country.Region =="Mexico" ,])Formatear Datos
- Eliminar Campos no utilizables.
- Formatear las Fechas.
- Crear un Marco de Datos (data frame)
Fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-12-18"), by = "day" )
# Casos confirmados
vec1 <- as.vector(conf_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)
#Descesos
vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)
#Recuperados
vec1 <- as.vector(rec_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)
#Generación de un marco de datos (data frame)
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)Grafiación de datos
Para el siguente apártado se presentaran visualizaciones donde los datos de confirmados, decesos y recuperados se representen para México
Gráfica Animada
gcov <- ggplot(data = datos1) +
geom_line(aes(Fecha, Confirmados, colour = "Confirmados")) +
geom_line(aes(Fecha, Decesos, colour = "Decesos")) +
geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
xlab("Fecha") +
ylab("COVID 19 en México") +
labs(colour="casos") +
ggtitle("Casos de COVID 19 en México (Fuente: JHU CSSE") +
scale_y_continuous(labels = comma) +
transition_reveal(Fecha)
gcovGráfica Interactiva
Se usa el paquete “plotly”
ggplotly(gcov)Gráfica Estatica
gcov <- ggplot(data = datos1) +
geom_line(aes(Fecha, Confirmados, colour = "Confirmados")) +
geom_line(aes(Fecha, Decesos, colour = "Decesos")) +
geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
xlab("Fecha") +
ylab("COVID 19 en México") +
labs(colour="casos") +
ggtitle("Casos de COVID 19 en México (Fuente: JHU CSSE") +
scale_y_continuous(labels = comma)
gcov3. Datos de Enfermedades Crónicas en Sonora
Fuente de los datos Obtenida de: https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
URL de datos CSV crudos: http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv
“Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018”
- El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.
Importar Datos
datos2 <- read.csv("Diagnosticos18.csv", encoding= "latin1")
class(datos2)## [1] "data.frame"
head(datos2)## Estado Jurisdicción Uneme CLUES Cve.Persona Genero
## 1 Guerrero ACAPULCO UNEME EC ACAPULCO GRSSA012354 GuACUN2751 Mujer
## 2 Guerrero ACAPULCO UNEME EC ACAPULCO GRSSA012354 GuACUN5442 Mujer
## 3 Guerrero ACAPULCO UNEME EC ACAPULCO GRSSA012354 GuACUN5995 Mujer
## 4 Guerrero ACAPULCO UNEME EC ACAPULCO GRSSA012354 GuACUN6110 Hombre
## 5 Guerrero ACAPULCO UNEME EC ACAPULCO GRSSA012354 GuACUN6113 Hombre
## 6 Guerrero ACAPULCO UNEME EC ACAPULCO GRSSA012354 GuACUN5995 Mujer
## Cve.Diagnóstico Diagnóstico Fecha.Diagnótico
## 1 E11.9 Diabetes 08/01/2018
## 2 E11.9 Diabetes 08/01/2018
## 3 E11.9 Diabetes 08/01/2018
## 4 E11.9 Diabetes 08/01/2018
## 5 E11.9 Diabetes 08/01/2018
## 6 E78.6 Dislipidemias 08/01/2018
Tabla Interactiva de Datos de Enfermedades Crónicas
datatable(datos2)## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html
Formato de Datos
SonoraS <- t(datos2[datos2$Estado == "Sonora", ])
SonoraS <- (datos2[datos2$Estado == "Sonora", ])Graficación
#Grafico Agrupado
ggplot(SonoraS, aes(fill=Jurisdicción, y=Diagnóstico)) +
geom_bar(position = "dodge", stat = "count") +
xlab ("Numero de casos") +
ylab ("Diagnóstico") +
ggtitle("Enfermedades cronicas en Sonora, 2018 (CENAPRECE)")