Importancia de los datos ante la contingencia por COVID-19 en México
Acerca de este documento
Código de flujo de trabajo de datos realizado por Juan Badouin para el blog del proyecto colectivo Monitor Sonora
Este es un documento que explica de manera demostrativa una forma de procesar datos abiertos oficiales de México y convertirlos en análisis y visualizaciones que puedan ser útiles para los ciudadanos ante la pandemia por COVID-19
El análisis fue realizado con el objetivo de difundir y democratizar el uso y análisis de datos en México para de esta forma crear una masa crítica que nos permita tomar mejores decisiones en lo colectivo con mejores herramientas y métodos.
El código aquí usado está escrito en el lenguaje de programación abierto R y puede ser descargado y así como también sus datos en los hipervínculos que se encuentran abajo.
Importación de paquetes
Analizando Datos globales de JHU para México
*De lo general a lo particular**
Datos obtenidos de:
“Coronavirus COVID-19 Global Cases by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University (JHU)” https://coronavirus.jhu.edu/map.html
Importar datos
- Importar los datos desde su URL ‘raw’ (.csv) del github de JHU https://github.com/CSSEGISandData/COVID-19 y extraer los datos para México
#Declaracion de URL de variables
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
#Leer los archivos .csv de las URL
datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
#definir variables
conf_mex <- t(datos_conf [datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos [datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados [datos_recuperados$Country.Region=="Mexico" ,])
Formatear datos
- Convertir los datos a un “data frame”
#Vector de Fecha
Fecha = seq(from = as.Date("2020-01-22"), to = as.Date("2020-07-13"), by = 'day')
#Casos confirmados
vec1 <- as.vector(conf_mex)
vec2 <-vec1[5:178]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)
#decesos
vec1 <- as.vector(dec_mex)
vec2 <-vec1[5:178]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)
#recuperados
vec1 <- as.vector(rec_mex)
vec2 <-vec1[5:178]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)
#generacion de un data frame
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)
Visualizacion
- Creación de visualizaciones de datos
A continuación se presentan visualizaciones que representan los datos de confirmados, decesos y recuperados para México
# Gráfica estática
gcov <-ggplot(data=datos1) +
geom_line(aes(Fecha, Confirmados, colour='Confirmados')) +
geom_line(aes(Fecha, Decesos, colour='Decesos')) +
geom_line(aes(Fecha, Recuperados, colour="Recuperados"))+
xlab('Fecha') +
ylab('COVID-19 Mexico') +
labs(colour = "Casos") +
ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
scale_y_continuous(labels = comma)
gcov
Tabla interactiva de datos
*Aquí se pueden consultar los datos con los que se construyeron los gráficos anteriroes, hacer búsquedas y ordenarlos
Enfermedades crónicas en Sonora
Fuente de los datos Obtenida de: https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
URL de datos CSV crudos: http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv
Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018
- El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.
Importar datos
## [1] "data.frame"
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagnostico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018