Difundir el uso y análisis de datos en México para ayudar a tomar decisiones de forma colectiva con mejores métodos y herramientas.
Introducir al público al tema del análisis de las métricas de salud pública, así como de la evolución y modelación de la panedmia de COVID-19 usando datos oficiales.
Se verán 3 ejercicios.
setwd("~/Estadistica")
library(pacman)
p_load("base64enc","htmltools","mime","xfun","prettydoc","readr","knitr","DT","dplyr","ggplot2","plotly","gganimate","gifski","scales")Para fines de reproducibilidad se incluye el código para su descarga
xfun::embed_file("U1A5.Rmd")Datos obtenidos de https://coronavirus.jhu.edu/map.html
#Ee realiza la declaración de las variables que contendrán las url en donde se encuentran los datos crudos de confirmados, decesos, recuperados
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
#Definir variables
conf_mex <- t(datos_conf[datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos[datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados[datos_recuperados$Country.Region=="Mexico" ,])#Vector de fecha
fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-12-18"), by = "day")
#CONFIRMADOS
vec1 <- as.vector(conf_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
confirmados <- as.vector(num1)
#DECESOS
vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
decesos <- as.vector(num1)
#RECUPERADOS
vec1 <- as.vector(rec_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
recuperados <- as.vector(num1)
#Generación de un marco de datos
datos1 <- data.frame(fecha, confirmados, decesos, recuperados)Se presentan visualizaciones que representan los datos de confirmados, decesos y recuperados en México
gcov <- ggplot(data = datos1) +
geom_line(aes(fecha, confirmados, colour="Confirmados")) +
geom_line(aes(fecha, decesos, colour="Decesos")) +
geom_line(aes(fecha, recuperados, colour="Recuperados")) +
xlab("Fecha") +
ylab("COVID-19 en México") +
labs(colour="casos") +
ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
scale_y_continuous(labels = comma)
gcovGráfico que resume los datos de COVID-19 en México, a lo largo del año
ggplotly(gcov)Esta es una gráfica en la cual podemos interactuar con los datos, hacer zoom, esconder variables, leer puntos, etc
ggplot(data = datos1) +
geom_line(aes(fecha, confirmados, colour="Confirmados")) +
geom_line(aes(fecha, decesos, colour="Decesos")) +
geom_line(aes(fecha, recuperados, colour="Recuperados")) +
xlab("Fecha") +
ylab("COVID-19 en México") +
labs(colour="casos") +
ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
scale_y_continuous(labels = comma) +
transition_reveal(fecha)Gráfico animado que muestra el crecimiento de los casos confirmados, decesos y recuperados de COVID-19 en México
Fuente de los datos obtenida de: https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
URL de datos CSV crudos: http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv
datos2 <- read.csv("Diagnosticos18.csv", encoding= "latin1")
class(datos2)## [1] "data.frame"
head(datos2)## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagnostico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
SonoraS <- t(datos2[datos2$Estado == "Sonora", ])
SonoraS <- (datos2[datos2$Estado == "Sonora", ])#Gráfico agrupado
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position = "dodge", stat = "count") +
xlab("Número de casos") +
ylab("Diagnóstico") +
ggtitle("Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") Este gráfico nos indica cuales son las ciudades de Sonora presentan más casos de enfermedades crónicas, la cual es Ciudad Obregón
datatable(datos2)## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html