u1a5

jose manzano

26/5/2021

TALLER DE CIENCIA DE DATOS APLICADA A SALUD PÚBLICA Y EPIDEMIOLOCÍA.

En este se pretende introducir al público al tema del análisis de las métricas de salud pública asi como la evolución y modelación de la pandemia de COVID-19 usando datos oficiales.

Ejercicios incluidos:

  • Datos globales de Johns Hopkins University para Mexico.
  • Datos de coronavirus.gob.mx para Sonora y Sinaloa.
  • Datos de enfermedades crónicas en Sonora.

Importación de paquetes

setwd("~/estadistica aplicada") 
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales") 

Datos globales de Johns Hopkins University para México

De lo general a lo particular. Empezamos por lo global, país, minucipio y luego por ciudad.

Código

xfun::embed_file("U1A5.Rmd")

Download U1A5.Rmd

Datos obtenidos de:

“Coronavirus COVID-19 Global Cases by the Center for Systems Science and engineering (CSSE) at Johns Hopkins University (JHU)” https://coronavirus.jhu.edu/map.html

Importacion de datos

url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"

url_decesos <-"https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"

url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)

conf_Mexico <- t(datos_conf[datos_conf$Country.Region=="Mexico" ,])
dec_Mexico <- t(datos_decesos[datos_decesos$Country.Region=="Mexico" ,])
rec_Mexico <- t(datos_recuperados[datos_recuperados$Country.Region=="Mexico" ,])

Formatear datos

objetivos:

  • Eliminar campos no utilizables
  • Formatear las fechas
  • Crear un marco de datos (date frame)
Fecha <- seq(from = as.Date("2020/01/22"), to = as.Date("2021/02/14"), by = "day")

#Casos confirmados
vec1 <- as.vector(conf_Mexico)
vec2 <- vec1[5:394]
num1 <- as.numeric(vec2) 
Confirmados <- as.vector(num1)
#decesis
vec1 <- as.vector(dec_Mexico)
vec2 <- vec1[5:394]
num1 <- as.numeric(vec2) 
Decensos <- as.vector(num1)

#recuperados
#Casos confirmados
vec1 <- as.vector(rec_Mexico)
vec2 <- vec1[5:394]
num1 <- as.numeric(vec2) 
Recuperados <- as.vector(num1)

#Generacion de un marco de datos (data frame)
datos1 <- data.frame(Fecha, Confirmados, Decensos, Recuperados)

Graficos

  • Grafica estadistica
gcov <-ggplot(data = datos1) + 
  geom_line(aes(Fecha, Confirmados, colour = "Confirmados")) +
  geom_line(aes(Fecha, Decensos, colour = "Decensos")) +
  geom_line(aes(Fecha, Recuperados, colour = "Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en México") +
  labs(colour="casos")+
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE") +
  scale_y_continuous(labels = comma)
gcov

  • Grafica interactiva Usando el paquete “plotly” Con esta gráfica podemos ver de una manera más exacta como avanzan los casos, recuperaciones y decensos del COVID-19 porque podemos interactuar con la tabla
ggplotly(gcov)
  • Gráfica animada

En este tipo de gráfica se mueve y se puede observar el progreso que ha tenido con los confirmados, decensos y recuperaciones sobre el COVID-19

ggplot(data = datos1) + 
  geom_line(aes(Fecha, Confirmados, colour = "Confirmados")) +
  geom_line(aes(Fecha, Decensos, colour = "Decensos")) +
  geom_line(aes(Fecha, Recuperados, colour = "Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en México") +
  labs(colour="casos")+
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE") +
  scale_y_continuous(labels = comma) + 
  transition_reveal(Fecha)

importacion de datos

datos2 <- read.csv("Diagnosticos18.csv", encoding = "latin1")
class(datos2)
## [1] "data.frame"
## [1] "data.frame"
head(datos2)
##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagnóstico   Diagnostico Fecha.Diagnótico
## 1           E78.2 Dislipidemias       02/01/2018
## 2           E78.2 Dislipidemias       02/01/2018
## 3           E78.2 Dislipidemias       02/01/2018
## 4           E78.2 Dislipidemias       02/01/2018
## 5           E78.2 Dislipidemias       02/01/2018
## 6           E78.2 Dislipidemias       02/01/2018

Formateo dedatos

Datos de sonora

SonoraS <- t(datos2[datos2$Estado == "Sonora", ])
SonoraS <- (datos2[datos2$Estado == "Sonora", ])

graficacion

  • grafico agrupado
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + 
    geom_bar(position="dodge", stat="count") +
    xlab ("Número de casos") +
    ylab ("Diagnostico") +
  ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

conclusion

Podemos observar que con la aplicacion de estas herramientas podemos analizar detalladamente un conjunto de información importante y relevante para las condiciones actuales