U1A5

Angélica Payán Serna

15/02/2021


TALLER DE CIENCIA DE DATOS APLICADA A SALUD PÚBLICA Y EPIDEMIOLOGÍA

Acerca de este documento

  • Difundir el uso y análisis de datos en México para ayudar a tomar decisiones de forma colectiva con mejores métodos y herramientas.

  • Introducir al público al tema del análisis de las métricas de salud pública, así como de la evolución y modelación de la panedmia de COVID-19 usando datos oficiales.

  • Se verán 3 ejercicios.

  1. Datos globales de Johns Hopkins University para méxico.
  2. Datos de coronavirus.gob.mx para Sonora y Sinaloa.
  3. Datos de enfermedades crónicas en Sonora.

Importación de bibliotecas

setwd("~/Estadistica")
library(pacman)
p_load("base64enc","htmltools","mime","xfun","prettydoc","readr","knitr","DT","dplyr","ggplot2","plotly","gganimate","gifski","scales")

Descarga de este código

Para fines de reproducibilidad se incluye el código para su descarga

xfun::embed_file("U1A5.Rmd")

Download U1A5.Rmd

Datos globales de Johns Hopkins University para méxico

Datos obtenidos de https://coronavirus.jhu.edu/map.html

Importar datos de JHU

#Ee realiza la declaración de las variables que contendrán las url en donde se encuentran los datos crudos de confirmados, decesos, recuperados

url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"

url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"

url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)

#Definir variables

conf_mex <- t(datos_conf[datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos[datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados[datos_recuperados$Country.Region=="Mexico" ,])

Formatear datos

  • Eliminar campos no utilizables
  • Formatear las fechas
  • crear un marco de datos (data frame)
#Vector de fecha
fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-12-18"), by = "day")

#CONFIRMADOS
vec1 <- as.vector(conf_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
confirmados <- as.vector(num1)

#DECESOS
vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
decesos <- as.vector(num1)

#RECUPERADOS
vec1 <- as.vector(rec_mex)
vec2 <- vec1[5:336]
num1 <- as.numeric(vec2)
recuperados <- as.vector(num1)

#Generación de un marco de datos
datos1 <- data.frame(fecha, confirmados, decesos, recuperados)

Graficación de datos

Se presentan visualizaciones que representan los datos de confirmados, decesos y recuperados en México

Gráfica estática

gcov <- ggplot(data = datos1) + 
  geom_line(aes(fecha, confirmados, colour="Confirmados")) + 
  geom_line(aes(fecha, decesos, colour="Decesos")) + 
  geom_line(aes(fecha, recuperados, colour="Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en México") +
  labs(colour="casos") +
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
  scale_y_continuous(labels = comma)
gcov

Gráfico que resume los datos de COVID-19 en México, a lo largo del año

Gráfica interactiva

ggplotly(gcov)

Esta es una gráfica en la cual podemos interactuar con los datos, hacer zoom, esconder variables, leer puntos, etc

Gráfica animada

ggplot(data = datos1) + 
  geom_line(aes(fecha, confirmados, colour="Confirmados")) + 
  geom_line(aes(fecha, decesos, colour="Decesos")) + 
  geom_line(aes(fecha, recuperados, colour="Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en México") +
  labs(colour="casos") +
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
  scale_y_continuous(labels = comma) +
  transition_reveal(fecha)

Gráfico animado que muestra el crecimiento de los casos confirmados, decesos y recuperados de COVID-19 en México

Datos de enfermedades crónicas en Sonora

Importar datos

datos2 <- read.csv("Diagnosticos18.csv", encoding= "latin1")
class(datos2)
## [1] "data.frame"
head(datos2)
##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagnostico   Diagnostico Fecha.Diagnostico
## 1           E78.2 Dislipidemias        02/01/2018
## 2           E78.2 Dislipidemias        02/01/2018
## 3           E78.2 Dislipidemias        02/01/2018
## 4           E78.2 Dislipidemias        02/01/2018
## 5           E78.2 Dislipidemias        02/01/2018
## 6           E78.2 Dislipidemias        02/01/2018

Formateo de datos

SonoraS <- t(datos2[datos2$Estado == "Sonora", ])
SonoraS <- (datos2[datos2$Estado == "Sonora", ])

Graficación

#Gráfico agrupado
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) +
  geom_bar(position = "dodge", stat = "count") +
  xlab("Número de casos") +
  ylab("Diagnóstico") +
  ggtitle("Enfermedades crónicas en Sonora, 2018 (CENAPRECE)")

Este gráfico nos indica cuales son las ciudades de Sonora presentan más casos de enfermedades crónicas, la cual es Ciudad Obregón

Tabla interactiva de datos

datatable(datos2)
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html