U1A5

Fernando A.

12/2/2021

1 Actividad 5, modelación documento de salud pública y epidemiología

1 Actividad 5, modelación documento de salud pública y epidemiología

En esta actividad se modelarán y analizaran los datos de “JOHNS HOPKINS university of medicine” acerca de los casos de infección, recuperación y muertes ocasionadas por COVID-19

1.1 Para descargar este código

Debido a que esta es una actividad de uso libre, se deja a disposición de quien guste usar este código.

xfun::embed_file("U1A5.Rmd")

Download U1A5.Rmd

En esta actividad se harán recolecciones de datos libres y modelación de los mismos de:

1.2 Importación de librerias

setwd("~/Documents/EA9") # Este es mi directorio de trabajo, en caso de replicar el código se deberá de cambiar el propio.
# pacman ayuda a importar paquetes de manera mas fácil, en caso de que no se cuente con esta librería utilizar el código install.packages('pacman')
library(pacman) # Se importa pacman
p_load('htmltools','mime','prettydoc','xfun','readr','DT','dplyr','ggplot2','plotly','gganimate','gifski','scales') # Esta función instala e importa paquetes con ayuda de pacman

1.3 Recolección y Modelación de datos de COVID-19 JOHNS HOPKINS university of medicine para México

Datos obtenidos de la universidad de JOHNS HOPKINS

1.3.1 Importación de datos de JHONS HOPKINS

1.3.1.1 Ligas para acceder a los datos

1.3.1.2 Importación y filtrado de los datos en R

1.3.1.2.1 Se guardan los datos crudos en varaibles para su posterior manipulación

url_confimados <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv'

url_decesos <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv'

url_recuperados <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv'

1.3.1.2.2 Leer los datos de las urls

confirmados <- read.csv(url_confimados) # Datos de personas confirmadas de covid-19

decesos <- read.csv(url_decesos) # Datos de personas fallecidas de covid-19

recuperados <- read.csv(url_recuperados) # Datos de personas recuperadas de covid-19

1.3.1.2.3 Declaración de variables para México

confirmadosMX <- t(confirmados[confirmados$Country.Region=='Mexico' ,])
decesosMX <- t(decesos[decesos$Country.Region=='Mexico' ,])
recuperadosMX <- t(recuperados[recuperados$Country.Region=='Mexico' ,])

1.3.1.2.4 Declaración de una fecha personalizada mas adecuada al formato utilizado en México

# Formato: YYYY/MM/DD
Fecha <- seq(from = as.Date('2020/01/22'), to = as.Date('2021/02/13'), by = 'day')

1.3.1.2.5 Filtrado y formateo de datos

# Confirmados
confirmadosMX <- as.vector(confirmadosMX)
confirmadosMX <- confirmadosMX[5:393]
confirmadosMX <- as.numeric(confirmadosMX)

# Recuperados
recuperadosMX <- as.vector(recuperadosMX)
recuperadosMX <- recuperadosMX[5:393]
recuperadosMX <- as.numeric(recuperadosMX)

# Decesos
decesosMX <- as.vector(decesosMX)
decesosMX <- decesosMX[5:393]
decesosMX <- as.numeric(decesosMX)

1.3.1.2.6 Creación de un data frame

# Es esta apartado se crea un data frame, de esta manera se trabajará de una manera mas organizada, ademas de la facilidad de manipulas y visualizar los datos, ya que están dentro de una misma "matriz"
covid <- data.frame(Fecha,confirmadosMX,recuperadosMX,decesosMX)

1.3.2 Visualización de datos en una tabla

El data frame creado anteriormente contienes todos los datos en una tabla, a continuación se podrán visualizar los datos en una tabla, esto es solamente ilustrativo.

datatable(covid)

1.3.3 Gráfica estatica

graficaCovid <- ggplot(data = covid)+
    geom_line(aes(x = Fecha, y = confirmadosMX, colour="Confirmados"))+
    geom_line(aes(x = Fecha, y = decesosMX, colour="Decesos"))+
    geom_line(aes(x = Fecha, y = recuperadosMX, colour="Recuperados"))+
    labs(title="Casos de COVID-19 en México", subtitle="Fuente: JHU CSSE", x="Fecha",y="COVID-19 en México",colour="Casos")+
    scale_y_continuous(labels=comma)
graficaCovid

1.3.4 Gráfica interactiva sobre los datos de covid-19 en México

ggplotly(graficaCovid)

La gráfica interactiva es muy interesante porque permite ver números especificos con solo poner el cursor sobre la linea

1.3.5 Gráfica animada

La gráfica animada sirve para poder observar como los casos van en aumento basándose en el aumento de la fecha

graficaCovid + transition_reveal(Fecha)

Como se puede apreciar la gráfica animada muestra en base a la fecha como han ido aumentado los casos de confirmados, recuperados y fallecidos debido al COVID-19

1.4 Recolección y Modelación de datos de enfermedades crónicas en Sonora.

Datos tomados de datos.gob
Datos crudos en .CSV
En caso de no encontrar los datos o que no permita la descarga, se pueden descargar de aquí

xfun::embed_file("Diagnosticos18.csv")

Download Diagnosticos18.csv

1.4.1 Importanción de datos del Gobierno federal sobre Enfermedades cronicas para el estado de Sonora

enfermedades <- read.csv("Diagnosticos18.csv", encoding = "UTF-8")

1.4.2 Visualización de datos en una tabla

datatable(enfermedades) # El archivo es demasiado grande es complicado para R poder cargarlo todo para visualizarlo, por ende en este caso se usará la sentencia head para poder ver el tipo de datos de los encabezado

## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html

head(enfermedades)

##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagnostico   Diagnostico Fecha.Diagnotico
## 1           E78.2 Dislipidemias       02/01/2018
## 2           E78.2 Dislipidemias       02/01/2018
## 3           E78.2 Dislipidemias       02/01/2018
## 4           E78.2 Dislipidemias       02/01/2018
## 5           E78.2 Dislipidemias       02/01/2018
## 6           E78.2 Dislipidemias       02/01/2018

1.4.3 Formateo de datos

enfermedadesS <- t(enfermedades[enfermedades$Estado == "Sonora", ])
enfermedadesS <- (enfermedades[enfermedades$Estado == "Sonora", ])

1.4.4 Gráficación de los datos de las enfermedades en sonora

1.4.4.1 Gráfico de agrupación

enfermedadesG <- ggplot(enfermedadesS, aes(fill=Jurisdiccion, y=Diagnostico))+
    geom_bar(position = "dodge", stat="count")+
    labs(title="Enfermedades cronicas en Sonora, 2018",subtitle = "Fuente: CENAPRECE",x="Número de casos",y="Diagnostico")
enfermedadesG

1.4.5 Gráfica interactiva sobre las enfermedades cronicas en Sonora

ggplotly(enfermedadesG)

1.4.6 Visualización de las enfermedades en sonora

datatable(enfermedadesS)

## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html