Caso de estudio de la 2da unidad de probabilidad y estadística: Enfermedades crónicas y su relación con los fallecimientos por COVID-19
- Importar bibliotecas:
setwd("~/PyE3")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")¿Que tanp probable es que un munucipio con alta cantidad de diagnósticos por enfermedades crónicas también sea un municipio con tasas elevadas de mortalidad por COVID-19?
Dado que los pacientes con enfermedades crónicas tienen mayor probabilidad de desarrollar complicaciones si se contagian.
Enfermedades crónicas en Sonora
Fuente de los datos Obtenida de: https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
URL de datos CSV crudos: http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv
Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018
- El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.
Importar datos
## [1] "data.frame"
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagn.f3.stico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
Formatear datos
Visualización
# Grouped
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") Ahora que se tienen los datos, podemos estimar la cantidad de personas diagnosticadas por jurisdicción (Ciudad):
- ¿Por qué razones si la población de Ciudad Obregón es más grande que la Santa Ana y de Caborca, existen más personas con diagnóstico de enfermedades crónicas estas últimas?
Existen varias razones principales, en Ciudad Obregón existe mucha gente que tiene hábitos que se usan mucho en pueblos, como lo son ejercitarse, caminar, comer más saludable, y esto previene parte de las enfermedades, además Santa Ana y Caborca tienen muy cerca la frontera con EUA, lo cuál influye mucho la publicidad y los hábitos estadounidenses en ese sector de la población, como comer más comida rápida, sedentarismo, etc. Lo que hace que sean más las personas con enfermedades crónicas.
- ¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26
017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273
Municipio Poblacion2015 Cronicas Fallecidos Caborca 85631 95 Santa Ana 16248 13 Cajeme 433050 625 Hermosillo 884273 1010
Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción.
Defunción por COVID-19
## Parsed with column specification:
## cols(
## .default = col_double(),
## cve_ent = col_character(),
## nombre = col_character()
## )
## See spec(...) for full column specifications.
defunciones <- read_csv("deff.csv", col_types = cols(Caborca = col_number(),
Cajeme = col_number(), Hermosillo = col_number(),
Santa = col_number()))Fecha = seq(from = as.Date("2020-03-02"), to = as.Date("2020-11-04"), by = 'day')
vec1 <- as.vector(defunciones$Caborca)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
cab <- as.vector(num1)
cab <- cumsum(cab)
vec1 <- as.vector(defunciones$Cajeme)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
caj <- as.vector(num1)
caj <- cumsum(caj)
vec1 <- as.vector(defunciones$Hermosillo)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
her <- as.vector(num1)
her <- cumsum(her)
vec1 <- as.vector(defunciones$Santa)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
san <- as.vector(num1)
san <- cumsum(san)
#generacion de un data frame
datos4 <- data.frame(Fecha, cab, caj, her, san)Visualización
defun <- ggplot(data = datos4)+
geom_line(aes(Fecha, cab, colour = 'Caborca'))+
geom_line(aes(Fecha, caj, colour = 'Cajeme'))+
geom_line(aes(Fecha, her, colour = 'Hermosillo'))+
geom_line(aes(Fecha, san, colour = 'Santa'))+
xlab('Fecha')+
ylab('Defunciones')+
labs(colour = 'Cantidad')+
ggtitle("Cantidad de defunciones por COVID-19 en Sonora")+
scale_y_continuous(labels = comma)
defun## Warning: Removed 1 row(s) containing missing values (geom_path).
## Warning: Removed 1 row(s) containing missing values (geom_path).
## Warning: Removed 1 row(s) containing missing values (geom_path).
## Warning: Removed 1 row(s) containing missing values (geom_path).
Fallecidos: https://datos.covid-19.conacyt.mx/#DownZCSV
- Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?
Hermosillo es el municipio que está más proporcionado en fallecidos por COVID-19 en relación a su población con enfermedades crónicas, sin embargo la ciudad con más personas fallecidas por COVID-19 por cada habitante con alguna enfermedad crónica sería Ciudad Obregón pues es la que tiene menos enfermedades crónicas en su población pero presenta un gran número de fallecidos, caso contrario con Caborca y Santa Ana, que presentan muchos habitantes con enfermedades crónicas pero pocas defunciones por COVID-19 registradas.
Redacción
Esto quiere decir que existen otras variables que están afectando a que Obregón tenga más fallecimientos por COVID-19 siendo que tiene menos población con enferemedades crónicas, y que no necesariamente la que tiene más enfermedades crónicas es la que tiene más fallecidos por COVID-19.