Caso de estudio de la 2da unidad de probabilidad y estadística: Enfermedades crónicas y su relación con los fallecimientos por COVID-19
- Importar bibliotecas:
setwd("~/PYE1112ADITSON")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales", "readxl")¿Que tanp probable es que un munucipio con alta cantidad de diagnósticos por enfermedades crónicas también sea un municipio con tasas elevadas de mortalidad por COVID-19?
Dado que los pacientes con enfermedades crónicas tienen mayor probabilidad de desarrollar complicaciones si se contagian.
Enfermedades crónicas en Sonora
Fuente de los datos Obtenida de: https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
URL de datos CSV crudos: http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv
Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018
- El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.
Importar datos
## [1] "data.frame"
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagn.f3.stico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
Formatear datos
Visualización
# Grouped
ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") Ahora que se tienen los datos, podemos estimar la cantidad de personas diagnísticadas por jurisdicción (Ciudad):
- ¿Por qué razones si la población de Ciudad Obregón es más grande que la Santa Ana y de Caborca, existen más personas con diagnóstico de enfermedades crónicas estas últimas?
En Ciudad Obregón la gente sigue teniendo las costumbres de los pueblos que hay a su alrededor, caborca, al contrario, adquirió costumbres de Estados Unidos al estar tan cerca de la frontera.
¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26
Hermosillo 884 273 personas
Cajeme 433 050 personas
Caborca 85 631 personas
Santa Ana 16 248 personas
Defunciones en Caborca: 95
Defunciones en Cajeme: 625
Defunciones en Hermosillo: 1010
Defunciones en Santa Ana: 113
Realizando relaciones por cada 10,000 personas queda de la siguiente forma:
Defunciones en Caborca: 12
Defunciones en Cajeme: 15
Defunciones en Hermosillo: 12
Defunciones en Santa Ana: 70
Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?
Fallecidos: https://datos.covid-19.conacyt.mx/#DownZCSV
Santa Ana es la ciudad que más presenta defunciones en proporción a sus habitantes, sin embargo, la ciudad que cuenta con más diagnósticos de enfermedades crónicas es Hermosillo.
Asignación
¿De qué manera podemos saber qué variables hacen que el número de fallecidos por ciudad aumente o disminuya?
Hacer una matriz de diagramas de dispersión para poder saber qué variables se correlacionan mejor entre sí, para esto será indispensable que no solamente use las variables que fueron proporcionadas, sino también variables que consideren que influyen.
¿Tiene que ver además de la educación y la salud la pobreza de las personas como incidente en la probabilidad de generar complicaciones por COVID-19?
https://www.coneval.org.mx/coordinacion/entidades/Sonora/Paginas/pobreza_municipal2015.aspx
Indicadores de marginación y pobreza:
http://www.coespo.sonora.gob.mx/indicadores/sociodemograficos/indice-y-grado-de-marginacion.html
Defunciones <- as.numeric(datodefunciones$defunciones)
CarenciaAccesoAlim <- as.numeric(datodefunciones$CarenciaAccesoAlim)
RezagoEscolar <- as.numeric(datodefunciones$RezagoE)## Warning: NAs introducidos por coerción
Defuncionesx10mil <- as.numeric(datodefunciones$Dx10mil)
IM <- as.numeric(datodefunciones$IM)
CarenciasSalud <- as.numeric(datodefunciones$CarenciasSalud)## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
data <- data.frame(Defunciones, Defuncionesx10mil, IM, RezagoEscolar, CarenciasSalud, IngresoMenor, CarenciaAccesoAlim, CarenciaCalidadVivienda)
cor(data)## Defunciones Defuncionesx10mil IM RezagoEscolar
## Defunciones 1.0000000 0.3207860 NA NA
## Defuncionesx10mil 0.3207860 1.0000000 NA NA
## IM NA NA 1 NA
## RezagoEscolar NA NA NA 1
## CarenciasSalud NA NA NA NA
## IngresoMenor NA NA NA NA
## CarenciaAccesoAlim 0.9866953 0.3240695 NA NA
## CarenciaCalidadVivienda NA NA NA NA
## CarenciasSalud IngresoMenor CarenciaAccesoAlim
## Defunciones NA NA 0.9866953
## Defuncionesx10mil NA NA 0.3240695
## IM NA NA NA
## RezagoEscolar NA NA NA
## CarenciasSalud 1 NA NA
## IngresoMenor NA 1 NA
## CarenciaAccesoAlim NA NA 1.0000000
## CarenciaCalidadVivienda NA NA NA
## CarenciaCalidadVivienda
## Defunciones NA
## Defuncionesx10mil NA
## IM NA
## RezagoEscolar NA
## CarenciasSalud NA
## IngresoMenor NA
## CarenciaAccesoAlim NA
## CarenciaCalidadVivienda 1
- ¿Qué características tendría un municipio que tuviera menos defunciones?
Son los municipios con menor población y con menos ingresos.
- ¿Qué variables se correlacionan con el número de defunciones?
La carencia de alimentación de la población.
- ¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
Lo municipios con mayor rezado son los que tienen mayor número de defunciones.
- ¿Qué otras variables podemos añadir al análisis?
Se le puede añadir los datos de permanencia en casa, delincuencia, etc.
https://datos.covid-19.conacyt.mx/#DownZCSV
Bosque aleatorio:
https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html