Caso de estudio de la 2da unidad de probabilidad y estadística: Enfermedades crónicas y su relación con los fallecimientos por COVID-19

Enfermedades crónicas y COVID-19

  • Importar bibliotecas:
setwd("~/PYE1112ITSON")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales","readxl")
  • ¿Que tan probable es que un municipio con alta cantidad de diagnósticos por enfermedades crónicas también sea un municipio con tasas elevadas de mortalidad por COVID-19?

  • Dado que los pacientes con enfermedades crónicas tienen mayor probabilidad de desarrollar complicaciones si se contagian.

Enfermedades crónicas en Sonora

¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?

Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de:

  • Fuente de los datos Obtenida de:

https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018

  • URL de datos CSV crudos:

http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv

Podemos ver la gráfica y código aquí:

https://rpubs.com/jigbadouin/MSDatos

Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018

  • El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.

Importar datos

datos2 <- read.csv("Diagnosticos18.csv",encoding = "UTF-8")
class(datos2)
## [1] "data.frame"
head(datos2)
##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagn.f3.stico   Diagnostico Fecha.Diagnostico
## 1              E78.2 Dislipidemias        02/01/2018
## 2              E78.2 Dislipidemias        02/01/2018
## 3              E78.2 Dislipidemias        02/01/2018
## 4              E78.2 Dislipidemias        02/01/2018
## 5              E78.2 Dislipidemias        02/01/2018
## 6              E78.2 Dislipidemias        02/01/2018

Formatear datos

SonoraS <- t(datos2 [datos2$Estado == "Sonora", ])
SonoraS <- (datos2 [datos2$Estado == "Sonora", ])

Visualización

# Grouped
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + 
    geom_bar(position="dodge", stat="count") +
    xlab ("Número de casos") +
    ylab ("Diagnóstico") +
  ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)")    

Ahora que se tienen los datos, podemos estimar la cantidad de personas diagnísticadas por jurisdicción (ciudad)

  • ¿Por qué razones si la población de Ciudad Obregón es más grande que la Santa Ana y de Caborca, existen más personas con diagnóstico de enfermedades crónicas?

Puede deberse a diferentes motivos, entre ellos encontramos que estas dos últimas ciudades se encuentran localizadas más cerca de la frontera con Estados Unidos, propiciando así adoptar ciertos hábitos del estilo de vida estadounidense como el sedentarismo, y consumismo de comida chatarra o procesada. Probablemente la población de Ciudad Obregón, en su mayoría, aún acostumbre a comer en casa (más sano) y a salir a caminar (a parques, por ejemplo).

  • ¿Cuánta gente habita en cada ciudad?

Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26

Clave Municipio Población

017 Caborca: 85631

058 Santa Ana: 16248

018 Cajeme: 433050

030 Hermosillo: 884273

Total de defunciones en Caborca: 95

Total de defunciones en Cajeme: 625

Total de defunciones en Hermosillo: 1010

Total de defunciones en Santa Ana: 113

  • Si hacemos una relación de número de personas fallecidas por cada 10,000 habitantes, para poder comparar en proporción, tenemos que por cada 10,000 habitantes*:

Defunciones en Caborca*: 12

Defunciones en Cajeme*: 15

Defunciones en Hermosillo*: 12

Defunciones en Santa Ana*: 70

Para el cálculo de los datos anteriores, se dividió el número de fallecidos por COVID-19 en cada municipio, entre su población total dividida entre diez mil.

  • Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? Santa Ana ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos? No; Hermosillo presenta muchísimos más diagnósticos de enfermedades crónicas y sin embargo presenta menos fallecidos por cada diez mil habitantes que Ciudad Obregón. Esto puede deberse, a que ciudad Hermosillo es capital del estado, y es una ciudad más próxima a EEUU, teniendo posiblemente acceso a mejores servicios de salud (instalaciones, personal capacitado, etc). Las medidas tomadas por cada ayuntamiento para afrontar la pandemia también pueden ser un factor a considerar.

Ordene en una tabla:

Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones

datosdalud <- read_excel("datosdalud.xlsx")

datatable(datosdalud)

Asignación

  • ¿Qué características tendría un municipio que tuviera menos defunciones?

Un buen sistema de salud, población saludable y activa (con pocos diagnósticos de enfermedades crónicas), buen nivel económico y educativo. Sin embargo en los datos, podemos observar que los municipios sin defunciones por COVID-19, son aquellos con menor número de habitantes, y resagos en las indicadores anteriormente mencionados.

  • ¿Qué variables se correlacionan con el número de defunciones?

Enfermedades crónicas, pobreza, entre otros:

#Importar datos
datodefunciones <- read_excel("datodefunciones.xlsx")
datatable(datodefunciones)
#Análisis de defunciones en proporción
summary(datodefunciones$Dx10mil)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   5.101   5.696   9.549  26.882
#MARCO DE DATOS
Defunciones <- datodefunciones$defunciones
CarenciaAccesoAlim <- datodefunciones$CarenciaAccesoAlim
RezagoEscolar <- datodefunciones$RezagoE

Defuncionesx10mil <- as.numeric(datodefunciones$Dx10mil)
IM <- as.numeric(datodefunciones$IM)
CarenciasSalud <- as.numeric(datodefunciones$CarenciasSalud)
IngresoMenor <- as.numeric(datodefunciones$IngresoMenor)
CarenciaCalidadVivienda <- as.numeric(datodefunciones$CarenciaCalidadVivienda)

variables <- data.frame(Defunciones, Defuncionesx10mil, IM, RezagoEscolar, CarenciasSalud, IngresoMenor, CarenciaAccesoAlim, CarenciaCalidadVivienda)

#MATRIZ DE CORRELACIÓN
cor(variables)
##                         Defunciones Defuncionesx10mil         IM RezagoEscolar
## Defunciones               1.0000000         0.3207860 -0.3113293    0.98401459
## Defuncionesx10mil         0.3207860         1.0000000 -0.2337152    0.33334330
## IM                       -0.3113293        -0.2337152  1.0000000   -0.30001375
## RezagoEscolar             0.9840146         0.3333433 -0.3000137    1.00000000
## CarenciasSalud            0.9700615         0.3297990 -0.3409449    0.98433483
## IngresoMenor             -0.1062908        -0.1368000  0.6138393   -0.05267524
## CarenciaAccesoAlim        0.9866953         0.3240695 -0.3081835    0.99097478
## CarenciaCalidadVivienda  -0.1458531        -0.1150329  0.1575851   -0.16592147
##                         CarenciasSalud IngresoMenor CarenciaAccesoAlim
## Defunciones                 0.97006148  -0.10629077         0.98669528
## Defuncionesx10mil           0.32979896  -0.13680001         0.32406951
## IM                         -0.34094494   0.61383934        -0.30818346
## RezagoEscolar               0.98433483  -0.05267524         0.99097478
## CarenciasSalud              1.00000000  -0.07740579         0.97351933
## IngresoMenor               -0.07740579   1.00000000        -0.07533714
## CarenciaAccesoAlim          0.97351933  -0.07533714         1.00000000
## CarenciaCalidadVivienda    -0.16322112   0.03765432        -0.16169238
##                         CarenciaCalidadVivienda
## Defunciones                         -0.14585307
## Defuncionesx10mil                   -0.11503291
## IM                                   0.15758506
## RezagoEscolar                       -0.16592147
## CarenciasSalud                      -0.16322112
## IngresoMenor                         0.03765432
## CarenciaAccesoAlim                  -0.16169238
## CarenciaCalidadVivienda              1.00000000

Podemos observar una correlación alta entre las variables:

  1. Defunciones y Rezago escolar 0.9840146

  2. Defunciones y Carencia de salud 0.9700615

  3. Defunciones y Carencia de acceso a la alimentación 0.9866953

  • ¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
summary(RezagoEscolar)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0   281.5   681.0  5142.8  2991.0 93337.0
sort(RezagoEscolar)
##  [1]     0    82    99   134   139   140   148   152   159   168   242   246
## [13]   256   258   260   271   277   280   282   291   304   306   310   326
## [25]   351   389   408   411   425   428   434   555   595   616   652   677
## [37]   685   704   845   906   907   970  1078  1160  1335  1387  1461  1728
## [49]  1811  1900  2073  2285  2303  2862  3378  3646  3741  4181  4433  6026
## [61]  8057  9003  9157 11620 12417 16016 21404 21781 25704 32326 46583 93337

Municipio —— Población RezagoEscolar Defunciones Dx10mil

Hermosillo ——– 884273 ———– 93337 — 1010 - 12

San Felipe de Jesús – 407 ————– 82 ——— 0 - 0

La respuesta es no, porque hay que tomar otros factores en cuenta como la población, y situaciones como que la gente de municipios más pequeños, van a atenderse, y muchas veces fallecen en municipios con mejores sistemas de salud y menor rezago educativo.

  • ¿Qué otras variables podemos añadir al análisis?

Carencia de salud, carencia de acceso a la alimentación, empleos informales, movimiento de la población (fuera de sus viviendas), entre otros.

https://datos.covid-19.conacyt.mx/#DownZCSV

Bosque aleatorio:

https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html

https://datos.gob.mx/busca/dataset?theme=Salud

  • ¿Tiene que ver además de la educación y la salud la pobreza de las personas como incidente en la probabilidad de generar complicaciones por COVID-19? índice de pobreza en Sonora:

https://www.coneval.org.mx/coordinacion/entidades/Sonora/Paginas/pobreza_municipal2015.aspx

índice de pobreza en Sonora

Indicadores de marginación y pobreza: http://www.coespo.sonora.gob.mx/indicadores/sociodemograficos/indice-y-grado-de-marginacion.html

La respuesta es si, porque la pobreza impide, en la mayoria de los casos, acceso a la alimentación, a vivienda de calidad, a servicios médicos especializados; y favorece los empleos informales, sin seguro médico que obligan a la población a salir a la calle y exponerse por necesidad de trabajar para subsistir.

Conclusión

Con ayuda de la estadística podemos estimar la relación que existe entre dos o más variables, y con ello construir modelos de predicción, para el cálculo de probabilidad.

En este caso de estudio, podemos identificar las variables sociales que se relacionan con el número de defunciones por COVID-19, y con ello, hacer un análisis que nos indique la probabilidad de tener complicaciones o fallecer por COVID-19 en caso de que cumplamos ciertos criterios, como tener o no un diagnóstico de enfermedades crónicas, tener cierta edad, nivel económico o educativo, vivir en un municipio con carencias de atención médica, entre otros.