U2A11
Caso de estudio de la 2da unidad de probabilidad y estadística: Enfermedades crónicas y su relación con los fallecimientos por COVID-19
- Importar bibliotecas:
setwd("~/PyE 11 AM")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")¿Que tan probable es que un munucipio con alta cantidad de diagnósticos por enfermedades crónicas también sea un municipio con tasas elevadas de mortalidad por COVID-19?
Dado que los pacientes con enfermedades crónicas tienen mayor probabilidad de desarrollar complicaciones si se contagian. Se tiene cierta hipótesis nula al respecto, pudiendo ser un factor determinante al momento crucial de una persona recibir tratamiento en contra de covid-19.
Enfermedades crónicas en Sonora
Fuente de los datos Obtenida de: https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
URL de datos CSV crudos: http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv
Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018
- El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.
Importar datos
## [1] "data.frame"
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagn.f3.stico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
Los datos importados más arriba, proporcionan información indicativa sobre la cantidad de personas que poseen enfermedades crónicas en los 4 municipios de Caborca, Santa Ana, Hermosillo y Cajeme. Esto es con el fin de más adelante realizar comparaciones al respecto y determinar si el municipio con mayor número de defunciones efectivamente es el mismo que posee habitantes con mayores enfermades crónicas, tales como diabetes, obesidad, hipertensión, entre otras.
Formatear datos
Visualización
# Grouped
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") En este caso, los datos son visualizados por medio de un gráfica, que muestra como se distribuyen los habitantes de esos 4 municipios del estado de Sonora que en el año 2018 tenían las enfermedades indicadas. Debe tenerse en cuenta que estos datos poseen 2 años de antigüedad, por lo cual podrían no ser del todo viables para fechas de finales de 2020.
- ¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?
$$
Para saber eso, es necesario comparar la cantidad de personas fallecidas por covid, con aquellas que poseen enfermedades crónicas. Al hacerlo, se hace obvio que a pesas de que obviamente Hermosillo supere a Cajeme tanto en cantidad de personas con enfermedades crónicas, como en fallecidos, existe una mayor cantidad de estos últimos en el municipio aparentemente más sano, siendo incluso mayor que en Caborca y Santa Ana, siendo lugares con poblaciones menos saludables según los datos proporcionados.
- ¿Por qué razones si la población de Ciudad Obregón es más grande que la santa ana y de caborca, existen más personas con diagnóstico de enfermedades crónicas ?
La razón de esto, puede ser probablemente al hecho de que estas tres localidades, se encuentran más cercanas a la frontera con Estados Unidos, a diferencia de Cajeme ubicada en el sur del Estado. Esto puede repercutir en los hábitos alimenticios de los habitantes, pues al estar más cerca del país vecino, posiblemente se tenga una influencia mucho mayor de cadenas de comidas rápidas o sea más habitual observar en mercados y tiendas productos importados pero muy procesados, que como es bien sabido, a la larga generan consecuencias en la sallud de las personas que los consumen. Además, Cajeme se encuentra en una región donde los negocios de la agricultura, ganadería y pesca son comunes y explotados, por lo cual es normal que a sus habitantes les sea más accesibles con respecto a alimentos o productos precesados.
Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción
- Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?
No, como se menciona arriba, Cajeme siendo el municipio con menores cantidades de personas con enfermedades crónicas, es el que posee más fallecidos por Covid-19 por cada 10 mil habitantes. Esto hace que se tenga que descartar la hipótesis nula de un principio que trataba de relacionar las personas enfermas, con las personas fallecidas por Covid-19.
Fallecidos: https://datos.covid-19.conacyt.mx/#DownZCSV
Asignación nueva
Importar datos nuevos
##
## -- Column specification --------------------------------------------------------
## cols(
## clave = col_double(),
## municipio = col_character(),
## poblacion = col_double(),
## areakm2 = col_number(),
## IM = col_double(),
## GM = col_character(),
## RezagoE = col_character(),
## CarenciasSalud = col_character(),
## IngresoMenor = col_character(),
## defunciones = col_double(),
## Dx10mil = col_double(),
## CarenciaAccesoAlim = col_double(),
## CarenciaCalidadVivienda = col_character(),
## vulnerables_ingreso = col_character()
## )
## [1] "spec_tbl_df" "tbl_df" "tbl" "data.frame"
El siguiente, se trata de un conjunto de datos de la población del estado de Sonora, que puede ayudar a predecir que tan probable será que una persona fallezca a causa de Covid-19, analizando las variables que se muestran.
Transformar datos nuevos
Con los datos obtenidos, se realiza una matriz, para poder aplicar una análisis de correlación.
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
Def <- as.numeric(datosalud$defunciones)
CCA <- as.numeric(datosalud$CarenciaAccesoAlim)
CCV <- as.numeric(datosalud$CarenciaCalidadVivienda)## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
Correlación
## IM RezE CarS IngM Def CCA CCV Vuln
## IM 1.0000000 NA NA NA -0.3113293 -0.3081835 NA NA
## RezE NA 1 NA NA NA NA NA NA
## CarS NA NA 1 NA NA NA NA NA
## IngM NA NA NA 1 NA NA NA NA
## Def -0.3113293 NA NA NA 1.0000000 0.9866953 NA NA
## CCA -0.3081835 NA NA NA 0.9866953 1.0000000 NA NA
## CCV NA NA NA NA NA NA 1 NA
## Vuln NA NA NA NA NA NA NA 1
Lo anterior es una muestra clara del como afecta una carencia de algo tan básico como la alimentación, en el número de fallecidos que se pueden llegar a presentar. Como se puede observar por el grado de correlación de casi 1, además de la gráfica con el índice de correlación, están fuertemente ligados el uno al otro. Además, hay que indicarse que, para la mayoría de municipios, una carencia de alimentación baja, corresponde con una cantidad de defunciones bajas, pero en aquellos en donde la carencia es alta, también lo son las defunciones.
- ¿Qué características tendría un municipio que tuviera menos defunciones?
Debería contar con un grado de marginación bajo y pocas carencias, tanto de vivienda como de alimentación, para que su población se encontrara saludable y con las capacidades económicas para responder ante una emergencia como lo sería un caso de Covid-19 en una familia promedio y con la situación actual de la mayoría de negocios en pausa.
- ¿Qué variables se correlacionan con el número de defunciones?
Para el estado de Sonora, la única variable que mostró correlación con el número de defunciones, fue la encargada de medir las carencias de alimentación de la población.
- ¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
No necesariamente, ya que como se ha mostrado, no existe una correlación, al menos del mismo tipo que como si lo hay con las carencias alimenticias.
- ¿Qué otras variables podemos añadir al análisis?
Pudiera ser conveniente obtener una variable que mida el grado de delincuencia en las personas, así como si también, estas existen más personas trabajando en esos municipios con mayores defunciones por Covid, que en aquellos con menos.
Redacción personal
Tal y como se demuestra por los datos, aunque no lo sea del todo, un factor importante en la manera en que fallecen las personas por Coronavirus, es su situación económica, ya que de esta derivan otras variables como las carencias alimenticias y otras aún no registradas, como el que tantas personas trabajan en esos municipios. Quizá es un factor más importante que el que tan previamente enferma se encuentra la población, sin embargo, todavía no es posible determinarse eso último.