Importar librerias
Importar datos
Caso de estudio
¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?
Las defunciones por covid-19 en sonora pueden ser causadas por enfermedades crónicas, la calidad del aire, el consumo de drogas, o incluso la pobreza.
Caso de estudio: Relación entre enfermedades crónicas y covid-19
¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?
No, Hermosillo tiene una cantidad mayor de personas con enfermedades crónicas y no tiene tantas defunciones debido a Covid-19
Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de: www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos
¿Por qué razones si la población de Ciudad Obregón es más grande que la Santa Ana y de Caborca, existen más personas con diagnóstico de enfermedades crónicas ?
Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html
¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?
No
¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?
Probablemente sea por la desigualdad económica, debido que en Cajeme existen una desigualdad económica muy grande, por ende muchas personas viven al día, lo cual significa que si un día no trabajan no comen, y para esas personas deben de trabajar todos los días, estas personas por lo general no tienen dinero para recibir atención medica, y como salen para poder trabajar se exponen demasiado.
¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?
Probablemente la contaminación del aire y el consumo de drogas sean factores importantes
¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26
017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273
Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción
Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") Los municipios que presentan mayor fallecidos por cada 10 mil habitantes son aquellos donde casi no hay habitantes, por ende no se pueden incluir, exceptuando esos municipios sigue Cajeme, Cajeme tiene una población de 433050 y tiene 625.
Asignación
¿Qué características tendría un municipio que tuviera menos defunciones?
Parece que entre mas grande el municipio posee una mayor cantidad de fallecidos, ademas de algunos otros factores
¿Qué variables se correlacionan con el número de defunciones?
pairs(select(datodefunciones,poblacion,areakm2,IM,RezagoE,CarenciasSalud,IngresoMenor,defunciones,Dx10mil,CarenciaAliemtacion,CarenciaServicioVivienda,IngresoInferiorBienestarPorcentaje))Existen demasiadas variables y es difícil ver un resultado, por eso se hará un vector de correlación para relacionar las variables y poder ver lo mas fácil
cor(select(datodefunciones,poblacion,areakm2,IM,RezagoE,CarenciasSalud,IngresoMenor,defunciones,Dx10mil,CarenciaAliemtacion,CarenciaServicioVivienda,IngresoInferiorBienestarPorcentaje))## poblacion areakm2 IM RezagoE
## poblacion 1.0000000 0.6651925 NA NA
## areakm2 0.6651925 1.0000000 NA NA
## IM NA NA 1 NA
## RezagoE NA NA NA 1
## CarenciasSalud NA NA NA NA
## IngresoMenor NA NA NA NA
## defunciones 0.9926897 0.6469147 NA NA
## Dx10mil 0.3058292 0.2174239 NA NA
## CarenciaAliemtacion NA NA NA NA
## CarenciaServicioVivienda NA NA NA NA
## IngresoInferiorBienestarPorcentaje NA NA NA NA
## CarenciasSalud IngresoMenor defunciones
## poblacion NA NA 0.9926897
## areakm2 NA NA 0.6469147
## IM NA NA NA
## RezagoE NA NA NA
## CarenciasSalud 1 NA NA
## IngresoMenor NA 1 NA
## defunciones NA NA 1.0000000
## Dx10mil NA NA 0.3207860
## CarenciaAliemtacion NA NA NA
## CarenciaServicioVivienda NA NA NA
## IngresoInferiorBienestarPorcentaje NA NA NA
## Dx10mil CarenciaAliemtacion
## poblacion 0.3058292 NA
## areakm2 0.2174239 NA
## IM NA NA
## RezagoE NA NA
## CarenciasSalud NA NA
## IngresoMenor NA NA
## defunciones 0.3207860 NA
## Dx10mil 1.0000000 NA
## CarenciaAliemtacion NA 1
## CarenciaServicioVivienda NA NA
## IngresoInferiorBienestarPorcentaje NA NA
## CarenciaServicioVivienda
## poblacion NA
## areakm2 NA
## IM NA
## RezagoE NA
## CarenciasSalud NA
## IngresoMenor NA
## defunciones NA
## Dx10mil NA
## CarenciaAliemtacion NA
## CarenciaServicioVivienda 1
## IngresoInferiorBienestarPorcentaje NA
## IngresoInferiorBienestarPorcentaje
## poblacion NA
## areakm2 NA
## IM NA
## RezagoE NA
## CarenciasSalud NA
## IngresoMenor NA
## defunciones NA
## Dx10mil NA
## CarenciaAliemtacion NA
## CarenciaServicioVivienda NA
## IngresoInferiorBienestarPorcentaje 1
Se puede ver que algunas variables no se relacionan con nada, por ende estas no se pueden tomar en cuenta, pero en algunas otras si, por ejemplo las defunciones se relacionan un 64% con el área en kilometros ^2 y en un 99% con la cantidad de personas en esa área.
¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
https://datos.covid-19.conacyt.mx/#DownZCSV
## RezagoE CarenciasSalud defunciones Dx10mil
## RezagoE 1 NA NA NA
## CarenciasSalud NA 1 NA NA
## defunciones NA NA 1.000000 0.320786
## Dx10mil NA NA 0.320786 1.000000
##
## Call:
## lm(formula = poblacion ~ defunciones, data = datodefunciones)
##
## Residuals:
## Min 1Q Median 3Q Max
## -83154 -2814 -1960 1174 52276
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3554.33 1809.34 1.964 0.0535 .
## defunciones 820.24 11.92 68.814 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14700 on 70 degrees of freedom
## Multiple R-squared: 0.9854, Adjusted R-squared: 0.9852
## F-statistic: 4735 on 1 and 70 DF, p-value: < 2.2e-16
## 2.5 % 97.5 %
## (Intercept) -54.29607 7162.9488
## defunciones 796.46670 844.0129
Se puede ver que están relacionados entre si.
cor.test(x = datodefunciones$poblacion, y = datodefunciones$defunciones, method="pearson", digits=3)##
## Pearson's product-moment correlation
##
## data: datodefunciones$poblacion and datodefunciones$defunciones
## t = 68.814, df = 70, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9883071 0.9954335
## sample estimates:
## cor
## 0.9926897
Se puede ver que tienen una relación de 99% por ende están estrechamente relacionados entre si.
Se puede ver que no necesariamente los municipios con mayor rezago educativo son los que tiene mas muertes, por ejemplo, Cajeme tiene un rezago educativo muy bajo en relación a la cantidad de población, y es el que tiene mas muertes por cada 10 mil habitantes.
Conclusión
Se podría decir que la cantidad de personas en un área afecta directamente a la cantidad de defunciones, se puede suponer que entre mas personas haya en una zona mas muertes por covid-19 habrá, ademas de que la educación no es un factor importante, ya que en lugares con buena educación las muertes son mayores, también se puede decir que la pobreza es una factor, ya que la desigualdad económica hace que las personas salga a diario para trabajar, esto los expone a enfermarse, adema la pobreza causa que no se puedan atender en hospitales y esto causa que se agrave el problema.
Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html
https://datos.gob.mx/busca/dataset?theme=Salud
¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/
Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. añada estos datos al excel datossalud