Importar librerias

library(pacman)
p_load('fdth','readr','readxl','DT','ggplot2','dplyr','prettydoc')

Importar datos

datodefunciones <- read_excel("datodefunciones.xlsx")
datos2 <- read.csv("Diagnosticos18.csv",encoding = "UTF-8")
SonoraS <- t(datos2 [datos2$Estado == "Sonora", ])
SonoraS <- (datos2 [datos2$Estado == "Sonora", ])

Caso de estudio

¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?

Las defunciones por covid-19 en sonora pueden ser causadas por enfermedades crónicas, la calidad del aire, el consumo de drogas, o incluso la pobreza.

Caso de estudio: Relación entre enfermedades crónicas y covid-19

¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?

No, Hermosillo tiene una cantidad mayor de personas con enfermedades crónicas y no tiene tantas defunciones debido a Covid-19

Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de: www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018

Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos

¿Por qué razones si la población de Ciudad Obregón es más grande que la Santa Ana y de Caborca, existen más personas con diagnóstico de enfermedades crónicas ?

Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones

datatable(SonoraS)
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html

¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?

No

¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?

Probablemente sea por la desigualdad económica, debido que en Cajeme existen una desigualdad económica muy grande, por ende muchas personas viven al día, lo cual significa que si un día no trabajan no comen, y para esas personas deben de trabajar todos los días, estas personas por lo general no tienen dinero para recibir atención medica, y como salen para poder trabajar se exponen demasiado.

¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?

Probablemente la contaminación del aire y el consumo de drogas sean factores importantes

¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26

017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273

Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción

Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?

ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + 
    geom_bar(position="dodge", stat="count") +
    xlab ("Número de casos") +
    ylab ("Diagnóstico") +
  ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

datatable(datodefunciones)

Los municipios que presentan mayor fallecidos por cada 10 mil habitantes son aquellos donde casi no hay habitantes, por ende no se pueden incluir, exceptuando esos municipios sigue Cajeme, Cajeme tiene una población de 433050 y tiene 625.

Asignación

¿Qué características tendría un municipio que tuviera menos defunciones?

Parece que entre mas grande el municipio posee una mayor cantidad de fallecidos, ademas de algunos otros factores

¿Qué variables se correlacionan con el número de defunciones?

pairs(select(datodefunciones,poblacion,areakm2,IM,RezagoE,CarenciasSalud,IngresoMenor,defunciones,Dx10mil,CarenciaAliemtacion,CarenciaServicioVivienda,IngresoInferiorBienestarPorcentaje))

Existen demasiadas variables y es difícil ver un resultado, por eso se hará un vector de correlación para relacionar las variables y poder ver lo mas fácil

cor(select(datodefunciones,poblacion,areakm2,IM,RezagoE,CarenciasSalud,IngresoMenor,defunciones,Dx10mil,CarenciaAliemtacion,CarenciaServicioVivienda,IngresoInferiorBienestarPorcentaje))
##                                    poblacion   areakm2 IM RezagoE
## poblacion                          1.0000000 0.6651925 NA      NA
## areakm2                            0.6651925 1.0000000 NA      NA
## IM                                        NA        NA  1      NA
## RezagoE                                   NA        NA NA       1
## CarenciasSalud                            NA        NA NA      NA
## IngresoMenor                              NA        NA NA      NA
## defunciones                        0.9926897 0.6469147 NA      NA
## Dx10mil                            0.3058292 0.2174239 NA      NA
## CarenciaAliemtacion                       NA        NA NA      NA
## CarenciaServicioVivienda                  NA        NA NA      NA
## IngresoInferiorBienestarPorcentaje        NA        NA NA      NA
##                                    CarenciasSalud IngresoMenor defunciones
## poblacion                                      NA           NA   0.9926897
## areakm2                                        NA           NA   0.6469147
## IM                                             NA           NA          NA
## RezagoE                                        NA           NA          NA
## CarenciasSalud                                  1           NA          NA
## IngresoMenor                                   NA            1          NA
## defunciones                                    NA           NA   1.0000000
## Dx10mil                                        NA           NA   0.3207860
## CarenciaAliemtacion                            NA           NA          NA
## CarenciaServicioVivienda                       NA           NA          NA
## IngresoInferiorBienestarPorcentaje             NA           NA          NA
##                                      Dx10mil CarenciaAliemtacion
## poblacion                          0.3058292                  NA
## areakm2                            0.2174239                  NA
## IM                                        NA                  NA
## RezagoE                                   NA                  NA
## CarenciasSalud                            NA                  NA
## IngresoMenor                              NA                  NA
## defunciones                        0.3207860                  NA
## Dx10mil                            1.0000000                  NA
## CarenciaAliemtacion                       NA                   1
## CarenciaServicioVivienda                  NA                  NA
## IngresoInferiorBienestarPorcentaje        NA                  NA
##                                    CarenciaServicioVivienda
## poblacion                                                NA
## areakm2                                                  NA
## IM                                                       NA
## RezagoE                                                  NA
## CarenciasSalud                                           NA
## IngresoMenor                                             NA
## defunciones                                              NA
## Dx10mil                                                  NA
## CarenciaAliemtacion                                      NA
## CarenciaServicioVivienda                                  1
## IngresoInferiorBienestarPorcentaje                       NA
##                                    IngresoInferiorBienestarPorcentaje
## poblacion                                                          NA
## areakm2                                                            NA
## IM                                                                 NA
## RezagoE                                                            NA
## CarenciasSalud                                                     NA
## IngresoMenor                                                       NA
## defunciones                                                        NA
## Dx10mil                                                            NA
## CarenciaAliemtacion                                                NA
## CarenciaServicioVivienda                                           NA
## IngresoInferiorBienestarPorcentaje                                  1

Se puede ver que algunas variables no se relacionan con nada, por ende estas no se pueden tomar en cuenta, pero en algunas otras si, por ejemplo las defunciones se relacionan un 64% con el área en kilometros ^2 y en un 99% con la cantidad de personas en esa área.

¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?

https://datos.covid-19.conacyt.mx/#DownZCSV

datatable(select(datodefunciones,municipio,poblacion,RezagoE,CarenciasSalud,defunciones,Dx10mil))
cor(select(datodefunciones,RezagoE,CarenciasSalud,defunciones,Dx10mil))
##                RezagoE CarenciasSalud defunciones  Dx10mil
## RezagoE              1             NA          NA       NA
## CarenciasSalud      NA              1          NA       NA
## defunciones         NA             NA    1.000000 0.320786
## Dx10mil             NA             NA    0.320786 1.000000
modelo.lineal <- lm(poblacion ~ defunciones, data= datodefunciones )
summary(modelo.lineal )
## 
## Call:
## lm(formula = poblacion ~ defunciones, data = datodefunciones)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -83154  -2814  -1960   1174  52276 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3554.33    1809.34   1.964   0.0535 .  
## defunciones   820.24      11.92  68.814   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14700 on 70 degrees of freedom
## Multiple R-squared:  0.9854, Adjusted R-squared:  0.9852 
## F-statistic:  4735 on 1 and 70 DF,  p-value: < 2.2e-16
confint(modelo.lineal)
##                 2.5 %    97.5 %
## (Intercept) -54.29607 7162.9488
## defunciones 796.46670  844.0129

Se puede ver que están relacionados entre si.

cor.test(x = datodefunciones$poblacion, y = datodefunciones$defunciones, method="pearson", digits=3)
## 
##  Pearson's product-moment correlation
## 
## data:  datodefunciones$poblacion and datodefunciones$defunciones
## t = 68.814, df = 70, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9883071 0.9954335
## sample estimates:
##       cor 
## 0.9926897

Se puede ver que tienen una relación de 99% por ende están estrechamente relacionados entre si.

Se puede ver que no necesariamente los municipios con mayor rezago educativo son los que tiene mas muertes, por ejemplo, Cajeme tiene un rezago educativo muy bajo en relación a la cantidad de población, y es el que tiene mas muertes por cada 10 mil habitantes.

Conclusión

Se podría decir que la cantidad de personas en un área afecta directamente a la cantidad de defunciones, se puede suponer que entre mas personas haya en una zona mas muertes por covid-19 habrá, ademas de que la educación no es un factor importante, ya que en lugares con buena educación las muertes son mayores, también se puede decir que la pobreza es una factor, ya que la desigualdad económica hace que las personas salga a diario para trabajar, esto los expone a enfermarse, adema la pobreza causa que no se puedan atender en hospitales y esto causa que se agrave el problema.

Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html

https://datos.gob.mx/busca/dataset?theme=Salud

¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/

Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. añada estos datos al excel datossalud