library(pacman)
p_load('fdth','readr','readxl','DT','ggplot2','dplyr')
datosSalud <- read_excel("datosdalud.xlsx")
datatable(datosSalud)
datos <- read.csv("Diagnosticos18.csv")
#datatable(datos)
head(datos)
##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagnóstico   Diagnostico Fecha.Diagnostico
## 1           E78.2 Dislipidemias        02/01/2018
## 2           E78.2 Dislipidemias        02/01/2018
## 3           E78.2 Dislipidemias        02/01/2018
## 4           E78.2 Dislipidemias        02/01/2018
## 5           E78.2 Dislipidemias        02/01/2018
## 6           E78.2 Dislipidemias        02/01/2018

En base a la información del Programa de gestión para mejorar la calidad del aire del estado de sonora

Procentaje de generación de PM10 en sonora

Procentaje de generación de NOx en sonora

Caso de estudio

¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?

Las defunciones por covid-19 en sonora pueden ser causadas por enfermedades cronicas, la calidad del aire, el consumo de drogas, o incluso la probreza.

Sonora <- t(datos [datos$Estado == "Sonora", ])
Sonora <- (datos [datos$Estado == "Sonora", ])

ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) + 
    geom_bar(position="dodge", stat="count") +
    xlab ("Número de casos") +
    ylab ("Diagnóstico") +
    ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

head(datosSalud)
## # A tibble: 4 x 9
##   Municipio Poblacion2015 Fallecidos Dx10000  Aleer `Asistencia Esc~
##   <chr>             <dbl>      <dbl>   <dbl>  <dbl>            <dbl>
## 1 Caborca           85631         95   11.1   14882            80708
## 2 Santa Ana         16248         13    8.00   2809            15374
## 3 Cajeme           433050        625   14.4   66782           411496
## 4 Hermosil~        884273       1010   11.4  140278           837720
## # ... with 3 more variables: NoAsistencia <dbl>,
## #   ProcentajeIngresoMenorBienestar <dbl>, Pobreza <dbl>
head(Sonora)
##     Estado Jurisdiccion                 Uneme       CLUES Cve.Persona Genero
## 240 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1253  Mujer
## 241 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1735 Hombre
## 588 Sonora      CABORCA UNEME EC RIO COLORADO SRSSA018441   SoCAUN910  Mujer
## 589 Sonora      CABORCA UNEME EC RIO COLORADO SRSSA018441   SoCAUN930  Mujer
## 627 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1801  Mujer
## 628 Sonora    SANTA ANA      UNEME EC NOGALES SRSSA018465    SoSAUN77  Mujer
##     Cve.Diagnóstico  Diagnostico Fecha.Diagnostico
## 240           I10.X Hipertension        04/01/2018
## 241           I10.X Hipertension        04/01/2018
## 588           E10.9     Diabetes        08/01/2018
## 589           E10.9     Diabetes        08/01/2018
## 627           I10.X Hipertension        08/01/2018
## 628           E11.9     Diabetes        08/01/2018

Caso de estudio: Relación entre enfermedades crónicas y covid-19

¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?

No Necesariamente, Hermosillo tiene una cantidad mayor de peronsas con enfermedades crónicas y no tiene tantas defunciones debido a Covid-19, lo que nos dice que las personas son mas propensas a enfermase, pero tienen una mejor atención al cuidarse.

Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de:

www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018

Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos

¿Por qué razones si la población de Ciudad Obregón es más grande que la santa ana y de caborca, existen más personas con diagnóstico de enfermedades crónicas ?

Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones

SonoraS <- t(datos [datos$Estado == "Sonora", ])
SonoraS <- (datos [datos$Estado == "Sonora", ])

ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + 
    geom_bar(position="dodge", stat="count") +
    xlab ("Número de casos") +
    ylab ("Diagnóstico") +
  ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?

No

¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?

Probablemente sea por la desigualdad económica, debido que en Cajeme existen una desigualdad económica muy grande, por ende muchas personas viven al día, lo cual significa que si un día no trabajan no comen, y para esas personas deben de trabajar todos los días, estas personas por lo general no tienen dinero para recibir atención medica, y como salen para poder trabajar se exponen demasiado.

¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?

Probablemente la contaminación del aire y el consumo de drogas sean factores importantes

¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26

017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273

Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción

Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?

datatable(select(datosSalud,Municipio,Dx10000))

La ciudad que presenta mas fallecidos es cajeme, presenta 14 fallecidos por cada 10,000 habitantes

Asignación

¿Qué características tendría un municipio que tuviera menos defunciones?

Parece ser que los municipios con menor probreza y menor cantidad de personas tienen una cantidad de defunciones menor.

¿Qué variables se correlacionan con el número de defunciones?

pairs(datosSalud[2:9])

Se puede ver curiosamente las muertes se relacionan con las personas que asisten a la escuela, esto probablemente significa que en donde hay mas personas que asisten a la escuela hay mas muertes por Covid-19, pero esto debe de ser influenciado por algún otro factor.

cor(datosSalud[2:9])
##                                 Poblacion2015 Fallecidos    Dx10000      Aleer
## Poblacion2015                       1.0000000  0.9901336  0.4729004  0.9998013
## Fallecidos                          0.9901336  1.0000000  0.5749140  0.9873561
## Dx10000                             0.4729004  0.5749140  1.0000000  0.4621700
## Aleer                               0.9998013  0.9873561  0.4621700  1.0000000
## Asistencia Escolar                  0.9999983  0.9903827  0.4740514  0.9997630
## NoAsistencia                       -0.9749900 -0.9442162 -0.2737888 -0.9763320
## ProcentajeIngresoMenorBienestar    -0.4416841 -0.3382622  0.5743740 -0.4504018
## Pobreza                             0.8630866  0.9246482  0.8201947  0.8542432
##                                 Asistencia Escolar NoAsistencia
## Poblacion2015                            0.9999983   -0.9749900
## Fallecidos                               0.9903827   -0.9442162
## Dx10000                                  0.4740514   -0.2737888
## Aleer                                    0.9997630   -0.9763320
## Asistencia Escolar                       1.0000000   -0.9747956
## NoAsistencia                            -0.9747956    1.0000000
## ProcentajeIngresoMenorBienestar         -0.4406805    0.6274609
## Pobreza                                  0.8639466   -0.7544904
##                                 ProcentajeIngresoMenorBienestar     Pobreza
## Poblacion2015                                       -0.44168411  0.86308665
## Fallecidos                                          -0.33826215  0.92464817
## Dx10000                                              0.57437403  0.82019469
## Aleer                                               -0.45040183  0.85424316
## Asistencia Escolar                                  -0.44068045  0.86394660
## NoAsistencia                                         0.62746091 -0.75449044
## ProcentajeIngresoMenorBienestar                      1.00000000  0.01132924
## Pobreza                                              0.01132924  1.00000000

Se puede ver que las muertes por cada 10000 habitantes se relaciona en un 50% con la pobreza, esto podría significar que las muertes están relacionadas con la cantidad de pobreza, ademas de que la cantidad total de fallecidos tiene una relación de 92% con la cantidad total de pobreza, tambien se ve una relación entre la asistencia escular y la capacidad de leer que muestra que las defunciones estan relacionadas ariba del 90% de los fallecidos lo cual se me hace extraño.

¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?

https://datos.covid-19.conacyt.mx/#DownZCSV

Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html

https://datos.gob.mx/busca/dataset?theme=Salud

¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/

Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. añada estos datos al excel datossalud

datodefunciones <- read_excel("datodefunciones.xlsx")
datatable(datodefunciones)
pairs(datodefunciones[3:14])

#borrar <- c("areakm2","clave","municipio", "GM")
#datosAEvaluar <- datodefunciones[ , !(names(datodefunciones) %in% borrar)]
#head(datosAEvaluar)
#pairs(datosAEvaluar)

Analisis de resultados

#cor(datosAEvaluar)
cor(datodefunciones[3:14])
##                           poblacion   areakm2 IM RezagoEducativo CarenciasSalud
## poblacion                 1.0000000 0.6651925 NA              NA             NA
## areakm2                   0.6651925 1.0000000 NA              NA             NA
## IM                               NA        NA  1              NA             NA
## RezagoEducativo                  NA        NA NA               1             NA
## CarenciasSalud                   NA        NA NA              NA              1
## IngresoMenor                     NA        NA NA              NA             NA
## defunciones               0.9926897 0.6469147 NA              NA             NA
## Dx10mil                   0.3058292 0.2174239 NA              NA             NA
## CarenciaSeguridad                NA        NA NA              NA             NA
## CarenciaAlimentación             NA        NA NA              NA             NA
## CarenciaServiciosVivienda        NA        NA NA              NA             NA
## Pobreza (%)                      NA        NA NA              NA             NA
##                           IngresoMenor defunciones   Dx10mil CarenciaSeguridad
## poblacion                           NA   0.9926897 0.3058292                NA
## areakm2                             NA   0.6469147 0.2174239                NA
## IM                                  NA          NA        NA                NA
## RezagoEducativo                     NA          NA        NA                NA
## CarenciasSalud                      NA          NA        NA                NA
## IngresoMenor                         1          NA        NA                NA
## defunciones                         NA   1.0000000 0.3207860                NA
## Dx10mil                             NA   0.3207860 1.0000000                NA
## CarenciaSeguridad                   NA          NA        NA                 1
## CarenciaAlimentación                NA          NA        NA                NA
## CarenciaServiciosVivienda           NA          NA        NA                NA
## Pobreza (%)                         NA          NA        NA                NA
##                           CarenciaAlimentación CarenciaServiciosVivienda
## poblacion                                   NA                        NA
## areakm2                                     NA                        NA
## IM                                          NA                        NA
## RezagoEducativo                             NA                        NA
## CarenciasSalud                              NA                        NA
## IngresoMenor                                NA                        NA
## defunciones                                 NA                        NA
## Dx10mil                                     NA                        NA
## CarenciaSeguridad                           NA                        NA
## CarenciaAlimentación                         1                        NA
## CarenciaServiciosVivienda                   NA                         1
## Pobreza (%)                                 NA                        NA
##                           Pobreza (%)
## poblacion                          NA
## areakm2                            NA
## IM                                 NA
## RezagoEducativo                    NA
## CarenciasSalud                     NA
## IngresoMenor                       NA
## defunciones                        NA
## Dx10mil                            NA
## CarenciaSeguridad                  NA
## CarenciaAlimentación               NA
## CarenciaServiciosVivienda          NA
## Pobreza (%)                         1

Se puede observar que el area por km2 y la población se relacionan un 64% y un 99% respectivamente con las defunciones por covid, lo que nos dice que entre mas grande sea el area avitada mayor la probabilidad de que la gente se contagíe (debatible) y por lo tanto mueran por el covid-19.

regresion <- lm(poblacion ~ defunciones, data = datodefunciones)
summary(regresion)
## 
## Call:
## lm(formula = poblacion ~ defunciones, data = datodefunciones)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -83154  -2814  -1960   1174  52276 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3554.33    1809.34   1.964   0.0535 .  
## defunciones   820.24      11.92  68.814   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14700 on 70 degrees of freedom
## Multiple R-squared:  0.9854, Adjusted R-squared:  0.9852 
## F-statistic:  4735 on 1 and 70 DF,  p-value: < 2.2e-16
plot (datodefunciones$defunciones, datodefunciones$poblacion, xlab='Defunciones', ylab='Población')
abline(regresion)

Podemos ver una relativa relación lineal conforme a las defunciones por COVID-19 y la cantidad de población en los estados de Sonora