U2A3

Miguel Sanez

10/11/2020

library(pacman)
p_load('fdth','readr','readxl','DT','ggplot2','dplyr')
datosSalud <- read_excel("datosdalud.xlsx")
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i = sheet, :
## Expecting numeric in H5 / R5C8: got a date
datatable(datosSalud)
datosDiag <- read.csv("Diagnosticos18.csv")
#datatable(datos)
head(datosDiag)
##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagnóstico   Diagnostico Fecha.Diagnostico
## 1           E78.2 Dislipidemias        02/01/2018
## 2           E78.2 Dislipidemias        02/01/2018
## 3           E78.2 Dislipidemias        02/01/2018
## 4           E78.2 Dislipidemias        02/01/2018
## 5           E78.2 Dislipidemias        02/01/2018
## 6           E78.2 Dislipidemias        02/01/2018

En base a la información del Programa de gestión para mejorar la calidad del aire del estado de sonora

https://cedes.gob.mx/images/pdf/ProAireSonora.pdf

Caso de estudio

¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?

El aumento de defunciones por covid-19 en Sonora se puede deber a enfermedades crónicas, contaminación, seguridad, uso de drogas, entre otras.

Sonora <- t(datosDiag [datosDiag$Estado == "Sonora", ])
Sonora <- (datosDiag [datosDiag$Estado == "Sonora", ])

ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) + geom_bar(position="dodge", stat="count") + xlab ("Número de casos") + ylab ("Diagnóstico") + ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

head(datosSalud)
## # A tibble: 4 x 9
##   Municipio Poblacion2015 Fallecidos Dx10000  Aleer `Asistencia Esc~
##   <chr>             <dbl>      <dbl>   <dbl>  <dbl>            <dbl>
## 1 Caborca           85631         95   11.1   14882            80708
## 2 Santa Ana         16248         13    8.00   2809            15374
## 3 Cajeme           433050        625   14.4   66782           411496
## 4 Hermosil~        884273       1010   11.4  140278           837720
## # ... with 3 more variables: NoAsistencia <dbl>, IngresoInf <dbl>,
## #   PobrezaEx <dbl>
head(Sonora)
##     Estado Jurisdiccion                 Uneme       CLUES Cve.Persona Genero
## 240 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1253  Mujer
## 241 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1735 Hombre
## 588 Sonora      CABORCA UNEME EC RIO COLORADO SRSSA018441   SoCAUN910  Mujer
## 589 Sonora      CABORCA UNEME EC RIO COLORADO SRSSA018441   SoCAUN930  Mujer
## 627 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1801  Mujer
## 628 Sonora    SANTA ANA      UNEME EC NOGALES SRSSA018465    SoSAUN77  Mujer
##     Cve.Diagnóstico  Diagnostico Fecha.Diagnostico
## 240           I10.X Hipertension        04/01/2018
## 241           I10.X Hipertension        04/01/2018
## 588           E10.9     Diabetes        08/01/2018
## 589           E10.9     Diabetes        08/01/2018
## 627           I10.X Hipertension        08/01/2018
## 628           E11.9     Diabetes        08/01/2018

Caso de estudio: Relación entre enfermedades crónicas y covid-19

¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?

Con respecto a los datos, la respuesta es no, ya que, Hermosillo es el municipio con más casos de enfermedades crónicas acumuladas, sin embargo, las muertes por covid se deben más factores que a solo las enfermedades crónicas, por lo que no hay más casos de defunciones por covid en los lugares donde se reportan más casos de enfermedades crónicas.

Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de:

www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018

Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos

¿Por qué razones si la población de Ciudad Obregón es más grande que la santa ana y de caborca, existen más personas con diagnóstico de enfermedades crónicas ?

Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones

SonoraS <- t(datosDiag [datosDiag$Estado == "Sonora", ])
SonoraS <- (datosDiag [datosDiag$Estado == "Sonora", ])

ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + geom_bar(position="dodge", stat="count") + xlab ("Número de casos") + ylab ("Diagnóstico") + ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?

No, ya que, los datos muestran que puede variar.

¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?

Se debe a diferentes factores. Estos factores pueden ser la ignorancia de algunas personas al no creer en el virus, otra puede ser que unas personas necesitan trabajar para poder tener con que satisfacer los gastos del hogar, entre otros. Por ende, estos factores hacen que se propague más el virus y haya más defunciones conforme a la salud de la persona o variantes de cada caso particular.

¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?

El consumo de sustancias, es decir, drogas, la contaminación,

¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26

  • Caborca 85631
  • 058 Santa Ana 16248
  • 018 Cajeme 433050
  • 030 Hermosillo 884 273

Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción

Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?

datatable(select(datosSalud,Municipio,Dx10000))

El municipio con más fallecidos es Cajeme y la ciudad es Ciudad Obregón, con un indice de 14 personas por cada 10000 habitantes.

Asignación

¿Qué características tendría un municipio que tuviera menos defunciones?

Se puede deber por la menos contaminación, mayor seguridad, menor indice de pobreza, entre otros.

¿Qué variables se correlacionan con el número de defunciones?

pairs(datosSalud[2:9])

Se puede observar que las defunciones se relacionan con la asistencia escolar y la pobreza extrema, esto es debido a la asistencia a la escuela y lugares publicos, donde haya mucho contagio, sin embargo, también se debe a factores externos a estos.

cor(datosSalud[2:9])
##                    Poblacion2015 Fallecidos    Dx10000      Aleer
## Poblacion2015          1.0000000  0.9901336  0.4729004  0.9998013
## Fallecidos             0.9901336  1.0000000  0.5749140  0.9873561
## Dx10000                0.4729004  0.5749140  1.0000000  0.4621700
## Aleer                  0.9998013  0.9873561  0.4621700  1.0000000
## Asistencia Escolar     0.9999983  0.9903827  0.4740514  0.9997630
## NoAsistencia          -0.9749900 -0.9442162 -0.2737888 -0.9763320
## IngresoInf             0.8885340  0.8160450  0.0469653  0.8962680
## PobrezaEx              0.7332882  0.6771593  0.3399908  0.7440218
##                    Asistencia Escolar NoAsistencia IngresoInf  PobrezaEx
## Poblacion2015               0.9999983   -0.9749900  0.8885340  0.7332882
## Fallecidos                  0.9903827   -0.9442162  0.8160450  0.6771593
## Dx10000                     0.4740514   -0.2737888  0.0469653  0.3399908
## Aleer                       0.9997630   -0.9763320  0.8962680  0.7440218
## Asistencia Escolar          1.0000000   -0.9747956  0.8877476  0.7323855
## NoAsistencia               -0.9747956    1.0000000 -0.9448974 -0.6724423
## IngresoInf                  0.8877476   -0.9448974  1.0000000  0.7746847
## PobrezaEx                   0.7323855   -0.6724423  0.7746847  1.0000000

Con los datos que se sacaron, podemos comprobar que la pobreza extrema está relacionada un 33% con las defunciones por cada 10000 habitantes, así como está relacionada con los fallecidos un 67%, y la asistencia escolar tiene una relación del 47% con las defunciones por cada 10000 habitantes y 99% con los fallecidos.

¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?

https://datos.covid-19.conacyt.mx/#DownZCSV

Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html

https://datos.gob.mx/busca/dataset?theme=Salud

¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/

Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. añada estos datos al excel datossalud

  • Pobreza extrema
  • Drogas, consumo de sustancias
  • Asistencia médica deficiente
datosDefunciones <- read_excel("datodefunciones.xlsx")
datatable(datosDefunciones)
borrar <- c("areakm2","clave","municipio", "GM")
datosEvaluar <- datosDefunciones[ , !(names(datosDefunciones) %in% borrar)]
head(datosEvaluar)
## # A tibble: 6 x 10
##   poblacion     IM RezagoE CarenciasSalud IngresoMenor defunciones Dx10mil
##       <dbl>  <dbl>   <dbl>          <dbl>        <dbl>       <dbl>   <dbl>
## 1      2756 -1.09      555            271         1.58           3  10.9  
## 2     82918 -1.83    11620          18751         1.42          78   9.41 
## 3     25694 -0.029    6026           1654         2.35           2   0.778
## 4      9578 -0.936    2073           1640         1.63           2   2.09 
## 5      1163 -0.848     306            154         2.42           0   0    
## 6      2677 -0.837     595            506         1.48           1   3.74 
## # ... with 3 more variables: CarenciaAliemtacion <dbl>,
## #   CarenciaServicioVivienda <dbl>, PobrezaEx <dbl>
pairs(datosEvaluar)

cor(datosEvaluar)
##                            poblacion IM     RezagoE CarenciasSalud IngresoMenor
## poblacion                 1.00000000 NA  0.99047932     0.97010790  -0.09421275
## IM                                NA  1          NA             NA           NA
## RezagoE                   0.99047932 NA  1.00000000     0.98433483  -0.05267524
## CarenciasSalud            0.97010790 NA  0.98433483     1.00000000  -0.07740579
## IngresoMenor             -0.09421275 NA -0.05267524    -0.07740579   1.00000000
## defunciones               0.99268971 NA  0.98401459     0.97006148  -0.10629077
## Dx10mil                   0.30582924 NA  0.33334330     0.32979896  -0.13680001
## CarenciaAliemtacion      -0.08708683 NA -0.10635644    -0.09970514   0.03949067
## CarenciaServicioVivienda -0.17944892 NA -0.19765271    -0.19392546   0.01031189
## PobrezaEx                 0.09155437 NA  0.11984847     0.10127863   0.56255210
##                          defunciones    Dx10mil CarenciaAliemtacion
## poblacion                 0.99268971  0.3058292         -0.08708683
## IM                                NA         NA                  NA
## RezagoE                   0.98401459  0.3333433         -0.10635644
## CarenciasSalud            0.97006148  0.3297990         -0.09970514
## IngresoMenor             -0.10629077 -0.1368000          0.03949067
## defunciones               1.00000000  0.3207860         -0.08395643
## Dx10mil                   0.32078597  1.0000000         -0.14404158
## CarenciaAliemtacion      -0.08395643 -0.1440416          1.00000000
## CarenciaServicioVivienda -0.18183681 -0.1818688          0.20663274
## PobrezaEx                 0.08850082  0.1570354          0.14791924
##                          CarenciaServicioVivienda  PobrezaEx
## poblacion                             -0.17944892 0.09155437
## IM                                             NA         NA
## RezagoE                               -0.19765271 0.11984847
## CarenciasSalud                        -0.19392546 0.10127863
## IngresoMenor                           0.01031189 0.56255210
## defunciones                           -0.18183681 0.08850082
## Dx10mil                               -0.18186883 0.15703535
## CarenciaAliemtacion                    0.20663274 0.14791924
## CarenciaServicioVivienda               1.00000000 0.15888879
## PobrezaEx                              0.15888879 1.00000000
sd(datosEvaluar$PobrezaEx)
## [1] 0.7091847
regresion <- lm(Dx10mil ~ PobrezaEx, data = datosDefunciones)
summary(regresion)
## 
## Call:
## lm(formula = Dx10mil ~ PobrezaEx, data = datosDefunciones)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.4662 -5.6166 -0.7472  4.0531 20.8162 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)    1.457      3.260   0.447    0.656
## PobrezaEx      1.298      0.976   1.330    0.188
## 
## Residual standard error: 5.832 on 70 degrees of freedom
## Multiple R-squared:  0.02466,    Adjusted R-squared:  0.01073 
## F-statistic:  1.77 on 1 and 70 DF,  p-value: 0.1877
plot(datosDefunciones$PobrezaEx, datosDefunciones$Dx10mil, xlab='Pobreza Extrema', ylab='Defunciones por cada 10000 habitantes')
abline(regresion)