U2A3

Andres

11/11/2020


library(pacman)
setwd("~/3er Semestre/ProbYEst")
p_load('fdth','readr','readxl','DT','ggplot2','dplyr')
datosSalud <- read_excel("datosdalud.xlsx")
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i = sheet, :
## Expecting numeric in H5 / R5C8: got a date
datatable(datosSalud)
datos <- read.csv("Diagnosticos18(3).csv")
datatable(datos)
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html
head(datos)
##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagnóstico   Diagnostico Fecha.Diagnostico
## 1           E78.2 Dislipidemias        02/01/2018
## 2           E78.2 Dislipidemias        02/01/2018
## 3           E78.2 Dislipidemias        02/01/2018
## 4           E78.2 Dislipidemias        02/01/2018
## 5           E78.2 Dislipidemias        02/01/2018
## 6           E78.2 Dislipidemias        02/01/2018

En base a la información del Programa de gestión para mejorar la calidad del aire del estado de sonora

https://cedes.gob.mx/images/pdf/ProAireSonora.pdf

Porcentaje de generación de PM10 en sonora

Porcentaje de generación de NOx en sonora

Caso de estudio

¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?

Las defunciones por covid-19 en sonora pueden ser causadas por enfermedades cronicas, la calidad del aire, el consumo de drogas, o incluso la probreza.

Sonora <- t(datos [datos$Estado == "Sonora", ])
Sonora <- (datos [datos$Estado == "Sonora", ])

ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) + geom_bar(position="dodge", stat="count") + xlab ("Número de casos") + ylab ("Diagnóstico") + ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

head(datosSalud)
## # A tibble: 4 x 9
##   Municipio Poblacion2015 Fallecidos Dx10000  Aleer `Asistencia Esc~
##   <chr>             <dbl>      <dbl>   <dbl>  <dbl>            <dbl>
## 1 Caborca           85631         95   11.1   14882            80708
## 2 Santa Ana         16248         13    8.00   2809            15374
## 3 Cajeme           433050        625   14.4   66782           411496
## 4 Hermosil~        884273       1010   11.4  140278           837720
## # ... with 3 more variables: NoAsistencia <dbl>, IngresoInf <dbl>,
## #   PobrezaModerada <dbl>
head(Sonora)
##     Estado Jurisdiccion                 Uneme       CLUES Cve.Persona Genero
## 240 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1253  Mujer
## 241 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1735 Hombre
## 588 Sonora      CABORCA UNEME EC RIO COLORADO SRSSA018441   SoCAUN910  Mujer
## 589 Sonora      CABORCA UNEME EC RIO COLORADO SRSSA018441   SoCAUN930  Mujer
## 627 Sonora    SANTA ANA  UNEME EC AGUA PRIETA SRSSA018453  SoSAUN1801  Mujer
## 628 Sonora    SANTA ANA      UNEME EC NOGALES SRSSA018465    SoSAUN77  Mujer
##     Cve.Diagnóstico  Diagnostico Fecha.Diagnostico
## 240           I10.X Hipertension        04/01/2018
## 241           I10.X Hipertension        04/01/2018
## 588           E10.9     Diabetes        08/01/2018
## 589           E10.9     Diabetes        08/01/2018
## 627           I10.X Hipertension        08/01/2018
## 628           E11.9     Diabetes        08/01/2018

Caso de estudio: Relación entre enfermedades crónicas y covid-19

¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?

No, pero se puede ver reflejado ya que en Hermosillo hay mas personas que en otras ciudades, ya que la ciudad es grande y por eso se ve reflejado en ese porcentaje, pero las muertes por covid se pueden deber mas factores aparte de las enfermedades cronicas.

Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de:

www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018

Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos

¿Por qué razones si la población de Ciudad Obregón es más grande que la santa ana y de caborca, existen más personas con diagnóstico de enfermedades crónicas ?

Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones

SonoraS <- t(datos [datos$Estado == "Sonora", ])
SonoraS <- (datos [datos$Estado == "Sonora", ])

ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + geom_bar(position="dodge",
stat="count") + xlab ("Número de casos") + ylab ("Diagnóstico") +
  ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?

No, necesariamente, los datos varian.

¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?

Debido a que no se toman las suficientes medidas o sanciones a la hora de no cumplir con las normas que se establecen, la ignorancia de parte de la gente, falta de información que se tienen o interes, gracias a opiniones publicas de parte de otra gente, se deja llevar mucho de las opiniones publicas.

¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?

La contaminacion y el consumo de drogas, podrian ser factores que nos puedan ayudar.

¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26

  • Caborca 85631
  • 058 Santa Ana 16248
  • 018 Cajeme 433050
  • 030 Hermosillo 884 273

Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción

Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?

datatable(select(datosSalud,Municipio,Dx10000))

El municipio con más fallecidos es Cajeme y la ciudad es Ciudad Obregón, con un indice de 14 personas por cada 10000 habitantes.

Asignación

¿Qué características tendría un municipio que tuviera menos defunciones?

Se puede deber por la menos contaminación, mayor información y respeto a las normas sanitarias.

¿Qué variables se correlacionan con el número de defunciones?

pairs(datosSalud[2:9])

Se puede apreciar como los fallecidos se muestra con una creciente con la asistencia a la escuela, pero en cambio con la NoAsistencia se muestra una decreciente esto quiere decir que este es un factor importante en los fallecidos, ya que posiblemente se tiene contacto con otras personas y por ende mas contagio.

cor(datosSalud[2:9])
##                    Poblacion2015 Fallecidos    Dx10000      Aleer
## Poblacion2015          1.0000000  0.9901336  0.4729004  0.9998013
## Fallecidos             0.9901336  1.0000000  0.5749140  0.9873561
## Dx10000                0.4729004  0.5749140  1.0000000  0.4621700
## Aleer                  0.9998013  0.9873561  0.4621700  1.0000000
## Asistencia Escolar     0.9999983  0.9903827  0.4740514  0.9997630
## NoAsistencia          -0.9749900 -0.9442162 -0.2737888 -0.9763320
## IngresoInf             0.8885340  0.8160450  0.0469653  0.8962680
## PobrezaModerada        0.9737072  0.9954549  0.6497718  0.9697187
##                    Asistencia Escolar NoAsistencia IngresoInf PobrezaModerada
## Poblacion2015               0.9999983   -0.9749900  0.8885340       0.9737072
## Fallecidos                  0.9903827   -0.9442162  0.8160450       0.9954549
## Dx10000                     0.4740514   -0.2737888  0.0469653       0.6497718
## Aleer                       0.9997630   -0.9763320  0.8962680       0.9697187
## Asistencia Escolar          1.0000000   -0.9747956  0.8877476       0.9740857
## NoAsistencia               -0.9747956    1.0000000 -0.9448974      -0.9086051
## IngresoInf                  0.8877476   -0.9448974  1.0000000       0.7608148
## PobrezaModerada             0.9740857   -0.9086051  0.7608148       1.0000000

¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?

https://datos.covid-19.conacyt.mx/#DownZCSV

Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html

https://datos.gob.mx/busca/dataset?theme=Salud

¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/

Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. añada estos datos al excel datossalud

  • Pobreza
  • Drogas, consumo de sustancias
  • Asistencia médica deficiente
datosDefunciones <- read_excel("datodefunciones.xlsx")
datatable(datosDefunciones)
borrar <- c("areakm2","clave","municipio", "GM")
datosEvaluar <- datosDefunciones[ , !(names(datosDefunciones) %in% borrar)]
head(datosEvaluar)
## # A tibble: 6 x 10
##   poblacion     IM RezagoE CarenciasSalud IngresoMenor defunciones Dx10mil
##       <dbl>  <dbl>   <dbl>          <dbl>        <dbl>       <dbl>   <dbl>
## 1      2756 -1.09      555            271         1.58           3  10.9  
## 2     82918 -1.83    11620          18751         1.42          78   9.41 
## 3     25694 -0.029    6026           1654         2.35           2   0.778
## 4      9578 -0.936    2073           1640         1.63           2   2.09 
## 5      1163 -0.848     306            154         2.42           0   0    
## 6      2677 -0.837     595            506         1.48           1   3.74 
## # ... with 3 more variables: CarenciaAliemtacion <dbl>,
## #   CarenciaServicioVivienda <dbl>, PobrezaModerada <dbl>
pairs(datosEvaluar)

cor(datosEvaluar)
##                            poblacion IM     RezagoE CarenciasSalud IngresoMenor
## poblacion                 1.00000000 NA  0.99047932     0.97010790  -0.09421275
## IM                                NA  1          NA             NA           NA
## RezagoE                   0.99047932 NA  1.00000000     0.98433483  -0.05267524
## CarenciasSalud            0.97010790 NA  0.98433483     1.00000000  -0.07740579
## IngresoMenor             -0.09421275 NA -0.05267524    -0.07740579   1.00000000
## defunciones               0.99268971 NA  0.98401459     0.97006148  -0.10629077
## Dx10mil                   0.30582924 NA  0.33334330     0.32979896  -0.13680001
## CarenciaAliemtacion      -0.08708683 NA -0.10635644    -0.09970514   0.03949067
## CarenciaServicioVivienda -0.17944892 NA -0.19765271    -0.19392546   0.01031189
## PobrezaModerada          -0.10011799 NA -0.12976312    -0.10819491   0.07139898
##                          defunciones    Dx10mil CarenciaAliemtacion
## poblacion                 0.99268971  0.3058292         -0.08708683
## IM                                NA         NA                  NA
## RezagoE                   0.98401459  0.3333433         -0.10635644
## CarenciasSalud            0.97006148  0.3297990         -0.09970514
## IngresoMenor             -0.10629077 -0.1368000          0.03949067
## defunciones               1.00000000  0.3207860         -0.08395643
## Dx10mil                   0.32078597  1.0000000         -0.14404158
## CarenciaAliemtacion      -0.08395643 -0.1440416          1.00000000
## CarenciaServicioVivienda -0.18183681 -0.1818688          0.20663274
## PobrezaModerada          -0.08616965 -0.1415895         -0.05510695
##                          CarenciaServicioVivienda PobrezaModerada
## poblacion                             -0.17944892     -0.10011799
## IM                                             NA              NA
## RezagoE                               -0.19765271     -0.12976312
## CarenciasSalud                        -0.19392546     -0.10819491
## IngresoMenor                           0.01031189      0.07139898
## defunciones                           -0.18183681     -0.08616965
## Dx10mil                               -0.18186883     -0.14158954
## CarenciaAliemtacion                    0.20663274     -0.05510695
## CarenciaServicioVivienda               1.00000000      0.01362693
## PobrezaModerada                        0.01362693      1.00000000
sd(datosEvaluar$PobrezaModerada)
## [1] 202.7395
regresion <- lm(Dx10mil ~ PobrezaModerada, data = datosDefunciones)
summary(regresion)
## 
## Call:
## lm(formula = Dx10mil ~ PobrezaModerada, data = datosDefunciones)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.3336 -5.1268 -0.6001  3.3024 20.6133 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      6.338004   0.873082   7.259  4.2e-10 ***
## PobrezaModerada -0.004095   0.003422  -1.197    0.235    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.846 on 70 degrees of freedom
## Multiple R-squared:  0.02005,    Adjusted R-squared:  0.006048 
## F-statistic: 1.432 on 1 and 70 DF,  p-value: 0.2355
plot(datosDefunciones$PobrezaModerada, datosDefunciones$Dx10mil, xlab='Pobreza Extrema', ylab='Defunciones por cada 10000 habitantes')
abline(regresion)