Importar datos
library(pacman)
p_load('fdth','readr','readxl','DT','ggplot2','dplyr')
salud <- read_excel("datosdalud.xlsx")## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i = sheet, :
## Expecting numeric in H5 / R5C8: got a date
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagnóstico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
Caso de estudio
¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?
Las defunciones por covid-19 en sonora pueden ser causadas por enfermedades cronicas, la calidad del aire, el consumo de drogas, o incluso la probreza.
Sonora <- t(datitos [datitos$Estado == "Sonora", ])
Sonora <- (datitos [datitos$Estado == "Sonora", ])
ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") ## # A tibble: 4 x 9
## Municipio Poblacion2015 Fallecidos Dx10000 Aleer `Asistencia Esc~
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Caborca 85631 95 11.1 14882 80708
## 2 Santa Ana 16248 13 8.00 2809 15374
## 3 Cajeme 433050 625 14.4 66782 411496
## 4 Hermosil~ 884273 1010 11.4 140278 837720
## # ... with 3 more variables: NoAsistencia <dbl>, IngresoInf <dbl>,
## # CarenciaVivienda <dbl>
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 240 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1253 Mujer
## 241 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1735 Hombre
## 588 Sonora CABORCA UNEME EC RIO COLORADO SRSSA018441 SoCAUN910 Mujer
## 589 Sonora CABORCA UNEME EC RIO COLORADO SRSSA018441 SoCAUN930 Mujer
## 627 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1801 Mujer
## 628 Sonora SANTA ANA UNEME EC NOGALES SRSSA018465 SoSAUN77 Mujer
## Cve.Diagnóstico Diagnostico Fecha.Diagnostico
## 240 I10.X Hipertension 04/01/2018
## 241 I10.X Hipertension 04/01/2018
## 588 E10.9 Diabetes 08/01/2018
## 589 E10.9 Diabetes 08/01/2018
## 627 I10.X Hipertension 08/01/2018
## 628 E11.9 Diabetes 08/01/2018
de estudio: Relación entre enfermedades crónicas y covid-19
¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?
No Necesariamente, Hermosillo tiene una cantidad mayor de peronsas con enfermedades crónicas y no tiene tantas defunciones debido a Covid-19, lo que nos dice que las personas son mas propensas a enfermase, pero tienen una mejor atención al cuidarse.
Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de:
www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
¿Por qué razones si la población de Ciudad Obregón es más grande que la santa ana y de caborca, existen más personas con diagnóstico de enfermedades crónicas ?
Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones.
SonoraS <- t(datitos [datitos$Estado == "Sonora", ])
SonoraS <- (datitos [datitos$Estado == "Sonora", ])
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") ¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diágnosticos? No necesariamente.
¿Por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones? Existe mucha pobreza dentro de Cajeme por lo cual no es tan fácil acceder a centros de salud o comprar los medicamentos necesarios para poder tener salud.
¿Que otra variable o variables nos pueden ayudar a entender este fenómeno? Considero que no tener una vivienda de calidad mínima afecta a la salud, no en corto plazo, pero sí a largo. Lo que quiero explicar es que al no contar con una vivienda bien adaptada podría suceder que afectase mucho la salud por no tener unas buenas condiciones.
¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26
017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273
Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción
Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?
Como se aprecia, el municipio de Cajeme presenta más fallecimientos con un número de 14 muertos por cada 10,000 habitantes.
¿Qué características tendría un municipio que tuviera menos defunciones? Un municipio con menos cantidad de pobreza, ya que así podrá haber más acceso a los centros de salud y poder comprar medicinas. Esa es la característica principal, porque también podría acceder a lo que es los datos de salud o el mundo.
¿Qué variables se correlacionan con el número de defunciones?
## Poblacion2015 Fallecidos Dx10000 Aleer
## Poblacion2015 1.0000000 0.9901336 0.47290043 0.9998013
## Fallecidos 0.9901336 1.0000000 0.57491398 0.9873561
## Dx10000 0.4729004 0.5749140 1.00000000 0.4621700
## Aleer 0.9998013 0.9873561 0.46216996 1.0000000
## Asistencia Escolar 0.9999983 0.9903827 0.47405142 0.9997630
## NoAsistencia -0.9749900 -0.9442162 -0.27378884 -0.9763320
## IngresoInf 0.8885340 0.8160450 0.04696530 0.8962680
## CarenciaVivienda -0.9164852 -0.8593160 -0.08092043 -0.9210630
## Asistencia Escolar NoAsistencia IngresoInf CarenciaVivienda
## Poblacion2015 0.9999983 -0.9749900 0.8885340 -0.91648520
## Fallecidos 0.9903827 -0.9442162 0.8160450 -0.85931598
## Dx10000 0.4740514 -0.2737888 0.0469653 -0.08092043
## Aleer 0.9997630 -0.9763320 0.8962680 -0.92106303
## Asistencia Escolar 1.0000000 -0.9747956 0.8877476 -0.91596641
## NoAsistencia -0.9747956 1.0000000 -0.9448974 0.97887810
## IngresoInf 0.8877476 -0.9448974 1.0000000 -0.98300992
## CarenciaVivienda -0.9159664 0.9788781 -0.9830099 1.00000000
¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
https://datos.covid-19.conacyt.mx/#DownZCSV
Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html
https://datos.gob.mx/busca/dataset?theme=Salud
¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/
Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. * Obesidad. Es una condición terrible, ya que poco a poco va degradando la salud que poseemos. * Calidad de vida. Llevar una mala calidad de vida provoca que muchso desgrados de salud en muchas partes del cuerpo humano.
borrar <- c("areakm2","clave","municipio", "GM")
evaluar <- funciones[ , !(names(funciones) %in% borrar)]
head(evaluar)## # A tibble: 6 x 10
## poblacion IM RezagoE CarenciasSalud IngresoMenor defunciones Dx10mil
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2756 -1.09 555 271 1.58 3 10.9
## 2 82918 -1.83 11620 18751 1.42 78 9.41
## 3 25694 -0.029 6026 1654 2.35 2 0.778
## 4 9578 -0.936 2073 1640 1.63 2 2.09
## 5 1163 -0.848 306 154 2.42 0 0
## 6 2677 -0.837 595 506 1.48 1 3.74
## # ... with 3 more variables: CarenciaAliemtacion <dbl>,
## # CarenciaServicioVivienda <dbl>, PobrezaEx <dbl>
## poblacion IM RezagoE CarenciasSalud IngresoMenor
## poblacion 1.00000000 NA 0.99047932 0.97010790 -0.09421275
## IM NA 1 NA NA NA
## RezagoE 0.99047932 NA 1.00000000 0.98433483 -0.05267524
## CarenciasSalud 0.97010790 NA 0.98433483 1.00000000 -0.07740579
## IngresoMenor -0.09421275 NA -0.05267524 -0.07740579 1.00000000
## defunciones 0.99268971 NA 0.98401459 0.97006148 -0.10629077
## Dx10mil 0.30582924 NA 0.33334330 0.32979896 -0.13680001
## CarenciaAliemtacion -0.08708683 NA -0.10635644 -0.09970514 0.03949067
## CarenciaServicioVivienda -0.17944892 NA -0.19765271 -0.19392546 0.01031189
## PobrezaEx 0.09155437 NA 0.11984847 0.10127863 0.56255210
## defunciones Dx10mil CarenciaAliemtacion
## poblacion 0.99268971 0.3058292 -0.08708683
## IM NA NA NA
## RezagoE 0.98401459 0.3333433 -0.10635644
## CarenciasSalud 0.97006148 0.3297990 -0.09970514
## IngresoMenor -0.10629077 -0.1368000 0.03949067
## defunciones 1.00000000 0.3207860 -0.08395643
## Dx10mil 0.32078597 1.0000000 -0.14404158
## CarenciaAliemtacion -0.08395643 -0.1440416 1.00000000
## CarenciaServicioVivienda -0.18183681 -0.1818688 0.20663274
## PobrezaEx 0.08850082 0.1570354 0.14791924
## CarenciaServicioVivienda PobrezaEx
## poblacion -0.17944892 0.09155437
## IM NA NA
## RezagoE -0.19765271 0.11984847
## CarenciasSalud -0.19392546 0.10127863
## IngresoMenor 0.01031189 0.56255210
## defunciones -0.18183681 0.08850082
## Dx10mil -0.18186883 0.15703535
## CarenciaAliemtacion 0.20663274 0.14791924
## CarenciaServicioVivienda 1.00000000 0.15888879
## PobrezaEx 0.15888879 1.00000000