Caso de estudio de la 2da unidad de probabilidad y estadística: Enfermedades crónicas y su relación con los fallecimientos por COVID-19

setwd("~/PyE")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales", "readxl")

Enfermedades crónicas en Sonora

Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018

  • El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.

Importar datos

datos <- read.csv("Diagnosticos18.csv",encoding = "UTF-8")
class(datos)
## [1] "data.frame"
head(datos)
##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagn.f3.stico   Diagnostico Fecha.Diagnostico
## 1              E78.2 Dislipidemias        02/01/2018
## 2              E78.2 Dislipidemias        02/01/2018
## 3              E78.2 Dislipidemias        02/01/2018
## 4              E78.2 Dislipidemias        02/01/2018
## 5              E78.2 Dislipidemias        02/01/2018
## 6              E78.2 Dislipidemias        02/01/2018

Formatear datos

Sonora <- t(datos [datos$Estado == "Sonora", ])
Sonora <- (datos [datos$Estado == "Sonora", ])

Visualización

# Grouped
ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) + 
    geom_bar(position="dodge", stat="count") +
    xlab ("Número de casos") +
    ylab ("Diagnóstico") +
  ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)")    

Ahora que se tienen los datos, podemos estimar la cantidad de personas diagnísticadas por jurisdicción (Ciudad):

obregon <- Sonora$Jurisdiccion
  • ¿Por qué razones si la población de Ciudad Obregón es más grande que la Santa Ana y de Caborca, existen más personas con diagnóstico de enfermedades crónicas estas últimas?

En Ciudad Obregón la gente sigue teniendo las costumbres de los pueblos que hay a su alrededor, caborca, al contrario, adquirió costumbres de Estados Unidos al estar tan cerca de la frontera.

Datos de defunciones

Importar datos

municipio <- read_csv("Casos_Diarios_Municipio_Defunciones_20201104.csv")
## Parsed with column specification:
## cols(
##   .default = col_double(),
##   nombre = col_character()
## )
## See spec(...) for full column specifications.
class(municipio)
## [1] "spec_tbl_df" "tbl_df"      "tbl"         "data.frame"
head(municipio)
## # A tibble: 6 x 251
##   cve_ent poblacion nombre `02/03/2020` `03/03/2020` `04/03/2020` `05/03/2020`
##     <dbl>     <dbl> <chr>         <dbl>        <dbl>        <dbl>        <dbl>
## 1   16046     15290 Juarez            0            0            0            0
## 2   16047     22358 Junga~            0            0            0            0
## 3   16048      5862 Lagun~            0            0            0            0
## 4   16049     18769 Madero            0            0            0            0
## 5    5035    744247 Torre~            0            0            0            0
## 6    5036     23781 Viesca            0            0            0            0
## # ... with 244 more variables: `06/03/2020` <dbl>, `07/03/2020` <dbl>,
## #   `08/03/2020` <dbl>, `09/03/2020` <dbl>, `10/03/2020` <dbl>,
## #   `11/03/2020` <dbl>, `12/03/2020` <dbl>, `13/03/2020` <dbl>,
## #   `14/03/2020` <dbl>, `15/03/2020` <dbl>, `16/03/2020` <dbl>,
## #   `17/03/2020` <dbl>, `18/03/2020` <dbl>, `19/03/2020` <dbl>,
## #   `20/03/2020` <dbl>, `21/03/2020` <dbl>, `22/03/2020` <dbl>,
## #   `23/03/2020` <dbl>, `24/03/2020` <dbl>, `25/03/2020` <dbl>,
## #   `26/03/2020` <dbl>, `27/03/2020` <dbl>, `28/03/2020` <dbl>,
## #   `29/03/2020` <dbl>, `30/03/2020` <dbl>, `31/03/2020` <dbl>,
## #   `01/04/2020` <dbl>, `02/04/2020` <dbl>, `03/04/2020` <dbl>,
## #   `04/04/2020` <dbl>, `05/04/2020` <dbl>, `06/04/2020` <dbl>,
## #   `07/04/2020` <dbl>, `08/04/2020` <dbl>, `09/04/2020` <dbl>,
## #   `10/04/2020` <dbl>, `11/04/2020` <dbl>, `12/04/2020` <dbl>,
## #   `13/04/2020` <dbl>, `14/04/2020` <dbl>, `15/04/2020` <dbl>,
## #   `16/04/2020` <dbl>, `17/04/2020` <dbl>, `18/04/2020` <dbl>,
## #   `19/04/2020` <dbl>, `20/04/2020` <dbl>, `21/04/2020` <dbl>,
## #   `22/04/2020` <dbl>, `23/04/2020` <dbl>, `24/04/2020` <dbl>,
## #   `25/04/2020` <dbl>, `26/04/2020` <dbl>, `27/04/2020` <dbl>,
## #   `28/04/2020` <dbl>, `29/04/2020` <dbl>, `30/04/2020` <dbl>,
## #   `01/05/2020` <dbl>, `02/05/2020` <dbl>, `03/05/2020` <dbl>,
## #   `04/05/2020` <dbl>, `05/05/2020` <dbl>, `06/05/2020` <dbl>,
## #   `07/05/2020` <dbl>, `08/05/2020` <dbl>, `09/05/2020` <dbl>,
## #   `10/05/2020` <dbl>, `11/05/2020` <dbl>, `12/05/2020` <dbl>,
## #   `13/05/2020` <dbl>, `14/05/2020` <dbl>, `15/05/2020` <dbl>,
## #   `16/05/2020` <dbl>, `17/05/2020` <dbl>, `18/05/2020` <dbl>,
## #   `19/05/2020` <dbl>, `20/05/2020` <dbl>, `21/05/2020` <dbl>,
## #   `22/05/2020` <dbl>, `23/05/2020` <dbl>, `24/05/2020` <dbl>,
## #   `25/05/2020` <dbl>, `26/05/2020` <dbl>, `27/05/2020` <dbl>,
## #   `28/05/2020` <dbl>, `29/05/2020` <dbl>, `30/05/2020` <dbl>,
## #   `31/05/2020` <dbl>, `01/06/2020` <dbl>, `02/06/2020` <dbl>,
## #   `03/06/2020` <dbl>, `04/06/2020` <dbl>, `05/06/2020` <dbl>,
## #   `06/06/2020` <dbl>, `07/06/2020` <dbl>, `08/06/2020` <dbl>,
## #   `09/06/2020` <dbl>, `10/06/2020` <dbl>, `11/06/2020` <dbl>,
## #   `12/06/2020` <dbl>, `13/06/2020` <dbl>, ...
  • Defunciones en Caborca: 95

  • Defunciones en Cajeme: 625

  • Defunciones en Hermosillo: 1010

  • Defunciones en Santa Ana: 113

Realizando relaciones por cada 10,000 personas queda de la siguiente forma:

  • Defunciones en Caborca: 12

  • Defunciones en Cajeme: 15

  • Defunciones en Hermosillo: 12

  • Defunciones en Santa Ana: 70

  • Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?

Fallecidos: https://datos.covid-19.conacyt.mx/#DownZCSV

Santa Ana es la ciudad que más presenta defunciones en proporción a sus habitantes, sin embargo, la ciudad que cuenta con más diagnósticos de enfermedades crónicas es Hermosillo.

Asignación

¿De qué manera podemos saber qué variables hacen que el número de fallecidos por ciudad aumente o disminuya?

Hacer una matriz de diagramas de dispersión para poder saber qué variables se correlacionan mejor entre sí, para esto será indispensable que no solamente use las variables que fueron proporcionadas, sino también variables que consideren que influyen.

¿Tiene que ver además de la educación y la salud la pobreza de las personas como incidente en la probabilidad de generar complicaciones por COVID-19?

! índice de pobreza en Sonora

https://www.coneval.org.mx/coordinacion/entidades/Sonora/Paginas/pobreza_municipal2015.aspx

Indicadores de marginación y pobreza:

http://www.coespo.sonora.gob.mx/indicadores/sociodemograficos/indice-y-grado-de-marginacion.html

datodefunciones <- read_excel("datodefunciones.xlsx")
datatable(datodefunciones)
Defunciones <- as.numeric(datodefunciones$defunciones)
CarenciaAccesoAlim <- as.numeric(datodefunciones$CarenciaAccesoAlim)
RezagoEscolar <- as.numeric(datodefunciones$RezagoE)
## Warning: NAs introducidos por coerción
Defuncionesx10mil <- as.numeric(datodefunciones$Dx10mil)
IM <- as.numeric(datodefunciones$IM)
CarenciasSalud <- as.numeric(datodefunciones$CarenciasSalud)
## Warning: NAs introducidos por coerción
IngresoMenor <- as.numeric(datodefunciones$IngresoMenor)
## Warning: NAs introducidos por coerción
CarenciaCalidadVivienda <- as.numeric(datodefunciones$CarenciaCalidadVivienda)
## Warning: NAs introducidos por coerción
data <- data.frame(Defunciones, Defuncionesx10mil, IM, RezagoEscolar, CarenciasSalud, IngresoMenor, CarenciaAccesoAlim, CarenciaCalidadVivienda)

cor(data)
##                         Defunciones Defuncionesx10mil IM RezagoEscolar
## Defunciones               1.0000000         0.3207860 NA            NA
## Defuncionesx10mil         0.3207860         1.0000000 NA            NA
## IM                               NA                NA  1            NA
## RezagoEscolar                    NA                NA NA             1
## CarenciasSalud                   NA                NA NA            NA
## IngresoMenor                     NA                NA NA            NA
## CarenciaAccesoAlim        0.9866953         0.3240695 NA            NA
## CarenciaCalidadVivienda          NA                NA NA            NA
##                         CarenciasSalud IngresoMenor CarenciaAccesoAlim
## Defunciones                         NA           NA          0.9866953
## Defuncionesx10mil                   NA           NA          0.3240695
## IM                                  NA           NA                 NA
## RezagoEscolar                       NA           NA                 NA
## CarenciasSalud                       1           NA                 NA
## IngresoMenor                        NA            1                 NA
## CarenciaAccesoAlim                  NA           NA          1.0000000
## CarenciaCalidadVivienda             NA           NA                 NA
##                         CarenciaCalidadVivienda
## Defunciones                                  NA
## Defuncionesx10mil                            NA
## IM                                           NA
## RezagoEscolar                                NA
## CarenciasSalud                               NA
## IngresoMenor                                 NA
## CarenciaAccesoAlim                           NA
## CarenciaCalidadVivienda                       1
  • ¿Qué características tendría un municipio que tuviera menos defunciones?

Son los municipios con menor población y con menos ingresos.

  • ¿Qué variables se correlacionan con el número de defunciones?

La carencia de alimentación de la población.

  • ¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?

Lo municipios con mayor rezado son los que tienen mayor número de defunciones.

  • ¿Qué otras variables podemos añadir al análisis?

Se le puede añadir los datos de permanencia en casa, delincuencia, etc.

https://datos.covid-19.conacyt.mx/#DownZCSV

Bosque aleatorio:

https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html

https://datos.gob.mx/busca/dataset?theme=Salud