ExamenFinal.knit

INSTRUCCIONES:

Resuelve los siguientes ejercicios prácticos utilizando R. Los ejercicios propuestos tienen distintas ponderaciones, y la calificación final de este exámen será dada a conocer en el espacio correspondiente de la plataforma Moodle. La ponderación se muestra al inicio o al final del respectivo enunciado del ejercicio.

Generación de la base de datos

La base de datos a utilizar será para el Estado de México con clave de entidad 15.

Primero importamos la base de datos abiertos publicada por la Dirección General de Epidemiología (DGE) disponible en el siguiente link: DGE
Después seleccionamos los datos referentes al Estado de México, al filtrar por la columna ENTIDAD_RES.
Posteriormente, importamos el cátalogo de municipios que se encuentra disponible en el mismo link que se brindó al inicio.
Se procede a fusionar la base filtrada con el catálogo de municipios para tener el nombre completo del municipio.

#Importamos la base de datos del Coi

covid19<-read.csv("C:/Users/Gerardo Ramos/OneDrive - Comisión Federal de Competencia Económica/Documents/CIDE METPOL/Manejo de bases de datos R/examen final/datos_abiertos_covid19/211215COVID19MEXICO.csv")

# Importamos el catálogo de municipios.

nom_mun<- read_excel("C:/Users/Gerardo Ramos/OneDrive - Comisión Federal de Competencia Económica/Documents/CIDE METPOL/Manejo de bases de datos R/examen final/diccionario_datos_covid19/201128 Catalogos.xlsx",
                     sheet = "Catálogo MUNICIPIOS")

# Seleccionamos únicamente los datos del Estado de México.

edomex_datos<- subset(covid19,covid19$ENTIDAD_RES==15)

# Filtramos el catálogo de municipios para solo tener los del Estado de México.

nom_mun_edomex<- subset(nom_mun,nom_mun$CLAVE_ENTIDAD==15)

# Convertimos la variable a numérica para eliminar los ceros extra.

nom_mun_edomex$CLAVE_MUNICIPIO<-as.numeric(nom_mun_edomex$CLAVE_MUNICIPIO)

# Fusionamos las bases de datos para el Estado de México.

edomex_datos<- left_join(edomex_datos, 
                         nom_mun_edomex, 
                         by = c("MUNICIPIO_RES"="CLAVE_MUNICIPIO") )

EJERCICIO

Utilizando la información brindada por la Secretaria de Salud Federal sobre los casos de COVID-19 detectados en la República Mexicana, y considerando solamente los casos positivos (verificar que la información que se obtenga de la base de datos sea igual a la reportada diariamente por dicha secretaría)

De acuerdo con el sitio oficial de COVID-19 México del Gobierno (disponible en el siguiente link Sitio-Covid), los casos positivos acumulados en el Estado de México alcanzaron la cifra de 380,842 casos como se observa en . Esta información fue consultado el día 16 de Diciembre de 2021 y deacuerdo con la DGE la información está actualizada al día 15 de Diciembre de 2021.

Por lo tanto, para el desarrollo de los ejercicios se utilizó la base de datos publicada de ese mismo día para comparar que se obtengan los mismos resultados.

Casos positivos en el Estado de México de acuerdo con la DGE

Covid 19 en el Estado de México de acuerdo con la DGE

Obtener lo siguiente.

1. Eligiendo un estado de la república de residencia del paciente que tenga más de 20 municipios, obtener (tablas):

1.1.

(5%) % de defunciones por municipio (total de defunciones / total de casos positivos).

Solución

Para poder trabajar con la base de datos es necesario primero identificar los casos positivos de Covid 19. En ese sentido, consulté la nota metodólogica presentada por la Secretaría y en ella se menciona que:

“Los casos positivos son el conjunto de casos que tengan resultado de muestra positivo o que se clasifiquen positivos por asociación epidemiológica o por dictaminación (solo para defunciones). Se filtran todos los casos positivos (CLASIFICACION_FINAL valores “1”, “2” y “3”) registrados en la base de datos.”

Por lo tanto, creamos la variable de casos_positivos de la siguiente manera:

# Creamos la variable de casos_positivos

edomex_datos$casos_positivos<-ifelse(edomex_datos$CLASIFICACION_FINAL== 1|
                                     edomex_datos$CLASIFICACION_FINAL== 2|
                                     edomex_datos$CLASIFICACION_FINAL== 3,1,0)

# Filtramos la base de datos para solo trabajar con los casos positivos.

edomex_datos<- subset(edomex_datos, edomex_datos$casos_positivos==1)

# Comprobamos la  cantidad de casos positivos para el Estado de México

table(edomex_datos$casos_positivos)

## 
##      1 
## 380842

La cantidad de casos positivos que encontramos para el Estado de México es de 380,842. La cual coincide con la cantidad reportada por la DGE.

Procedemos a realizar la tabla, para necesitamos trabajar con las fechas, sin embargo, antes de poder utilizarlas es necesario cambar el formato para que estas variables se puedan tratar como fechas y sea más sencillo utilizarlas.

# Identificamos que la clase de nuestras fechas es Caracter.

class(edomex_datos$FECHA_DEF)

## [1] "character"

class(edomex_datos$FECHA_INGRESO)

## [1] "character"

class(edomex_datos$FECHA_ACTUALIZACION)

## [1] "character"

# Cambiamos el las fechas a objetos del tipo "date"

edomex_datos$FECHA_INGRESO <-as.Date(edomex_datos$FECHA_INGRESO,
                                     format="%Y-%m-%d")

edomex_datos$FECHA_ACTUALIZACION <-as.Date(edomex_datos$FECHA_ACTUALIZACION,
                                           format="%Y-%m-%d")

edomex_datos$FECHA_DEF <-as.Date(edomex_datos$FECHA_DEF,
                                 format="%Y-%m-%d")

# Creamos una variable para contabilizar las defunciones.
# Esta variable cuenta como una defunción a aquellas observaciones 
# que reportaron una fecha de defunción.

edomex_datos$defunciones <- ifelse(is.na(edomex_datos$FECHA_DEF),0,1)

# Agrupamos por municipio y contamos los casos correspondientes por municipio.

def_mun<- aggregate(cbind(casos_positivos,defunciones)~MUNICIPIO,
                    edomex_datos, sum)

# Generamos la columna que nos da el porcentaje de defunciones con respecto a 
# los casos positivos.

def_mun$Porcentaje_def <- round(def_mun$defunciones/def_mun$casos_positivos*100, 2)

# Creamos nuestra tabla y para una mejor presentación la ordenamos
# por el municipio con mayor porcentaje de defunciones hasta el municipio con el 
# menor porcentaje.

a<-data.frame(def_mun[order(def_mun$Porcentaje_def,
                            decreasing = T),][1:126,],
              row.names = c(1:nrow(def_mun)))

# Presentamos la tabla con un formato interactivo que permite realizar bÚsquedas,
# y permite cambiar el orden por columna.

datatable(a ,class = 'cell-border stripe')

Nota

La tabla contiene a los 125 municipios del Estado de México y también mantiene la información de los casos para los cuales el municipio de residencia no fue especificado.

Adicionalmente, aprovechamos la información generada para corroborar que la cantidad de defunciones que identificamos coincida con la cifra reportada por la DGE que fue de 44,558 defunciones.

Análisis

El municipio de TLATLAY tiene el mayor porcentaje de defunciones con 27.19 %, mientras que el municipio conel menor porcentaje es TEMAMATLA CON el 3.75 %. Esto muestra que hay una gran variabilidad entre los municipios con respecto a esta variable.

sum(a$defunciones)

## [1] 44558

Como se observa, el dato que obtuvimos coincide exactamente con la cifra reportada por la DGE.

1.2.

(5%) % de casos positivos con al menos una comorbilidad a nivel municipal.

Solución

Para este ejercicio necesitamos identificar a las personas que sufren al menos una comorbilidad, lo que significa que son aquellas personas que dieron positivo a covid y además dijeron que padecen otra enfermedad como diabetes, tabaquísmo, hipertensión u otras.

Para identificar estos casos relizamos el siguiente código:

# Creamos la variable comorbilidad

edomex_datos$comorbilidad <- ifelse( edomex_datos$DIABETES ==1|
                                     edomex_datos$EPOC ==1|
                                     edomex_datos$ASMA ==1|
                                     edomex_datos$INMUSUPR ==1|
                                     edomex_datos$HIPERTENSION ==1|
                                     edomex_datos$OTRA_COM ==1|
                                     edomex_datos$CARDIOVASCULAR ==1|
                                     edomex_datos$OBESIDAD ==1|
                                     edomex_datos$RENAL_CRONICA ==1|
                                     edomex_datos$TABAQUISMO ==1,1,0)

# Agrupamos nuestros datos por municipio y contamos los casos posotivos y comorbilidad.

com_mun<- aggregate(cbind(casos_positivos,comorbilidad)~
                      MUNICIPIO, edomex_datos, sum)

# Generamos la variable de porcentaje de casos positivos con al menos una 
# comorbilidad, esta se construye con los casos que dieron positivo y tienen 
# al menos una comorbilidad entre el número total de casos positivos por municipio.

com_mun$Porcentaje_comorb <- round(com_mun$comorbilidad/com_mun$casos_positivos*100, 2)

# Le damos formato a nuestra tabla para ordenar los municipio de mayor a menor,
# de esta manera se presenta primero a los municipios con mayor porcentaje de 
# población con covid y al menos una comorbilidad hasta los municipios con menor 
# porcentaje.

b<-data.frame(com_mun[order(com_mun$Porcentaje_comorb, decreasing = T),][1:126,],row.names = c(1:nrow(com_mun)))

datatable(b ,class = 'cell-border stripe')

Nota

Se ordenan los datos de mayor a menor por la columna de “Porcentaje_comor” para que la tabla nos permita tener la información más relevante desde la primera revisión que damos.

Análisis

Se observa que TLATLAYA vuelve a aparecer en el primer lugar como el municipio con mayor porcentaje de población con covid y al menos una comorbilidad. Si comparamos esta tabla con la anterior podríamos tener una hipótesis que diga que la probabilidad de que una persona de este municipio fallezca es mayor a la de los otros municipios porque su población padece de otras enfermedades además del covid. Es solo una hipótesis que se puede generar, pero para comprobarla se tendría que hacer una investigación más a fondo.

1.3.

(10%) Total de casos positivos acumulados por día a nivel estatal.

Solución

Para poder obtener los casos acumulados por día basta con agrupar nuestros casos positivos por fecha de ingreso y posteriormente calculamos la cantidad acumulada con la función cumsum().

# Agrupamos por Fecha de ingreso

casos_dia<- aggregate(casos_positivos~
                      FECHA_INGRESO, edomex_datos, sum)

# Calculamos los casos positivos acumulados por día.
casos_dia$acumulados<- cumsum(casos_dia$casos_positivos)

# seleccionamos las variable de interés y las presentamos en una tabla interactiva.



datatable(casos_dia[,c(1,3)] ,class = 'cell-border stripe')

Nota

Para ver todos los días se puede desplazar en las pestañas de la tabla para observar el avance.

Como se puede observar en esta tabla, se confirma que nuestros datos calculados para los casos positivos coincide con los reportados por la DGE.

1.4.

(10%) Total acumulado de defunciones por día a nivel estatal.

Solución

Para este inciso, se hace algo similar, pero con la fecha de defunción. Se llegó a la conslusión de que era correcto utilizar esta fecha en lugar de la fecha de ingreso ya que como se observa al principio del chunk, se identificó que la fecha de defunción es un subconjunto de la fecha de ingreso, es decir, todos los elementos de FHECHA_DEF están contenidos en FECHA_INGRESO.

Si utilizaramos la fecha de ingreso encontraríamos varias fechas en las cuales se repetiría la cantidad de fallecidos, esto es porque no todos los días de la fecha de ingreso fallece las personas. Por lo tanto, para tener una secuencia siempre creciente ocupamos la FECHA_DEF.

# Comprobamos que todas las fechas de defunción están contenidas en el vector 
# de fechas de ingreso.

def<- edomex_datos$FECHA_DEF[!is.na(edomex_datos$FECHA_DEF)]

prueba <-def %in% edomex_datos$FECHA_INGRESO

table(prueba)

## prueba
##  TRUE 
## 44558

# Realizamos nuestra tabla agregando por Fecha de defunción.

defunciones_dia<- aggregate(defunciones~
                      FECHA_DEF, edomex_datos, sum)

# Generamos la variable de defunciones acumuladas por día

defunciones_dia$acumulado_defunciones <- cumsum(defunciones_dia$defunciones)

# Presentamos en una tabla el resultado de nuestras variables de interés.

datatable(defunciones_dia[,c(1,3)] ,class = 'cell-border stripe')

Nota

Para ver todos los días se puede desplazar en las pestañas de la tabla para observar el avance.

Como se puede observar en esta tabla, se confirma que nuestros datos calculados para las defunciones coincide con los reportados por la DGE.

1.5.

(10%) % de mujeres, a nivel municipal, que representan un caso positivo (Número de mujeres positivas en el municipio / Número de casos positivos en ese municipio).

Solución

Para este inciso se generó una variable para solo contabilizar a las mujeres que dieron positivo a Covid. Posteriormente, se agruparon los datos por municipio y al final presentamos los resultados en una tabla interactiva.

# Variable para identificar a las mujeres y poder contarlas.

edomex_datos$mujeres<- ifelse(edomex_datos$SEXO==1,1,0)

# Se agrupa nuestros datos por municipio y contamos las mujeres.

mujeres_covid<- aggregate(cbind(casos_positivos,mujeres)~
                      MUNICIPIO, edomex_datos, sum)

# Se crea la variable del porcentaje de mujeres que dieron positivo a Covid por municipio.

mujeres_covid$Porcentaje_Mujeres_covid <- round(mujeres_covid$mujeres/mujeres_covid$casos_positivos*100, 2)

datatable(data.frame(mujeres_covid[order(mujeres_covid$Porcentaje_Mujeres_covid, decreasing = T),][2:126,],row.names = c(1:125)),class = 'cell-border stripe')

Nota

Para esta tabla ordenamos los municipios empezando con aquel en el que el porcentaje de mujeres con covid-19 fue mayor y así sucesivamente hasta el municipio con el menor porcentaje. Adicionalmente, excluimos los casos para los cuales no se especificó el municipio de residencia.

Análisis

Como se puede observar en la tabla el municipio con mayor porcentaje fue TIMILPAN con 55.2 %, mientras que el municipio con el menor porcentaje fue IXTAPAN DEL ORO con 29.63 % .

2. (10%) Gráfico de barras de los 10 municipios con mayor % de defunciones.

Solución

Para este inciso podemos hacer uso de los datos obtenidos anteriormente, especificamente en el inciso 1.1.1, ya que es una base ordenada de mayor a menor porcentaje de defunciones y solo tomaremos las primeras diez filas que corresponden a los 10 municipios con mayor porcentaje de defunciones.

graf1<-ggplot(data = a[1:10,], aes(x=reorder(MUNICIPIO,-Porcentaje_def),y=Porcentaje_def,fill=MUNICIPIO,
                                   text = paste("Municipio: ",reorder(MUNICIPIO,-Porcentaje_def))))+# con reorder indicamos que ordene las barras de la mayor a la menor con base en el porcentaje de defunciones.
  geom_bar(stat="identity", position="dodge")+
  geom_text( aes(x = MUNICIPIO, label = Porcentaje_def),vjust=2)+# Permite añadir las etiquetas del porcentaje de cada municipio.
  theme_grey() +
  theme(axis.text.x=element_text(size=rel(-.5), angle=90))+ #Este comando nos permite cambiar el tamaño de la fuente y la orientación de las etiquetas.
  labs(title = "Gráfico de barras de los 10 municipios con mayor % de defunciones",
       caption = "Fuente: Elaboración propia con información de la Dirección General de Epidemiología",
       x="Municipios", y="Porcentaje de defunciones")+
  scale_fill_manual(values=brewer.pal(n = 10, name = "Spectral"))

ggplotly(graf1, tooltip = c("text","y"))

Análisis

La gráfica muestra que el municipio con el mayor porcentaje de defunciones es el municipio de TLATLAYA on el 27.19 % y los 9 municipios que le siguen no están tan alejados de esa cantidad.

3. (15%) Gráfico de barras de los 10 municipios con mayor número de casos positivos detectados, divido por hombres y por mujeres.

Solución

Para este inciso primero agrupamos nuestros datos por municipio y por sexo. Posteriormente, obtenemos los datos del total de casos positivos que se identificaron por cada municipio en el inciso 1.1.1, después le pegamos esta información del total de casos a nuestra base agrupada por municipio y sexo. Esto nos permite estructurar nuestros datos de insumo para poder crear una gráfica maravillosa.

una vez hecho lo anterior, ordenamos nuestra tabla por los municipios que tuvieron el mayor número total de casos positivos, sin perder la agrupación de municipio y sexo.

AdIcionalmente, transformamos nuestra variable de sexo que es numérica a caracter, para ello sustituimos los números uno por la palabra “MUJERES” y los números 2 los sustituimos por la palabra “HOMBRES”.

Por último, se realiza la gráfica que permite visualizar a solo los diez municipios con el mayor numero de casos totales de covid divididos por sexo.

# Se agrupan nuestros datos por municipio y por sexo.

sexo_mun<- aggregate(casos_positivos~
                      MUNICIPIO+SEXO, edomex_datos, sum)

# obtenemos los datos del total de casos positivos que se identificaron por cada municipio en el inciso 1.1.1

tmp<- a[,c(1,2)]

# Le pegamos esta información del total de casos a nuestra base agrupada por municipio y sexo.

c<- left_join(sexo_mun,tmp, by = c("MUNICIPIO" = "MUNICIPIO"))

# Ordenamos nuestra tabla por los municipios que tuvieron el mayor numero total 
# de casos positivos, sin perder la agrupación de municipio y sexo.

c<- c %>% arrange(desc(c$casos_positivos.y),MUNICIPIO,SEXO,.by_group = TRUE)

#transformamos nuestra variable de sexo que es numérica a caracter, para ello 
# sustituimos los números uno por la palabra "MUJERES" y los números 2 
# los sustituimos por la palabra "HOMBRES".

c$SEXO<- ifelse(c$SEXO==1,"MUJERES","HOMBRES")

# se realiza la gráfica que permite visualizar a solo los diez municipios con el 
# mayor numero de casos totales de covid divididos por sexo.

graf2<-ggplot(data = c[1:20,], aes(x=reorder(MUNICIPIO,-casos_positivos.x),y= casos_positivos.x,
                                   fill=SEXO, 
                                   text = paste("Municipio: ",reorder(MUNICIPIO,-casos_positivos.x),
                                                '</br>Casos Positivos: ',casos_positivos.x) ))+
  geom_bar(stat="identity", position=position_dodge())+
  theme_get() +
  theme(axis.text.x=element_text(size=rel(.75), angle=90))+
  labs(title = "Gráfico de barras de los 10 municipios con mayor número de\n casos positivos detectados, divido por hombres y por mujeres.",
       caption = "Fuente: Elaboración propia con información de la Dirección General de Epidemiología.",
       x="Municipios", y="Número de casos positivos")+
  scale_fill_manual(values=brewer.pal(n = 2, name = "Dark2"))

## Warning in brewer.pal(n = 2, name = "Dark2"): minimal value for n is 3, returning requested palette with 3 different levels

ggplotly(graf2,tooltip = c("text","SEXO"))

Análisis

Se observa que el municipio con mayor números de casos positivos reportados es el municipio de Ecatepec. Además un patrón común es que el total de hombres con covid es mayor que el de las mujeres para estos 10 municipios.

4. (15%) Gráfico de líneas que representa el número acumulado de defunciones a nivel estatal por día. Al desplazar el cursor sobre la línea, se debe de mostrar la cantidad representada en la línea.

Solución

En este punto se realiza una gráfica de linea dinámica que permite observar la cantidad de defunciones acumuladas a través el tiempo. Se tomo comó referencia elo ejemplo que compartió el profesor.

Comenzamos retomando los datos que se generaron anteriormente, extraemos la información de interés, la transformamos en una serie de tiempo y la gráficamos.

# De la información generada anteriormente extraemos la fecha de defunción y la cantidad acumulada de defunciones.
prueba<-  defunciones_dia[,c(1,3)]

# Convertimos el objeto en una serie de tiempo ordenada.

muertes_dia <- xts(x=prueba,order.by=prueba$FECHA_DEF)

# Graficamos los datos.

dygraph(muertes_dia, main = "Gráfico de líneas de defunciones acumuladas en el Estado de México", xlab = "Fecha", ylab = "Número acumulado de defunciones") %>%
  dyOptions(labelsUTC = TRUE, fillGraph=TRUE, fillAlpha=0.1, drawGrid = FALSE, colors="#984EA3") %>%
  dyRangeSelector(fillColor = "Red", strokeColor = "black") %>%
  dyCrosshair(direction = "vertical") %>%
  dyHighlight(highlightCircleSize = 5, highlightSeriesBackgroundAlpha = 0.2, hideOnMouseOut = FALSE)  %>%
  dyRoller(rollPeriod = 1)

Nota

Al ser una gráfica de datos acumulados la tendencia siempre será creciente.

5. (20%) Mapa que muestre la distribución espacial, por municipio, del % de defunciones. Utilizar el corte por cuantiles. Al situar el cursor sobre el municipio, se debe de desplegar el % de defunciones y el total de casos de defunciones del correspondiente.

Solución

Para realizar el mapa, utilizamos información del INEGI para tener los archivos tipo shape del Estado de México, este fue tratado en QGIS para poder utilizarlo con la paquetería leaflet.

Entonces, importamos nuestro archivo generado con QGIS, lo graficamos para comprobar que se importó correctamente.

Agrupamos nuestros datos por municipio y mantenemos también la clave del municipio (esto nos permitirá posteriormente fusionar estos datos con el archivo geoespacial del mapa del Estado de México), resumimos por casos positivos y defunciones por municipio.

Creamos la columna del porcentaje de defunciones. Posteriormente, transformamos en numérica la columna de la clave municipal del objeto geoespacial para que se eliminen los ceros. Lo anterior, nos permite realizar un merge para fusionar la tabla en la que hemos agregado nuestros datos y el objeto geoespacial en una misma base de datos manteniendo el orden.

Posteriormente, se utiliza esta tabla para agregar columnas al objeto geoespacial.

Una vez generado nuestra información a utilizar, se generan los cuantiles con base en el porcentaje de defunciones por municipio. Procedemos a establecer los colores que tendrá nuestro mapa y las etiquetas que mostrará cuando se deslice el cursor sobre cada municipio.

Por último, se crea el mapa.

# Importamos nuestro archivo generado con QGIS.

edomex<-readOGR("C:/Users/Gerardo Ramos/OneDrive - Comisión Federal de Competencia Económica/Documents/CIDE METPOL/Manejo de bases de datos R/examen final",
                      layer="edomex_mapa",encoding = "UTF-8")

## OGR data source with driver: ESRI Shapefile 
## Source: "C:\Users\Gerardo Ramos\OneDrive - Comisión Federal de Competencia Económica\Documents\CIDE METPOL\Manejo de bases de datos R\examen final", layer: "edomex_mapa"
## with 125 features
## It has 4 fields

# Lo graficamos para comprobar que se importó correctamente.

plot(edomex)

# Agrupamos nuestros datos por municipio y mantenemos también la clave del municipio

def_mun2<- aggregate(cbind(casos_positivos,defunciones)~
                      MUNICIPIO+MUNICIPIO_RES, edomex_datos, sum)

# Creamos la columna del porcentaje de defunciones.

def_mun2$Porcentaje_def <- round(def_mun2$defunciones/def_mun2$casos_positivos*100, 2)

# Transformamos en numérica la columna de la clave municipal del objeto geoespacial para que se eliminen los ceros.

edomex@data$CVE_MUN<- as.numeric(edomex@data$CVE_MUN)

# Se realiza un merge para fusionar la tabla en la que hemos agregado nuestros 
# datos y el objeto geoespacial en una misma base de datos manteniendo el orden

mapa_defun<-merge(x=edomex@data, y= def_mun2, by.x="CVE_MUN",
                  by.y="MUNICIPIO_RES", sort =FALSE, all.x = T)

# Se utiliza esta tabla para agregar columnas al objeto geoespacial.

edomex@data$defunciones<-mapa_defun$defunciones

edomex@data$Porcentaje_def<- mapa_defun$Porcentaje_def

# se generan los cuantiles con base en el porcentaje de defunciones por municipio.


quant_def<-cut(edomex@data$Porcentaje_def,5)

quant_def <- as.vector(sort(unique(quant_def)))
quant_def <- as.numeric(str_sub(quant_def, 2, 5))

quant_def<- c(quant_def, Inf)

# Se establecen los colores que tendrá nuestro mapa.

colores_mex<-brewer.pal(4, "YlGnBu")
colores_mex <- colorBin( palette="Reds", domain=edomex@data$Porcentaje_def, na.color="black", bins=quant_def)

# Se generan las etiquetas que mostrará cuando se deslice el cursor sobre cada municipio.

labs_mex <- paste(
  "Municipio: ",edomex@data$NOMGEO, "<br/>",
  "Porcentaje de defunciones: ", edomex@data$Porcentaje_def, "<br/>",
  "Total de defunciones", edomex@data$defunciones)  %>% lapply(htmltools::HTML)

# Se crea el mapa.

leaflet(data=edomex) %>% 
  addTiles() %>% 
  addPolygons(label = labs_mex, fillColor = colores_mex(edomex@data$Porcentaje_def),
              fillOpacity = 1.5,
              color = "black")%>%
  addLegend(pal = colores_mex, values = quant_def, title = "% De defunciones",position = "topright",
            opacity = 1.5)

Análisis

La distribución espacial del porcentaje de defunciones es muy variada y no se observa un patrón claro de que se localice en zonas especificas. Adicionalmente, se puede observar que los municipios que tiene el mayor porcentaje (mas del 22 %)de defunciones están significativamente muy por encima de los municipios que presentaron el menor porcentaje (3.73 %).

Centro de Investigación y Docencia Económicas, A.C.

Exámen final

Gerardo David Ramos Balderas

17 de diciembre de 2021

INSTRUCCIONES:

Generación de la base de datos

EJERCICIO

Casos positivos en el Estado de México de acuerdo con la DGE

Covid 19 en el Estado de México de acuerdo con la DGE

1. Eligiendo un estado de la república de residencia del paciente que tenga más de 20 municipios, obtener (tablas):

1.1.

1.2.

1.3.

1.4.

1.5.

2. (10%) Gráfico de barras de los 10 municipios con mayor % de defunciones.

3. (15%) Gráfico de barras de los 10 municipios con mayor número de casos positivos detectados, divido por hombres y por mujeres.

4. (15%) Gráfico de líneas que representa el número acumulado de defunciones a nivel estatal por día. Al desplazar el cursor sobre la línea, se debe de mostrar la cantidad representada en la línea.

5. (20%) Mapa que muestre la distribución espacial, por municipio, del % de defunciones. Utilizar el corte por cuantiles. Al situar el cursor sobre el municipio, se debe de desplegar el % de defunciones y el total de casos de defunciones del correspondiente.