Síndrome de Muerte Súbita del Lactante en Carolina del Norte

Iniciamos instalandos paquetes y llamando las librerias

library(sf)
library(ggplot2)
library(spData)
library(patchwork)
library(RColorBrewer)
library(scales)
library(stringr)
library(dplyr)
library(GGally)
library(plotly)
library(sp)
#library(spData)
library(spdep)
library(gstat)
#library(ggplot2)
library(raster)
library(spData)
# spData Contiene una variedad de Datos
#data(package = "spData")
# Cargamos los Datos
data("nc.sids")

Procedemos a cargar los datos de SIDS del estado de Carolina del Norte y revisamos caracteristicas de la base de datos

#str(nc.sids)
head(nc.sids)
##             CNTY.ID BIR74 SID74 NWBIR74 BIR79 SID79 NWBIR79 east north      x
## Ashe           1825  1091     1      10  1364     0      19  164   176 -81.67
## Alleghany      1827   487     0      10   542     3      12  183   182 -50.06
## Surry          1828  3188     5     208  3616     6     260  204   174 -16.14
## Currituck      1831   508     1     123   830     2     145  461   182 406.01
## Northampton    1832  1421     9    1066  1606     3    1197  385   176 281.10
## Hertford       1833  1452     7     954  1838     5    1237  411   176 323.77
##                   y       lon      lat L.id M.id
## Ashe        4052.29 -81.48594 36.43940    1    2
## Alleghany   4059.70 -81.14061 36.52443    1    2
## Surry       4043.76 -80.75312 36.40033    1    2
## Currituck   4035.10 -76.04892 36.45655    1    4
## Northampton 4029.75 -77.44057 36.38799    1    4
## Hertford    4028.10 -76.96474 36.38189    1    4
dim(nc.sids)
## [1] 100  15

nc.sids es un objeto de clase sf (simple features) y data.frame.Contiene 100 observaciones (filas) y 15 variables (columnas).Algunas de las variables incluyen:

El conjunto de datos nc.sids de la librería spData es un objeto espacial que contiene información sobre los condados de Carolina del Norte, incluyendo características geométricas (área, perímetro, geometría) y datos demográficos/epidemiológicos (nacimientos y muertes por SIDS en los años 1974 y 1979). Las variables incluyen identificadores, nombres y códigos de los condados, así como datos relevantes para el análisis de la mortalidad infantil.

Este conjunto de datos es adecuado para realizar análisis espaciales, como la visualización de tasas de SIDS en diferentes condados

summary(nc.sids)
##     CNTY.ID         BIR74           SID74          NWBIR74      
##  Min.   :1825   Min.   :  248   Min.   : 0.00   Min.   :   1.0  
##  1st Qu.:1902   1st Qu.: 1077   1st Qu.: 2.00   1st Qu.: 190.0  
##  Median :1982   Median : 2180   Median : 4.00   Median : 697.5  
##  Mean   :1986   Mean   : 3300   Mean   : 6.67   Mean   :1051.0  
##  3rd Qu.:2067   3rd Qu.: 3936   3rd Qu.: 8.25   3rd Qu.:1168.5  
##  Max.   :2241   Max.   :21588   Max.   :44.00   Max.   :8027.0  
##      BIR79           SID79          NWBIR79             east      
##  Min.   :  319   Min.   : 0.00   Min.   :    3.0   Min.   : 19.0  
##  1st Qu.: 1336   1st Qu.: 2.00   1st Qu.:  250.5   1st Qu.:178.8  
##  Median : 2636   Median : 5.00   Median :  874.5   Median :285.0  
##  Mean   : 4224   Mean   : 8.36   Mean   : 1352.8   Mean   :271.3  
##  3rd Qu.: 4889   3rd Qu.:10.25   3rd Qu.: 1406.8   3rd Qu.:361.2  
##  Max.   :30757   Max.   :57.00   Max.   :11631.0   Max.   :482.0  
##      north             x                 y             lon        
##  Min.   :  6.0   Min.   :-328.04   Min.   :3757   Min.   :-84.08  
##  1st Qu.: 97.0   1st Qu.: -60.55   1st Qu.:3920   1st Qu.:-81.20  
##  Median :125.5   Median : 114.38   Median :3963   Median :-79.26  
##  Mean   :122.1   Mean   :  91.46   Mean   :3953   Mean   :-79.51  
##  3rd Qu.:151.5   3rd Qu.: 240.03   3rd Qu.:4000   3rd Qu.:-77.87  
##  Max.   :182.0   Max.   : 439.65   Max.   :4060   Max.   :-75.67  
##       lat             L.id           M.id     
##  Min.   :33.92   Min.   :1.00   Min.   :1.00  
##  1st Qu.:35.26   1st Qu.:1.00   1st Qu.:2.00  
##  Median :35.68   Median :2.00   Median :3.00  
##  Mean   :35.62   Mean   :2.12   Mean   :2.67  
##  3rd Qu.:36.05   3rd Qu.:3.00   3rd Qu.:3.25  
##  Max.   :36.52   Max.   :4.00   Max.   :4.00
#plot(nc.sids)
  1. BIR74 (Nacimientos totales en 1974): Los nacimientos totales en 1974 varían ampliamente, desde 248 hasta 21588, con una media de 3300 y una mediana de 2180.

  2. SID74 (Muertes por SIDS en 1974): Las muertes por SIDS en 1974 oscilan entre 0 y 44, con una media de 6.67 y una mediana de 4. Esto sugiere que aunque la mayoría de los condados tienen pocas o ninguna muerte por SIDS, algunos tienen un número relativamente alto.

  3. NWBIR74 (Nacimientos de no blancos en 1974): Los nacimientos de no blancos en 1974 también muestran una amplia variación, con un mínimo de 1 y un máximo de 8027, una media de 1051 y una mediana de 697.5.

  4. BIR79 (Nacimientos totales en 1979): Similar a 1974, los nacimientos en 1979 varían considerablemente, desde 319 hasta 30757, con una media de 4224 y una mediana de 2636.

  5. SID79 (Muertes por SIDS en 1979): Las muertes por SIDS en 1979 también varían desde 0 hasta 57, con una media de 8.36 y una mediana de 5, indicando una distribución similar a 1974 pero con un mayor valor máximo.

  6. NWBIR79 (Nacimientos de no blancos en 1979): Los nacimientos de no blancos en 1979 muestran una variación similar a 1974, con un mínimo de 3 y un máximo de 11631, una media de 1352.8 y una mediana de 874.5.

  7. los índices 𝐿 y M de Cressie y Read (1985) son métricas utilizadas en geoestadística para evaluar la calidad del ajuste de modelos de variograma a datos espaciales: Índice : Mide la discrepancia entre el variograma observado y el modelo de variograma ajustado. Un valor bajo indica un buen ajuste del modelo a los datos. Índice M: Proporciona una medida alternativa de la calidad del ajuste entre el modelo de variograma y los datos observados. Un valor bajo sugiere que el modelo representa bien los datos.

# Crear un dataframe para las variables SID74 y SID79
df <- data.frame(
  Valor = c(nc.sids$SID74, nc.sids$SID79),
  Variable = factor(rep(c("SID74", "SID79"), each = nrow(nc.sids)))
)

# Crear el gráfico de cajas y bigotes
ggplot(df, aes(x = Variable, y = Valor, fill = Variable)) +
  geom_boxplot(outlier.colour = "blue", outlier.shape = 16, color = "black") +
  scale_fill_manual(values = c("SID74" = "red", "SID79" = "yellow")) +
  labs(title = "Distribucion de SID74 y SID79",
       x = "Variable",
       y = "Valor de SIDS") +
  theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 16),
    axis.title = element_text(size = 14),
    axis.text = element_text(size = 12),
    legend.position = "none",
    panel.grid.major = element_blank(),
    panel.grid.minor = element_blank()
  )

- Se puede observar que la línea negra de caja permite comparar las medianas SID74 y SID79. Por esta diferencia indica un aumento en la cantidad de de SIDS de 1974 a 1979. - SID79 es la caja mas alta y con más outliers sugiere una mayor variabilidad en la cantidad de muertes a causa del SIDS para los periodos de 1979 a 1984. Lo que indica que para este periodo hubieron 6 condados con altas cantidades de muertes SIDS.

cor(nc.sids)
##             CNTY.ID        BIR74      SID74    NWBIR74        BIR79
## CNTY.ID  1.00000000  0.130450774  0.2289197  0.1276602  0.121737412
## BIR74    0.13045077  1.000000000  0.8572055  0.9025430  0.996998820
## SID74    0.22891974  0.857205475  1.0000000  0.8977063  0.843936380
## NWBIR74  0.12766023  0.902542963  0.8977063  1.0000000  0.895668187
## BIR79    0.12173741  0.996998820  0.8439364  0.8956682  1.000000000
## SID79    0.21056065  0.913567215  0.8330762  0.8465393  0.895292312
## NWBIR79  0.13192139  0.923890131  0.9000538  0.9934904  0.921557994
## east    -0.07108284 -0.005231878  0.1176315  0.1678843 -0.005585095
## north   -0.98559615 -0.168035431 -0.2747043 -0.1748723 -0.156728243
## x       -0.08047143 -0.006440828  0.1151355  0.1662177 -0.006731231
## y       -0.96765559 -0.177465155 -0.3051205 -0.2150185 -0.165743591
## lon     -0.06799285 -0.004992632  0.1184122  0.1684407 -0.005342509
## lat     -0.98557522 -0.167055613 -0.2779922 -0.1796515 -0.155874566
## L.id     0.94537937  0.111893412  0.2218719  0.1153046  0.104986754
## M.id    -0.09768192  0.008299599  0.1469809  0.1827982  0.004956627
##                SID79    NWBIR79         east       north            x
## CNTY.ID  0.210560647  0.1319214 -0.071082842 -0.98559615 -0.080471429
## BIR74    0.913567215  0.9238901 -0.005231878 -0.16803543 -0.006440828
## SID74    0.833076196  0.9000538  0.117631512 -0.27470431  0.115135544
## NWBIR74  0.846539329  0.9934904  0.167884259 -0.17487230  0.166217655
## BIR79    0.895292312  0.9215580 -0.005585095 -0.15672824 -0.006731231
## SID79    1.000000000  0.8586045 -0.002848457 -0.24721302 -0.004976015
## NWBIR79  0.858604549  1.0000000  0.150415344 -0.17493781  0.148742224
## east    -0.002848457  0.1504153  1.000000000  0.07430752  0.999950659
## north   -0.247213025 -0.1749378  0.074307523  1.00000000  0.083701957
## x       -0.004976015  0.1487422  0.999950659  0.08370196  1.000000000
## y       -0.257669725 -0.2113871 -0.101078698  0.98417252 -0.091722203
## lon     -0.002188980  0.1509804  0.999991056  0.07126089  0.999903807
## lat     -0.247137763 -0.1792933  0.047232063  0.99956239  0.056679564
## L.id     0.201257623  0.1198831 -0.167174577 -0.93941999 -0.176201259
## M.id     0.025982993  0.1635107  0.960023449  0.10229846  0.960265014
##                   y          lon         lat       L.id         M.id
## CNTY.ID -0.96765559 -0.067992854 -0.98557522  0.9453794 -0.097681921
## BIR74   -0.17746516 -0.004992632 -0.16705561  0.1118934  0.008299599
## SID74   -0.30512051  0.118412238 -0.27799221  0.2218719  0.146980949
## NWBIR74 -0.21501855  0.168440652 -0.17965145  0.1153046  0.182798209
## BIR79   -0.16574359 -0.005342509 -0.15587457  0.1049868  0.004956627
## SID79   -0.25766973 -0.002188980 -0.24713776  0.2012576  0.025982993
## NWBIR79 -0.21138712  0.150980365 -0.17929332  0.1198831  0.163510732
## east    -0.10107870  0.999991056  0.04723206 -0.1671746  0.960023449
## north    0.98417252  0.071260891  0.99956239 -0.9394200  0.102298464
## x       -0.09172220  0.999903807  0.05667956 -0.1762013  0.960265014
## y        1.00000000 -0.104105049  0.98843803 -0.9063936 -0.065743008
## lon     -0.10410505  1.000000000  0.04414628 -0.1640769  0.959903035
## lat      0.98843803  0.044146280  1.00000000 -0.9373976  0.076422964
## L.id    -0.90639364 -0.164076913 -0.93739763  1.0000000 -0.192268360
## M.id    -0.06574301  0.959903035  0.07642296 -0.1922684  1.000000000

L.id y M.id tienen correlaciones bajas con la mayoría de las otras variables, excepto con las coordenadas espaciales. Esto puede sugerir que estos índices están más relacionados con la configuración espacial que con las medidas específicas de nacimientos y muertes.

Visualización espacial

#library(ggplot2)
#library(ggmap)  # Solo si decides agregar un mapa de fondo
#library(plotly)

# Añadir un mapa de fondo (opcional)
# north_carolina_map <- get_map(location = 'North Carolina', zoom = 7, maptype = 'toner-lite')

# Crear el gráfico base con ggplot2
p <- ggplot(nc.sids, aes(x = lon, y = lat, size = SID74, fill = SID74)) +
  # Si usas un mapa de fondo, descomenta la siguiente línea
   #geom_tile(data = nc.sids, aes(x = lon, y = lat), alpha = 0.5, fill = "grey80") +
  geom_point(shape = 21, color = "black", alpha = 0.7) +
  geom_text(aes(label = rownames(nc.sids)), size = 3.5, nudge_y = 0.2, color = "black", check_overlap = TRUE) +  # Ajustar tamaño y superposición
  scale_size_continuous(range = c(3, 12), guide = FALSE) +  # Ajusta el rango de tamaño según la variabilidad
  scale_fill_gradient(low = "#F1EEF6", high = "red", name = "Tasa de SIDS",
                      breaks = seq(0, 60, by = 10), labels = c("0", "10", "20", "30", "40", "50", "60"),
                      guide = guide_colorbar(barheight = unit(5, "cm"), label.position = "right")) +
  labs(title = "Tasas de SIDS en Carolina del Norte (1974-1978)",
       subtitle = "Tasa de SIDS por condado",
       caption = "Fuente: nc.sids dataset") +
  theme_classic() +
  theme(plot.title = element_text(face = "bold", size = 16),
        plot.subtitle = element_text(size = 14),
        plot.caption = element_text(size = 10, color = "gray50"),
        axis.text = element_blank(),
        axis.title = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank(),
        legend.position = "right",
        legend.title = element_text(size = 12),
        legend.text = element_text(size = 10))

# Convertir el gráfico a un formato interactivo con plotly
interactive_plot <- ggplotly(p)

# Mostrar el gráfico interactivo
interactive_plot

El gráfico muestra la distribución espacial de la tasa de muertes por SIDS en Carolina del Norte en 1974, facilitando la identificación de áreas con altas y bajas tasas de SIDS y permitiendo comparar visualmente entre diferentes condados.Este análisis visual puede proporcionar ideas sobre cómo se distribuye el problema de SIDS en el estado y ayudar a identificar áreas que podrían necesitar más investigación o atención.como son Onslow, Cumberland, Robeson, Mecklenburg que presentaron las tasas mas altas.

# Cambiar 'SID79' a la columna que representa las tasas de SIDS en 1979-1984
library(ggplot2)
library(plotly)

# Crear el gráfico base con ggplot2
p <- ggplot(nc.sids, aes(x = lon, y = lat, size = SID79, fill = SID79)) +
  geom_point(shape = 21, color = "black") +
  geom_text(aes(label = rownames(nc.sids)), size = 3, nudge_y = 0.1, color = "black") +
  scale_size_continuous(range = c(3, 10), guide = FALSE) +
  scale_fill_gradient(low = "#F1EEF6", high = "yellow", name = "Tasa de SIDS",
                      breaks = seq(0, 60, by = 10), labels = c("0", "10", "20", "30", "40", "50", "60"),
                      guide = guide_colorbar(barheight = unit(5, "cm"), label.position = "right")) +
  labs(title = "Tasas de SIDS en Carolina del Norte (1979-1984)",
       subtitle = "Tasa de SIDS por condado",
       caption = "Fuente: nc.sids dataset") +
  theme_classic() +
  theme(plot.title = element_text(face = "bold", size = 16),
        plot.subtitle = element_text(size = 14),
        plot.caption = element_text(size = 10, color = "gray50"),
        axis.text = element_blank(),
        axis.title = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank(),
        legend.position = "right",
        legend.title = element_text(size = 12),
        legend.text = element_text(size = 10))

# Convertir el gráfico a un formato interactivo con plotly
interactive_plot <- ggplotly(p)

# Mostrar el gráfico interactivo
interactive_plot

El anterior gráfico proporciona una visión visual clara de cómo las tasas de muertes por SIDS se distribuyen en Carolina del Norte para el período 1979-1984, permitiendo una rápida identificación de áreas de interés y facilitando la comparación entre diferentes condados.Podemos notar que para este periodo de tiempo los condado con mayor tasas son Cumberland, Mecklenburg, Guilford, los dos primeros condados mecionados en el periodo de 1974-1978 tambien presentaron altas tasas.

# Cargar las bibliotecas necesarias
library(ggplot2)
library(plotly)

# Crear el primer gráfico con ggplot2 y convertirlo a un gráfico interactivo con plotly
p1 <- ggplot(nc.sids, aes(x = lon, y = lat, size = SID74, fill = SID74)) +
  geom_point(shape = 21, color = "black", alpha = 0.7) +
  geom_text(aes(label = rownames(nc.sids)), size = 3.5, nudge_y = 0.2, color = "black", check_overlap = TRUE) +
  scale_size_continuous(range = c(3, 12), guide = FALSE) +
  scale_fill_gradient(low = "#F1EEF6", high = "red", name = "Tasa de SIDS",
                      breaks = seq(0, 60, by = 10), labels = c("0", "10", "20", "30", "40", "50", "60"),
                      guide = guide_colorbar(barheight = unit(5, "cm"), label.position = "right")) +
  labs(title = "Tasas de SIDS en Carolina del Norte (1974-1978)",
       subtitle = "Tasa de SIDS por condado",
       caption = "Fuente: nc.sids dataset") +
  theme_classic() +
  theme(plot.title = element_text(face = "bold", size = 16),
        plot.subtitle = element_text(size = 14),
        plot.caption = element_text(size = 10, color = "gray50"),
        axis.text = element_blank(),
        axis.title = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank(),
        legend.position = "right",
        legend.title = element_text(size = 12),
        legend.text = element_text(size = 10))

interactive_plot1 <- ggplotly(p1)

# Crear el segundo gráfico con ggplot2 y convertirlo a un gráfico interactivo con plotly
p2 <- ggplot(nc.sids, aes(x = lon, y = lat, size = SID79, fill = SID79)) +
  geom_point(shape = 21, color = "black") +
  geom_text(aes(label = rownames(nc.sids)), size = 3, nudge_y = 0.1, color = "black") +
  scale_size_continuous(range = c(3, 10), guide = FALSE) +
  scale_fill_gradient(low = "#F1EEF6", high = "yellow", name = "Tasa de SIDS",
                      breaks = seq(0, 60, by = 10), labels = c("0", "10", "20", "30", "40", "50", "60"),
                      guide = guide_colorbar(barheight = unit(5, "cm"), label.position = "right")) +
  labs(title = "Tasas de SIDS en Carolina del Norte (1979-1984)",
       subtitle = "Tasa de SIDS por condado",
       caption = "Fuente: nc.sids dataset") +
  theme_classic() +
  theme(plot.title = element_text(face = "bold", size = 16),
        plot.subtitle = element_text(size = 14),
        plot.caption = element_text(size = 10, color = "gray50"),
        axis.text = element_blank(),
        axis.title = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank(),
        legend.position = "right",
        legend.title = element_text(size = 12),
        legend.text = element_text(size = 10))

interactive_plot2 <- ggplotly(p2)

# Combinar ambos gráficos en uno solo utilizando subplot de plotly
combined_plot <- subplot(interactive_plot1, interactive_plot2, nrows = 1, shareX = TRUE, shareY = TRUE,
                         titleX = TRUE, titleY = TRUE, margin = 0.05) %>%
  layout(title = "Tasas de SIDS en Carolina del Norte (1974-1978 y 1979-1984)")

# Mostrar el gráfico combinado
combined_plot

Datos World - Experanza de Vida Mundial

El análisis de la esperanza de vida es fundamental para entender la salud pública, dado que refleja el acceso a servicios de salud y las condiciones de vida en una población. También está estrechamente relacionado con el desarrollo económico, ayudando a identificar áreas que necesitan políticas más específicas. A nivel regional, estos datos pueden guiar la planificación y asignación de recursos para mejorar el bienestar. En el ámbito académico, contribuye al conocimiento sobre los factores espaciales que influyen en la salud, y los resultados pueden usarse para sensibilizar a las autoridades y diseñar estrategias que reduzcan las desigualdades en salud.

Principales Variables:

# Cargar la librería y los datos
library(spData)
data("world")

# Ver la estructura de los datos
str(world)
## sf [177 × 11] (S3: sf/tbl_df/tbl/data.frame)
##  $ iso_a2   : chr [1:177] "FJ" "TZ" "EH" "CA" ...
##  $ name_long: chr [1:177] "Fiji" "Tanzania" "Western Sahara" "Canada" ...
##  $ continent: chr [1:177] "Oceania" "Africa" "Africa" "North America" ...
##  $ region_un: chr [1:177] "Oceania" "Africa" "Africa" "Americas" ...
##  $ subregion: chr [1:177] "Melanesia" "Eastern Africa" "Northern Africa" "Northern America" ...
##  $ type     : chr [1:177] "Sovereign country" "Sovereign country" "Indeterminate" "Sovereign country" ...
##  $ area_km2 : num [1:177] 19290 932746 96271 10036043 9510744 ...
##  $ pop      : num [1:177] 8.86e+05 5.22e+07 NA 3.55e+07 3.19e+08 ...
##  $ lifeExp  : num [1:177] 70 64.2 NA 82 78.8 ...
##  $ gdpPercap: num [1:177] 8222 2402 NA 43079 51922 ...
##  $ geom     :sfc_MULTIPOLYGON of length 177; first list element: List of 3
##   ..$ :List of 1
##   .. ..$ : num [1:5, 1:2] -180 -180 -180 -180 -180 ...
##   ..$ :List of 1
##   .. ..$ : num [1:9, 1:2] 178 178 177 177 178 ...
##   ..$ :List of 1
##   .. ..$ : num [1:8, 1:2] 180 180 179 179 179 ...
##   ..- attr(*, "class")= chr [1:3] "XY" "MULTIPOLYGON" "sfg"
##  - attr(*, "sf_column")= chr "geom"
##  - attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA NA NA NA NA
##   ..- attr(*, "names")= chr [1:10] "iso_a2" "name_long" "continent" "region_un" ...
# Ver las primeras filas del dataset
head(world)
## Simple feature collection with 6 features and 10 fields
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: -180 ymin: -18.28799 xmax: 180 ymax: 83.23324
## Geodetic CRS:  WGS 84
## # A tibble: 6 × 11
##   iso_a2 name_long  continent region_un subregion type  area_km2     pop lifeExp
##   <chr>  <chr>      <chr>     <chr>     <chr>     <chr>    <dbl>   <dbl>   <dbl>
## 1 FJ     Fiji       Oceania   Oceania   Melanesia Sove…   1.93e4  8.86e5    70.0
## 2 TZ     Tanzania   Africa    Africa    Eastern … Sove…   9.33e5  5.22e7    64.2
## 3 EH     Western S… Africa    Africa    Northern… Inde…   9.63e4 NA         NA  
## 4 CA     Canada     North Am… Americas  Northern… Sove…   1.00e7  3.55e7    82.0
## 5 US     United St… North Am… Americas  Northern… Coun…   9.51e6  3.19e8    78.8
## 6 KZ     Kazakhstan Asia      Asia      Central … Sove…   2.73e6  1.73e7    71.6
## # ℹ 2 more variables: gdpPercap <dbl>, geom <MULTIPOLYGON [°]>
# Descripción estadística de las variables
summary(world)
##     iso_a2           name_long          continent          region_un        
##  Length:177         Length:177         Length:177         Length:177        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##   subregion             type              area_km2             pop           
##  Length:177         Length:177         Min.   :    2417   Min.   :5.630e+04  
##  Class :character   Class :character   1st Qu.:   46185   1st Qu.:3.755e+06  
##  Mode  :character   Mode  :character   Median :  185004   Median :1.040e+07  
##                                        Mean   :  832558   Mean   :4.282e+07  
##                                        3rd Qu.:  621860   3rd Qu.:3.075e+07  
##                                        Max.   :17018507   Max.   :1.364e+09  
##                                                           NA's   :10         
##     lifeExp        gdpPercap                   geom    
##  Min.   :50.62   Min.   :   597.1   MULTIPOLYGON :177  
##  1st Qu.:64.96   1st Qu.:  3752.4   epsg:4326    :  0  
##  Median :72.87   Median : 10734.1   +proj=long...:  0  
##  Mean   :70.85   Mean   : 17106.0                      
##  3rd Qu.:76.78   3rd Qu.: 24232.7                      
##  Max.   :83.59   Max.   :120860.1                      
##  NA's   :10      NA's   :17

La variable lifeExp muestra una esperanza de vida que varía desde 50.62 años hasta 83.59 años, con una media de 70.85 años y una mediana de 72.87 años. La primera y tercera cuartil son 64.96 y 76.78 años, respectivamente. Esto indica una amplia variabilidad en la esperanza de vida entre los países, con algunos países con expectativas de vida mucho más altas que otros.

El PIB per cápita (gdpPercap) tiene un rango amplio, desde 597.1 hasta 120,860.1 dólares, con una media de 17,106.0 dólares. La esperanza de vida y el PIB per cápita suelen estar correlacionados positivamente, sugiriendo que los países con mayores ingresos tienden a tener una mayor esperanza de vida.

A partir del resumen de la base de datos world, la variable pop (población) muestra una notable variabilidad entre los países, con un rango que va desde 56,300 hasta 1,364,000,000 habitantes. La población media es de aproximadamente 42,820,000 habitantes, y la mediana es de 10,400,000 habitantes. La distribución de la población está sesgada hacia los países con grandes poblaciones, como se observa en el valor máximo extremadamente alto. Este sesgo hacia poblaciones más grandes puede reflejar la existencia de varios países con poblaciones relativamente pequeñas en comparación con los más poblados, lo que sugiere que la mayoría de la población mundial está concentrada en unos pocos países. Para el análisis de la esperanza de vida, es relevante considerar el tamaño de la población, ya que las dinámicas de salud y la provisión de servicios pueden variar significativamente entre países con diferentes tamaños de población.

par(mfrow = c(1, 3))
boxplot(world$pop,col = "green",
        border = 4, xlab = "Poblacion")
boxplot(world$lifeExp,col = "green",
        border = 4, xlab = 'Esperanza de vida')
boxplot(world$gdpPercap,col = "green",
        border = 4, xlab = 'PIB percapita')

par(mfrow = c(1, 1))
library()
ggplot(data = world) + geom_sf(aes(fill = lifeExp)) + 
  labs(title = 'Esperanza de vida mundial', fill = 'Esperanza de vida', x = '', y='') + 
  geom_sf_text(aes(label=ifelse(lifeExp > 82, str_to_title(name_long),"")), col="black",
               fontface="bold", size=3, fun.geometry=function(x) sf::st_centroid(x)) +
  theme(plot.title = element_text(hjust = 0.5, face = 'bold'),
        panel.background=element_rect(fill = "white"),
        panel.grid.major=element_line(color="gray"),
        panel.grid.minor=element_line(color="gray")) +
  scale_fill_gradientn(colours = brewer.pal(n = 5, name = "Greens"))
## Warning: Removed 10 rows containing missing values or values outside the scale range
## (`geom_text()`).

1. El gráfico muestra la esperanza de vida en diferentes países a nivel mundial, utilizando un gradiente de color para representar los distintos niveles de esperanza de vida. Los países con colores más oscuros indican una mayor esperanza de vida, mientras que los colores más claros representan una esperanza de vida menor. Esto permite una visualización clara de las disparidades en esperanza de vida entre diferentes regiones y países.

  1. Los países con una esperanza de vida superior a 82 años están etiquetados en el gráfico. Estos países suelen encontrarse en regiones desarrolladas, como Europa Occidental, América del Norte y algunas partes de Asia. La inclusión de estas etiquetas permite identificar rápidamente los países con la esperanza de vida más alta y resaltar las zonas donde las condiciones de vida y el acceso a servicios de salud son excelentes.

Los países con menor esperanza de vida, que se representan con colores más claros, se localizan principalmente en regiones de África Sub-Sahariana y algunas áreas de Asia. Estos países enfrentan desafíos significativos en términos de salud pública, desarrollo económico y acceso a servicios básicos, lo cual se refleja en sus menores niveles de esperanza de vida.

El gráfico revela patrones regionales claros, con diferencias notables en la esperanza de vida entre continentes. Por ejemplo, se observa que las regiones más desarrolladas suelen tener una esperanza de vida más alta en comparación con las regiones en desarrollo o con menos recursos. Esto subraya la importancia de considerar el contexto económico y social al interpretar los datos de esperanza de vida.