Iniciamos instalandos paquetes y llamando las librerias
library(sf)
library(ggplot2)
library(spData)
library(patchwork)
library(RColorBrewer)
library(scales)
library(stringr)
library(dplyr)
library(GGally)
library(plotly)
library(sp)
#library(spData)
library(spdep)
library(gstat)
#library(ggplot2)
library(raster)
library(spData)
# spData Contiene una variedad de Datos
#data(package = "spData")
# Cargamos los Datos
data("nc.sids")
Procedemos a cargar los datos de SIDS del estado de Carolina del Norte y revisamos caracteristicas de la base de datos
#str(nc.sids)
head(nc.sids)
## CNTY.ID BIR74 SID74 NWBIR74 BIR79 SID79 NWBIR79 east north x
## Ashe 1825 1091 1 10 1364 0 19 164 176 -81.67
## Alleghany 1827 487 0 10 542 3 12 183 182 -50.06
## Surry 1828 3188 5 208 3616 6 260 204 174 -16.14
## Currituck 1831 508 1 123 830 2 145 461 182 406.01
## Northampton 1832 1421 9 1066 1606 3 1197 385 176 281.10
## Hertford 1833 1452 7 954 1838 5 1237 411 176 323.77
## y lon lat L.id M.id
## Ashe 4052.29 -81.48594 36.43940 1 2
## Alleghany 4059.70 -81.14061 36.52443 1 2
## Surry 4043.76 -80.75312 36.40033 1 2
## Currituck 4035.10 -76.04892 36.45655 1 4
## Northampton 4029.75 -77.44057 36.38799 1 4
## Hertford 4028.10 -76.96474 36.38189 1 4
dim(nc.sids)
## [1] 100 15
nc.sids es un objeto de clase sf (simple features) y data.frame.Contiene 100 observaciones (filas) y 15 variables (columnas).Algunas de las variables incluyen:
El conjunto de datos nc.sids de la librería spData es un objeto espacial que contiene información sobre los condados de Carolina del Norte, incluyendo características geométricas (área, perímetro, geometría) y datos demográficos/epidemiológicos (nacimientos y muertes por SIDS en los años 1974 y 1979). Las variables incluyen identificadores, nombres y códigos de los condados, así como datos relevantes para el análisis de la mortalidad infantil.
Este conjunto de datos es adecuado para realizar análisis espaciales, como la visualización de tasas de SIDS en diferentes condados
summary(nc.sids)
## CNTY.ID BIR74 SID74 NWBIR74
## Min. :1825 Min. : 248 Min. : 0.00 Min. : 1.0
## 1st Qu.:1902 1st Qu.: 1077 1st Qu.: 2.00 1st Qu.: 190.0
## Median :1982 Median : 2180 Median : 4.00 Median : 697.5
## Mean :1986 Mean : 3300 Mean : 6.67 Mean :1051.0
## 3rd Qu.:2067 3rd Qu.: 3936 3rd Qu.: 8.25 3rd Qu.:1168.5
## Max. :2241 Max. :21588 Max. :44.00 Max. :8027.0
## BIR79 SID79 NWBIR79 east
## Min. : 319 Min. : 0.00 Min. : 3.0 Min. : 19.0
## 1st Qu.: 1336 1st Qu.: 2.00 1st Qu.: 250.5 1st Qu.:178.8
## Median : 2636 Median : 5.00 Median : 874.5 Median :285.0
## Mean : 4224 Mean : 8.36 Mean : 1352.8 Mean :271.3
## 3rd Qu.: 4889 3rd Qu.:10.25 3rd Qu.: 1406.8 3rd Qu.:361.2
## Max. :30757 Max. :57.00 Max. :11631.0 Max. :482.0
## north x y lon
## Min. : 6.0 Min. :-328.04 Min. :3757 Min. :-84.08
## 1st Qu.: 97.0 1st Qu.: -60.55 1st Qu.:3920 1st Qu.:-81.20
## Median :125.5 Median : 114.38 Median :3963 Median :-79.26
## Mean :122.1 Mean : 91.46 Mean :3953 Mean :-79.51
## 3rd Qu.:151.5 3rd Qu.: 240.03 3rd Qu.:4000 3rd Qu.:-77.87
## Max. :182.0 Max. : 439.65 Max. :4060 Max. :-75.67
## lat L.id M.id
## Min. :33.92 Min. :1.00 Min. :1.00
## 1st Qu.:35.26 1st Qu.:1.00 1st Qu.:2.00
## Median :35.68 Median :2.00 Median :3.00
## Mean :35.62 Mean :2.12 Mean :2.67
## 3rd Qu.:36.05 3rd Qu.:3.00 3rd Qu.:3.25
## Max. :36.52 Max. :4.00 Max. :4.00
#plot(nc.sids)
BIR74 (Nacimientos totales en 1974): Los nacimientos totales en 1974 varían ampliamente, desde 248 hasta 21588, con una media de 3300 y una mediana de 2180.
SID74 (Muertes por SIDS en 1974): Las muertes por SIDS en 1974 oscilan entre 0 y 44, con una media de 6.67 y una mediana de 4. Esto sugiere que aunque la mayoría de los condados tienen pocas o ninguna muerte por SIDS, algunos tienen un número relativamente alto.
NWBIR74 (Nacimientos de no blancos en 1974): Los nacimientos de no blancos en 1974 también muestran una amplia variación, con un mínimo de 1 y un máximo de 8027, una media de 1051 y una mediana de 697.5.
BIR79 (Nacimientos totales en 1979): Similar a 1974, los nacimientos en 1979 varían considerablemente, desde 319 hasta 30757, con una media de 4224 y una mediana de 2636.
SID79 (Muertes por SIDS en 1979): Las muertes por SIDS en 1979 también varían desde 0 hasta 57, con una media de 8.36 y una mediana de 5, indicando una distribución similar a 1974 pero con un mayor valor máximo.
NWBIR79 (Nacimientos de no blancos en 1979): Los nacimientos de no blancos en 1979 muestran una variación similar a 1974, con un mínimo de 3 y un máximo de 11631, una media de 1352.8 y una mediana de 874.5.
los índices 𝐿 y M de Cressie y Read (1985) son métricas utilizadas en geoestadística para evaluar la calidad del ajuste de modelos de variograma a datos espaciales: Índice : Mide la discrepancia entre el variograma observado y el modelo de variograma ajustado. Un valor bajo indica un buen ajuste del modelo a los datos. Índice M: Proporciona una medida alternativa de la calidad del ajuste entre el modelo de variograma y los datos observados. Un valor bajo sugiere que el modelo representa bien los datos.
# Crear un dataframe para las variables SID74 y SID79
df <- data.frame(
Valor = c(nc.sids$SID74, nc.sids$SID79),
Variable = factor(rep(c("SID74", "SID79"), each = nrow(nc.sids)))
)
# Crear el gráfico de cajas y bigotes
ggplot(df, aes(x = Variable, y = Valor, fill = Variable)) +
geom_boxplot(outlier.colour = "blue", outlier.shape = 16, color = "black") +
scale_fill_manual(values = c("SID74" = "red", "SID79" = "yellow")) +
labs(title = "Distribucion de SID74 y SID79",
x = "Variable",
y = "Valor de SIDS") +
theme_minimal() +
theme(
plot.title = element_text(face = "bold", size = 16),
axis.title = element_text(size = 14),
axis.text = element_text(size = 12),
legend.position = "none",
panel.grid.major = element_blank(),
panel.grid.minor = element_blank()
)
- Se puede observar que la línea negra de caja permite comparar las
medianas SID74 y SID79. Por esta diferencia indica un aumento en la
cantidad de de SIDS de 1974 a 1979. - SID79 es la caja mas alta y con
más outliers sugiere una mayor variabilidad en la cantidad de muertes a
causa del SIDS para los periodos de 1979 a 1984. Lo que indica que para
este periodo hubieron 6 condados con altas cantidades de muertes
SIDS.
cor(nc.sids)
## CNTY.ID BIR74 SID74 NWBIR74 BIR79
## CNTY.ID 1.00000000 0.130450774 0.2289197 0.1276602 0.121737412
## BIR74 0.13045077 1.000000000 0.8572055 0.9025430 0.996998820
## SID74 0.22891974 0.857205475 1.0000000 0.8977063 0.843936380
## NWBIR74 0.12766023 0.902542963 0.8977063 1.0000000 0.895668187
## BIR79 0.12173741 0.996998820 0.8439364 0.8956682 1.000000000
## SID79 0.21056065 0.913567215 0.8330762 0.8465393 0.895292312
## NWBIR79 0.13192139 0.923890131 0.9000538 0.9934904 0.921557994
## east -0.07108284 -0.005231878 0.1176315 0.1678843 -0.005585095
## north -0.98559615 -0.168035431 -0.2747043 -0.1748723 -0.156728243
## x -0.08047143 -0.006440828 0.1151355 0.1662177 -0.006731231
## y -0.96765559 -0.177465155 -0.3051205 -0.2150185 -0.165743591
## lon -0.06799285 -0.004992632 0.1184122 0.1684407 -0.005342509
## lat -0.98557522 -0.167055613 -0.2779922 -0.1796515 -0.155874566
## L.id 0.94537937 0.111893412 0.2218719 0.1153046 0.104986754
## M.id -0.09768192 0.008299599 0.1469809 0.1827982 0.004956627
## SID79 NWBIR79 east north x
## CNTY.ID 0.210560647 0.1319214 -0.071082842 -0.98559615 -0.080471429
## BIR74 0.913567215 0.9238901 -0.005231878 -0.16803543 -0.006440828
## SID74 0.833076196 0.9000538 0.117631512 -0.27470431 0.115135544
## NWBIR74 0.846539329 0.9934904 0.167884259 -0.17487230 0.166217655
## BIR79 0.895292312 0.9215580 -0.005585095 -0.15672824 -0.006731231
## SID79 1.000000000 0.8586045 -0.002848457 -0.24721302 -0.004976015
## NWBIR79 0.858604549 1.0000000 0.150415344 -0.17493781 0.148742224
## east -0.002848457 0.1504153 1.000000000 0.07430752 0.999950659
## north -0.247213025 -0.1749378 0.074307523 1.00000000 0.083701957
## x -0.004976015 0.1487422 0.999950659 0.08370196 1.000000000
## y -0.257669725 -0.2113871 -0.101078698 0.98417252 -0.091722203
## lon -0.002188980 0.1509804 0.999991056 0.07126089 0.999903807
## lat -0.247137763 -0.1792933 0.047232063 0.99956239 0.056679564
## L.id 0.201257623 0.1198831 -0.167174577 -0.93941999 -0.176201259
## M.id 0.025982993 0.1635107 0.960023449 0.10229846 0.960265014
## y lon lat L.id M.id
## CNTY.ID -0.96765559 -0.067992854 -0.98557522 0.9453794 -0.097681921
## BIR74 -0.17746516 -0.004992632 -0.16705561 0.1118934 0.008299599
## SID74 -0.30512051 0.118412238 -0.27799221 0.2218719 0.146980949
## NWBIR74 -0.21501855 0.168440652 -0.17965145 0.1153046 0.182798209
## BIR79 -0.16574359 -0.005342509 -0.15587457 0.1049868 0.004956627
## SID79 -0.25766973 -0.002188980 -0.24713776 0.2012576 0.025982993
## NWBIR79 -0.21138712 0.150980365 -0.17929332 0.1198831 0.163510732
## east -0.10107870 0.999991056 0.04723206 -0.1671746 0.960023449
## north 0.98417252 0.071260891 0.99956239 -0.9394200 0.102298464
## x -0.09172220 0.999903807 0.05667956 -0.1762013 0.960265014
## y 1.00000000 -0.104105049 0.98843803 -0.9063936 -0.065743008
## lon -0.10410505 1.000000000 0.04414628 -0.1640769 0.959903035
## lat 0.98843803 0.044146280 1.00000000 -0.9373976 0.076422964
## L.id -0.90639364 -0.164076913 -0.93739763 1.0000000 -0.192268360
## M.id -0.06574301 0.959903035 0.07642296 -0.1922684 1.000000000
L.id y M.id tienen correlaciones bajas con la mayoría de las otras variables, excepto con las coordenadas espaciales. Esto puede sugerir que estos índices están más relacionados con la configuración espacial que con las medidas específicas de nacimientos y muertes.
#library(ggplot2)
#library(ggmap) # Solo si decides agregar un mapa de fondo
#library(plotly)
# Añadir un mapa de fondo (opcional)
# north_carolina_map <- get_map(location = 'North Carolina', zoom = 7, maptype = 'toner-lite')
# Crear el gráfico base con ggplot2
p <- ggplot(nc.sids, aes(x = lon, y = lat, size = SID74, fill = SID74)) +
# Si usas un mapa de fondo, descomenta la siguiente línea
#geom_tile(data = nc.sids, aes(x = lon, y = lat), alpha = 0.5, fill = "grey80") +
geom_point(shape = 21, color = "black", alpha = 0.7) +
geom_text(aes(label = rownames(nc.sids)), size = 3.5, nudge_y = 0.2, color = "black", check_overlap = TRUE) + # Ajustar tamaño y superposición
scale_size_continuous(range = c(3, 12), guide = FALSE) + # Ajusta el rango de tamaño según la variabilidad
scale_fill_gradient(low = "#F1EEF6", high = "red", name = "Tasa de SIDS",
breaks = seq(0, 60, by = 10), labels = c("0", "10", "20", "30", "40", "50", "60"),
guide = guide_colorbar(barheight = unit(5, "cm"), label.position = "right")) +
labs(title = "Tasas de SIDS en Carolina del Norte (1974-1978)",
subtitle = "Tasa de SIDS por condado",
caption = "Fuente: nc.sids dataset") +
theme_classic() +
theme(plot.title = element_text(face = "bold", size = 16),
plot.subtitle = element_text(size = 14),
plot.caption = element_text(size = 10, color = "gray50"),
axis.text = element_blank(),
axis.title = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank(),
legend.position = "right",
legend.title = element_text(size = 12),
legend.text = element_text(size = 10))
# Convertir el gráfico a un formato interactivo con plotly
interactive_plot <- ggplotly(p)
# Mostrar el gráfico interactivo
interactive_plot
El gráfico muestra la distribución espacial de la tasa de muertes por SIDS en Carolina del Norte en 1974, facilitando la identificación de áreas con altas y bajas tasas de SIDS y permitiendo comparar visualmente entre diferentes condados.Este análisis visual puede proporcionar ideas sobre cómo se distribuye el problema de SIDS en el estado y ayudar a identificar áreas que podrían necesitar más investigación o atención.como son Onslow, Cumberland, Robeson, Mecklenburg que presentaron las tasas mas altas.
# Cambiar 'SID79' a la columna que representa las tasas de SIDS en 1979-1984
library(ggplot2)
library(plotly)
# Crear el gráfico base con ggplot2
p <- ggplot(nc.sids, aes(x = lon, y = lat, size = SID79, fill = SID79)) +
geom_point(shape = 21, color = "black") +
geom_text(aes(label = rownames(nc.sids)), size = 3, nudge_y = 0.1, color = "black") +
scale_size_continuous(range = c(3, 10), guide = FALSE) +
scale_fill_gradient(low = "#F1EEF6", high = "yellow", name = "Tasa de SIDS",
breaks = seq(0, 60, by = 10), labels = c("0", "10", "20", "30", "40", "50", "60"),
guide = guide_colorbar(barheight = unit(5, "cm"), label.position = "right")) +
labs(title = "Tasas de SIDS en Carolina del Norte (1979-1984)",
subtitle = "Tasa de SIDS por condado",
caption = "Fuente: nc.sids dataset") +
theme_classic() +
theme(plot.title = element_text(face = "bold", size = 16),
plot.subtitle = element_text(size = 14),
plot.caption = element_text(size = 10, color = "gray50"),
axis.text = element_blank(),
axis.title = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank(),
legend.position = "right",
legend.title = element_text(size = 12),
legend.text = element_text(size = 10))
# Convertir el gráfico a un formato interactivo con plotly
interactive_plot <- ggplotly(p)
# Mostrar el gráfico interactivo
interactive_plot
El anterior gráfico proporciona una visión visual clara de cómo las tasas de muertes por SIDS se distribuyen en Carolina del Norte para el período 1979-1984, permitiendo una rápida identificación de áreas de interés y facilitando la comparación entre diferentes condados.Podemos notar que para este periodo de tiempo los condado con mayor tasas son Cumberland, Mecklenburg, Guilford, los dos primeros condados mecionados en el periodo de 1974-1978 tambien presentaron altas tasas.
# Cargar las bibliotecas necesarias
library(ggplot2)
library(plotly)
# Crear el primer gráfico con ggplot2 y convertirlo a un gráfico interactivo con plotly
p1 <- ggplot(nc.sids, aes(x = lon, y = lat, size = SID74, fill = SID74)) +
geom_point(shape = 21, color = "black", alpha = 0.7) +
geom_text(aes(label = rownames(nc.sids)), size = 3.5, nudge_y = 0.2, color = "black", check_overlap = TRUE) +
scale_size_continuous(range = c(3, 12), guide = FALSE) +
scale_fill_gradient(low = "#F1EEF6", high = "red", name = "Tasa de SIDS",
breaks = seq(0, 60, by = 10), labels = c("0", "10", "20", "30", "40", "50", "60"),
guide = guide_colorbar(barheight = unit(5, "cm"), label.position = "right")) +
labs(title = "Tasas de SIDS en Carolina del Norte (1974-1978)",
subtitle = "Tasa de SIDS por condado",
caption = "Fuente: nc.sids dataset") +
theme_classic() +
theme(plot.title = element_text(face = "bold", size = 16),
plot.subtitle = element_text(size = 14),
plot.caption = element_text(size = 10, color = "gray50"),
axis.text = element_blank(),
axis.title = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank(),
legend.position = "right",
legend.title = element_text(size = 12),
legend.text = element_text(size = 10))
interactive_plot1 <- ggplotly(p1)
# Crear el segundo gráfico con ggplot2 y convertirlo a un gráfico interactivo con plotly
p2 <- ggplot(nc.sids, aes(x = lon, y = lat, size = SID79, fill = SID79)) +
geom_point(shape = 21, color = "black") +
geom_text(aes(label = rownames(nc.sids)), size = 3, nudge_y = 0.1, color = "black") +
scale_size_continuous(range = c(3, 10), guide = FALSE) +
scale_fill_gradient(low = "#F1EEF6", high = "yellow", name = "Tasa de SIDS",
breaks = seq(0, 60, by = 10), labels = c("0", "10", "20", "30", "40", "50", "60"),
guide = guide_colorbar(barheight = unit(5, "cm"), label.position = "right")) +
labs(title = "Tasas de SIDS en Carolina del Norte (1979-1984)",
subtitle = "Tasa de SIDS por condado",
caption = "Fuente: nc.sids dataset") +
theme_classic() +
theme(plot.title = element_text(face = "bold", size = 16),
plot.subtitle = element_text(size = 14),
plot.caption = element_text(size = 10, color = "gray50"),
axis.text = element_blank(),
axis.title = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank(),
legend.position = "right",
legend.title = element_text(size = 12),
legend.text = element_text(size = 10))
interactive_plot2 <- ggplotly(p2)
# Combinar ambos gráficos en uno solo utilizando subplot de plotly
combined_plot <- subplot(interactive_plot1, interactive_plot2, nrows = 1, shareX = TRUE, shareY = TRUE,
titleX = TRUE, titleY = TRUE, margin = 0.05) %>%
layout(title = "Tasas de SIDS en Carolina del Norte (1974-1978 y 1979-1984)")
# Mostrar el gráfico combinado
combined_plot
El análisis de la esperanza de vida es fundamental para entender la salud pública, dado que refleja el acceso a servicios de salud y las condiciones de vida en una población. También está estrechamente relacionado con el desarrollo económico, ayudando a identificar áreas que necesitan políticas más específicas. A nivel regional, estos datos pueden guiar la planificación y asignación de recursos para mejorar el bienestar. En el ámbito académico, contribuye al conocimiento sobre los factores espaciales que influyen en la salud, y los resultados pueden usarse para sensibilizar a las autoridades y diseñar estrategias que reduzcan las desigualdades en salud.
Principales Variables:
# Cargar la librería y los datos
library(spData)
data("world")
# Ver la estructura de los datos
str(world)
## sf [177 × 11] (S3: sf/tbl_df/tbl/data.frame)
## $ iso_a2 : chr [1:177] "FJ" "TZ" "EH" "CA" ...
## $ name_long: chr [1:177] "Fiji" "Tanzania" "Western Sahara" "Canada" ...
## $ continent: chr [1:177] "Oceania" "Africa" "Africa" "North America" ...
## $ region_un: chr [1:177] "Oceania" "Africa" "Africa" "Americas" ...
## $ subregion: chr [1:177] "Melanesia" "Eastern Africa" "Northern Africa" "Northern America" ...
## $ type : chr [1:177] "Sovereign country" "Sovereign country" "Indeterminate" "Sovereign country" ...
## $ area_km2 : num [1:177] 19290 932746 96271 10036043 9510744 ...
## $ pop : num [1:177] 8.86e+05 5.22e+07 NA 3.55e+07 3.19e+08 ...
## $ lifeExp : num [1:177] 70 64.2 NA 82 78.8 ...
## $ gdpPercap: num [1:177] 8222 2402 NA 43079 51922 ...
## $ geom :sfc_MULTIPOLYGON of length 177; first list element: List of 3
## ..$ :List of 1
## .. ..$ : num [1:5, 1:2] -180 -180 -180 -180 -180 ...
## ..$ :List of 1
## .. ..$ : num [1:9, 1:2] 178 178 177 177 178 ...
## ..$ :List of 1
## .. ..$ : num [1:8, 1:2] 180 180 179 179 179 ...
## ..- attr(*, "class")= chr [1:3] "XY" "MULTIPOLYGON" "sfg"
## - attr(*, "sf_column")= chr "geom"
## - attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA NA NA NA NA
## ..- attr(*, "names")= chr [1:10] "iso_a2" "name_long" "continent" "region_un" ...
# Ver las primeras filas del dataset
head(world)
## Simple feature collection with 6 features and 10 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: -180 ymin: -18.28799 xmax: 180 ymax: 83.23324
## Geodetic CRS: WGS 84
## # A tibble: 6 × 11
## iso_a2 name_long continent region_un subregion type area_km2 pop lifeExp
## <chr> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl>
## 1 FJ Fiji Oceania Oceania Melanesia Sove… 1.93e4 8.86e5 70.0
## 2 TZ Tanzania Africa Africa Eastern … Sove… 9.33e5 5.22e7 64.2
## 3 EH Western S… Africa Africa Northern… Inde… 9.63e4 NA NA
## 4 CA Canada North Am… Americas Northern… Sove… 1.00e7 3.55e7 82.0
## 5 US United St… North Am… Americas Northern… Coun… 9.51e6 3.19e8 78.8
## 6 KZ Kazakhstan Asia Asia Central … Sove… 2.73e6 1.73e7 71.6
## # ℹ 2 more variables: gdpPercap <dbl>, geom <MULTIPOLYGON [°]>
# Descripción estadística de las variables
summary(world)
## iso_a2 name_long continent region_un
## Length:177 Length:177 Length:177 Length:177
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## subregion type area_km2 pop
## Length:177 Length:177 Min. : 2417 Min. :5.630e+04
## Class :character Class :character 1st Qu.: 46185 1st Qu.:3.755e+06
## Mode :character Mode :character Median : 185004 Median :1.040e+07
## Mean : 832558 Mean :4.282e+07
## 3rd Qu.: 621860 3rd Qu.:3.075e+07
## Max. :17018507 Max. :1.364e+09
## NA's :10
## lifeExp gdpPercap geom
## Min. :50.62 Min. : 597.1 MULTIPOLYGON :177
## 1st Qu.:64.96 1st Qu.: 3752.4 epsg:4326 : 0
## Median :72.87 Median : 10734.1 +proj=long...: 0
## Mean :70.85 Mean : 17106.0
## 3rd Qu.:76.78 3rd Qu.: 24232.7
## Max. :83.59 Max. :120860.1
## NA's :10 NA's :17
La variable lifeExp muestra una esperanza de vida que varía desde 50.62 años hasta 83.59 años, con una media de 70.85 años y una mediana de 72.87 años. La primera y tercera cuartil son 64.96 y 76.78 años, respectivamente. Esto indica una amplia variabilidad en la esperanza de vida entre los países, con algunos países con expectativas de vida mucho más altas que otros.
El PIB per cápita (gdpPercap) tiene un rango amplio, desde 597.1 hasta 120,860.1 dólares, con una media de 17,106.0 dólares. La esperanza de vida y el PIB per cápita suelen estar correlacionados positivamente, sugiriendo que los países con mayores ingresos tienden a tener una mayor esperanza de vida.
A partir del resumen de la base de datos world, la variable pop (población) muestra una notable variabilidad entre los países, con un rango que va desde 56,300 hasta 1,364,000,000 habitantes. La población media es de aproximadamente 42,820,000 habitantes, y la mediana es de 10,400,000 habitantes. La distribución de la población está sesgada hacia los países con grandes poblaciones, como se observa en el valor máximo extremadamente alto. Este sesgo hacia poblaciones más grandes puede reflejar la existencia de varios países con poblaciones relativamente pequeñas en comparación con los más poblados, lo que sugiere que la mayoría de la población mundial está concentrada en unos pocos países. Para el análisis de la esperanza de vida, es relevante considerar el tamaño de la población, ya que las dinámicas de salud y la provisión de servicios pueden variar significativamente entre países con diferentes tamaños de población.
par(mfrow = c(1, 3))
boxplot(world$pop,col = "green",
border = 4, xlab = "Poblacion")
boxplot(world$lifeExp,col = "green",
border = 4, xlab = 'Esperanza de vida')
boxplot(world$gdpPercap,col = "green",
border = 4, xlab = 'PIB percapita')
par(mfrow = c(1, 1))
library()
ggplot(data = world) + geom_sf(aes(fill = lifeExp)) +
labs(title = 'Esperanza de vida mundial', fill = 'Esperanza de vida', x = '', y='') +
geom_sf_text(aes(label=ifelse(lifeExp > 82, str_to_title(name_long),"")), col="black",
fontface="bold", size=3, fun.geometry=function(x) sf::st_centroid(x)) +
theme(plot.title = element_text(hjust = 0.5, face = 'bold'),
panel.background=element_rect(fill = "white"),
panel.grid.major=element_line(color="gray"),
panel.grid.minor=element_line(color="gray")) +
scale_fill_gradientn(colours = brewer.pal(n = 5, name = "Greens"))
## Warning: Removed 10 rows containing missing values or values outside the scale range
## (`geom_text()`).
1. El gráfico muestra la esperanza de vida en diferentes países a nivel
mundial, utilizando un gradiente de color para representar los distintos
niveles de esperanza de vida. Los países con colores más oscuros indican
una mayor esperanza de vida, mientras que los colores más claros
representan una esperanza de vida menor. Esto permite una visualización
clara de las disparidades en esperanza de vida entre diferentes regiones
y países.
Los países con menor esperanza de vida, que se representan con colores más claros, se localizan principalmente en regiones de África Sub-Sahariana y algunas áreas de Asia. Estos países enfrentan desafíos significativos en términos de salud pública, desarrollo económico y acceso a servicios básicos, lo cual se refleja en sus menores niveles de esperanza de vida.
El gráfico revela patrones regionales claros, con diferencias notables en la esperanza de vida entre continentes. Por ejemplo, se observa que las regiones más desarrolladas suelen tener una esperanza de vida más alta en comparación con las regiones en desarrollo o con menos recursos. Esto subraya la importancia de considerar el contexto económico y social al interpretar los datos de esperanza de vida.