El estudio de la dinámica poblacional constituye un elemento esencial para comprender los procesos sociales, económicos y de desarrollo de los países. En un contexto global marcado por desigualdades demográficas, transiciones etarias y efectos recientes de la pandemia de COVID-19, resulta fundamental identificar patrones comunes y diferencias estructurales entre las naciones. En este marco, el presente trabajo tiene como propósito la caracterización y el agrupamiento de países según sus indicadores demográficos, con el fin de reconocer los distintos momentos de la transición poblacional a escala mundial.
Para ello, se utilizó la base de datos “Population Estimates and Projections” del World Bank Group, elaborada en conjunto con la División de Población de las Naciones Unidas (UN DESA). Esta fuente fue seleccionada por su carácter integral, su confiabilidad metodológica y su cobertura geográfica y temporal, que abarca más de 200 países y territorios. La base combina estimaciones históricas y proyecciones demográficas, lo que permite analizar tanto el estado actual de la población como las tendencias de cambio a mediano y largo plazo. Sus indicadores estandarizados garantizan comparabilidad internacional y una representación precisa de la estructura poblacional.
El análisis se centra en el año 2023, por corresponder al periodo posterior a la pandemia de COVID-19, cuando los indicadores demográficos comienzan a estabilizarse tras los impactos observados entre 2020 y 2022 en la natalidad, la mortalidad y la migración. Este año ofrece, por tanto, un punto de referencia representativo de la etapa de recuperación demográfica global, en la que se reflejan los ajustes y transformaciones estructurales generados por la crisis sanitaria. Además, la elección de 2023 garantiza la disponibilidad y comparabilidad internacional de los datos, ya que el Banco Mundial y la División de Población de las Naciones Unidas actualizan sus estimaciones con base en la información más reciente de censos y registros vitales posteriores a la pandemia.
Asimismo, se seleccionaron 15 variables demográficas, junto con un total de 187 países con información completa y comparable, que describen de manera integral la estructura, dinámica y composición poblacional de las naciones. Estas incluyen indicadores de tamaño y distribución espacial (población total, urbana y rural), crecimiento y renovación demográfica (tasas de natalidad, mortalidad, fecundidad y crecimiento poblacional), condiciones de salud y longevidad (esperanza de vida y mortalidad infantil y neonatal) y dependencia por edad (índices de dependencia juvenil y de ancianos). La elección de estas variables se fundamenta en su pertinencia para representar los principales componentes de la estructura poblacional y su influencia en el desarrollo social y económico.
A partir de esta información, se aplican técnicas estadísticas multivariadas, en particular el Análisis de Componentes Principales (ACP) y el Análisis de Conglomerados (Clustering), que facilitan la identificación de patrones comunes y la agrupación de países con perfiles demográficos semejantes. Este enfoque contribuye a una comprensión más profunda de las etapas diferenciadas de la transición demográfica mundial, permitiendo reflexionar sobre sus implicaciones en el desarrollo económico, social y poblacional de las naciones.
La metodología empleada en este estudio se orienta a analizar y agrupar países según sus características demográficas, utilizando herramientas estadísticas multivariadas que permiten identificar patrones comunes en la estructura poblacional. El proceso se desarrolló en dos etapas principales: primero, la descripción y selección de variables que abarcan indicadores de tamaño y distribución espacial de la población, crecimiento y renovación demográfica, condiciones de salud y longevidad, y dependencia por edad, proporcionando una visión integral de los factores que configuran la estructura poblacional y sus diferencias entre regiones y segundo, la aplicación de modelos estadísticos exploratorios, específicamente el Análisis de Componentes Principales (ACP) y el Análisis de Conglomerados (Clustering). Estas técnicas posibilitan reducir la dimensionalidad de la información, identificar las variables más representativas y clasificar a los países en grupos con perfiles demográficos semejantes.
Población urbana (PobUrb): Representa el número total de habitantes que residen en áreas urbanas dentro de cada país. Su análisis permite evaluar el nivel de urbanización y desarrollo territorial de los países.
Tasa de mortalidad (por 1000 nacidos vivos) (TasMortNac): Indica el número de defunciones por cada mil nacimientos en un periodo determinado. Permite evaluar las condiciones generales de salud y la supervivencia de la población.
Tasa bruta de natalidad (por cada 1000 habitantes) (TasBruNat): Mide el número de nacimientos vivos por cada mil habitantes. Es un indicador clave de la fecundidad y del potencial de crecimiento natural de la población.
Esperanza de vida al nacer, varones (EspVidVar): Indica la cantidad promedio de años que se espera que viva un hombre al momento de su nacimiento. Su propósito es valorar las condiciones de salud y bienestar de la población masculina.
Esperanza de vida al nacer, mujeres (EspVidMuj): Expresa la cantidad promedio de años que se espera que viva una mujer desde su nacimiento. Permite observar la longevidad femenina y la diferencia de género en la supervivencia.
Número de muertes infantiles (NuMueInf): Indica el total de fallecimientos de niños menores de un año en un periodo determinado. Refleja la calidad del sistema de salud y el nivel de atención materno-infantil.
Número de muertes neonatales (NuMueNeo): Representa la cantidad de muertes ocurridas en los primeros 28 días de vida. Complementa la mortalidad infantil y evidencia los riesgos perinatales.
Población total (PobTot): Es el número total de habitantes de cada país, sin distinción de edad o sexo. Permite comparar el tamaño poblacional entre naciones y establecer diferencias en magnitud demográfica.
Crecimiento demográfico anual (%) (CrecDem): Mide la variación porcentual de la población total respecto al año anterior. Su propósito es determinar el ritmo de expansión o contracción poblacional en cada país.
Población rural (PobrRur): Representa el número total de habitantes que viven en zonas rurales. Ayuda a identificar el grado de ruralidad y las desigualdades espaciales entre regiones.
Tasa de fecundidad total (nacidos por mujer) (TasFecTot): Indica el número promedio de hijos que tendría una mujer a lo largo de su vida fértil. Sirve para analizar los niveles de reemplazo generacional y las tendencias reproductivas.
Índice de dependencia por edad, ancianos (IndDepAnci): Expresa la relación entre la población de 65 años o más y la población en edad laboral. Su propósito es evaluar el nivel de envejecimiento y la presión sobre los sistemas de salud y pensiones.
Índice de dependencia por edad, jóvenes (IndDepJov): Mide la proporción de población menor de 15 años respecto a la población económicamente activa. Permite estimar la carga económica y social de la población joven.
Crecimiento de la población rural anual (%) (CrecPobRur): Indica la tasa de variación porcentual de la población rural respecto al año anterior. Permite analizar los procesos de migración interna y la dinámica urbano-rural.
Población de 65 años o más, total (Pob65MasTot): Representa el número total de personas de 65 años o más. Permite medir el nivel de envejecimiento poblacional y su peso dentro del total nacional.
Es una técnica estadística utilizada para reducir la dimensionalidad de un conjunto de datos con múltiples variables posiblemente correlacionadas, transformándolas en un conjunto más pequeño de variables no correlacionadas llamadas componentes principales. Cada componente principal captura una cantidad decreciente de la varianza total de los datos, y el primero contiene la mayor varianza posible. Esto facilita la visualización, el análisis exploratorio y el modelado predictivo de datos complejos, manteniendo la mayor cantidad de información posible.
El ACP se aplica ampliamente en investigaciones sociales, económicas, ambientales y demográficas, donde los fenómenos se describen mediante múltiples indicadores interrelacionados. En el ámbito demográfico, resulta especialmente útil para identificar patrones estructurales comunes entre países, determinar las variables con mayor peso explicativo y sintetizar la información en dimensiones interpretables, como la dinámica de crecimiento, el envejecimiento poblacional o la dependencia etaria.
Su importancia radica en que permite simplificar la información sin perder su esencia, eliminando redundancias entre variables y revelando las relaciones subyacentes que no son evidentes a simple vista. Además, sirve como base para otras técnicas multivariadas, como el análisis de conglomerados, al generar ejes que representan las características más relevantes del conjunto de datos. En este estudio, el ACP constituye el punto de partida para reducir y estructurar los indicadores demográficos, facilitando la posterior agrupación de países según sus similitudes poblacionales.
Es una técnica de análisis de clúster jerárquico aglomerativo que busca minimizar la varianza total dentro de los clústeres en cada paso del agrupamiento. En el método de Ward, se empieza con cada objeto como un clúster individual y, en cada iteración, se fusionan los dos clústeres cuya unión cause el menor aumento en la suma total de la varianza dentro de los clústeres. Este criterio de varianza mínima lo hace especialmente útil para obtener agrupamientos compactos y bien diferenciados, y usa distancias euclidianas al cuadrado para calcular las fusiones.
Se emplea en diversos ámbitos científicos y sociales, particularmente en estudios de segmentación, clasificación y análisis exploratorio multivariado. En el campo demográfico, su aplicación posibilita agrupar países con estructuras poblacionales semejantes, revelando patrones globales asociados al crecimiento, la fecundidad, el envejecimiento o la dependencia por edad.
La importancia del método de Ward radica en su capacidad para identificar tipologías demográficas y comprender las diferencias estructurales entre regiones. Combinado con el ACP, ofrece una herramienta sólida para reducir la complejidad de los datos y clasificar observaciones de forma objetiva, permitiendo una interpretación visual clara a través del dendrograma jerárquico resultante.
Antes de presentar los resultados del modelo, se llevó a cabo el análisis descriptivo, cuyo propósito fue explorar y comprender el comportamiento de las principales variables demográficas incluidas en la base de datos del Banco Mundial, con el objetivo de identificar patrones, diferencias y tendencias relevantes entre los países. Este ejercicio permitió reconocer de qué manera indicadores tales como la esperanza de vida, la tasa de natalidad, la mortalidad infantil, la fecundidad y la estructura poblacional reflejan distintos niveles de desarrollo y bienestar. Dicho análisis preliminar facilitó la observación de las desigualdades demográficas existentes entre las diversas regiones del mundo y constituyó la base para las etapas posteriores del desarrollo del caso, específicamente el Análisis de Componentes Principales (ACP) y la clusterización, en las cuales se profundizó en la identificación de grupos de países con características similares.
El análisis preliminar arrojó resultados que permitieron acercarse a las posibles respuestas que podrían obtenerse en la aplicación de los modelos, a continuación se presentan los indicadores y las relaciones que se consideraron relevantes para la interpretación y análisis resultados.
library(readxl)
library(ggplot2)
library(dplyr)
library(maps)
library(countrycode)
library(viridis)
datos <- read_excel("Data (1).xlsx")
datos_mapa <- datos %>%
select(Country, `Numero de muertes neonatales (NuMueNeo)`) %>%
rename(NuMueNeo = `Numero de muertes neonatales (NuMueNeo)`) %>%
filter(!is.na(NuMueNeo)) %>%
mutate(
iso3c = countrycode(Country,
origin = "country.name",
destination = "iso3c",
custom_match = c(
"Korea del Norte" = "PRK",
"Korea del Sur" = "KOR",
"Congo, Dem. Rep." = "COD",
"Congo, Rep." = "COG"
),
warn = FALSE)
)
mapa_mundo <- map_data("world")
mapa_mundo <- mapa_mundo %>%
mutate(region = case_when(
region == "USA" ~ "United States",
region == "UK" ~ "United Kingdom",
region == "Democratic Republic of the Congo" ~ "Congo, Dem. Rep.",
region == "Republic of Congo" ~ "Congo, Rep.",
region == "Ivory Coast" ~ "Cote d'Ivoire",
TRUE ~ region
))
mapa_datos <- mapa_mundo %>%
left_join(datos_mapa, by = c("region" = "Country"))
mapa <- ggplot(mapa_datos, aes(x = long, y = lat, group = group, fill = NuMueNeo)) +
geom_polygon(color = "white", linewidth = 0.1) +
scale_fill_viridis(
name = "Muertes\nNeonatales",
option = "plasma",
na.value = "grey90",
trans = "log10",
labels = scales::comma
) +
labs(
title = "Muertes Neonatales por País"
) +
theme_minimal() +
theme(
plot.title = element_text(size = 16, face = "bold", hjust = 0.5),
plot.subtitle = element_text(size = 12, hjust = 0.5),
legend.position = "right",
axis.text = element_blank(),
axis.title = element_blank(),
axis.ticks = element_blank(),
panel.grid = element_blank()
) +
coord_fixed(1.3)
print(mapa)cat("Total de muertes neonatales:",
format(sum(datos$`Numero de muertes neonatales (NuMueNeo)`, na.rm = TRUE), big.mark = ","), "\n")## Total de muertes neonatales: 2,282,546
##
## === TOP 10 PAÍSES CON MÁS MUERTES NEONATALES ===
top10 <- datos %>%
select(Country, `Numero de muertes neonatales (NuMueNeo)`) %>%
rename(NuMueNeo = `Numero de muertes neonatales (NuMueNeo)`) %>%
arrange(desc(NuMueNeo)) %>%
head(10)
print(top10)## # A tibble: 10 × 2
## Country NuMueNeo
## <chr> <dbl>
## 1 India 401499
## 2 Pakistan 258588
## 3 Nigeria 252871
## 4 Ethiopia 112319
## 5 Congo, Dem. Rep. 110646
## 6 Bangladesh 62615
## 7 Afghanistan 50351
## 8 Tanzania 48216
## 9 Indonesia 47186
## 10 Sudan 41690
Aquí el gráfico muestra una relación positiva y marcada entre la tasa bruta de natalidad y el número de muertes infantiles. Los países con mayores tasas de natalidad tienden a registrar también más muertes de niños menores de un año, lo que refleja una asociación directa entre el alto nivel de fecundidad y los retos sanitarios.
En regiones como África Subsahariana y Asia del Sur, esta tendencia es especialmente evidente: allí las tasas de natalidad superan los 30 nacimientos por cada mil habitantes y las muertes infantiles alcanzan cifras muy elevadas. Esto se asocia con limitaciones en los sistemas de salud, deficiencias en la atención prenatal y neonatal, bajos niveles de vacunación y condiciones de pobreza estructural.
En contraste, los países con tasas de natalidad reducidas, principalmente en Europa, América del Norte y Oceanía presentan niveles más bajos de mortalidad infantil, lo que evidencia sistemas sanitarios sólidos, mayor cobertura médica y mejores condiciones de vida.
En conjunto, la gráfica refleja las profundas desigualdades globales en materia de salud infantil y desarrollo social. A medida que los países avanzan en la transición demográfica y mejoran su infraestructura sanitaria, la mortalidad infantil tiende a disminuir drásticamente.
Luego, se observó que la esperanza de vida femenina es generalmente mayor que la masculina en casi todos los países. Sin embargo, hay una tendencia negativa en ambos casos, pues tanto hombres como mujeres presentan una reducción en la esperanza de vida a medida que aumenta la tasa de fecundidad. Esto sugiere que las condiciones socioeconómicas y de salud influyen de la misma forma en ambos sexos.
library(tidyr)
library(ggplot2)
library(dplyr)
library(countrycode)
datos <- read_excel("Data (1).xlsx")
datos <- datos %>%
mutate(Continent = countrycode(Country,
origin = "country.name",
destination = "continent",
warn = FALSE))
data_long <- datos %>%
pivot_longer(cols = c(`Esperanza de vida al nacer, varones (años) (EspVidVar)`,
`Esperanza de vida al nacer, mujeres (años) (EspVidMuj)`),
names_to = "Sexo",
values_to = "EsperanzaVida") %>%
mutate(Sexo = case_when(
grepl("varones", Sexo) ~ "EspVidVar",
grepl("mujeres", Sexo) ~ "EspVidMuj"
)) %>%
filter(!is.na(EsperanzaVida) & !is.na(`Tasa de fecundidad total (nacidos por mujer) (TasFecTot )`))
ggplot(data_long, aes(x = `Tasa de fecundidad total (nacidos por mujer) (TasFecTot )`,
y = EsperanzaVida,
color = Continent)) +
geom_point(size = 2.5, alpha = 0.7) +
geom_smooth(method = "lm",
se = FALSE,
color = "black",
linetype = "dashed",
linewidth = 1) +
facet_wrap(~Sexo) +
labs(
title = "Fecundidad vs Esperanza de Vida por Sexo",
x = "Tasa de Fecundidad Total",
y = "Esperanza de Vida",
color = "Continent"
) +
theme_minimal(base_size = 12) +
theme(
plot.title = element_text(size = 16, face = "bold"),
strip.text = element_text(size = 12, face = "bold"),
legend.position = "right",
panel.grid.minor = element_blank()
) +
scale_color_manual(values = c(
"Africa" = "#F8766D",
"Americas" = "#A3A500",
"Asia" = "#00BFC4",
"Europe" = "#00BA38",
"Oceania" = "#F564E3"
))Así mismo, al hacer la comparación por continentes, se aprecia una clara diferencia en los patrones de fecundidad y esperanza de vida. África se ubica principalmente en la parte inferior derecha del gráfico, con altas tasas de fecundidad (entre 4 y 6 hijos por mujer) y baja esperanza de vida (entre 60 y 70 años), lo que refleja mayores desafíos en salud, educación y desarrollo económico. En contraste, Europa se concentra en la parte superior izquierda, caracterizada por baja fecundidad (alrededor de 1 o 2 hijos) y alta esperanza de vida (superior a los 80 años), lo que evidencia mejores condiciones de vida y sistemas de salud más desarrollados. Asia y América muestran una posición intermedia, con valores que varían según el nivel de desarrollo de cada país, mientras que Oceanía presenta un comportamiento similar al europeo, con baja fecundidad y alta longevidad. En conjunto, se evidencian desigualdades globales en términos de bienestar y desarrollo humano entre los distintos continentes.
También, al relacionar la esperanza de vida promedio (esperanza de mujeres y esperanza de hombres) con el índice de dependencia por edad (ancianos) se observa una tendencia positiva, pues los países con mayor esperanza de vida también presentan altos índices de dependencia por parte de las personas mayores, lo que sugiere poblaciones envejecidas. En contraste, los países con menor esperanza de vida muestran una proporción menor de dependencia de la población adulta.
library(plotly)
library(dplyr)
data <- read_excel("Data.xlsx")
data <- data %>%
mutate(EspVidProm = (EspVidVar + EspVidMuj) / 2)
grafico_interactivo <- plot_ly(
data = data,
x = ~EspVidProm,
y = ~IndDepAnci,
text = ~paste(
"<b>País:</b>", Country,
"<br><b>Esperanza de vida promedio:</b>", round(EspVidProm, 1), "años",
"<br><b>Índice de dependencia ancianos:</b>", round(IndDepAnci, 2)
),
type = 'scatter',
mode = 'markers',
marker = list(size = 9, color = ~EspVidProm, colorscale = "Viridis", showscale = TRUE)
) %>%
layout(
title = "<b>Relación entre esperanza de vida y envejecimiento poblacional</b>",
xaxis = list(title = "Esperanza de vida promedio (años)"),
yaxis = list(title = "Índice de dependencia por edad - ancianos"),
hoverlabel = list(bgcolor = "white")
)
grafico_interactivoEsto confirma la existencia de una transición demográfica diferenciada, donde los países desarrollados se enfrentan a retos modernos asociados al envejecimiento de su población y los países en desarrollo aún se encuentran en etapas donde predominan generaciones jóvenes y menores niveles de longevidad.
También se vió interesante comparar los países con mayor grado de dependencia juvenil y anciana para seguir comprendiendo los patrones encontrados anteriormente. Así, se observó un contraste claro entre ambos tipos de dependencia. Donde los países con mayor dependencia juvenil como la República Centroafricana (100,9%), Nigeria (93,1%), Somalia (92%), Chad (91,3%) y Malí (90,9%) se caracterizan por tener estructuras poblacionales muy jóvenes, resultado de tasas de natalidad elevadas y de una transición demográfica joven.
library(readxl)
library(dplyr)
library(tidyr)
library(ggplot2)
datos <- read_excel("Data.xlsx")
dep_long <- datos %>%
select(Country, IndDepJov, IndDepAnci) %>%
pivot_longer(cols = c(IndDepJov, IndDepAnci),
names_to = "Tipo",
values_to = "Indice") %>%
mutate(Tipo = recode(Tipo,
"IndDepJov" = "Dependencia Juvenil",
"IndDepAnci" = "Dependencia de Ancianos"))
dep_top <- dep_long %>%
group_by(Tipo) %>%
slice_max(order_by = Indice, n = 5)
ggplot(dep_top, aes(x = reorder(Country, Indice), y = Indice, fill = Tipo)) +
geom_bar(stat = "identity", position = position_dodge(width = 0.9)) +
geom_text(aes(label = round(Indice, 1)),
position = position_dodge(width = 0.9),
hjust = -0.1, size = 3.5) +
coord_flip() +
labs(title = "Comparación de países con mayor dependencia juvenil y de ancianos",
x = "País",
y = "Índice de dependencia (%)",
fill = "Tipo de dependencia") +
theme_minimal() +
theme(plot.title = element_text(hjust = 0.5, face = "bold")) +
scale_fill_manual(values = c("#4DBBD5FF", "#E64B35FF")) En estos contextos, la principal presión social y económica recae en la necesidad de proveer educación, salud y oportunidades laborales para una población infantil y adolescente creciente.
En contraste, los países con mayor dependencia de ancianos como Japón (50,3%), Finlandia (38,3%), Portugal (38,3%), Italia (38,1%) y Grecia (37,3%) evidencian un envejecimiento poblacional avanzado, donde la proporción de personas mayores supera ampliamente la de jóvenes. Estas naciones enfrentan retos distintos, vinculados a la sostenibilidad de los sistemas de pensiones, la atención en salud y la disminución de la fuerza laboral activa.
Conocer y analizar los índices de dependencia es fundamental porque permite evaluar la carga demográfica potencial de un país y anticipar las necesidad de políticas públicas. Un alto índice juvenil exige estrategias orientadas al fortalecimiento educativo, la creación de empleo y la reducción de la pobreza infantil; mientras que un alto índice de ancianos demanda políticas enfocadas en la atención geriátrica, la seguridad social y la productividad sostenible. En conjunto, estos indicadores constituyen una herramienta esencial para comprender la dinámica demográfica mundial y sirven como punto de partida para análisis posteriores, como el ACP, que busca identificar patrones globales de desarrollo y estructura poblacional.
Por último, un análisis de la estructura poblacional permite comprender las diferencias en la composición por edad, localización y nivel de urbanización de los países, aspectos que reflejan su etapa dentro del proceso de transición demográfica y su nivel de desarrollo socioeconómico. Variables como la población total, la distribución urbana y rural, y la proporción de personas mayores de 65 años constituyen indicadores clave para evaluar el grado de urbanización, el envejecimiento poblacional y los desafíos asociados a la sostenibilidad social y económica. A través de estos indicadores, es posible identificar patrones que distinguen a las naciones más industrializadas con poblaciones urbanas y envejecidas de aquellas en vías de desarrollo, caracterizadas por una estructura más joven y una mayor dependencia del sector rural.
library(readxl)
library(dplyr)
library(tidyr)
library(ggplot2)
datos <- read_excel("Data.xlsx")
datos_top <- datos %>%
select(Country, PobTot, PobUrb, PobrRur, Pob65MasTot)
top5 <- datos_top %>%
arrange(desc(PobTot)) %>%
slice(1:5)
top5_long <- top5 %>%
pivot_longer(cols = -Country, names_to = "Variable", values_to = "Valor")
top5_long$Variable <- recode(top5_long$Variable,
"PobTot" = "Población total",
"PobUrb" = "Población urbana",
"PobrRur" = "Población rural",
"Pob65MasTot" = "Población ≥ 65 años"
)
top5_long$Variable <- factor(top5_long$Variable,
levels = c("Población total", "Población urbana", "Población rural", "Población ≥ 65 años")
)
format_si <- function(x, digits = 1) {
sapply(x, function(v) {
if (is.na(v)) return(NA_character_)
absv <- abs(as.numeric(v))
sign <- ifelse(v < 0, "-", "")
if (absv >= 1e9) {
paste0(sign, formatC(absv/1e9, format = "f", digits = digits), "B")
} else if (absv >= 1e6) {
paste0(sign, formatC(absv/1e6, format = "f", digits = digits), "M")
} else if (absv >= 1e3) {
paste0(sign, formatC(absv/1e3, format = "f", digits = digits), "K")
} else {
as.character(v)
}
}, USE.NAMES = FALSE)
}
ggplot(top5_long, aes(x = Variable, y = Valor, fill = Country)) +
geom_bar(stat = "identity", position = position_dodge(width = 0.8), width = 0.7) +
geom_text(aes(label = format_si(Valor, digits = 1)),
position = position_dodge(width = 0.8),
hjust = -0.05, size = 3.5) +
coord_flip() +
labs(
title = "Comparativo de indicadores de estructura poblacional - Top 5 países",
x = "",
y = "Población (personas)",
fill = "País"
) +
scale_y_continuous(labels = function(x) format_si(x, digits = 1)) +
theme_minimal(base_size = 13) +
theme(
plot.title = element_text(hjust = 0.5, face = "bold"),
legend.position = "top",
axis.text.x = element_text(size = 11),
axis.text.y = element_text(size = 11)
) +
expand_limits(y = max(top5_long$Valor, na.rm = TRUE) * 1.15)En términos generales, China e India destacan por su gran peso demográfico, lo que las posiciona como los principales centros poblacionales del planeta. Estas naciones concentran una proporción significativa de la población mundial y reflejan la marcada concentración poblacional en el continente asiático. En un nivel inferior se ubican Estados Unidos, Indonesia y Pakistán, que, aunque presentan cifras menores, continúan siendo potencias demográficas con gran influencia regional.
En lo referente a la población urbana, se observa que China y Estados Unidos presentan estructuras predominantemente urbanas, propias de economías industrializadas y con altos niveles de desarrollo en infraestructura y servicios. En contraste, India, Indonesia y Pakistán mantienen una proporción más elevada de población residente en áreas rurales, lo que refleja un proceso de urbanización en crecimiento y una economía aún dependiente de las actividades primarias.
Respecto a la población rural, India sobresale como el país con mayor proporción de habitantes en zonas no urbanas, lo que pone de manifiesto los desafíos que enfrenta en materia de modernización agrícola, acceso a servicios básicos e infraestructura. Por su parte, China muestra una reducción progresiva de su población rural, coherente con su acelerado proceso de urbanización, mientras que Estados Unidos presenta un patrón opuesto, caracterizado por una alta concentración en áreas metropolitanas.
En cuanto a la población adulta mayor, los datos revelan que China y Estados Unidos enfrentan un proceso de envejecimiento demográfico cada vez más evidente, resultado del aumento de la esperanza de vida y la disminución de la natalidad. En contraste, India, Indonesia y Pakistán conservan una estructura poblacional más joven, con predominio de personas en edad productiva y una menor proporción de adultos mayores.
De manera general, el análisis muestra una clara diferencia entre países con estructuras demográficas urbanas y envejecidas, frente a otros con poblaciones jóvenes y rurales. Estas diferencias reflejan distintas etapas dentro del proceso de transición demográfica, en el cual los países más desarrollados tienden hacia la estabilización y el envejecimiento de su población, mientras que las naciones en desarrollo aún se encuentran en fases de crecimiento acelerado. En conjunto, esta caracterización permite comprender las dinámicas poblacionales globales y constituye un punto de partida fundamental para el agrupamiento de países según sus indicadores demográficos, objetivo central del presente estudio.
El gráfico de sedimentación (scree plot) y la tabla de varianza explicada muestra el porcentaje de varianza explicada por cada componente principal obtenido en el análisis. En el eje horizontal se representan los componentes o dimensiones, y en el eje vertical, el porcentaje de varianza explicada por cada uno.
library(factoextra)
library(tidyverse)
library(readxl)
data <- read_excel("Data.xlsx")
# Seleccionar solo las variables numéricas
data.numeric <- data %>% select(where(is.numeric))
# Establecer los nombres de los países como nombres de filas
rownames(data.numeric) <- data$Country
res.pca <- prcomp(data.numeric, scale = TRUE)
res.pca## Standard deviations (1, .., p=14):
## [1] 2.551458e+00 2.133781e+00 1.025801e+00 9.724048e-01 6.434018e-01
## [6] 5.116423e-01 3.312827e-01 3.035126e-01 1.508862e-01 1.367818e-01
## [11] 9.320684e-02 8.670611e-02 6.249021e-02 2.051884e-16
##
## Rotation (n x k) = (14 x 14):
## PC1 PC2 PC3 PC4 PC5
## PobUrb 0.006993232 -0.42971534 -0.36025203 0.04092415 -0.04174891
## TasMortNac -0.362085489 0.02986868 -0.03571043 -0.15519991 -0.04250885
## TasBruNat -0.377606060 0.06475955 -0.07329206 0.06971863 -0.18341389
## EspVidVar 0.347037640 -0.03873684 0.11836352 0.37723404 -0.08212844
## EspVidMuj 0.369416563 -0.03476269 0.08939118 0.23891030 -0.07432565
## NuMueInf -0.174249122 -0.32431789 0.54203400 -0.02879546 -0.03497203
## NuMueNeo -0.163775349 -0.33259632 0.54760767 -0.02137344 -0.00644255
## PobTot -0.026697261 -0.45946114 -0.16379536 0.03416274 0.03560412
## CrecDem -0.193365438 0.05603061 0.02076875 0.85393970 -0.07644388
## PobrRur -0.059537860 -0.44510630 0.05947771 0.02364147 0.11356098
## TasFecTot -0.367732042 0.06515805 -0.06087846 0.06409241 -0.35666314
## IndDepAnci 0.309811932 -0.04428222 0.10324933 -0.17809263 -0.85121106
## IndDepJov -0.371734922 0.06152647 -0.09554316 0.03390795 -0.25252250
## Pob65MasTot 0.033543721 -0.41157238 -0.44000321 0.02818276 -0.11718170
## PC6 PC7 PC8 PC9 PC10
## PobUrb -0.03185254 0.358754268 0.1765537374 -0.01733486 0.051445635
## TasMortNac -0.49773875 0.237907245 -0.7051251944 0.14555089 -0.088610230
## TasBruNat 0.29371591 0.001205696 -0.0752555069 0.05699728 0.053959481
## EspVidVar 0.27181503 0.266204038 -0.5037462984 -0.40989661 0.379996549
## EspVidMuj 0.29523382 0.100829635 -0.2122260842 0.61215664 -0.498127083
## NuMueInf -0.01492766 0.272897827 0.1738506038 -0.07139440 0.029696632
## NuMueNeo 0.02365860 0.151949509 0.0629316956 0.13225315 -0.030567672
## PobTot 0.02378060 -0.168780486 -0.0605531285 -0.03261110 0.019070849
## CrecDem -0.41490745 -0.128111679 0.1795843775 0.05180330 -0.009892387
## PobrRur 0.08002966 -0.707796109 -0.3043425560 -0.04546263 -0.016935291
## TasFecTot 0.33065106 0.017505752 -0.0214352595 -0.45235646 -0.558976842
## IndDepAnci -0.28018893 -0.193564511 0.0462525892 0.00721894 0.085977220
## IndDepJov 0.36604658 -0.038495089 -0.0005113821 0.44249496 0.516629319
## Pob65MasTot -0.04689374 0.225766811 0.0428779278 0.06027047 -0.068878889
## PC11 PC12 PC13 PC14
## PobUrb -0.548323412 0.07935895 -0.155146456 -4.327033e-01
## TasMortNac -0.081618746 -0.05719458 0.017826387 3.330669e-16
## TasBruNat 0.051868029 0.82824258 0.150254917 -2.220446e-16
## EspVidVar 0.046330249 -0.01257091 -0.042170365 3.989864e-17
## EspVidMuj -0.120393580 -0.00364344 0.109480514 -1.908196e-17
## NuMueInf -0.066514679 -0.10426820 0.665136728 -8.326673e-17
## NuMueNeo 0.215243589 0.09971151 -0.678143485 -3.330669e-16
## PobTot -0.280438165 0.02584169 -0.036929650 8.025557e-01
## CrecDem 0.004575505 -0.01774907 -0.007322322 -6.418477e-17
## PobrRur 0.029691194 -0.03311317 0.091294214 -4.106972e-01
## TasFecTot -0.050805499 -0.29292997 -0.099690808 1.595946e-16
## IndDepAnci -0.050133969 0.08322527 -0.011025629 6.765422e-17
## IndDepJov -0.035959817 -0.42889653 -0.023591848 1.006140e-16
## Pob65MasTot 0.732569877 -0.06851040 0.128907079 -5.551115e-16
Se observa que el primer componente principal (CP1) explica aproximadamente 46% de la varianza total, mientras que el segundo componente (CP2) explica cerca de 33%. En conjunto, estos dos componentes concentran alrededor del 79% de la varianza acumulada, lo cual indica que gran parte de la información contenida en las variables originales puede resumirse adecuadamente en solo dos dimensiones.
A partir del tercer componente, la varianza explicada disminuye de manera considerable (menos del 10% cada uno), y la pendiente de la curva se estabiliza, formando el denominado “punto de codo”. Esto sugiere que incluir más componentes no aporta información relevante adicional y solo añadiría ruido al análisis.
Por tanto, según el criterio del codo y la proporción de varianza explicada, se concluye que los dos primeros componentes principales son suficientes para representar la estructura subyacente de los datos, permitiendo una reducción dimensional efectiva sin pérdida significativa de información.
# Gráfico de cómo contribuyen las variables a cada dimensión
fviz_pca_var(res.pca,
col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE,
axes = c(1, 2)
)Con base en el gráfico biplot obtenido del Análisis de Componentes Principales (ACP), se observa que las dos primeras dimensiones explican conjuntamente una proporción importante de la variabilidad total de los datos. La Dimensión 1, que representa el 46,5 % de la varianza, está definida principalmente por variables relacionadas con el crecimiento natural de la población, tales como la tasa bruta de natalidad, la tasa de fecundidad total, la tasa de mortalidad y el índice de dependencia juvenil, las cuales se orientan hacia el lado izquierdo del eje. En el extremo opuesto, hacia la derecha, se agrupan las variables asociadas a la esperanza de vida al nacer (en hombres y mujeres) y el índice de dependencia de ancianos, indicadores que reflejan mejores condiciones de salud y un mayor envejecimiento poblacional.
Por su parte, la Dimensión 2 (32,5 % de la varianza) está influenciada por variables vinculadas con el tamaño y la estructura de la población, como la población total, urbana, rural y población de 65 años o más, que se concentran en la parte inferior del gráfico, cerca del eje vertical. También se ubican en esta zona las variables de mortalidad infantil y mortalidad neonatal, aunque con una posición más alejada del centro y una ligera inclinación hacia la izquierda.
En conjunto, el gráfico permite identificar dos ejes de diferenciación: el primero, asociado al nivel de desarrollo y transición demográfica (Dim-1), y el segundo, relacionado con el tamaño y la composición de la población (Dim-2). Esta combinación de factores evidencia cómo las variables demográficas se agrupan de manera coherente, diferenciando países con estructuras jóvenes y en crecimiento de aquellos con poblaciones más urbanas, envejecidas y desarrolladas.
# Presentar la matriz de correlaciones
cor_matrix <- cor(data.numeric)
library(corrplot)
library(ggplot2)
library(reshape2)
numeric_cols <- c("PobUrb", "TasMortNac", "TasBruNat", "EspVidVar",
"EspVidMuj", "NuMueInf", "NuMueNeo", "PobTot",
"CrecDem", "PobrRur", "TasFecTot", "IndDepAnci",
"IndDepJov", "CrecPobRur", "Pob65MasTot")
# subset con solo variables numéricas
data.numeric <- data[, numeric_cols]
# Convertir columnas a numéricas
for(col in names(data.numeric)) {
if(is.character(data.numeric[[col]])) {
data.numeric[[col]] <- as.numeric(gsub(",", ".", data.numeric[[col]]))
}
}
# Eliminar filas con valores NA
data.numeric <- na.omit(data.numeric)
cor_matrix <- cor(data.numeric)
par(mar = c(1, 1, 3, 1))
corrplot(cor_matrix,
method = "color",
type = "upper",
order = "hclust",
addCoef.col = "black",
tl.col = "black",
tl.srt = 45,
number.cex = 0.6,
tl.cex = 0.8,
title = "Matriz de Correlación - Variables Demográficas",
mar = c(0,0,2,0)) Número de muertes infantiles (NuMueInf) ↔︎ Número de muertes neonatales (NuMueNeo): r = 0.993
La correlación casi perfecta entre las muertes infantiles y las muertes neonatales indica que ambos indicadores están estrechamente vinculados y responden a los mismos determinantes de salud pública. En el mundo real, los países que registran un alto número de muertes neonatales suelen presentar también un elevado número de muertes infantiles totales. Esto refleja condiciones estructurales como deficiencias en la atención prenatal, escasa cobertura de servicios médicos durante el parto, baja calidad hospitalaria y limitaciones en el acceso a vacunas y nutrición infantil. En contraste, los países con sistemas de salud desarrollados logran reducir simultáneamente ambos tipos de mortalidad, lo que explica la fuerte correlación presentada en estas variables.
Tasa bruta de natalidad (TasBrutNat) ↔︎ Índice de dependencia juvenil (IndDepJov): r = 0.987
La relación positiva y elevada entre la tasa de natalidad y el índice de dependencia juvenil evidencia un patrón demográfico distintivo: a mayor número de nacimientos, mayor es la proporción de población joven que depende económicamente de los adultos en edad productiva. En términos reales, los países con altas tasas de natalidad, comúnmente en regiones de África y Asia del Sur presentan estructuras poblacionales jóvenes, lo que implica mayores demandas en educación, empleo y servicios básicos. En cambio, las naciones con baja natalidad, típicas de Europa o América del Norte, muestran índices de dependencia juvenil más bajos y estructuras demográficas más envejecidas. Esta relación es un reflejo directo de la etapa de transición demográfica en la que se encuentra cada país.
Población urbana (PobUrb) ↔︎ Población de 65 años o más (Pob65MasTot): r = 0.983
La fuerte correlación positiva entre el porcentaje de población urbana y la proporción de personas mayores de 65 años sugiere que los países más urbanizados también tienden a tener poblaciones más envejecidas. Este fenómeno se explica porque la urbanización suele ir acompañada de mejores condiciones de vida, acceso a servicios de salud, educación y empleo formal, factores que contribuyen a un aumento en la esperanza de vida en las zonas urbanas. En consecuencia, las sociedades altamente urbanizadas, como las europeas y algunas asiáticas (Japón, Corea del Sur), presentan una estructura poblacional envejecida. Por el contrario, en los países menos urbanizados, la población es predominantemente joven y la proporción de adultos mayores es reducida.
Tasa de mortalidad (TasMortNac) ↔︎ Esperanza de vida femenina (EspVidMuj): r = -0.932
La correlación negativa muy alta entre la tasa de mortalidad y la esperanza de vida femenina indica que, a medida que aumenta la mortalidad general, disminuye la esperanza de vida de las mujeres. Este resultado refleja un patrón demográfico universal: los países con altos niveles de mortalidad presentan una menor longevidad en su población. En el contexto real, las mujeres suelen tener una esperanza de vida ligeramente superior a la de los hombres; sin embargo, en entornos con altas tasas de mortalidad, esa ventaja se reduce debido a la precariedad de las condiciones sanitarias, reproductivas y socioeconómicas. En cambio, en países desarrollados, la baja mortalidad general se traduce en una esperanza de vida femenina más alta, producto de un mejor acceso a la salud, la educación y la seguridad social.
Tasa de mortalidad (TasMortNac) ↔︎ Esperanza de vida masculina (EspVidVar): r = -0.881
Esta correlación negativa muestra el mismo patrón descrito anteriormente, pero aplicado a la población masculina. A mayor tasa de mortalidad, menor es la esperanza de vida de los hombres. En la práctica, esta relación refleja que las condiciones de vida precarias, los conflictos armados, las enfermedades transmisibles y la limitada cobertura sanitaria afectan con mayor intensidad a la población masculina en muchos países de ingresos bajos y medios. Por el contrario, las naciones con sistemas de salud consolidados, infraestructura sanitaria avanzada y políticas de bienestar social logran reducir significativamente la mortalidad y, con ello, extender la longevidad de los hombres.
Tasa bruta de natalidad (TasBrutNat) ↔︎ Esperanza de vida femenina (EspVidMuj): r = -0.878
La correlación negativa entre la tasa de natalidad y la esperanza de vida femenina pone en evidencia un rasgo característico de la transición demográfica: los países con mayor natalidad tienden a tener menores niveles de esperanza de vida. En el mundo real, las naciones con altas tasas de natalidad, suelen estar en etapas tempranas del desarrollo, donde la fecundidad elevada coexiste con una mayor mortalidad y menor acceso a servicios de salud y educación. Por el contrario, los países con baja natalidad, producto de una mayor urbanización y planificación familiar presentan una esperanza de vida más alta. Esta relación inversa refleja el paso de sociedades jóvenes y en crecimiento hacia poblaciones envejecidas y estables, típico de los contextos más desarrollados.
Tasa de mortalidad (TasMortNac) ↔︎ Índice de dependencia juvenil (IndDepJov): r = 0.838
La correlación positiva fuerte entre la tasa de mortalidad y el índice de dependencia juvenil sugiere que los países con una proporción elevada de población joven tienden a registrar también mayores niveles de mortalidad general. En términos demográficos, esta relación puede interpretarse como un reflejo de los niveles de desarrollo y la etapa de transición demográfica en la que se encuentran los países.
En las naciones con estructuras poblacionales jóvenes, caracterizadas por una alta fecundidad y un amplio grupo de dependientes menores de 15 años suelen coexistir factores que incrementan la mortalidad, tales como limitaciones en los sistemas de salud, menores niveles de ingreso, deficiencias nutricionales y desigualdades sociales. En contraste, los países con poblaciones envejecidas, donde la dependencia juvenil es baja, suelen tener tasas de mortalidad general reducidas y mejores condiciones sanitarias.
Esperanza de vida femenina (EspVidMuj) ↔︎ Tasa de fecundidad total (TasFecTot): r = -0.848
La correlación negativa entre la esperanza de vida femenina y la tasa de fecundidad total refleja una relación demográfica ampliamente documentada: a medida que disminuye la fecundidad, aumenta la esperanza de vida. Este patrón caracteriza el proceso de transición demográfica, en el cual los países pasan de tener altas tasas de natalidad y mortalidad a niveles más bajos y estables de ambos indicadores.
En el mundo real, las naciones con baja fecundidad, comúnmente ubicadas en Europa, América del Norte y Oceanía también presentan mayores niveles de esperanza de vida, producto de mejores condiciones socioeconómicas, acceso a educación, cobertura sanitaria y mayor participación femenina en el mercado laboral. Por el contrario, los países con alta fecundidad, predominantemente en África y Asia del Sur tienden a mostrar esperanzas de vida más bajas, consecuencia de sistemas de salud menos desarrollados, desigualdad social y menor acceso a recursos educativos y de planificación familiar
Teniendo en cuenta la información previamente analizada, y como se mencionó anteriormente, las dimensiones resultantes del Análisis de Componentes Principales fueron denominadas de la siguiente manera, según el conjunto de variables que las componen y el significado demográfico que representan.
Este componente está definido principalmente por las variables tasa bruta de natalidad (TasBruNat), tasa de fecundidad total (TasFecTot), tasa de mortalidad (TasMortNac) e índice de dependencia juvenil (IndDepJov), las cuales se asocian con estructuras poblacionales jóvenes, altas tasas de crecimiento natural y menores niveles de desarrollo sanitario. En sentido opuesto, las variables esperanza de vida al nacer en hombres y mujeres (EspVidVar y EspVidMuj) y el índice de dependencia de ancianos (IndDepAnc) representa poblaciones envejecidas, con mayor longevidad y mejores condiciones de bienestar.
# Contribución de variables a la Dimensión 1
fviz_contrib(res.pca, choice = "var", axes = 1, top = 10)De manera general, este conjunto de relaciones refleja el proceso de transición demográfica, entendido como el cambio que experimentan los países al pasar de altas tasas de natalidad y mortalidad hacia niveles más bajos de ambos indicadores. La literatura sobre transición demográfica muestra que la combinación de tasas de natalidad y fecundidad, mortalidad infantil/neonatal y esperanza de vida captura las etapas de desarrollo poblacional de los países; por eso estas variables sirven como indicadores sintéticos del ‘grado de transición demográfica’ (Dyson, 2014; UN WPP). Dicho proceso se asocia con mejoras en la salud, la educación y las condiciones económicas, que incrementan la esperanza de vida y reducen gradualmente los nacimientos y defunciones.
En este eje se ubican países con elevada fecundidad, alta mortalidad y fuerte dependencia juvenil, característicos de las primeras etapas de la transición poblacional. Entre ellos destacan Nigeria, Chad, Somalia, Níger, la República Democrática del Congo, la República Centroafricana, Malí, Sudán del Sur, Pakistán y Mozambique, naciones situadas principalmente en África subsahariana y el sur de Asia. Estas regiones se distinguen por un rápido crecimiento natural, una estructura poblacional joven y limitaciones en el acceso a servicios básicos, factores que ralentizan el avance hacia etapas más avanzadas del desarrollo demográfico.
En síntesis, este primer componente puede interpretarse como un indicador del nivel de desarrollo y del grado de transición demográfica, pues resume los contrastes entre países con poblaciones jóvenes y en expansión frente a aquellos con estructuras envejecidas y mayor esperanza de vida. Su denominación se justifica porque el eje expresa simultáneamente el avance del proceso de transición poblacional y las condiciones de bienestar asociadas, convirtiéndose en el principal factor diferenciador entre las naciones analizadas.
El segundo componente principal (Dimensión 2) se caracteriza por agrupar un conjunto de variables asociadas al tamaño y la composición demográfica de los países. Entre las variables que presentan las mayores contribuciones se encuentran la población total (PobTot), la población rural (PobRur), la población urbana (PobUrb) y la población de 65 años o más (Pob65MasTot), seguidas por el número de muertes neonatales (NuMueNeo) y el número de muertes infantiles (NuMueInf). En conjunto, estas variables explican gran parte de la varianza de esta dimensión, lo que indica que el eje representa principalmente diferencias en la escala y estructura poblacional, más que en el nivel de desarrollo o bienestar social.
# Contribución de variables a la Dimensión 2
fviz_contrib(res.pca, choice = "var", axes = 2, top = 10)La elevada contribución de la población total, tanto en sus componentes urbana como rural, sugiere que esta dimensión distingue a los países en función de su magnitud demográfica y su grado de urbanización. Asimismo, la participación de la población mayor de 65 años introduce un matiz relacionado con el envejecimiento poblacional, fenómeno que suele acompañar los procesos de transición demográfica. Las variables relacionadas al número de muertes infantiles y número de muertes neonatales, aunque con menor peso relativo, refuerzan esta lectura al reflejar las condiciones de salud y supervivencia dentro de las estructuras demográficas de gran escala.
En cuanto a los países, se observa que India y China aportan la mayor proporción a la Dimensión 2, representando conjuntamente más del 80 % de su varianza. Esta fuerte influencia confirma que el componente está determinado por naciones con poblaciones extremadamente numerosas, seguidas en menor medida por países como Pakistán, Nigeria y Estados Unidos. Estas potencias demográficas se distinguen por sus altos volúmenes poblacionales y su combinación de áreas urbanas densamente pobladas con extensas zonas rurales.
Por tanto, esta dimensión puede interpretarse como un indicador del tamaño y la estructura poblacional, que distingue a los países según su volumen demográfico, nivel de urbanización y composición etaria. Su denominación se justifica porque el componente refleja las desigualdades en escala poblacional y las variaciones estructurales internas tales como la proporción de población rural, urbana y adulta mayor que caracterizan a las distintas regiones del mundo.
A partir del análisis jerárquico realizado mediante el método de conglomerados, se determinó que el número óptimo de grupos o clusters es tres (3). Esta decisión se basó en la observación del dendrograma, donde se identifican tres grandes agrupaciones claramente diferenciadas. La elección de tres grupos resulta adecuada, ya que permite visualizar de manera clara las distintas fases del proceso de transición demográfica, distinguiendo entre países con estructuras poblacionales jóvenes y alta fecundidad, aquellos en etapas intermedias de transición, y los que presentan poblaciones envejecidas y bajos niveles de natalidad, característicos de las fases más avanzadas del desarrollo demográfico.
library(factoextra)
library(cluster)
library(tidyverse)
# Extraer las coordenadas de los individuos (países) en el espacio PCA
pca_coords <- res.pca$x
paises_excluir <- c("India", "China")
# Filtrar datos
pca_coords_filtrado <- pca_coords[!rownames(pca_coords) %in% paises_excluir, ]
# información del PCA
eig.val <- get_eigenvalue(res.pca)
res.var <- get_pca_var(res.pca)
res.ind <- get_pca_ind(res.pca)
# matriz de distancias
dist_matrix_filtrado <- dist(pca_coords_filtrado[, 1:3], method = "euclidean")
# Clustering jerárquico
hc_clusters_filtrado <- hclust(dist_matrix_filtrado, method = "ward.D2")
# Dendrograma
plot(hc_clusters_filtrado,
main = "Dendrograma",
xlab = "",
ylab = "Altura",
sub = "",
cex = 0.7,
hang = -1)
# rectángulos para k=3
rect.hclust(hc_clusters_filtrado, k = 3, border = c("#FF69B4", "#00CED1", "#458B00"))Cluster 1: Régimen demográfico moderno.
El régimen demográfico moderno corresponde a la fase más avanzada del proceso de transición demográfica, en la cual las sociedades han alcanzado bajas tasas de natalidad y mortalidad, acompañadas de una alta esperanza de vida y un marcado envejecimiento poblacional. Este régimen refleja el resultado de transformaciones profundas en los ámbitos sanitario, educativo, económico y social, que han permitido mejorar las condiciones de vida y reducir significativamente la mortalidad, especialmente en edades tempranas.
Este cluster concentra a los países desarrollados o en una etapa avanzada de desarrollo, que presentan niveles de desarrollo humano, sanitario y educativo. Se distinguen por una elevada esperanza de vida en ambos sexos, con una ligera ventaja femenina, lo que evidencia la efectividad de sus sistemas de salud, infraestructura sanitaria, educación y condiciones de vida, como se observa en la Figura 1, donde se aprecia la distribución de la esperanza de vida por sexo.
library(ggplot2)
library(dplyr)
library(tidyr)
library(gridExtra)
library(scales)
library(readxl)
library(ggrepel)
# Leer los datos
datos <- read_excel("Data.xlsx")
cluster3_paises <- c("Albania", "Andorra", "Antigua and Barbuda", "Argentina",
"Armenia", "Australia", "Austria", "Azerbaijan", "Bahamas, The",
"Bahrain", "Barbados", "Belarus", "Belgium", "Bhutan",
"Bosnia and Herzegovina", "Brazil", "Brunei Darussalam",
"Bulgaria", "Cabo Verde", "Canada", "Chile", "Colombia",
"Costa Rica", "Croatia", "Cuba", "Cyprus", "Czechia", "Denmark",
"Dominica", "Ecuador", "Estonia", "Finland", "France", "Georgia",
"Germany", "Greece", "Grenada", "Hungary", "Iceland",
"Iran, Islamic Rep.", "Ireland", "Israel", "Italy", "Jamaica",
"Japan", "Korea del Norte", "Korea del Sur", "Kuwait", "Latvia",
"Lebanon", "Lithuania", "Luxembourg", "Malaysia", "Maldives",
"Malta", "Mauritius", "Mexico", "Moldova", "Montenegro",
"Netherlands", "New Zealand", "North Macedonia", "Norway",
"Palau", "Panama", "Peru", "Poland", "Portugal", "Qatar",
"Romania", "Russian Federation", "San Marino", "Serbia",
"Seychelles", "Singapore", "Slovak Republic", "Slovenia",
"Spain", "Sri Lanka", "St. Kitts and Nevis", "St. Lucia",
"Sweden", "Switzerland", "Thailand", "Trinidad and Tobago",
"Tunisia", "Turkiye", "Ukraine", "United Arab Emirates",
"United Kingdom", "United States", "Uruguay", "Viet Nam")
datos$Cluster <- NA
datos$Cluster[datos$Country %in% cluster3_paises] <- "Cluster 3"
datos_cluster <- datos %>% filter(!is.na(Cluster))
datos_c3 <- datos_cluster %>% filter(Cluster == "Cluster 3")
p3_1 <- ggplot(datos_c3, aes(x = EspVidVar, y = EspVidMuj)) +
geom_point(aes(color = IndDepAnci), alpha = 0.6, size = 3) +
geom_abline(intercept = 0, slope = 1, linetype = "dashed", color = "red") +
geom_text_repel(aes(label = Country), size = 2, max.overlaps = 20) +
scale_color_gradient(name = "Índice Dependencia\nAncianos", low = "lightblue", high = "purple") +
labs(title = "Figura 1 Esperanza de Vida por Sexo",
subtitle = "Línea roja = igualdad, Color = Dependencia de ancianos",
x = "Esperanza de Vida Varones (años)",
y = "Esperanza de Vida Mujeres (años)") +
theme_minimal() +
theme(
plot.title = element_text(face = "bold")
)
print(p3_1)Una característica central de este grupo es el marcado índice de dependencia de adultos mayores, lo que evidencia un proceso de envejecimiento poblacional. En estos países, las tasas de natalidad y fecundidad son bajas, mientras que la mortalidad infantil es controlada. Como consecuencia, la pirámide poblacional se invierte, dando lugar a una sociedad con un gran número de personas mayores y una menor proporción de jóvenes. Desde el punto de vista económico y social, este fenómeno plantea retos significativos en términos de sostenibilidad de los sistemas de pensiones, atención sanitaria y mercado laboral.
Esto se refleja en el gráfico de la figura 2, donde los países con mayores índices de dependencia de ancianos, como Japón y varios europeos, también presentan las mayores esperanzas de vida promedio, evidenciando un envejecimiento avanzado de la población.
p3_4 <- ggplot(datos_c3, aes(x = IndDepAnci, y = (EspVidMuj + EspVidVar)/2)) +
geom_point(aes(color = EspVidMuj - EspVidVar), size = 3, alpha = 0.7) +
geom_smooth(method = "lm", se = TRUE, color = "blue", linetype = "dashed") +
geom_text_repel(aes(label = Country), size = 2.5, max.overlaps = 15) +
scale_color_gradient(name = "Brecha de Género\n(años)", low = "yellow", high = "red") +
labs(title = "Figura 2 Envejecimiento vs Esperanza de Vida Promedio",
x = "Índice de Dependencia de Ancianos",
y = "Esperanza de Vida Promedio (años)") +
theme_minimal()+
theme(
plot.title = element_text(face = "bold")
)
print(p3_4)Desde el punto de vista económico y social, este fenómeno plantea retos significativos en términos de sostenibilidad de los sistemas de pensiones, atención sanitaria y mercado laboral.
En este grupo se ubican países como Japón, Alemania, Francia, Reino Unido, Canadá, Australia, España, Suecia y Estados Unidos, junto con varias naciones de Europa del Este y América Latina como Chile, Uruguay, Argentina y Costa Rica que han alcanzado etapas avanzadas de desarrollo demográfico.
En resumen, el Cluster 1 representa a las sociedades avanzadas y en tránsito, con altos niveles de bienestar, esperanza de vida prolongada y baja natalidad, pero también con retos emergentes asociados al envejecimiento demográfico y la sostenibilidad económica.
Cluster 2: Transición demográfica inicial
Este grupo está compuesto principalmente por países con niveles medios de desarrollo y estructuras demográficas aún en transición, lo que significa que están pasando de altos niveles de natalidad y mortalidad hacia valores moderados. En estos países se observa una población total considerablemente alta, acompañada de un crecimiento urbano progresivo que no ha eliminado la importancia de la población rural.
La coexistencia de altas cifras de muertes infantiles y neonatales junto con un tamaño poblacional grande sugiere brechas significativas en el acceso a los servicios de salud, saneamiento básico y nutrición, especialmente en las áreas rurales. Esto indica que, aunque la urbanización está en marcha, los beneficios del desarrollo urbano no se distribuyen de forma equitativa entre todos los sectores de la población.
En este grupo se observa la coexistencia de altas tasas de fecundidad y natalidad junto con elevados niveles de mortalidad neonatal, lo que refleja brechas significativas en el acceso a los servicios de salud, saneamiento básico y nutrición, especialmente en las zonas rurales. Como se aprecia en la Figura 3, los países con mayor fecundidad presentan también los índices más altos de mortalidad neonatal y crecimiento demográfico, lo que evidencia la persistencia de condiciones sanitarias precarias y la desigual distribución de los beneficios del desarrollo urbano. Esto indica que, aunque la urbanización y la transición demográfica están en marcha, los avances no se extienden de manera equitativa a toda la población.
library(ggplot2)
library(dplyr)
library(tidyr)
library(gridExtra)
library(scales)
library(ggrepel)
cluster2_paises <- c("Afghanistan", "Angola", "Benin", "Burkina Faso", "Burundi",
"Cameroon", "Central African Republic", "Chad",
"Congo, Dem. Rep.", "Congo, Rep.", "Cote d'Ivoire",
"Equatorial Guinea", "Ethiopia", "Gambia, The", "Guinea",
"Guinea-Bissau", "Kenya", "Lesotho", "Liberia", "Madagascar",
"Malawi", "Mali", "Mauritania", "Mozambique", "Niger",
"Nigeria", "Pakistan", "Sierra Leone", "Somalia", "South Sudan",
"Sudan", "Tanzania", "Togo", "Uganda", "Yemen, Rep.", "Zambia",
"Zimbabwe")
datos$Cluster <- NA
datos$Cluster[datos$Country %in% cluster2_paises] <- "Cluster 2"
datos_cluster <- datos %>% filter(!is.na(Cluster))
datos_c2 <- datos_cluster %>% filter(Cluster == "Cluster 2")
p2_1 <- ggplot(datos_c2, aes(x = TasFecTot, y = TasMortNac)) +
geom_point(aes(size = CrecDem, color = TasBruNat), alpha = 0.7) +
geom_text_repel(aes(label = Country), size = 2.5, max.overlaps = 15) +
scale_size_continuous(name = "Crecimiento Demográfico (%)") +
scale_color_gradient(name = "Tasa Bruta Natalidad", low = "lightgreen", high = "darkgreen") +
labs(title = "Figura 3 Tasa de Fecundidad vs Mortalidad Neonatal",
subtitle = "Tamaño = Crecimiento Demográfico, Color = Tasa Bruta Natalidad",
x = "Tasa de Fecundidad Total (nacidos por mujer)",
y = "Tasa de Mortalidad Neonatal (por 1000 nacidos vivos)") +
theme_minimal() +
theme(
plot.title = element_text(face = "bold")
)
print(p2_1)Desde el punto de vista económico, muchos de estos países dependen de sectores primarios o semindustriales, lo que genera un crecimiento demográfico sostenido pero con limitaciones estructurales en la cobertura de servicios públicos. Las políticas públicas suelen centrarse en mejorar los sistemas de salud materno-infantil, la educación básica y la planificación urbana.
En síntesis, el Cluster 2 representa a países en vías de consolidar su transición En síntesis, el Cluster 2 representa a países en vías de consolidar su transición demográfica, donde el crecimiento urbano, aunque dinámico, aún convive con rezagos rurales y deficiencias sanitarias. Este equilibrio frágil entre expansión poblacional y desarrollo social genera una estructura demográfica heterogénea que los distingue claramente de los otros dos grupos.
Dentro de este conjunto se encuentran países como Bangladesh, Egipto, Marruecos, Indonesia, Filipinas, Sudáfrica, Paraguay, El Salvador, Honduras y Bolivia, además de diversas naciones africanas y asiáticas —como Senegal, Myanmar, Nepal o Tayikistán— que representan de manera clara este estadio intermedio de transición poblacional.
Cluster 3: Régimen demográfico antiguo
El régimen demográfico antiguo corresponde a la fase inicial del proceso de transición demográfica, caracterizada por altas tasas de natalidad y mortalidad, una esperanza de vida reducida y una estructura poblacional predominantemente joven. En este tipo de sociedades, la elevada fecundidad responde a factores culturales, sociales y económicos, como la importancia del trabajo infantil, el bajo acceso a métodos anticonceptivos y la limitada participación de la mujer en el sistema educativo y laboral. Al mismo tiempo, la mortalidad en especial la infantil y materna se mantiene en niveles altos debido a la escasa cobertura sanitaria, la pobreza generalizada y las deficiencias en las condiciones de vida e higiene.
Este cluster agrupa a los países con mayores retos demográficos, sociales y económicos. Se caracteriza por tasas muy elevadas de fecundidad y natalidad, lo que significa que las familias tienen un número alto de hijos por mujer, generando un rápido crecimiento poblacional anual. Sin embargo, este crecimiento no se traduce en bienestar, ya que también se observan tasas altas de mortalidad general e infantil, lo que evidencia limitaciones estructurales en los sistemas de salud, nutrición y saneamiento. Como se observa en la Figura 4, los países con mayor número de muertes infantiles y neonatales, como Bangladesh, Indonesia, Filipinas y Egipto, reflejan claramente esta situación. La persistencia de altos niveles de mortalidad temprana, incluso en países con grandes poblaciones, pone de manifiesto las desigualdades en el acceso a servicios médicos y la debilidad de las políticas públicas orientadas a la protección materno-infantil.
datos <- read_excel("Data.xlsx")
paises_cluster1 <- c("Algeria", "Bangladesh", "Belize", "Bolivia", "Botswana",
"Cambodia", "Comoros", "Djibouti", "Dominican Republic",
"Egypt, Arab Rep.", "El Salvador", "Eritrea", "Eswatini",
"Fiji", "Gabon", "Ghana", "Guatemala", "Guyana", "Haiti",
"Honduras", "Indonesia", "Iraq", "Jordan", "Kazakhstan",
"Kiribati", "Kyrgyz Republic", "Lao PDR", "Libya", "Mongolia",
"Morocco", "Myanmar", "Namibia", "Nepal", "Nicaragua", "Oman",
"Papua New Guinea", "Paraguay", "Philippines", "Rwanda",
"Samoa", "Sao Tome and Principe", "Saudi Arabia", "Senegal",
"Solomon Islands", "South Africa", "Suriname",
"Syrian Arab Republic", "Tajikistan", "Timor-Leste", "Tonga",
"Turkmenistan", "Tuvalu", "Uzbekistan", "Vanuatu", "Venezuela, RB")
cluster1 <- datos %>%
filter(Country %in% paises_cluster1)
datos_c2 <- datos_cluster %>% filter(Cluster == "Cluster 2")
mortalidad_data <- cluster1 %>%
select(Country, NuMueInf, NuMueNeo) %>%
arrange(desc(NuMueInf)) %>%
head(20) %>%
pivot_longer(cols = c(NuMueInf, NuMueNeo),
names_to = "Tipo",
values_to = "Muertes")
g1 <- ggplot(mortalidad_data, aes(x = reorder(Country, Muertes), y = Muertes, fill = Tipo)) +
geom_bar(stat = "identity", position = "dodge", alpha = 0.8) +
scale_fill_manual(values = c("NuMueInf" = "#d62728", "NuMueNeo" = "#ff7f0e"),
labels = c("Muertes Infantiles", "Muertes Neonatales"),
name = "Tipo de Mortalidad") +
coord_flip() +
labs(title = "Figura: 4 Mortalidad Infantil y Neonatal",
x = NULL,
y = "Número de Muertes") +
scale_y_continuous(labels = comma) +
theme_minimal() +
theme(plot.title = element_text(size = 14, face = "bold"),
plot.subtitle = element_text(size = 10, color = "gray40"),
legend.position = "top",
panel.grid.major.y = element_blank())
print(g1)El índice de dependencia juvenil es particularmente alto, indicando que una gran proporción de la población está compuesta por menores de edad que aún no participan en la fuerza laboral. Este fenómeno ejerce presión sobre los recursos públicos y familiares, ya que una pequeña población económicamente activa debe sostener a un gran número de dependientes jóvenes.
Desde el punto de vista del desarrollo, estos países suelen encontrarse en etapas iniciales de industrialización, con economías basadas principalmente en la agricultura de subsistencia o la extracción de recursos naturales. Además, suelen experimentar inestabilidad política o conflictos internos, lo que agrava la dificultad para invertir en educación, salud y planificación familiar.
Como se observa en el gráfico de la Figura 5, en la mayoría de los países el índice de dependencia juvenil supera ampliamente al de los ancianos, evidenciando una estructura poblacional joven que coincide con las características descritas anteriormente.
indices_data <- cluster1 %>%
select(Country, IndDepJov, IndDepAnci) %>%
arrange(desc(IndDepJov)) %>%
head(15) %>%
pivot_longer(cols = c(IndDepJov, IndDepAnci),
names_to = "TipoDependencia",
values_to = "Valor")
indices_data$TipoDependencia <- factor(indices_data$TipoDependencia,
labels = c("Dependencia\nde Ancianos",
"Dependencia\nJuvenil"))
g13 <- ggplot(indices_data, aes(x = reorder(Country, Valor), y = Valor, fill = TipoDependencia)) +
geom_col(position = "dodge", alpha = 0.8) +
scale_fill_manual(values = c("Dependencia\nJuvenil" = "#8c564b",
"Dependencia\nde Ancianos" = "#bcbd22"),
name = "Tipo de\nDependencia") +
coord_flip() +
labs(title = "Figura: 5 Dependencia: Juvenil vs Ancianos",
x = NULL,
y = "Índice de Dependencia") +
theme_minimal() +
theme(plot.title = element_text(size = 14, face = "bold"),
plot.subtitle = element_text(size = 10, color = "gray40"),
panel.grid.major.y = element_blank(),
legend.position = "top")
print(g13)En conclusión, el Cluster 3 agrupa a los países más vulnerables en términos de desarrollo humano, donde las dinámicas demográficas reflejan una población en expansión sin un crecimiento económico proporcional, lo que puede perpetuar los ciclos de pobreza y desigualdad. Entre ellos destacan Afganistán, Nigeria, Níger, Chad, Etiopía, Mozambique, Uganda, Somalia y Sudán del Sur, junto con otras naciones del África subsahariana y del sur de Asia que ejemplifican claramente este régimen poblacional.
El análisis estadístico realizado permitió identificar patrones demográficos coherentes con las distintas fases del modelo clásico de transición demográfica. A partir del Análisis de Componentes Principales (ACP), se observaron dos ejes fundamentales de diferenciación entre los países: el primero, asociado al nivel de desarrollo y transición demográfica, y el segundo, vinculado al tamaño y estructura poblacional. Estos componentes sintetizan las relaciones entre variables como natalidad, mortalidad, fecundidad, esperanza de vida y dependencia por edad, evidenciando que las diferencias en el desarrollo humano y sanitario se reflejan directamente en la estructura y dinámica poblacional de las naciones.
Por su parte, el Análisis de Conglomerados permitió clasificar a los países en tres grupos bien definidos que representan las etapas del proceso de transición demográfica. El Cluster 1 agrupa a las naciones con un régimen demográfico moderno, caracterizado por baja natalidad, alta esperanza de vida y un marcado envejecimiento poblacional. El Cluster 2 reúne países en transición inicial, con avances en salud y urbanización, pero aún con altas tasas de fecundidad y mortalidad neonatal. Finalmente, el Cluster 3 corresponde al régimen demográfico antiguo, donde persisten altas tasas de natalidad y mortalidad, baja esperanza de vida y una fuerte dependencia juvenil. Estos resultados evidencian una clara asociación entre el desarrollo socioeconómico y la estructura demográfica.
En conjunto, el estudio demuestra que el análisis multivariado es una herramienta eficaz para identificar patrones de desarrollo entre países, ya que permite integrar de manera estadísticamente robusta información demográfica compleja y revelar diferencias estructurales que no son evidentes mediante el análisis descriptivo tradicional. Los resultados confirman que los países más avanzados tienden hacia un envejecimiento poblacional y retos de sostenibilidad social, mientras que los menos desarrollados enfrentan desafíos relacionados con el crecimiento acelerado y la presión sobre los recursos básicos.
En un contexto posterior a la pandemia de COVID-19, estos hallazgos refuerzan la necesidad de fortalecer las políticas públicas y económicas adaptadas al perfil demográfico de cada país, promoviendo estrategias que reduzcan las brechas de bienestar y favorezcan una transición más equitativa y sostenible. Asimismo, este tipo de análisis tiene una amplia aplicabilidad práctica en la planificación social, económica y territorial, al proporcionar información precisa sobre las características y necesidades específicas de las poblaciones. En el ámbito de la salud pública, por ejemplo, permite identificar países o regiones con una estructura etaria envejecida, donde se requieren políticas de atención geriátrica, promoción de la vida saludable y sostenibilidad de los sistemas de pensiones. En contraste, en aquellos con poblaciones jóvenes y alta fecundidad, el enfoque debe dirigirse hacia la reducción de la mortalidad infantil y materna, el fortalecimiento de la cobertura sanitaria y la planificación familiar.
En el campo de la educación, los resultados contribuyen a anticipar la demanda educativa y orientar la inversión en infraestructura escolar según el tamaño y composición de la población en edad escolar. De manera similar, en el ámbito del empleo y la economía, el conocimiento de la estructura poblacional permite prever la disponibilidad de fuerza laboral y diseñar programas de formación técnica o profesional acordes con las necesidades productivas del país.
Desde la perspectiva de la planificación territorial, el análisis facilita la toma de decisiones sobre la distribución de recursos, el desarrollo de infraestructura y la gestión urbana o rural, considerando la densidad y dinámica de crecimiento poblacional. Además, constituye una herramienta estratégica para la cooperación internacional y el desarrollo sostenible, ya que permite comparar de forma objetiva los niveles de desarrollo y orientar la asignación de recursos de organismos multilaterales como el Banco Mundial, el PNUD o la CEPAL hacia los países con mayores rezagos demográficos y sociales.
En síntesis, la caracterización y agrupamiento de países según sus indicadores demográficos no sólo tiene valor analítico, sino también un profundo potencial operativo para el diseño de políticas públicas más equitativas, eficientes y sostenibles, adaptadas a las realidades y necesidades de cada etapa del desarrollo poblacional.
The World Bank. (n.d.). Population estimates and projections [Data set]. DataBank. https://databank.worldbank.org/source/population-estimates-and-projections
IBM Corporation. (2024). What Is Principal Component Analysis (PCA)? [Artículo web]. IBM. https://www.ibm.com/think/topics/principal-component-analysis
IBM Corporation. (2024). What is hierarchical clustering? [Artículo web]. IBM. https://www.ibm.com/think/topics/hierarchical-clustering/
Dyson, T. (2014). Population and Development: The Demographic Transition. Population and Development Review.
Notestein, F. W. (1945). Population: The long view. In T. W. Schultz (Ed.), Food for the World (pp. 36–57). University of Chicago Press.
Thompson, W. S. (1929). Population problems. McGraw-Hill.