REPORTE APRENDIZAJE NO SUPERVISADO

# creación de la variable "base" para lectura y visualización de los datos en excel.
base_datos_indicadores <- read_xlsx("DataTaller3.xlsx", col_names = TRUE)

# Se especifican los nombres de las columnas que se desean eliminar.
columnas_a_eliminar <- c("AG.AGR.TRAC.NO", "EG.USE.ELEC.KH.PC", "SI.POV.GINI", "EN.ATM.HFCG.KT.CE", "SI.POV.MDIM")

# Eliminación de las columnas especificadas.
base_datos_indicadores <- base_datos_indicadores[, !names(base_datos_indicadores) %in% columnas_a_eliminar]

# Eliminación de filas y espacios que tienen datos faltantes. 
# Establecimiento del filtro para el año seleccionado.
base_datos_indicadores <- na.omit(base_datos_indicadores) %>% 
  filter(Year == "A2015") 

# Establecer los nombres de los países como índices (row names)
base_datos_indicadores <- base_datos_indicadores %>%
  column_to_rownames(var = "Country_Name")

# Eliminación de la columna "Year" y de las filas que no son países.
base_datos_indicadores <- base_datos_indicadores[1:106, 2:16]

# Obtención de los datos geoespaciales de los países.
datos_mapa <- ne_countries(scale = "medium", returnclass = "sf")

# Filtrar los datos geoespaciales para incluir solo los países presentes en base_datos_indicadores
datos_mapa_filtrados <- datos_mapa %>%
  filter(name %in% rownames(base_datos_indicadores))

# Combinar los datos geoespaciales filtrados con los valores de base_datos_indicadores
datos_mapa_filtrados <- merge(datos_mapa_filtrados, base_datos_indicadores,
                              by.x = "name", by.y = "row.names", all.x = TRUE)

Introducción sobre el contexto

Las variables proporcionadas en la base de datos son de gran importancia, ya que abarcan una amplia gama de aspectos socioeconómicos y demográficos. Estos indicadores nos permiten comprender y analizar el desarrollo de los países desde diversas perspectivas, como la infraestructura, los servicios básicos, la economía, la demografía y el medio ambiente.

El análisis de estos datos nos brindan información valiosa sobre las disparidades en el desarrollo entre áreas urbanas y rurales, la calidad de vida de la población, el acceso a servicios esenciales, el rendimiento económico de los países, la conservación del medio ambiente, la estructura demográfica y muchas otras dimensiones. Al estudiar y comparar estos indicadores, podemos identificar patrones, tendencias y desafíos en diferentes regiones, lo que a su vez nos ayuda a formular políticas y estrategias más efectivas para abordar estas cuestiones y promover un desarrollo sostenible y equitativo en todo el mundo.

Tambien se destaca el hecho de que los datos recopilados corresponden al año 2015 y que además se han excluido cinco indicadores debido a la insuficiencia de información disponible para su análisis en ese periodo de tiempo específico. Los indicadores que han sido omitidos son:

[SI.POV.GINI] → Índice Gini.
[AG.AGR.TRAC.NO] → Maquinaria agrícola, tractores.
[EG.USE.ELEC.KH.PC] → Consumo de energía eléctrica (kWh per cápita).
[SI.POV.MDIM] → Tasa de recuento de la pobreza multidimensional (% de la población total).
[EN.ATM.HFCG.KT.CE] → Emisiones de gases HFC (miles de toneladas métricas de CO2 equivalente).

✓ Matriz de correlación de las variables a estudiar:

En primer lugar se plantea la siguiente matriz de correlación, la cual es una herramienta valiosa en este contexto de investigación ya que muestra las relaciones entre todas las variables estudiadas agrupadas por pares, donde cada celda de la matriz representa el coeficiente de correlación (en porcentaje) entre dos variables específicas. Los coeficientes de correlación se representan utilizando una escala de colores, donde colores intensos indican correlaciones más fuertes cercanas a 1 (o 100 en este caso ya que la matriz está planteada con base en porcentajes) y colores más claros indican correlaciones más débiles. Las relaciones positivas o directas entre variables están representadas por porcentajes positivos y colores azulados, mientras que las relaciones inversas o negativas están representadas por porcentajes negativos y tonos de colores rojizos. Descrito lo anterior, se presenta la matriz de correlación para este caso de estudio así como el respectivo nombre de cada una de las variables:

library(corrplot)

# Cambiar los nombres de las variables
nombres_variables <- c(1:15)
base_datos_indicadores2 <- data.frame(base_datos_indicadores)  # Asegurarse de que la base de datos sea un data.frame
colnames(base_datos_indicadores2) <- nombres_variables

# Cambiar la paleta de colores
col <- colorRampPalette(c("#FFD0D0", "#D0F0FF", "#0048FF"))(10)

# Ajustar la intensidad del color
col <- colorRampPalette(c("#FF0000", "#FFD0D0", "#D0F0FF", "#0048FF"))(10)

# Personalizar la visualización
corrplot(cor(base_datos_indicadores2), type = "upper", method = "ellipse",
         tl.cex = 0.7, col = col, cl.pos = "n", tl.col = "black", addCoef.col = "black",
         addCoefasPercent = TRUE, number.cex = 0.7, diag = FALSE,
         mar.exp = c(0.5, 0.5))  # Ajustar el espacio entre las etiquetas

Para facilitar la visualización de la tabla se renombraron las variables con números del 1 al 15 según su orden de aparición en la base de datos suministrada, por tal motivo a continuación se presenta una tabla donde se relacionan el nombre de cada una de las variables con su respectivo número asignado, teniéndose entonces que:

# Crear un vector con los números del 1 al 15
numeros <- 1:15

# Crear un vector con las respectivas variables o descripciones
variables <- c(
  "Acceso a la electricidad (% de la población)",
  "Acceso a la electricidad, rural (% de la población rural)",
  "Acceso a combustibles y tecnologías limpias para cocinar (% de la población)",
  "Transporte aéreo, pasajeros transportados",
  "Empleadores, total (% del empleo total)",
  "Gasto (% del PIB)",
  "Exportaciones de bienes y servicios (% del PIB)",
  "Tasa de fertilidad, total (nacimientos por mujer)",
  "Superficie forestal (% de la superficie terrestre)",
  "Crecimiento del PIB (% anual)",
  "Inflación, precios al consumidor (% anual)",
  "Esperanza de vida al nacer, total (años)",
  "Tasa de mortalidad, adultos, mujeres (por cada 1000 mujeres adultas)",
  "Tasa de mortalidad, adultos, hombres (por cada 1000 hombres adultos)",
  "Población, total"
)

# Crear la tabla utilizando la función data.frame
tabla <- data.frame(Número = numeros, Variable_o_Descripción = variables)

# Crear la tabla utilizando la función data.frame
tabla <- data.frame(Número = numeros, Variable_o_Descripción = variables)

# Imprimir la tabla con kable
tabla_dinamica <- kable(tabla, align = c("c", "l"), col.names = c(" ", "Nombre de la variable")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>%
  row_spec(1:nrow(tabla), color = "black", align = "c") %>%
  column_spec(1, width = "20%", background = "#3498DB", bold = TRUE, color = "white") %>%
  column_spec(2, border_right = TRUE, width = "60%") %>%
  kable_styling(position = "center")

# Mostrar la tabla
tabla_dinamica

	Nombre de la variable
1	Acceso a la electricidad (% de la población)
2	Acceso a la electricidad, rural (% de la población rural)
3	Acceso a combustibles y tecnologías limpias para cocinar (% de la población)
4	Transporte aéreo, pasajeros transportados
5	Empleadores, total (% del empleo total)
6	Gasto (% del PIB)
7	Exportaciones de bienes y servicios (% del PIB)
8	Tasa de fertilidad, total (nacimientos por mujer)
9	Superficie forestal (% de la superficie terrestre)
10	Crecimiento del PIB (% anual)
11	Inflación, precios al consumidor (% anual)
12	Esperanza de vida al nacer, total (años)
13	Tasa de mortalidad, adultos, mujeres (por cada 1000 mujeres adultas)
14	Tasa de mortalidad, adultos, hombres (por cada 1000 hombres adultos)
15	Población, total

De la matriz anterior se puede concluir que las variables 12, 13 y 14, que representan Esperanza de vida al nacer, total (años); Tasa de mortalidad, adultos, mujeres (por cada 1000 mujeres adultas) y Tasa de mortalidad, adultos, hombres (por cada 1000 hombres adultos) respectivamente, se relacionan fuertemente (coloraciones y porcentajes muy altos) con un amplio número de otras variables (6 - 7) ya sea de manera positiva o negativa. Además también es importante destacar que, fuera del grupo mencionado previamente, una cantidad considerable de otras variables presentan correlaciones significativas entre ellas, lo que nos indica que puede haber una relación causal entre sí debido a la influencia de factores comunes. Dicho lo anterior, a continuación se presentan los siguientes bloques de variables y sus valores representativos.

✓ Infraestructura y servicios básicos:

Los indicadores relacionados con la infraestructura y los servicios básicos incluyen el acceso a la electricidad, tanto a nivel general como en áreas rurales específicas, así como el acceso a combustibles y tecnologías limpias para cocinar. Estos indicadores reflejan las disparidades en el desarrollo entre áreas urbanas y rurales, y tienen un impacto significativo en la calidad de vida y el acceso a servicios esenciales.

El acceso a la electricidad es fundamental para el desarrollo socioeconómico y mejora la productividad y la calidad de vida, sin embargo, en áreas rurales, el acceso a este recurso es limitado, lo que crea brechas en el desarrollo. Además, el acceso a combustibles y tecnologías limpias para cocinar es esencial para la salud y el medio ambiente, especialmente en regiones donde se depende de combustibles tradicionales dañinos. Por lo tanto, Mejorar estos indicadores es crucial para promover un desarrollo equitativo y garantizar servicios básicos esenciales para todos.

EG.ELC.ACCS.ZS → Acceso a la electricidad (% de la poblacion).
EG.ELC.ACCS.RU.ZS → Acceso a la electricidad, rural (% de la poblacion rural).
EG.CFT.ACCS.ZS → Acceso a combustibles y tecnologias limpias para cocinar (% de la poblacion).

# Crear la tabla con las columnas de la base de datos
tabla <- base_datos_indicadores[, 1:3]

# Redondear los valores a dos decimales
tabla <- round(tabla, 2)

# Formatear los valores con separadores de miles o millones
tabla$EG.ELC.ACCS.ZS <- format(tabla$EG.ELC.ACCS.ZS, big.mark = ".", decimal.mark = ",")
tabla$EG.ELC.ACCS.RU.ZS <- format(tabla$EG.ELC.ACCS.RU.ZS, big.mark = ".", decimal.mark = ",")
tabla$EG.CFT.ACCS.ZS <- format(tabla$EG.CFT.ACCS.ZS, big.mark = ".", decimal.mark = ",")

# Agregar estilo a la tabla
tabla_dinamica <- kable(tabla, "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>%
  column_spec(1, border_left = TRUE, border_right = TRUE, width = "20%") %>%
  column_spec(2, border_right = TRUE, width = "20%") %>%
  column_spec(3, border_right = TRUE, width = "20%") %>%
  column_spec(4, border_right = TRUE, width = "20%") %>%
  row_spec(1:nrow(tabla), color = "black", align = "c") %>%
  scroll_box(width = "100%", height = "208px") %>%
  kable_styling(position = "center")

# Mostrar la tabla
tabla_dinamica

	EG.ELC.ACCS.ZS	EG.ELC.ACCS.RU.ZS	EG.CFT.ACCS.ZS
Angola	42,00	3,82	47,20
Australia	100,00	100,00	100,00
Austria	100,00	100,00	100,00
Azerbaijan	100,00	100,00	95,90
Bahamas, The	100,00	100,00	100,00
Bangladesh	74,90	65,22	18,30
Belarus	100,00	100,00	99,30
Belgium	100,00	100,00	100,00
Belize	91,80	87,56	82,90
Bhutan	95,53	92,92	75,00
Bosnia and Herzegovina	99,70	100,00	43,90
Botswana	62,13	26,45	61,70
Brazil	99,71	98,23	95,40
Bulgaria	100,00	100,00	88,42
Cabo Verde	86,36	76,14	75,50
Cambodia	64,91	56,12	20,30
Cameroon	58,60	21,10	22,00
Canada	100,00	100,00	100,00
Chile	99,71	100,00	100,00
Colombia	98,19	91,79	89,75
Congo, Rep.	44,40	11,81	25,40
Costa Rica	99,41	97,68	94,30
Cote d’Ivoire	62,60	39,23	23,10
Croatia	100,00	100,00	100,00
Cyprus	100,00	100,00	100,00
Czechia	100,00	100,00	100,00
Dominican Republic	98,56	93,92	89,00
Egypt, Arab Rep.	99,30	99,45	99,80
El Salvador	95,40	89,42	85,50
Equatorial Guinea	66,04	3,85	24,00
Estonia	100,00	100,00	100,00
Ethiopia	29,00	15,50	4,30
Fiji	95,17	91,03	40,30
Finland	100,00	100,00	100,00
France	100,00	100,00	100,00
Gabon	87,38	17,85	85,60
Georgia	100,00	100,00	79,30
Germany	100,00	100,00	100,00
Ghana	74,08	57,60	21,10
Greece	100,00	100,00	100,00
Guatemala	90,52	84,64	42,70
Honduras	89,98	79,01	45,90
Hungary	100,00	100,00	100,00
Iceland	100,00	100,00	100,00
India	88,00	83,37	48,20
Indonesia	97,54	94,92	67,10
Iraq	99,35	97,86	98,10
Ireland	100,00	100,00	100,00
Israel	100,00	100,00	100,00
Italy	100,00	100,00	100,00
Jamaica	94,90	91,14	85,40
Japan	100,00	100,00	100,00
Jordan	99,90	98,97	99,90
Kazakhstan	100,00	100,00	93,30
Kenya	41,60	29,00	11,60
Korea, Rep.	100,00	100,00	100,00
Kyrgyz Republic	98,69	98,71	76,30
Latvia	100,00	100,00	100,00
Lithuania	100,00	100,00	100,00
Luxembourg	100,00	100,00	100,00
Madagascar	23,01	0,86	0,90
Malaysia	99,78	99,17	96,80
Malta	100,00	100,00	100,00
Mauritius	99,36	99,19	97,20
Moldova	100,00	100,00	94,70
Mongolia	88,40	67,36	44,15
Morocco	97,30	94,49	97,70
Myanmar	60,50	47,60	19,60
Namibia	51,60	31,29	44,30
Nepal	82,52	79,64	29,00
Netherlands	100,00	100,00	100,00
New Zealand	100,00	100,00	100,00
Panama	92,29	78,72	87,50
Paraguay	99,33	98,58	65,40
Peru	93,85	76,69	75,80
Philippines	89,08	83,19	42,20
Poland	100,00	100,00	100,00
Portugal	100,00	100,00	100,00
Romania	100,00	100,00	86,20
Rwanda	22,80	12,54	0,60
Samoa	99,07	98,95	31,40
Saudi Arabia	100,00	100,00	100,00
Senegal	60,50	38,14	27,30
Serbia	99,90	100,00	73,00
Singapore	100,00	100,00	100,00
Slovak Republic	100,00	100,00	100,00
Slovenia	100,00	100,00	100,00
Solomon Islands	55,10	51,50	8,40
South Africa	85,30	80,20	83,40
Spain	100,00	100,00	100,00
Sri Lanka	94,35	93,17	25,75
Sudan	46,90	31,35	45,40
Sweden	100,00	100,00	100,00
Switzerland	100,00	100,00	100,00
Tanzania	26,17	11,53	2,90
Thailand	99,60	99,51	78,90
Togo	44,65	19,64	6,60
Turkiye	100,00	100,00	94,90
Uganda	18,50	9,05	0,70
United Arab Emirates	100,00	100,00	100,00
United Kingdom	100,00	100,00	100,00
United States	100,00	100,00	100,00
Uzbekistan	100,00	100,00	85,35
Vanuatu	52,21	39,89	9,50
Zambia	31,10	4,70	14,00
Zimbabwe	33,70	10,95	29,50

✓ Aspectos económicos:

También se incluyen variables que representan aspectos económicos, como el gasto (% del PIB) y las exportaciones de bienes y servicios (% del PIB). Estos indicadores ofrecen información sobre el rendimiento económico de un país, su participación en el comercio internacional y la importancia de las exportaciones en su economía.

El gasto, como porcentaje del producto interno bruto, refleja la inversión y el consumo en áreas clave de la economía, como infraestructura, educación y salud. Por otro lado, las exportaciones representan el valor de los bienes y servicios vendidos en el extranjero, lo que indica la competitividad de una economía en el mercado global y su capacidad para generar ingresos a través del comercio internacional. Por lo tanto, estos indicadores ofrecen información valiosa sobre la salud económica de un país y su participación en el comercio mundial.

GC.XPN.TOTL.GD.ZS → “Gasto (% del PIB).
NE.EXP.GNFS.ZS → Exportaciones de bienes y servicios (% del PIB).

# Crear la tabla con las columnas de la base de datos
tabla <- base_datos_indicadores[, 6:7]

# Redondear los valores a dos decimales
tabla <- round(tabla, 2)

# Formatear los valores con separadores de miles o millones
tabla$GC.XPN.TOTL.GD.ZS <- format(tabla$GC.XPN.TOTL.GD.ZS, big.mark = ".", decimal.mark = ",")
tabla$NE.EXP.GNFS.ZS <- format(tabla$NE.EXP.GNFS.ZS, big.mark = ".", decimal.mark = ",")

# Agregar estilo a la tabla
tabla_dinamica <- kable(tabla, "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>%
  column_spec(1, border_left = TRUE, border_right = TRUE, width = "20%") %>%
  column_spec(2, border_right = TRUE, width = "40%") %>%
  column_spec(3, border_right = TRUE, width = "40%") %>%
  row_spec(1:nrow(tabla), color = "black", align = "c") %>%
  scroll_box(width = "100%", height = "208px") %>%
  kable_styling(position = "center")

# Mostrar la tabla
tabla_dinamica

	GC.XPN.TOTL.GD.ZS	NE.EXP.GNFS.ZS
Angola	20,82	29,75
Australia	26,78	20,07
Austria	46,27	53,09
Azerbaijan	24,79	37,79
Bahamas, The	16,04	37,00
Bangladesh	9,01	17,34
Belarus	28,11	58,01
Belgium	41,59	77,81
Belize	20,45	51,16
Bhutan	19,56	34,44
Bosnia and Herzegovina	36,91	35,53
Botswana	31,24	53,09
Brazil	36,92	12,90
Bulgaria	34,34	63,80
Cabo Verde	28,47	44,91
Cambodia	12,05	61,72
Cameroon	12,42	20,99
Canada	17,06	31,85
Chile	21,63	29,19
Colombia	26,82	15,65
Congo, Rep.	15,58	42,73
Costa Rica	28,55	30,00
Cote d’Ivoire	13,45	27,36
Croatia	41,45	45,68
Cyprus	39,23	70,02
Czechia	33,26	80,56
Dominican Republic	15,21	23,76
Egypt, Arab Rep.	30,23	13,18
El Salvador	22,76	29,49
Equatorial Guinea	9,94	56,66
Estonia	36,15	77,44
Ethiopia	10,38	9,36
Fiji	26,32	48,84
Finland	40,42	35,41
France	47,99	30,59
Gabon	17,19	46,03
Georgia	28,19	40,86
Germany	27,99	46,92
Ghana	17,36	33,83
Greece	51,52	32,13
Guatemala	12,53	19,83
Honduras	21,98	45,17
Hungary	43,27	87,53
Iceland	32,21	51,65
India	15,13	19,81
Indonesia	14,50	21,16
Iraq	27,03	34,51
Ireland	27,56	122,10
Israel	34,39	31,17
Italy	43,62	29,72
Jamaica	25,79	29,92
Japan	16,97	17,44
Jordan	25,71	36,59
Kazakhstan	15,49	28,52
Kenya	20,72	15,13
Korea, Rep.	23,49	42,99
Kyrgyz Republic	27,24	35,19
Latvia	43,57	60,28
Lithuania	32,76	68,78
Luxembourg	37,22	191,84
Madagascar	9,56	28,39
Malaysia	18,29	69,45
Malta	36,00	154,62
Mauritius	11,39	51,50
Moldova	28,52	31,90
Mongolia	24,31	44,18
Morocco	23,06	30,00
Myanmar	17,94	20,46
Namibia	38,00	35,37
Nepal	13,99	10,21
Netherlands	40,18	82,66
New Zealand	31,54	27,91
Panama	14,43	47,68
Paraguay	14,83	34,77
Peru	20,57	21,29
Philippines	13,48	27,21
Poland	34,34	47,45
Portugal	43,76	40,62
Romania	33,01	41,35
Rwanda	16,94	13,24
Samoa	28,60	27,14
Saudi Arabia	32,24	33,32
Senegal	18,30	22,68
Serbia	40,67	45,18
Singapore	15,93	178,38
Slovak Republic	40,81	91,60
Slovenia	43,05	77,15
Solomon Islands	30,67	40,36
South Africa	33,68	27,71
Spain	33,20	33,61
Sri Lanka	17,09	19,89
Sudan	10,71	0,73
Sweden	32,16	43,77
Switzerland	17,07	63,83
Tanzania	14,87	17,10
Thailand	18,68	67,64
Togo	17,79	35,85
Turkiye	28,88	24,53
Uganda	10,76	12,88
United Arab Emirates	4,15	97,56
United Kingdom	38,33	27,63
United States	22,50	12,46
Uzbekistan	15,07	13,77
Vanuatu	24,04	46,03
Zambia	23,23	37,14
Zimbabwe	21,81	19,16

✓ Aspectos demográficos:

En cuanto a la demografía, se encuentran variables como la tasa de fertilidad (nacimientos por mujer), la esperanza de vida al nacer y las tasas de mortalidad en adultos tanto para mujeres como para hombres. Estas variables proporcionan información sobre la estructura demográfica de una población, la salud y el bienestar de sus ciudadanos, así como la incidencia de enfermedades y otros factores de riesgo.

La tasa de fertilidad es un indicador clave que refleja el número promedio de hijos nacidos por mujer en una determinada población. Este indicador permite evaluar los patrones reproductivos y el crecimiento de la población. Por otro lado, la esperanza de vida al nacer proporciona información sobre la cantidad de años que se espera que viva una persona en promedio. Es un indicador importante de la calidad de vida y la salud en una sociedad. Además, las tasas de mortalidad en adultos, tanto para mujeres como para hombres, ofrecen datos cruciales sobre los riesgos de enfermedades y otros factores que afectan la supervivencia en la etapa adulta.

SP.DYN.LE00.IN → Esperanza de vida al nacer, total (años).
SP.DYN.TFRT.IN → Tasa de fertilidad, total (nacimientos por mujer).
SP.DYN.AMRT.FE → Tasa de mortalidad, adultos, mujeres (por cada 1000 mujeres adultas).
SP.DYN.AMRT.MA → Tasa de mortalidad, adultos, hombres (por cada 1000 hombres adultos).

# Crear la tabla con las columnas de la base de datos
tabla <- base_datos_indicadores[, c("SP.DYN.LE00.IN", "SP.DYN.TFRT.IN", "SP.DYN.AMRT.FE", "SP.DYN.AMRT.MA")]

# Redondear los valores a dos decimales
tabla <- round(tabla, 2)

# Formatear los valores con separadores de miles o millones
tabla$SP.DYN.LE00.IN <- format(tabla$SP.DYN.LE00.IN, big.mark = ".", decimal.mark = ",")
tabla$SP.DYN.TFRT.IN <- format(tabla$SP.DYN.TFRT.IN, big.mark = ".", decimal.mark = ",")
tabla$SP.DYN.AMRT.FE <- format(tabla$SP.DYN.AMRT.FE, big.mark = ".", decimal.mark = ",")
tabla$SP.DYN.AMRT.MA <- format(tabla$SP.DYN.AMRT.MA, big.mark = ".", decimal.mark = ",")

# Agregar estilo a la tabla
tabla_dinamica <- kable(tabla, "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>%
  column_spec(1, border_left = TRUE, border_right = TRUE, width = "20%") %>%
  column_spec(2, border_right = TRUE, width = "20%") %>%
  column_spec(3, border_right = TRUE, width = "20%") %>%
  column_spec(4, border_right = TRUE, width = "20%") %>%
  column_spec(5, border_right = TRUE, width = "20%") %>%
  row_spec(1:nrow(tabla), color = "black", align = "c") %>%
  scroll_box(width = "100%", height = "208px") %>%
  kable_styling(position = "center")

# Mostrar la tabla
tabla_dinamica

	SP.DYN.LE00.IN	SP.DYN.TFRT.IN	SP.DYN.AMRT.FE	SP.DYN.AMRT.MA
Angola	60,66	5,77	229,95	321,30
Australia	82,40	1,81	45,23	78,37
Austria	81,19	1,49	44,69	84,69
Azerbaijan	71,45	1,94	93,65	194,52
Bahamas, The	73,10	1,58	134,41	231,77
Bangladesh	70,49	2,11	112,62	176,35
Belarus	73,62	1,72	82,36	245,38
Belgium	80,99	1,70	53,98	89,44
Belize	73,19	2,44	109,72	208,20
Bhutan	70,34	1,96	128,97	169,98
Bosnia and Herzegovina	76,18	1,29	59,73	109,24
Botswana	63,82	2,94	237,82	336,80
Brazil	74,33	1,78	84,63	178,50
Bulgaria	74,61	1,53	86,61	185,53
Cabo Verde	74,62	2,12	73,42	196,45
Cambodia	69,87	2,55	141,29	203,96
Cameroon	59,66	4,83	278,46	329,93
Canada	81,82	1,60	50,74	81,20
Chile	79,75	1,74	61,87	109,66
Colombia	76,26	1,86	73,97	145,40
Congo, Rep.	63,23	4,56	269,71	297,23
Costa Rica	79,09	1,79	55,47	110,19
Cote d’Ivoire	57,76	4,81	351,63	360,73
Croatia	77,28	1,41	51,41	121,65
Cyprus	80,97	1,33	44,47	74,01
Czechia	78,58	1,57	53,07	112,24
Dominican Republic	72,95	2,43	104,98	195,90
Egypt, Arab Rep.	70,48	3,44	114,94	204,22
El Salvador	71,81	2,07	116,19	291,40
Equatorial Guinea	60,10	4,77	242,42	308,12
Estonia	77,59	1,58	62,83	169,88
Ethiopia	63,65	4,53	197,24	275,38
Fiji	66,84	2,64	195,04	270,84
Finland	81,48	1,65	43,60	94,54
France	82,32	1,96	49,38	101,59
Gabon	65,46	3,89	199,25	284,02
Georgia	73,30	2,20	73,54	224,90
Germany	80,64	1,50	50,17	92,45
Ghana	63,17	4,05	225,06	281,40
Greece	81,04	1,33	38,85	95,38
Guatemala	72,10	3,03	129,84	227,29
Honduras	72,49	2,58	110,13	168,72
Hungary	75,57	1,45	85,93	177,63
Iceland	82,47	1,80	43,19	67,53
India	69,64	2,29	144,48	202,43
Indonesia	69,70	2,35	152,11	199,15
Iraq	69,44	4,09	146,13	200,68
Ireland	81,45	1,85	47,71	74,33
Israel	82,05	3,09	39,69	72,99
Italy	82,54	1,35	38,61	67,31
Jamaica	72,39	1,59	124,72	172,32
Japan	83,79	1,45	37,14	70,18
Jordan	75,01	3,17	78,45	118,29
Kazakhstan	71,97	2,74	112,35	269,75
Kenya	61,89	3,80	306,19	394,21
Korea, Rep.	82,02	1,24	26,32	70,80
Kyrgyz Republic	70,65	3,20	117,86	252,92
Latvia	74,48	1,70	85,92	234,55
Lithuania	74,32	1,70	85,05	245,42
Luxembourg	82,29	1,47	36,40	72,39
Madagascar	64,34	4,18	198,54	258,22
Malaysia	75,09	2,04	81,84	160,29
Malta	81,90	1,37	29,26	53,66
Mauritius	74,35	1,36	80,78	177,84
Moldova	69,24	1,87	119,20	299,51
Mongolia	69,50	3,01	128,01	287,84
Morocco	72,92	2,53	100,72	141,13
Myanmar	65,56	2,25	163,31	268,88
Namibia	60,70	3,60	319,94	454,91
Nepal	67,46	2,25	171,95	222,23
Netherlands	81,51	1,66	49,46	66,69
New Zealand	81,61	1,99	52,40	76,51
Panama	77,47	2,56	76,46	141,08
Paraguay	73,19	2,64	115,35	188,45
Peru	75,62	2,34	90,77	142,01
Philippines	71,27	2,95	118,79	162,72
Poland	77,45	1,32	63,43	163,90
Portugal	81,12	1,31	42,47	104,09
Romania	74,91	1,62	76,96	185,51
Rwanda	65,30	4,08	210,06	284,93
Samoa	72,52	4,36	107,91	172,65
Saudi Arabia	76,92	2,64	78,66	98,50
Senegal	66,88	4,78	149,47	226,35
Serbia	75,29	1,46	69,59	142,21
Singapore	82,74	1,24	36,03	64,37
Slovak Republic	76,56	1,40	64,86	156,17
Slovenia	80,78	1,57	45,53	101,18
Solomon Islands	69,58	4,36	153,31	198,71
South Africa	63,95	2,36	277,00	392,51
Spain	82,83	1,33	38,81	77,00
Sri Lanka	74,93	2,09	73,58	174,89
Sudan	64,66	4,90	176,56	257,01
Sweden	82,20	1,85	39,95	66,93
Switzerland	82,90	1,54	36,48	62,28
Tanzania	64,65	5,09	211,72	285,56
Thailand	77,72	1,47	81,68	192,26
Togo	59,40	4,59	277,69	293,38
Turkiye	76,65	2,19	54,34	124,74
Uganda	61,09	5,31	280,12	360,02
United Arab Emirates	79,22	1,49	49,54	73,99
United Kingdom	80,96	1,80	54,08	84,59
United States	78,69	1,84	80,43	134,30
Uzbekistan	70,47	2,49	121,51	212,75
Vanuatu	69,51	4,01	141,94	203,55
Zambia	61,21	4,79	259,21	349,50
Zimbabwe	59,59	3,85	338,87	419,83

✓ Aspectos forestales y poblacionales:

Asimismo, se incluye la superficie forestal, expresada como porcentaje de la superficie terrestre, el cual es un indicador crucial que refleja la extensión de los bosques y áreas arboladas en relación con el territorio total de un país. Este indicador proporciona información clave sobre la biodiversidad, la conservación del medio ambiente y la gestión sostenible de los recursos naturales. Un alto porcentaje de superficie forestal indica una mayor presencia de ecosistemas forestales, que desempeñan un papel vital en la protección de la diversidad biológica, la mitigación del cambio climático y la regulación del ciclo del agua. Además, la gestión adecuada de estos bosques puede promover la utilización sostenible de los recursos forestales y la conservación de hábitats críticos para muchas

Por otro lado, el indicador de población total representa el número total de habitantes en un país o región en un momento determinado. Este indicador demográfico es fundamental para comprender el tamaño y la composición de la población, y desempeña un papel clave en la planificación y formulación de políticas. La información sobre la población total ayuda a estimar las necesidades y demandas de servicios básicos, como vivienda, educación, salud y empleo. Además, permite comprender las tendencias demográficas, incluyendo tasas de crecimiento, distribución por edad y sexo, y migración, lo que a su vez influye en las decisiones en materia de desarrollo urbano, políticas sociales y económicas, y la gestión de los recursos naturales.

SP.POP.TOTL → Poblacion, total.
AG.LND.FRST.ZS → Superficie forestal (% de la superficie terrestre).

# Crear la tabla con las columnas de la base de datos
tabla <- base_datos_indicadores[, c("SP.POP.TOTL", "AG.LND.FRST.ZS")]

# Redondear los valores a dos decimales
tabla <- round(tabla, 2)

# Formatear los valores con separadores de miles o millones
tabla$SP.POP.TOTL <- format(tabla$SP.POP.TOTL, big.mark = ".", decimal.mark = ",")
tabla$AG.LND.FRST.ZS <- format(tabla$AG.LND.FRST.ZS, big.mark = ".", decimal.mark = ",")

# Agregar estilo a la tabla
tabla_dinamica <- kable(tabla, "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>%
  column_spec(1, border_left = TRUE, border_right = TRUE, width = "20%") %>%
  column_spec(2, border_right = TRUE, width = "40%") %>%
  column_spec(3, border_right = TRUE, width = "40%") %>%
  row_spec(1:nrow(tabla), color = "black", align = "c") %>%
  scroll_box(width = "100%", height = "208px") %>%
  kable_styling(position = "center")

# Mostrar la tabla
tabla_dinamica

	SP.POP.TOTL	AG.LND.FRST.ZS
Angola	28.127.721	55,65
Australia	23.815.995	17,32
Austria	8.642.699	47,03
Azerbaijan	9.649.341	13,04
Bahamas, The	392.697	50,94
Bangladesh	157.830.000	14,47
Belarus	9.461.076	42,53
Belgium	11.274.196	22,76
Belize	359.871	58,43
Bhutan	743.274	71,23
Bosnia and Herzegovina	3.524.324	42,20
Botswana	2.305.171	27,96
Brazil	205.188.205	60,29
Bulgaria	7.177.991	35,31
Cabo Verde	552.166	10,97
Cambodia	15.417.523	50,12
Cameroon	23.012.646	43,62
Canada	35.702.908	38,72
Chile	17.870.124	23,67
Colombia	47.119.728	54,20
Congo, Rep.	5.064.386	64,47
Costa Rica	4.895.242	57,83
Cote d’Ivoire	23.596.741	10,70
Croatia	4.203.604	34,34
Cyprus	1.187.280	18,69
Czechia	10.546.059	34,56
Dominican Republic	10.405.832	43,54
Egypt, Arab Rep.	97.723.799	0,05
El Salvador	6.231.066	29,27
Equatorial Guinea	1.346.973	88,78
Estonia	1.315.407	55,69
Ethiopia	102.471.895	15,45
Fiji	917.200	60,57
Finland	5.479.531	73,74
France	66.548.272	30,75
Gabon	2.028.517	91,55
Georgia	3.725.276	40,62
Germany	81.686.611	32,73
Ghana	28.870.939	34,63
Greece	10.820.883	30,27
Guatemala	15.567.419	33,46
Honduras	9.294.505	57,77
Hungary	9.843.028	22,58
Iceland	330.815	0,48
India	1.322.866.505	23,82
Indonesia	259.091.970	50,61
Iraq	37.757.813	1,90
Ireland	4.701.957	10,95
Israel	8.380.100	7,62
Italy	60.730.582	31,44
Jamaica	2.794.445	53,32
Japan	127.141.000	68,43
Jordan	9.494.246	1,10
Kazakhstan	17.542.806	1,23
Kenya	46.851.488	6,19
Korea, Rep.	51.014.947	65,03
Kyrgyz Republic	5.956.900	6,53
Latvia	1.977.527	54,50
Lithuania	2.904.910	34,91
Luxembourg	569.604	34,45
Madagascar	24.850.912	21,48
Malaysia	31.068.833	59,24
Malta	445.053	1,09
Mauritius	1.262.605	18,87
Moldova	2.835.978	11,75
Mongolia	2.964.749	9,10
Morocco	34.680.458	12,74
Myanmar	51.483.949	45,92
Namibia	2.282.704	8,50
Nepal	27.610.325	41,59
Netherlands	16.939.923	10,84
New Zealand	4.609.400	37,40
Panama	3.957.099	57,62
Paraguay	6.177.950	44,04
Peru	30.711.863	57,18
Philippines	103.031.365	23,52
Poland	37.986.412	30,77
Portugal	10.358.076	36,15
Romania	19.815.616	29,99
Rwanda	11.642.959	10,94
Samoa	203.571	57,98
Saudi Arabia	32.749.848	0,45
Senegal	14.356.181	42,94
Serbia	7.095.383	31,09
Singapore	5.535.002	23,23
Slovak Republic	5.423.801	39,97
Slovenia	2.063.531	61,96
Solomon Islands	612.660	90,27
South Africa	55.876.504	14,21
Spain	46.444.832	37,13
Sri Lanka	20.970.000	34,40
Sudan	38.171.178	10,28
Sweden	9.799.186	68,69
Switzerland	8.282.396	31,68
Tanzania	52.542.823	54,29
Thailand	70.294.397	39,27
Togo	7.473.229	22,51
Turkiye	79.646.178	28,10
Uganda	37.477.356	12,69
United Arab Emirates	8.916.899	4,47
United Kingdom	65.116.219	13,04
United States	320.738.994	33,90
Uzbekistan	31.298.900	8,06
Vanuatu	276.438	36,28
Zambia	16.248.230	61,55
Zimbabwe	14.154.937	45,69

✓ Conectividad y evolución económica:

Adicionalmente, se incluyen otros indicadores relevantes como el transporte aéreo, que refleja la cantidad de pasajeros transportados y proporciona información sobre la conectividad y la movilidad de un país. Este indicador es importante para evaluar el desarrollo del sector del transporte aéreo y su contribución a la economía, el turismo y las relaciones internacionales.

El porcentaje de empleadores en relación con el empleo total es otro indicador significativo que ofrece una perspectiva sobre la dinámica del mercado laboral. Este indicador refleja la proporción de empleadores en comparación con el total de personas empleadas, lo que puede proporcionar información sobre el espíritu emprendedor, la creación de empresas y el grado de desarrollo empresarial en una sociedad.

Asimismo, el crecimiento del PIB (% anual) y la inflación, precios al consumidor (% anual), son indicadores económicos clave que ofrecen información sobre la evolución de la economía de un país. Estos indicadores complementan la evaluación del desarrollo económico y social de un país, proporcionando información valiosa sobre la dinámica del mercado laboral, la evolución económica y la estabilidad de precios. Su análisis contribuye a la comprensión de las condiciones económicas y sociales, y puede guiar la toma de decisiones en materia de políticas públicas y desarrollo sostenible.

NY.GDP.MKTP.KD.ZG → Crecimiento del PIB (% anual).
IS.AIR.PSGR → Transporte aereo, pasajeros transportados.
SL.EMP.MPYR.ZS → Empleadores, total (% del empleo total).
FP.CPI.TOTL.ZG → Inflación, precios al consumidor (% anual).

# Crear la tabla con las columnas de la base de datos
tabla <- base_datos_indicadores[, c("NY.GDP.MKTP.KD.ZG", "IS.AIR.PSGR", "SL.EMP.MPYR.ZS", "FP.CPI.TOTL.ZG")]

# Redondear los valores a dos decimales
tabla <- round(tabla, 2)

# Formatear los valores con separadores de miles o millones
tabla$NY.GDP.MKTP.KD.ZG <- format(tabla$NY.GDP.MKTP.KD.ZG, big.mark = ".", decimal.mark = ",")
tabla$IS.AIR.PSGR <- format(tabla$IS.AIR.PSGR, big.mark = ".", decimal.mark = ",")
tabla$SL.EMP.MPYR.ZS <- format(tabla$SL.EMP.MPYR.ZS, big.mark = ".", decimal.mark = ",")
tabla$FP.CPI.TOTL.ZG <- format(tabla$FP.CPI.TOTL.ZG, big.mark = ".", decimal.mark = ",")

# Agregar estilo a la tabla
tabla_dinamica <- kable(tabla, "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>%
  column_spec(1, border_left = TRUE, border_right = TRUE, width = "20%") %>%
  column_spec(2, border_right = TRUE, width = "20%") %>%
  column_spec(3, border_right = TRUE, width = "20%") %>%
  column_spec(4, border_right = TRUE, width = "20%") %>%
  column_spec(5, border_right = TRUE, width = "20%") %>%
  row_spec(1:nrow(tabla), color = "black", align = "c") %>%
  scroll_box(width = "100%", height = "208px") %>%
  kable_styling(position = "center")

# Mostrar la tabla
tabla_dinamica

	NY.GDP.MKTP.KD.ZG	IS.AIR.PSGR	SL.EMP.MPYR.ZS	FP.CPI.TOTL.ZG
Angola	0,94	1.244.491	4,77	9,35
Australia	2,15	69.779.346	6,21	1,51
Austria	1,01	14.718.641	4,51	0,90
Azerbaijan	1,09	1.803.112	12,42	4,03
Bahamas, The	1,00	900.028	2,86	1,86
Bangladesh	6,55	3.997.815	1,82	6,19
Belarus	-3,83	1.489.035	0,80	13,53
Belgium	2,04	11.473.055	4,30	0,56
Belize	3,37	935.604	6,28	-0,86
Bhutan	6,64	162.864	0,08	4,55
Bosnia and Herzegovina	3,09	7.071	4,01	-1,04
Botswana	-4,85	226.549	2,43	3,06
Brazil	-3,55	102.039.359	4,38	9,03
Bulgaria	3,43	1.063.498	3,57	-0,10
Cabo Verde	1,01	548.908	3,65	0,13
Cambodia	6,97	1.103.880	0,10	1,22
Cameroon	5,67	267.208	3,10	2,68
Canada	0,66	80.228.302	4,75	1,13
Chile	2,15	15.006.762	4,15	4,35
Colombia	2,96	30.909.723	4,19	4,99
Congo, Rep.	-3,55	657.927	1,12	3,17
Costa Rica	3,65	1.525.922	3,17	0,80
Cote d’Ivoire	7,19	642.893	1,50	1,25
Croatia	2,52	1.782.666	5,20	-0,46
Cyprus	3,42	23.405	2,32	-2,10
Czechia	5,39	3.378.028	3,52	0,31
Dominican Republic	6,93	14.463	3,22	0,84
Egypt, Arab Rep.	4,37	11.109.554	11,95	10,37
El Salvador	2,40	2.597.649	4,42	-0,73
Equatorial Guinea	-9,11	400.758	8,98	1,68
Estonia	1,85	512.389	3,64	-0,49
Ethiopia	10,39	7.074.779	0,48	9,57
Fiji	4,50	1.336.976	1,21	1,37
Finland	0,54	13.035.848	4,23	-0,21
France	1,11	65.039.503	4,26	0,04
Gabon	3,88	137.331	2,61	-0,34
Georgia	3,02	232.263	1,38	4,00
Germany	1,49	117.222.850	4,62	0,51
Ghana	2,12	390.457	5,61	17,15
Greece	-0,20	11.237.054	6,88	-1,74
Guatemala	4,09	93.129	2,75	2,39
Honduras	3,84	276.689	9,67	3,16
Hungary	3,71	20.043.787	5,10	-0,06
Iceland	4,44	4.134.980	3,59	1,63
India	8,00	98.927.860	1,73	4,91
Indonesia	4,88	90.095.131	3,51	6,36
Iraq	4,72	2.142.554	2,37	1,39
Ireland	24,37	115.928.738	4,58	-0,29
Israel	2,49	6.331.198	3,97	-0,63
Italy	0,78	28.603.919	6,62	0,04
Jamaica	0,92	92.836	3,42	3,69
Japan	1,56	114.128.000	2,04	0,80
Jordan	2,50	3.065.145	5,28	-0,88
Kazakhstan	1,20	5.081.632	1,35	6,67
Kenya	4,97	4.569.473	1,66	6,58
Korea, Rep.	2,81	66.093.149	6,12	0,71
Kyrgyz Republic	3,88	967.629	1,83	6,50
Latvia	3,89	2.527.368	4,30	0,17
Lithuania	2,02	1.363.946	2,29	-0,88
Luxembourg	2,27	1.830.972	3,58	0,47
Madagascar	3,13	458.572	3,85	7,40
Malaysia	5,09	50.345.820	4,04	2,10
Malta	9,61	1.583.046	4,49	1,10
Mauritius	3,69	1.466.527	3,95	1,29
Moldova	-0,34	1.005.936	0,51	9,68
Mongolia	2,38	529.311	1,34	5,74
Morocco	4,34	7.043.971	2,54	1,56
Myanmar	3,28	2.095.503	2,94	9,45
Namibia	4,26	553.322	4,08	3,39
Nepal	3,98	510.342	1,03	7,87
Netherlands	1,96	35.687.843	3,83	0,60
New Zealand	3,74	14.385.078	3,57	0,29
Panama	5,73	12.193.261	3,07	0,14
Paraguay	2,96	452.004	4,98	3,13
Peru	3,25	13.877.662	4,06	3,40
Philippines	6,35	37.023.422	3,15	0,67
Poland	4,38	4.448.883	3,93	-0,87
Portugal	1,79	12.706.909	4,80	0,49
Romania	3,16	3.634.598	1,12	-0,59
Rwanda	8,86	544.541	0,05	2,53
Samoa	3,85	98.950	3,70	0,72
Saudi Arabia	4,11	33.431.736	1,85	1,21
Senegal	6,37	115.355	0,84	0,14
Serbia	1,81	2.427.047	3,77	1,39
Singapore	2,98	33.585.397	5,72	-0,52
Slovak Republic	5,17	11.098	3,12	-0,33
Slovenia	2,21	1.045.409	3,55	-0,53
Solomon Islands	1,68	373.739	0,96	-0,57
South Africa	1,32	18.882.898	5,16	4,54
Spain	3,84	60.564.041	4,97	-0,50
Sri Lanka	4,21	4.911.730	3,10	3,77
Sudan	1,91	496.177	4,97	16,91
Sweden	4,49	58.636.668	3,58	-0,05
Switzerland	1,64	27.011.762	5,82	-1,14
Tanzania	6,16	1.312.807	2,68	5,59
Thailand	3,13	56.447.637	2,85	-0,90
Togo	5,74	420.875	1,38	2,58
Turkiye	6,08	96.604.665	4,42	7,67
Uganda	5,19	41.812	3,70	5,59
United Arab Emirates	6,79	84.343.562	2,66	4,07
United Kingdom	2,39	131.512.994	2,44	0,37
United States	2,71	798.222.000	2,27	0,12
Uzbekistan	7,22	2.486.673	11,83	8,75
Vanuatu	0,37	272.332	0,58	2,48
Zambia	2,92	203.617	0,29	10,11
Zimbabwe	2,02	370.165	0,49	-2,43

✓ Por lo tanto…

Al analizar conjuntamente estos indicadores, es posible obtener una visión más completa de la situación socioeconómica y demográfica de los países. Estas variables pueden influir en la segmentación de las naciones al revelar patrones y tendencias comunes en áreas como el desarrollo económico, el acceso a servicios básicos, la salud y el bienestar de la población, la sostenibilidad ambiental y la estructura demográfica. Por lo tanto, la segmentación de países basada en estas variables puede ayudar a identificar grupos similares de naciones con características socioeconómicas y demográficas compartidas.

Lo mencionado anteriormente puede ser útil para la formulación de políticas y la toma de decisiones informadas, permitiendo la implementación de estrategias específicas adaptadas a las necesidades y desafíos particulares de cada grupo. En resumen, el análisis no supervisado de los indicadores proporcionados en la base de datos puede ser una herramienta valiosa para comprender y segmentar los países en función de su desarrollo socioeconómico, demografía y otros aspectos relevantes. Esto puede contribuir a un mejor conocimiento de las características y desafíos de los países, así como a la identificación de áreas de mejora y oportunidades para el desarrollo sostenible.

Descripción de las variables

#1

ACCESO A LA ELECTRICIDAD (% DE LA POBLACIÓN)

El acceso a la electricidad es un indicador que mide el porcentaje de la población total de un país que tiene acceso a la electricidad. Este indicador refleja la disponibilidad y la infraestructura eléctrica en una región determinada. Una alta tasa de acceso a la electricidad indica que la mayoría de la población tiene acceso a fuentes de energía eléctrica para satisfacer sus necesidades básicas y utilizar equipos eléctricos en su vida diaria. El acceso a la electricidad está estrechamente relacionado con el desarrollo socioeconómico, ya que la electricidad es fundamental para el funcionamiento de diversos sectores, como la industria, la agricultura, la salud y la educación. Además, el acceso a la electricidad también mejora la calidad de vida de las personas al proporcionar iluminación, refrigeración, calefacción y acceso a tecnologías modernas.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$EG.ELC.ACCS.ZS)

# Creación del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(`EG.ELC.ACCS.ZS`),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", `EG.ELC.ACCS.ZS`))) %>%
  addLegend(pal = mi_paleta,
            values = ~`EG.ELC.ACCS.ZS`,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#2

ACCESO A LA ELECTRICIDAD, RURAL (% DE LA POBLACIÓN RURAL)

El acceso a la electricidad rural se refiere al porcentaje de la población rural de un país que tiene acceso a la electricidad. Este indicador se utiliza para evaluar la brecha de acceso a la electricidad entre las áreas urbanas y rurales. En general, las áreas rurales suelen tener un menor acceso a la electricidad debido a la falta de infraestructura eléctrica y a la dispersión geográfica de la población. El acceso a la electricidad en las áreas rurales es crucial para promover el desarrollo y mejorar las condiciones de vida de las comunidades rurales, ya que permite el uso de tecnologías modernas, impulsa la productividad agrícola, mejora la educación y la atención médica, y proporciona oportunidades económicas.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$EG.ELC.ACCS.RU.ZS)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(EG.ELC.ACCS.RU.ZS),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", EG.ELC.ACCS.RU.ZS))) %>%
  addLegend(pal = mi_paleta,
            values = ~EG.ELC.ACCS.RU.ZS,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#3

ACCESO A COMBUSTIBLES Y TECNOLOGÍAS LIMPIAS PARA COCINAR (% DE LA POBLACIÓN)

El acceso a combustibles y tecnologías limpias para cocinar se refiere al porcentaje de la población que utiliza combustibles y tecnologías seguras y no contaminantes para la preparación de alimentos. Este indicador es relevante porque muchas personas en países en desarrollo todavía dependen de combustibles sólidos, como la leña y el carbón, para cocinar, lo que puede tener efectos negativos en la salud y el medio ambiente. El acceso a combustibles y tecnologías limpias para cocinar implica el uso de fuentes de energía más eficientes y menos contaminantes, como el gas natural, el biogás, las estufas mejoradas y las cocinas solares. Mejorar este acceso es fundamental para reducir la exposición a humos tóxicos, disminuir la deforestación y promover prácticas de cocina más seguras y sostenibles.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$EG.CFT.ACCS.ZS)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(EG.CFT.ACCS.ZS),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", EG.CFT.ACCS.ZS))) %>%
  addLegend(pal = mi_paleta,
            values = ~EG.CFT.ACCS.ZS,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#4

TRANSPORTE AEREO, PASAJEROS TRANSPORTADOS

El indicador de transporte aéreo, pasajeros transportados, representa la cantidad de personas que utilizan el transporte aéreo en un país o región durante un período determinado. Este indicador es una medida de la movilidad y conectividad aérea de un lugar, así como de la demanda de viajes en avión. El transporte aéreo desempeña un papel importante en el comercio internacional, el turismo y la conexión entre diferentes regiones geográficas. El número de pasajeros transportados en avión puede verse afectado por factores económicos, sociales y políticos, así como por la disponibilidad de aeropuertos, rutas aéreas y servicios de transporte. Es importante monitorear este indicador para comprender las tendencias de viaje y la demanda de transporte aéreo, así como para informar las políticas y decisiones relacionadas con la infraestructura y los servicios aeroportuarios.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$IS.AIR.PSGR)

# Creación del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(`IS.AIR.PSGR`),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", format(`IS.AIR.PSGR`, big.mark = ".", decimal.mark = ","))) %>%
  addLegend(pal = mi_paleta,
            values = ~`IS.AIR.PSGR`,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#5

EMPLEADORES, TOTAL (% DEL EMPLEO TOTAL)

El indicador de empleadores, total, como porcentaje del empleo total, representa la proporción de personas que son empleadores en relación con el empleo total en un país. Los empleadores son aquellos que poseen y operan negocios o empresas y que asumen la responsabilidad de emplear y pagar a otros trabajadores. Este indicador es importante para comprender la estructura del empleo y el papel de los empleadores en la economía. Una alta proporción de empleadores puede indicar un mayor nivel de emprendimiento y actividad empresarial en un país, lo que puede ser un indicador de desarrollo económico. Además, los empleadores suelen desempeñar un papel importante en la generación de empleo y en la creación de oportunidades económicas para otros trabajadores.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$SL.EMP.MPYR.ZS)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(SL.EMP.MPYR.ZS),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", SL.EMP.MPYR.ZS))) %>%
  addLegend(pal = mi_paleta,
            values = ~SL.EMP.MPYR.ZS,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#6

GASTO (% DEL PIB)

El indicador de gasto, como porcentaje del Producto Interno Bruto (PIB), refleja la proporción del gasto total realizado en una economía en relación con su producción total de bienes y servicios. Este indicador es utilizado para evaluar la magnitud y la composición del gasto en una economía y su impacto en el crecimiento y el desarrollo económico. El gasto puede ser tanto del sector público como del sector privado e incluye el consumo de los hogares, la inversión empresarial y el gasto público en bienes y servicios. Un alto nivel de gasto en relación con el PIB puede indicar una mayor actividad económica y un mayor nivel de demanda agregada, lo que puede estimular el crecimiento económico. Sin embargo, es importante tener en cuenta la composición del gasto y su eficiencia para evaluar la sostenibilidad y la calidad del crecimiento económico.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$GC.XPN.TOTL.GD.ZS)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(GC.XPN.TOTL.GD.ZS),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", GC.XPN.TOTL.GD.ZS))) %>%
  addLegend(pal = mi_paleta,
            values = ~GC.XPN.TOTL.GD.ZS,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#7

EXPORTACIONES DE BIENES Y SERVICIOS (% DEL PIB)

El indicador de exportaciones de bienes y servicios, como porcentaje del PIB, muestra la proporción del valor de las exportaciones en relación con el tamaño de la economía, medido por el PIB. Este indicador es importante para evaluar el grado de apertura económica de un país y su participación en el comercio internacional. Un alto porcentaje de exportaciones en relación con el PIB indica una mayor integración en los mercados globales y una dependencia relativamente alta de las exportaciones como fuente de ingresos y crecimiento económico. Las exportaciones pueden incluir bienes tangibles, como productos manufacturados, alimentos y materias primas, así como servicios, como el turismo, la tecnología de la información y los servicios empresariales. El monitoreo de este indicador es crucial para evaluar la competitividad y la diversificación de una economía y para informar las políticas comerciales y de desarrollo económico.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$NE.EXP.GNFS.ZS)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(NE.EXP.GNFS.ZS),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", NE.EXP.GNFS.ZS))) %>%
  addLegend(pal = mi_paleta,
            values = ~NE.EXP.GNFS.ZS,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#8

TASA DE FERTILIDAD, TOTAL (NACIMIENTOS POR MUJER)

La tasa de fertilidad total es un indicador demográfico que mide el número promedio de hijos nacidos vivos por mujer durante su vida fértil. Este indicador es utilizado para evaluar los patrones reproductivos de una población y su impacto en el crecimiento y la estructura de la población. Una tasa de fertilidad total superior a 2,1 hijos por mujer se considera necesaria para el reemplazo generacional y el mantenimiento de una población estable a largo plazo. Las tasas de fertilidad más altas suelen estar asociadas con países en desarrollo, mientras que las tasas más bajas se encuentran en países desarrollados. El monitoreo de la tasa de fertilidad total es fundamental para comprender la dinámica demográfica, planificar políticas de salud reproductiva y educación, y anticipar los cambios en la estructura de edad de la población y sus implicaciones socioeconómicas.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$SP.DYN.TFRT.IN)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(SP.DYN.TFRT.IN),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", SP.DYN.TFRT.IN))) %>%
  addLegend(pal = mi_paleta,
            values = ~SP.DYN.TFRT.IN,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#9

SUPERFICIE FORESTAL (% DE LA SUPERFICIE TERRESTRE)

El indicador de superficie forestal, como porcentaje de la superficie terrestre, muestra la proporción de tierra cubierta por bosques y masas forestales en relación con la superficie total del país. Este indicador es importante para evaluar la cantidad de tierra dedicada a la conservación de los ecosistemas forestales, así como para monitorear los cambios en la cobertura forestal a lo largo del tiempo. Los bosques desempeñan un papel fundamental en la regulación del clima, la conservación de la biodiversidad, la protección del suelo y el suministro de recursos naturales, como la madera y los productos forestales no maderables. El monitoreo de la superficie forestal es crucial para evaluar la deforestación, implementar políticas de gestión forestal sostenible y promover la conservación de los ecosistemas forestales.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$AG.LND.FRST.ZS)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(AG.LND.FRST.ZS),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", AG.LND.FRST.ZS))) %>%
  addLegend(pal = mi_paleta,
            values = ~AG.LND.FRST.ZS,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#10

CRECIMIENTO DEL PIB (% ANUAL)

El crecimiento del PIB, medido en términos porcentuales anuales, es un indicador clave para evaluar el rendimiento económico de un país o región. Refleja la tasa de aumento de la producción total de bienes y servicios durante un período determinado. El crecimiento del PIB es una medida amplia del desarrollo económico y se utiliza para evaluar la capacidad de un país para generar riqueza, empleo y mejorar el nivel de vida de su población. Un alto crecimiento del PIB puede indicar una economía dinámica y en expansión, mientras que un crecimiento bajo puede sugerir desafíos económicos o un estancamiento. El seguimiento y análisis del crecimiento del PIB son esenciales para la formulación de políticas económicas, la toma de decisiones de inversión y el monitoreo del progreso hacia los objetivos de desarrollo sostenible.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$NY.GDP.MKTP.KD.ZG)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(NY.GDP.MKTP.KD.ZG),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", NY.GDP.MKTP.KD.ZG))) %>%
  addLegend(pal = mi_paleta,
            values = ~NY.GDP.MKTP.KD.ZG,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#11

INFLACIÓN, PRECIOS AL CONSUMIDOR (% ANUAL)

La inflación, medida en términos porcentuales anuales, es un indicador económico que refleja el aumento generalizado y sostenido de los precios de los bienes y servicios en una economía durante un período de tiempo. La inflación afecta directamente el poder adquisitivo de los consumidores y tiene implicaciones para la estabilidad macroeconómica. Un nivel moderado y controlado de inflación puede ser indicativo de un crecimiento económico saludable, mientras que una inflación alta o descontrolada puede erosionar el valor del dinero y generar inestabilidad económica. El monitoreo y la gestión de la inflación son importantes para formular políticas monetarias y fiscales, así como para proteger el bienestar económico de la población.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$FP.CPI.TOTL.ZG)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(FP.CPI.TOTL.ZG),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", FP.CPI.TOTL.ZG))) %>%
  addLegend(pal = mi_paleta,
            values = ~FP.CPI.TOTL.ZG,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#12

ESPERANZA DE VIDA AL NACER, TOTAL (AÑOS)

La esperanza de vida al nacer es un indicador demográfico que estima el número promedio de años que se espera que viva una persona al nacer. Este indicador refleja las condiciones de salud y calidad de vida de una población y es influenciado por factores como la atención médica, la nutrición, el acceso al agua potable, la educación y las condiciones socioeconómicas. Una esperanza de vida al nacer más alta indica un mayor nivel de desarrollo humano y bienestar general. El seguimiento de la esperanza de vida al nacer es esencial para evaluar el progreso en salud y desarrollo humano, así como para planificar políticas de atención médica y envejecimiento de la población.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$SP.DYN.LE00.IN)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(SP.DYN.LE00.IN),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", SP.DYN.LE00.IN))) %>%
  addLegend(pal = mi_paleta,
            values = ~SP.DYN.LE00.IN,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#13

TASA DE MORTALIDAD, ADULTOS, MUJERES (POR CADA 1000 MUJERES ADULTAS)

La tasa de mortalidad de adultos, mujeres, es un indicador demográfico que mide el número de muertes ocurridas en mujeres adultas por cada 1000 mujeres adultas en un período de tiempo determinado. Esta tasa de mortalidad refleja el riesgo de muerte en la población femenina adulta y proporciona información importante sobre la salud y el bienestar de las mujeres en una determinada región o país. Los factores que pueden influir en esta tasa de mortalidad incluyen enfermedades crónicas, complicaciones durante el embarazo y el parto, enfermedades cardiovasculares, cáncer y otros factores de riesgo relacionados con el estilo de vida y las condiciones socioeconómicas. El monitoreo de la tasa de mortalidad de adultos, mujeres, permite evaluar el progreso en salud femenina, identificar desigualdades de género y orientar las políticas de salud dirigidas a las necesidades específicas de las mujeres adultas..

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$SP.DYN.AMRT.FE)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(SP.DYN.AMRT.FE),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", SP.DYN.AMRT.FE))) %>%
  addLegend(pal = mi_paleta,
            values = ~SP.DYN.AMRT.FE,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#14

TASA DE MORTALIDAD, ADULTOS, HOMBRES (POR CADA 1000 HOMBRES ADULTOS)

La tasa de mortalidad de adultos, hombres, es un indicador demográfico que mide el número de muertes ocurridas en hombres adultos por cada 1000 hombres adultos en un período de tiempo determinado. Esta tasa de mortalidad proporciona información sobre el riesgo de muerte en la población masculina adulta y refleja aspectos relacionados con la salud y el bienestar de los hombres en una región o país específico. Los factores que pueden influir en esta tasa de mortalidad incluyen enfermedades crónicas, enfermedades cardiovasculares, cáncer, accidentes, violencia y otros factores de riesgo relacionados con el estilo de vida y las condiciones socioeconómicas. El monitoreo de la tasa de mortalidad de adultos, hombres, es importante para evaluar la salud masculina, identificar desigualdades de género y orientar las políticas de salud dirigidas a las necesidades específicas de los hombres adultos.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$SP.DYN.AMRT.MA)

# Creación  del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(SP.DYN.AMRT.MA),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", sprintf("%.2f", SP.DYN.AMRT.MA))) %>%
  addLegend(pal = mi_paleta,
            values = ~SP.DYN.AMRT.MA,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

#15

POBLACIÓN, TOTAL

El indicador de población total representa el número total de habitantes en un país o región en un momento específico. Es un indicador fundamental para evaluar el tamaño y la composición demográfica de una población. El monitoreo de la población total es esencial para la planificación y el desarrollo socioeconómico, así como para el diseño de políticas públicas en áreas como la salud, la educación, la vivienda y la infraestructura. Además, el análisis de la población total puede proporcionar información sobre los patrones de migración, el envejecimiento de la población, la distribución geográfica y otros aspectos demográficos relevantes.

# Creación de una función para la paleta de colores.
mi_paleta <- colorNumeric(palette = "Greens", domain = base_datos_indicadores$SP.POP.TOTL)

# Creación del mapa de densidad dinámico.
mapa_interactivo <- leaflet(datos_mapa_filtrados) %>%
  setView(lng = 1, lat = 45, zoom = 1.4) %>%
  addTiles() %>%
  addPolygons(fillColor = ~mi_paleta(`SP.POP.TOTL`),
              fillOpacity = 0.8,
              color = "#BDBDC3",
              weight = 1,
              highlightOptions = highlightOptions(color = "white", weight = 2,
                                                  bringToFront = TRUE),
              label = ~paste0(name, ": ", format(`SP.POP.TOTL`, big.mark = ".", decimal.mark = ","))) %>%
  addLegend(pal = mi_paleta,
            values = ~`SP.POP.TOTL`,
            title = "Escala:",
            position = "bottomright")

# Visualización del mapa interactivo.
mapa_interactivo

Presentación de la metodología

ANÁLISIS DE COMPONENTES PRINCIPALES (ACP)

El Análisis de Componentes Principales (ACP) es una técnica estadística utilizada para reducir la dimensionalidad de un conjunto de variables y encontrar patrones subyacentes en los datos. Su objetivo principal es transformar un conjunto de variables correlacionadas en un conjunto nuevo de variables no correlacionadas llamadas componentes principales. Estos componentes principales se construyen de tal manera que capturan la mayor variabilidad posible presente en los datos originales. Dicho lo anterior, la fórmula general para calcular cada componente principal es:

\[Y_j = a_1x_1 + a_2x_2 + a_3x_3 + \ldots + a_px_p\]

Donde:

$x_i:$ Son las variables originales.
$Y_j:$ Representa el j-ésimo componente principal.
$a_1, a_2, a_3, ..., a_p:$ Son los coeficientes respectivos que determinan la contribución relativa de cada variable en la construcción del componente principal.

El proceso de extracción de los componentes principales implica encontrar los valores óptimos para los coeficientes $a_1, a_2, a_3, ..., a_p$ que maximizan la varianza total explicada por cada componente. La varianza capturada por cada componente principal se puede calcular utilizando la siguiente fórmula:

\[\text{Var}(Y_j) = \frac{1}{n} \sum_{i=1}^{n}(Y_j - \bar{Y_j})^2\]

Donde:

$n:$ Es el tamaño de la muestra.
$Y_j:$ Es el valor del j-ésimo componente principal.
$\bar{Y_j}:$ Es la media del j-ésimo componente principal.

La importancia relativa de cada componente principal se determina a partir de los valores propios (eigenvalues) asociados a cada componente. Los valores propios representan la varianza explicada por cada componente y se calculan como la suma de los cuadrados de las cargas (coeficientes) de las variables en cada componente principal. Con esto en mente, La fórmula para calcular los valores propios es:

\[\lambda_j = \sum_{i=1}^{p} (a_{ij}^2)\]

Donde:

$\lambda_j:$ Es el valor propio asociado al j-ésimo componente principal.
$a_{ij}:$ Son los coeficientes (cargas) de las variables en el j-ésimo componente principal.

Al ordenar los componentes principales según sus valores propios en orden descendente, podemos identificar cuáles capturan la mayor cantidad de varianza en los datos. Generalmente, se seleccionan los primeros componentes principales que expliquen una proporción significativa de la varianza total. En resumen, el ACP utiliza las combinaciones lineales de las variables originales para construir componentes principales que explican la mayor variabilidad posible en los datos. Esto permite reducir la dimensionalidad del conjunto de datos original y mantener la información relevante para el análisis posterior.

CLUSTERIZACIÓN - MÉTODO DE WARD O CLUSTERING JERÁRQUICO

El clustering jerárquico aglomerativo es una técnica de agrupamiento que tiene como objetivo construir una estructura jerárquica de clusters a partir de un conjunto de datos. En este contexto, el método de Ward es uno de los enfoques más utilizados en el clustering jerárquico.

El método de Ward se basa en el criterio de suma de cuadrados mínimos para fusionar los clusters de manera óptima. Comienza considerando cada punto de datos como un cluster individual y, en cada paso, se fusionan los dos clusters más similares en función de su similitud o distancia. La medida de similitud puede variar, pero comúnmente se utilizan distancias como la euclidiana o la de Manhattan.

La clave del método de Ward radica en su criterio de fusión, que busca minimizar el incremento de la suma de cuadrados dentro del nuevo cluster resultante. Esto significa que se busca minimizar la variabilidad dentro de los clusters fusionados. La fórmula utilizada para calcular este incremento de la suma de cuadrados es:

\[\text{Incremento SSW} = \sum_{i=1}^{k}\sum_{x \in C_i} \|x - \bar{x}_i\|^2 - \sum_{i=1}^{k} \sum_{x \in C_i} \|x - \bar{x}\|^2\]

Donde:

$k:$ Es el número de clusters antes de la fusión.
$C_i:$ Es el i-ésimo cluster antes de la fusión.
$\bar{x}_i:$ Es el centroide del i-ésimo cluster antes de la fusión.
$\bar{x}:$ Es el centroide de todos los puntos de datos antes de la fusión.

El proceso de fusión continúa iterativamente hasta que todos los puntos de datos se agrupen en un único cluster o hasta alcanzar un número predeterminado de clusters. A medida que se fusionan los clusters, se construye una estructura jerárquica en forma de un dendrograma, que muestra las fusiones realizadas y las similitudes entre los clusters en diferentes niveles de agrupamiento.

Una ventaja del método de Ward es que no es necesario especificar de antemano el número de clusters deseado, ya que genera una estructura jerárquica completa. Esto permite explorar diferentes niveles de agrupamiento y seleccionar el número de clusters óptimo posteriormente, utilizando medidas como el coeficiente de silueta o métodos de corte en el dendrograma.

Resultados principales

Resultado #1

ANÁLISIS EXPLORATORIO DE LOS DATOS

El análisis de componentes principales (PCA) realizado en este apartado proporciona una visión general de la estructura de la información y permite reducir la dimensionalidad de la base al transformar un conjunto de datos con múltiples variables en un grupo más reducido de componentes principales. En este caso específico, se aplicó el método PCA a un conjunto de datos que contenía 15 variables, lo que generó 15 componentes principales.

criterio de valores propios de Kaiser-Guttman

Sin embargo, no se retienen todos los componentes principales generados por PCA, ya que es crucial capturar la mayor cantidad de variabilidad posible en los datos con el menor (y más óptimo) número posible de componentes seleccionados. Por lo tanto, para abordar esta selección se optó por emplear en primera instancia el criterio de Kaiser, el cual indica que “se conservarán solamente aquellos factores cuyos valores propios (eigenvalues) son mayores a la unidad”, resaltando que este valor se elige porque indica que el componente explica al menos la misma cantidad de varianza que una de las variables originales incluidas en el análisis. Dicho lo anterior y siguiendo el procedimiento planteado por el método de kaiser se tiene que:

base_datos_indicadores_entreno <- base_datos_indicadores[1:80, ]
res.pca <- prcomp(base_datos_indicadores_entreno, scale = TRUE)

eig.val <- get_eigenvalue(res.pca)

# Cambiar los títulos de las columnas a español
colnames(eig.val) <- c("Varianza")

# Agregar estilo a la tabla
tabla_dinamica <- kable(eig.val[1], "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>%
  column_spec(1, border_left = TRUE, border_right = TRUE, width = "10%") %>%
  column_spec(2, border_right = TRUE, width = "10%") %>%
  row_spec(1:nrow(eig.val[1]), color = "black", align = "c") %>%
  row_spec(1:4, color = "#2A19FF", bold = TRUE, align = "c") %>%
  scroll_box(width = "100%", height = "300px") %>%
  kable_styling(position = "center")

# Mostrar la tabla
tabla_dinamica

	Varianza
Dim.1	6.6942924
Dim.2	1.7212551
Dim.3	1.4339144
Dim.4	1.0587174
Dim.5	0.9282411
Dim.6	0.7264082
Dim.7	0.6326453
Dim.8	0.5302823
Dim.9	0.4260340
Dim.10	0.3641798
Dim.11	0.2383926
Dim.12	0.1328477
Dim.13	0.0567914
Dim.14	0.0322959
Dim.15	0.0237024

Tal como se observa en la anterior tabla y siguiendo la lógica sugerida por el criterio de Kaiser, la elección óptima sería de 4 componentes principales (según este método empleado). Sin embargo, observando la composición de estos componentes se pudo observar que, en el caso de los componentes 3 y 4, hay al menos dos variables principales (las que mayor variabilidad aportan dentro del componente) en común dentro de estos, las cuales corresponde a “Superficie forestal (% de la superficie terrestre)” y “Exportaciones de bienes y servicios (% del PIB)”. Lo anterior nos indica, por lo tanto, que en el caso de elegir los 4 componentes recomendados por el criterio de Kaiser, no habría la diversidad de variables esperada en la representación de cada componente, por el contrario tendríamos componentes con composiciones altamente similares, lo que no contribuirá al correcto análisis de este caso de estudio.

Por tal motivo, se empleará una prueba adicional correspondiente al método de suma de cuadrados, esto con el objetivo de refinar los resultados recién obtenidos y contar con una perspectiva adicional para tomar la decisión más acertada referente al número de componentes principales a escoger.

Método de suma de cuadrados o regla del codo

El método de suma de cuadrados o también conocido como “la regla del codo”, el cual se basa en el análisis de la cantidad de varianza explicada por cada componente principal para lograr una selección adecuada en cuanto al número óptimo de componentes principales, implica observar el gráfico de varianza explicada en función del número de componentes y buscar el punto de inflexión o “codo” en el gráfico. Este punto, donde se produce el codo, es considerado el número óptimo de componentes a seleccionar ya que a partir de este, agregar más componentes no conduce a una reducción significativa en la suma de cuadrados o a un aumento en el porcentaje de la varianza capturada. Por lo cual este punto corresponde al número óptimo de componentes principales a retener, ya que son estos los que se espera que capturen una proporción significativa de la variabilidad en los datos. El siguiente gráfico ilustra de manera visual el principio mencionado previamente:

base_datos_indicadores_entreno <- base_datos_indicadores[1:80, ]
res.pca <- prcomp(base_datos_indicadores_entreno, scale = TRUE)

# Calcular el porcentaje de varianza explicada
porcentaje_varianza <- res.pca$sdev^2 / sum(res.pca$sdev^2) * 100

# Crear la gráfica dinámica con ggplotly
x <- fviz_eig(res.pca, barfill = "#19FFF1", linecolor = "#2A19FF", title = "Porcentaje de Varianza Explicada", n = 15) + theme_bw()

# Configurar el tema y los colores de la gráfica
tema <- list(
  bgcolor = "white",
  plot_bgcolor = "white",
  legend_bgcolor = "white",
  legend_bordercolor = "black",
  legend_title_font = list(size = 12),
  legend_font = list(size = 10),
  title_font = list(size = 16),
  xaxis = list(title_font = list(size = 12)),
  yaxis = list(title_font = list(size = 12))
)

# Crear la gráfica interactiva con plotly
ggplotly(x) %>%
  layout(title = " ",
         xaxis = list(title = "Componente Principal"),
         yaxis = list(title = "Porcentaje de Varianza Explicada"),
         showlegend = FALSE,
         template = tema)

Al analizar el anterior gráfico, se puede apreciar que el punto de inflexión se da justo en la segunda barra, lo cual sugiere que se consideren únicamente los dos primeros componentes en el análisis planteado. Dicho lo anterior, se puede observar como el porcentaje acumulado de varianza explicada alcanza aproximadamente el 44.63% con la inclusión del primer componente principal, y aumenta hasta alrededor del 56.11% al considerar también el segundo componente, tal como lo indica el método de “la regla del codo”. Este resultado, por ende, indica que los dos primeros componentes principales capturan una cantidad significativa de información contenida en los datos (un 44.63% y 11.48% respectivamente).

base_datos_indicadores_entreno <- base_datos_indicadores[1:80, ]
res.pca <- prcomp(base_datos_indicadores_entreno, scale = TRUE)

eig.val <- get_eigenvalue(res.pca)

# Cambiar los títulos de las columnas a español
colnames(eig.val) <- c("Varianza", "Varianza Explicada", "Varianza Explicada Acumulada")

# Agregar estilo a la tabla
tabla_dinamica <- kable(eig.val, "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>%
  column_spec(1, border_left = TRUE, border_right = TRUE, width = "25%") %>%
  column_spec(2, border_right = TRUE, width = "25%") %>%
  column_spec(3, border_right = TRUE, width = "25%") %>%
  column_spec(4, border_right = TRUE, width = "25%") %>%
  row_spec(1:nrow(eig.val), color = "black", align = "c") %>%
  row_spec(1:2, color = "#2A19FF", bold = TRUE, align = "c") %>%
  scroll_box(width = "100%", height = "300px") %>%
  kable_styling(position = "center")

# Mostrar la tabla
tabla_dinamica

	Varianza	Varianza Explicada	Varianza Explicada Acumulada
Dim.1	6.6942924	44.6286161	44.62862
Dim.2	1.7212551	11.4750343	56.10365
Dim.3	1.4339144	9.5594293	65.66308
Dim.4	1.0587174	7.0581161	72.72120
Dim.5	0.9282411	6.1882739	78.90947
Dim.6	0.7264082	4.8427216	83.75219
Dim.7	0.6326453	4.2176350	87.96983
Dim.8	0.5302823	3.5352154	91.50504
Dim.9	0.4260340	2.8402266	94.34527
Dim.10	0.3641798	2.4278655	96.77313
Dim.11	0.2383926	1.5892837	98.36242
Dim.12	0.1328477	0.8856511	99.24807
Dim.13	0.0567914	0.3786096	99.62668
Dim.14	0.0322959	0.2153057	99.84198
Dim.15	0.0237024	0.1580161	100.00000

A partir de este análisis, podemos concluir que la retención de los dos primeros componentes principales es apropiada para representar de manera significativa los datos y lograr una reducción de dimensionalidad. Estos dos componentes principales en conjunto explican aproximadamente el 56.11% de la varianza total de los datos, lo cual constituye una proporción considerable. Por lo tanto, al retener únicamente dos componentes en lugar de las 15 variables originales, se consigue una representación más compacta de los datos sin comprometer de manera significativa la información contenida en ellos.

Nombramiento de Dim.1 y Dim.2

La tabla empleada en esta sección muestra la correlación entre cada variable y su respectiva componente principal. La intención en este momento es renombrar las dos componentes principales seleccionadas anteriormente a través de la regla del codo, por lo tanto se analizaran aquellas variables que presenten una mayor correlacion con la componente de estudio. Dicho lo anterior tenemos que:

Dimensión 1 (+):

EG.ELC.ACCS.ZS = Acceso a la electricidad → 0.3390034971.
SP.DYN.LE00.IN = Esperanza de vida al nacer → 0.3681128242.
EG.CFT.ACCS.ZS = Acceso a la energía de combustibles fósiles → 0.3403206712.
EG.ELC.ACCS.RU.ZS = Acceso a la electricidad en áreas rurales → 0.3454466713.

Dimensión 1 (-):

SP.DYN.TFRT.IN = Tasa de fertilidad total → -0.3354221015.
SP.DYN.AMRT.FE = Tasa de mortalidad para el género femenino → -0.3630022062.
SP.DYN.AMRT.MA = Tasa de mortalidad para el género masculino → -0.3353326282.

Dimensión 2 (-):

SP.POP.TOTL = Población total → -0.60102735.
IS.AIR.PSGR = Pasajeros de transporte aéreo. → -0.55739832.

Es importante destacar que cuando una variable presenta una carga positiva en una dimensión determinada, indica que existe una correlación positiva entre esa variable y la dimensión correspondiente. Esto implica que a medida que los valores de la variable aumentan, también lo hacen los valores de la dimensión, lo que sugiere una asociación directa o una relación en la misma dirección entre la variable y la componente principal.

Por otro lado, cuando una variable muestra una carga negativa en una dimensión específica, señala una correlación negativa entre esa variable y la dimensión respectiva. Esto significa que a medida que los valores de la variable aumentan, los valores de la dimensión disminuyen, indicando una relación inversa o una asociación en direcciones opuestas entre la variable y la componente principal. Podríamos interpretar esto como que las variables con valores más bajos o negativos tienden a tener valores más altos en su respectiva dimensión.

base_datos_indicadores_entreno <- base_datos_indicadores[1:80, ]

res.pca <- prcomp(base_datos_indicadores_entreno, scale = TRUE)

# Formatear los valores para mostrar solo 4 decimales
res.pca$rotation <- round(res.pca$rotation[, 1:2], 4)

# Obtener las coordenadas de las dos primeras dimensiones
coordenadas <- res.pca$rotation[, 1:2]

# Crear un data frame con las coordenadas
coordenadas_df <- data.frame(Dim.1 = coordenadas[, 1], Dim.2 = coordenadas[, 2])

# Cambiar los nombres de las columnas
colnames(coordenadas_df) <- c("Salud y desarrollo socioeconómico", "Movilidad y Demografía")

# Generar la tabla interactiva con barra deslizante y mostrar solo 4 decimales
tabla_interactiva <- datatable(coordenadas_df,
                               options = list(scrollY = "300px", paging = FALSE, info = "none", dom = 't')) %>%
  formatStyle(columns = c("Salud y desarrollo socioeconómico", "Movilidad y Demografía"), digits = 4)

# Imprimir la tabla
tabla_interactiva

Descrito lo anterior, se puede observar que la dimensión 1 está fuertemente correlacionada con variables que abarcan aspectos importantes de la salud, como la esperanza de vida al nacer y la tasa de mortalidad para ambos géneros. Además, se destacan variables relacionadas con el acceso a servicios básicos como la electricidad y los combustibles fósiles. Por lo tanto a esta componente se le asignará el nombre de “Salud y Desarrollo Socioeconómico”.

Por otro lado, vemos que para la componente 2 se muestra una fuerte influencia negativa hacia las variables SP.POP.TOTL y IS.AIR.PSGR, lo que sugiere que se está capturando una dimensión en la que se pueden encontrar patrones relacionados con la densidad de población y la movilidad de las personas a través del transporte aéreo. Por lo tanto el nombre para esta componente será “Movilidad y Demografía”.

Resultado #2

ANÁLISIS DE LAS VARIABLES

En este apartado se presenta en primera instancia un mapa de contribución de variables, en el cual cada punto representa una variable y su posición está determinada por su contribución al análisis de componentes principales. Destacándose que la contribución de cada variable se representa mediante una escala de colores, donde el gradiente de color (desde el azul claro hasta el rojo oscuro) indica el nivel de contribución. La utilidad de este gráfico se ve reflejada en observar la posición relativa de las variables y su contribución al análisis, donde las variables que se encuentren cerca entre sí indican una mayor similitud en términos de sus efectos sobre los componentes principales. Por otro lado, las variables que se encuentren alejadas indican diferencias significativas en sus contribuciones.

Además, también es importante destacar que aquellas variables que se encuentren más cercanas a los respectivos ejes (Dim.1 y Dim.2) y que presenten una coloración más oscura tienen una contribución mayor sobre los componentes principales. Lo anteriormente explicado se puede apreciar de manera general en el siguiente mapa y se ahondará de manera específica en cada variable a lo largo de este apartado.

# Resultados para Variables
res.var <- get_pca_var(res.pca)

# Generar el gráfico base
m <- fviz_pca_var(res.pca,
                  col.var = "contrib",
                  gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
                  repel = TRUE)

# Obtener los nombres de las variables
var_names <- rownames(res.var$contrib)

# Convertir el gráfico en un gráfico interactivo con zoom y etiquetas personalizadas
m_interactive <- plotly::ggplotly(m) %>%
  layout(annotations = list(
    x = ~x,
    y = ~y,
    text = ~var_names,
    repel = TRUE,
    showarrow = FALSE,
    font = list(size = 10)
  )) %>%
  layout(title = "")  # Eliminar el título del mapa

# Mostrar el gráfico interactivo
m_interactive

Coordenadas de las variables

Observando los resultados de la tabla interactiva, podemos identificar diferentes patrones y características de las variables. Por ejemplo, algunas variables muestran coordenadas con valores cercanos a cero en ambas dimensiones, lo que sugiere que su contribución al análisis de componentes principales es limitada. Por otro lado, hay variables con coordenadas que difieren significativamente de cero en una o ambas dimensiones, lo que indica una contribución más importante al análisis.

Así mismo, examinando las coordenadas extremas podemos identificar aquellos puntos que representan variables que tienen una contribución inusual o significativa en el análisis de componentes principales. Por ejemplo, las variables “SP.DYN.LE00.IN” (Esperanza de vida al nacer) y “SP.DYN.AMRT.FE” (Tasa de mortalidad para el género femenino) tienen coordenadas con valores altos en la componente “Salud y desarrollo socioeconómico”. Cabe resaltar que la primera variable mencionada tiene una dirección positiva en la primera dimensión mientras que la segunda presenta una carga negativa, esto nos da a entender entonces que a medida que la esperanza de vida al nacer aumenta también lo hacen los valores de la componente “Salud y desarrollo socioeconómico” debido a la relación directa que existe entre la variable y el componente, al contrario de lo que ocurre con la tasa de mortalidad para el género femenino donde a medida que se presentan valores cada vez menores se generan mejores resultados en la componente “Salud y desarrollo socioeconómico”, esto debido a la relación inversa que existe entre la variable y la componente.

Es importante tener en cuenta la orientación de los ejes en el gráfico para interpretar correctamente la contribución de las variables a las dimensiones principales. Por ejemplo, en el caso de las variables SP.POP.TOTL (población total de un país) y IS.AIR.PSGR (tráfico aéreo de pasajeros internacionales), cuyas cargas son negativas, se interpreta que un aumento en estos indicadores estaría asociado con un incremento en la dimensión de movilidad y demografía, esto se concluye a partir de la lógica subyacente de que a mayor población o vuelos aéreos presente un país, mayor debería ser la dimensión de movilidad y demográfica asociada a estas naciones.

# Resultados para Variables
res.var <- get_pca_var(res.pca)

# Formatear los valores para mostrar solo 4 decimales
res.var$coord <- round(res.var$coord, 4)

# Obtener las coordenadas de las dos primeras dimensiones
coordenadas <- res.var$coord[, 1:2]

# Cambiar los nombres de las columnas
colnames(coordenadas) <- c("Salud y desarrollo socioeconómico", "Movilidad y Demografía")

# Generar la tabla interactiva con barra deslizante y mostrar solo 4 decimales
tabla_interactiva <- datatable(coordenadas,
                               options = list(scrollY = "300px", paging = FALSE, info = "none", dom = 't')) %>%
  formatStyle(columns = c("Salud y desarrollo socioeconómico", "Movilidad y Demografía"), digits = 4)

# Imprimir la tabla
tabla_interactiva

Contribuciones de las variables

En este caso, por ejemplo la variable ““SP.POP.TOTL” se refiere a la población total de un país y presenta una contribución alta (36.12%) en la componente “Movilidad y Demografía”, lo cual indica que los países con una población total más alta tienden a tener una influencia significativa en esta componente del PCA. De la misma manera, la variable ““IS.AIR.PSGR” se refiere al tráfico de pasajeros aéreos internacionales y su contribución (31.07%) es alta en la misma componente que la variable anterior, indicando que los países con un mayor tráfico de pasajeros aéreos internacionales presentan una mayor influencia en la componente “Movilidad y Demografía” a comparación del resto de variables.

Por otro lado, las variables “SP.DYN.LE00.IN” y “SP.DYN.AMRT.FE” tienen contribuciones altas en la componente “Salud y desarrollo socioeconómico”. Esto sugiere que estas variables tienen una influencia considerable en esa dimensión y contribuyen significativamente a la variabilidad observada a lo largo de la Dim.1 con un 13.56% y 13.18% de contribución respectivamente. Siendo la variable ““SP.DYN.LE00.IN” la esperanza de vida al nacer y la variable ““SP.DYN.AMRT.FE” la tasa de mortalidad para el género femenino. Por lo tanto, se puede afirmar que estas variables contribuyen significativamente a la variabilidad capturada por esta componenete.

# Resultados para Variables
res.var <- get_pca_var(res.pca)

# Formatear los valores para mostrar solo 4 decimales
res.var$contrib <- round(res.var$contrib, 4)

# Obtener las contribuciones de las dos primeras dimensiones
contribuciones <- res.var$contrib[, 1:2]

# Cambiar los nombres de las columnas
colnames(contribuciones) <- c("Salud y desarrollo socioeconómico", "Movilidad y Demografía")

# Generar la tabla interactiva con barra deslizante y mostrar solo 4 decimales
tabla_interactiva <- datatable(contribuciones,
                               options = list(scrollY = "300px", paging = FALSE, info = "none", dom = 't')) %>%
  formatStyle(columns = c("Salud y desarrollo socioeconómico", "Movilidad y Demografía"), digits = 4)

# Imprimir la tabla
tabla_interactiva

Resultado #3

ANÁLISIS DE LOS INDIVIDUOS

En este caso se empleó un gráfico de individuos para el análisis de componentes principales (PCA), el cual es una herramienta poderosa para identificar patrones y estructuras en un conjunto de datos multivariable. Al observar la distribución de los puntos en el gráfico, es posible identificar agrupamientos o clusters de individuos que comparten características similares. Estos agrupamientos pueden indicar la existencia de subgrupos o categorías dentro de la muestra que podrían ser de interés para un análisis más detallado.

Además de los agrupamientos, el gráfico de individuos también permite detectar la presencia de outliers o valores atípicos. Los outliers son individuos que se encuentran alejados del grupo principal y presentan un comportamiento inusual en relación con las variables consideradas. Estos puntos destacados pueden proporcionar información valiosa sobre casos excepcionales o extremos en el conjunto de datos. Por lo tanto, identificarlos y comprenderlos es importante, ya que pueden influir en los resultados del análisis y proporcionar conocimientos únicos sobre fenómenos poco comunes o excepcionales en el contexto de estudio.

base_datos_indicadores_entreno <- base_datos_indicadores[1:80, ]

res.pca <- prcomp(base_datos_indicadores_entreno, scale = TRUE)

fviz_pca_ind(res.pca,
             col.ind = "cos2",
             gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
             repel = TRUE
) + ggtitle(NULL)

Análisis de los individuos - Componente “Salud y Desarrollo Socioeconómico”

El análisis de individuos a través de las componentes principales “Salud y Desarrollo Socioeconómico” y “Movilidad y Demografía” ha permitido identificar patrones interesantes en relación con los países objeto de estudio. Observando las coordenadas que presenta cada nación en el gráfico de individuos, se puede apreciar que existen diversos agrupamientos por zonas geográficas. Por ejemplo, se puede observar a simple vista que un gran número de países Africanos se encuentran a la izquierda (zona negativa) del gráfico en la componente “Salud y Desarrollo Socioeconómico” presentando una fuerte coloración, lo que nos indica que contribuyen de manera significativa a la formación de esta componente. Esta situación por lo tanto nos indica que este grupo de países presentan valores altos en variables como: Tasa de fertilidad total, tasa de mortalidad para el género femenino y tasa de mortalidad para el género femenino (según lo explicado en apartados anteriores), por lo tanto entre más altos sean los valores obtenidos en estas variables peor serán los resultados en la componente “Salud y Desarrollo Socioeconómico” para esta zona en concreto.

Una situación contraria a la que se presenta a la izquierda de la gráfica (zona positiva), donde se encuentran ubicados un gran número de países europeos los cuales presentan valores altos en variables como: Acceso a la electricidad, esperanza de vida al nacer, acceso a la energía de combustibles fósiles y acceso a la electricidad en áreas rurales. Lo anterior nos indica por tanto que entre más altos sean los valores obtenidos en estas variables mejores serán los resultados en la componente “Salud y Desarrollo Socioeconómico” para esta zona en concreto.

También es importante destacar que en la zona media de la gráfica (oscilando alrededor de 0) se encuentran una cantidad considerable de países Latinoamericanos, presentando una coloración muy clara, lo cual nos indica que no contribuyen de manera significativa a la formación de esta componente.

Análisis de los individuos - Componente “Movilidad y Demografía”

Por otro lado, en la segunda dimensión (relacionada con la movilidad y demografía) se logra identificar una variación interesante, puesto que la India, representada por su coordenada extremadamente negativa, destaca como un punto atípico con un fuerte impacto en el aumento de esta dimensión, lo cual sugiere que la movilidad y demografía en la India pueden diferir significativamente de otros países.

En resumen, el análisis de los individuos en el PCA revela patrones geográficos y socioeconómicos interesantes. Los agrupamientos observados reflejan diferencias regionales en términos de salud y desarrollo socioeconómico, con países africanos rezagados en comparación con los europeos. Además, se destaca la influencia significativa de la India en la dimensión de movilidad y demografía, lo cual puede indicar características distintivas en esos aspectos. Estos hallazgos proporcionan información valiosa para comprender las variaciones entre países y pueden ser útiles para futuros estudios y toma de decisiones.

Contribuciones de los individuos

Analizando las contribuciones generadas por cada país tanto a la componente de “Salud y Desarrollo Socioeconómico” como a la componente de “Movilidad y Demografía”, se puede corroborar lo mencionado previamente acerca de los bloques geográficos conformados. En primer lugar se puede evidenciar que los valores positivos más altos corresponden principalmente a países europeos lo que genera mejores resultados para estos individuos en la componente de “Salud y Desarrollo Socioeconómico”. Por otro lado se ve que los valores negativos más altos pertenecen en su mayoría a países africanos, generando peores resultados para estos individuos en relación con la componente de “Salud y Desarrollo Socioeconómico”. En cuanto a la componente de “Movilidad y Demografía”, se observa como la India es con diferencia el país que más contribuye a esta componente debido a la alta población con la que cuenta (alrededor de 1.300 millones de personas), resaltando también que Irlanda se encuentra en segundo lugar en cuanto a contribución no tanto por su población sino por la gran cantidad de pasajeros transportados de manera aérea que presenta.

# Resultados para Variables
res.ind <- get_pca_ind(res.pca)

# Formatear los valores para mostrar solo 4 decimales
res.ind$coord <- round(res.ind$coord, 4)

# Obtener las contribuciones de las dos primeras dimensiones
contribuciones <- res.ind$coord[, 1:2]

# Cambiar los nombres de las columnas
colnames(contribuciones) <- c("Salud y desarrollo socioeconómico", "Movilidad y Demografía")

# Generar la tabla interactiva con barra deslizante y mostrar solo 4 decimales
tabla_interactiva <- datatable(contribuciones,
                               options = list(scrollY = "300px", paging = FALSE, info = "none", dom = 't')) %>%
  formatStyle(columns = c("Salud y desarrollo socioeconómico", "Movilidad y Demografía"), digits = 4)

# Imprimir la tabla
tabla_interactiva

Calidad de la representación de los individuos

Al examinar la calidad de la representación de los individuos en las componentes de “Salud y Desarrollo Socioeconómico” y “Movilidad y Demografía”, podemos observar algunas tendencias interesantes. Los valores más altos en ambas componentes indican una representación más precisa y significativa de los países en relación con esos aspectos. En la componente de “Salud y Desarrollo Socioeconómico”, encontramos que países como Camerún, Kenya y Madagascar presentan una calidad de representación alta, lo que sugiere que su perfil socioeconómico y de salud es distintivo y bien representado en el análisis. En cuanto a la componente de “Movilidad y Demografía”, se destaca la alta calidad de representación de India, Indonesia y Filipinas. Estos países tienen una gran contribución a esta dimensión debido a su tamaño de población y patrones de movilidad únicos, lo que indica que sus características demográficas y de movilidad son bien reflejadas.

# Resultados para Variables
res.ind <- get_pca_ind(res.pca)

# Formatear los valores para mostrar solo 4 decimales
res.ind$cos2 <- round(res.ind$cos2, 4)

# Obtener las calidad de las dos primeras dimensiones
calidad <- res.ind$cos2[, 1:2]

# Cambiar los nombres de las columnas
colnames(calidad) <- c("Salud y desarrollo socioeconómico", "Movilidad y Demografía")

# Generar la tabla interactiva con barra deslizante y mostrar solo 4 decimales
tabla_interactiva <- datatable(calidad,
                               options = list(scrollY = "300px", paging = FALSE, info = "none", dom = 't')) %>%
  formatStyle(columns = c("Salud y desarrollo socioeconómico", "Movilidad y Demografía"), digits = 4)

# Imprimir la tabla
tabla_interactiva

Resultado #4

REPRESENTACIÓN CONJUNTA DE VARIABLES E INDIVIDUOS

En esta gráfica conjunta de variables e individuos, se pueden corroborar de manera visual las tendencias discutidas en las secciones anteriores correspondientes a la presentación de resultados individuales.

# Generar el gráfico PCA biplot sin título
fviz_pca_biplot(res.pca, repel = TRUE, col.var = "#2E9FDF", col.ind = "#696969") +
  ggtitle(label = NULL)

En primer lugar, podemos observar que los países africanos se encuentran ubicados en un sector del gráfico donde se concentran las variables relacionadas con la tasa de fertilidad y la tasa de mortalidad en ambos sexos. Esto indica que estos países presentan bajos resultados en relación a la componente de “Salud y Desarrollo Socioeconómico”, lo cual puede estar relacionado con desafíos en términos de salud materno-infantil, acceso a servicios de salud y desarrollo socioeconómico.

Por otro lado, en el sector opuesto del gráfico, encontramos las variables relacionadas con la esperanza de vida y el acceso a electricidad y tecnología. En esta zona, se sitúan principalmente países europeos y otras potencias mundiales como Japón, Australia y Canadá. Estos países muestran altos niveles en relación a la componente “Salud y Desarrollo Socioeconómico” y un mayor acceso a servicios de infraestructura y tecnología, lo cual refleja un mejor desarrollo socioeconómico y una mayor calidad de vida en estas naciones.

En cuanto a la componente de “Movilidad y Demografía”, se destacan países como India, Irlanda e Indonesia. India sobresale por su muy elevada densidad poblacional, lo cual indica una gran concentración de personas en su territorio. Irlanda destaca por su elevado número de pasajeros transportados de forma aérea, lo cual puede ser atribuido a su crecimiento económico y su importancia como centro de conexiones internacionales. Indonesia también se destaca por su alta densidad poblacional y su relevancia como destino turístico, lo cual se refleja en el número de pasajeros que llegan al país.

Finalmente se destaca que este gráfico se emplea con el propósito de visualizar de manera clara las diferencias y similitudes entre los países en términos de salud, desarrollo socioeconómico, movilidad y demografía, ya que esta representación visual es una herramienta útil para identificar patrones, tendencias y relaciones en los datos, brindando una visión más completa y comprensible de la situación de cada país.

Resultado #5

PREDICCIÓN DE NUEVOS INDIVIDUOS

Inicialmente la base original, que contenía 106 países, fue dividida en un proporción 75% - 25% con el propósito de predecir el comportamiento de un grupo de países seleccionados de manera aleatoria, donde 80 datos (75%) fueron usados para identificar y analizar el comportamiento que presentan estas naciones en las dos componentes principales objeto de estudio y los restantes 26 (25%) se emplearon para evaluar la capacidad de predicción del modelo. Dicho lo anterior, se re utilizó el gráfico mostrado en el apartado anterior para posicionar los nuevos países ingresados. Cabe destacar que los resultados fueron los esperados dada la estructura que presentan los nuevos datos y los patrones típicos de comportamiento que se han venido presentando anteriormente con respecto a los bloques geográficos conformados por países del mismo continente o los datos extremos evidenciados fruto de su extensa población o su elevado tráfico aéreo.

# Utilizo un conjunto para predecir

base_datos_indicadores_prueba <- base_datos_indicadores[81:106, ]

base_datos_indicadores_prueba.coord <- predict(res.pca, newdata = base_datos_indicadores_prueba)


# Utilizo el gráfico anterior y le anexo los nuevos individuos

p <- fviz_pca_ind(res.pca, repel = TRUE)

fviz_add(p, base_datos_indicadores_prueba.coord, repel = TRUE, color ="#2E9FDF")+
  ggtitle(label = NULL)

Contribución - Nuevos individuos

En este caso, a pesar de que vemos que los ejes se han invertido (ahora los países con altas contribuciones positivas se encuentran a la izquierda de la gráfica y aquellos con contribuciones negativas elevadas se posicionan a la derecha) la tendencia sigue siendo la misma, por ejemplo vemos como países como Uganda, Zambia, Zimbabwe, Tanzania, Senegal, etc. Se ubican en el bloque conformado por otros países africanos situados más a la izquierda de la figura; mientras que naciones como Singapur, Suiza, Reino Unido y Suecia entran a formar parte del conglomerado de países europeos / primermundistas que se encuentran ubicados a la derecha de la gráfica.

La misma situación ocurre cuando observamos, por ejemplo, la componente de “Movilidad y Demografía”, donde a pesar de que los ejes se han vuelto a invertir y la interpretación puede llegar a complicarse, la gráfica ilustra de forma clara el fenómeno ocurrido, el cual corresponde a la aparición de un nuevo punto atípico (con un valor bastante más extremo que el presentado por la India), tratándose este de la aparición de Estados Unidos, el cual presenta el segundo valor más alto en densidad poblacional (sólo por detrás de la india) pero que ocupa el primer puesto, con una amplia diferencia, en tráfico aéreo. La combinación de estas dos variables, por lo tanto, explican su ubicación extrema en la gráfica y su alto grado de contribución a la componente de “Movilidad y Demografía”.

resxs.pca <- prcomp(base_datos_indicadores_prueba, scale = TRUE)

# Resultados para Variables
resxs.ind <- get_pca_ind(resxs.pca)

# Formatear los valores para mostrar solo 4 decimales
resxs.ind$coord <- round(resxs.ind$coord, 4)

# Obtener las contribuciones de las dos primeras dimensiones
contribucionesxs <- resxs.ind$coord[, 1:2]

# Cambiar los nombres de las columnas
colnames(contribucionesxs) <- c("Salud y desarrollo socioeconómico", "Movilidad y Demografía")

# Generar la tabla interactiva con barra deslizante y mostrar solo 4 decimales
tabla_interactiva <- datatable(contribucionesxs,
                               options = list(scrollY = "300px", paging = FALSE, info = "none", dom = 't')) %>%
  formatStyle(columns = c("Salud y desarrollo socioeconómico", "Movilidad y Demografía"), digits = 4)

# Imprimir la tabla
tabla_interactiva

Resultado #6

ANÁLISIS DEL CLUSTERING REALIZADO SOBRE EL CONJUNTO DE DATOS

Finalmente, una vez se tiene la base de datos conformada por los 106 países correspondientes (los 80 iniciales más los 26 agregados en el apartado anterior) continuamos con la creación de los agrupamientos o “clusters” de estas naciones. Resaltando que esta es una técnica de análisis no supervisado que tiene como objetivo identificar patrones y estructuras ocultas en conjuntos de datos mediante la agrupación de objetos o elementos similares en conjuntos llamados clusters, de manera que los objetos, en este caso países, dentro de un mismo clúster sean más similares entre sí en comparación con los objetos pertenecientes a otros conjuntos.

Al aplicar esta técnica, se espera revelar relaciones y similitudes entre los países que podrían no ser evidentes a simple vista, lo que proporciona una base para un análisis más profundo y una comprensión más completa de las características y dinámicas presentes en la muestra de los países proporcionados. Mediante la formación de clusters, se espera obtener una visión más estructurada y diferenciada de los países, lo que puede ser de gran utilidad para la toma de decisiones, la identificación de áreas de desarrollo, la comparación de rendimiento entre grupos de países y otros análisis que busquen comprender las particularidades de cada clúster en relación con el conjunto completo de naciones.

Dendograma de los clusters creados

Al analizar el dendrograma obtenido, se realizó una cuidadosa observación visual en busca de puntos de corte que mostraran una clara división en los enlaces entre los clusters. Durante este proceso, se pudo identificar un corte evidente que dividía el dendrograma en cuatro grupos distintos, esta división se caracteriza principalmente por enlaces más largos y la formación de grupos claramente definidos. Se consideró entonces que esta estructura representa una organización significativa en los datos, por lo que al dividir el conglomerado de individuos en cuatro clusters, se pudo capturar de manera efectiva las diferentes tendencias y patrones presentes en el conjunto de datos, permitiendo un análisis más detallado y una comprensión completa de las características subyacentes en estudio. Por lo tanto, se considera que esta elección se alinea con el objetivo de obtener información relevante y significativa para responder a las preguntas de investigación y tomar decisiones informadas.

Clase 1: Países Subdesarrollados

Para esta clase se obtuvieron varios resultados que nos clarifican la estructura de los países que la conforman. Por ejemplo, el índice de fertilidad (SP.DYN.TFRT.IN) es considerablemente alto, lo que indica una tasa de natalidad elevada en comparación con los países pertenecientes a otras clases. Además, tanto la tasa de mortalidad femenina (SP.DYN.AMRT.FE) como la tasa de mortalidad masculina (SP.DYN.AMRT.MA) son superiores al promedio global, lo que sugiere un mayor riesgo de fallecimiento en comparación con el resto de naciones. Por otro lado, en términos económicos, el crecimiento anual del índice de precios al consumidor (FP.CPI.TOTL.ZG) es superior a la media global, lo que se traduce en una inflación más alta, además la tasa de empleo (SL.EMP.MPYR.ZS) es ligeramente inferior a la general, indicando la existencia de un mercado laboral menos favorable. En cuanto al comercio, la proporción de exportaciones de bienes y servicios (NE.EXP.GNFS.ZS) y el gasto total del gobierno como porcentaje del PIB (GC.XPN.TOTL.GD.ZS) tienen valores negativos, lo que muestra un menor nivel de comercio exterior y un menor gasto del gobierno. Así mismo, el acceso a la electricidad (EG.ELC.ACCS.ZS) y el acceso a la electricidad en zonas rurales (EG.ELC.ACCS.RU.ZS) tienen valores negativos, dando a entender que el acceso a este recurso en este grupo es limitado en comparación con otros países. Finalmente se tiene que la esperanza de vida al nacer (SP.DYN.LE00.IN) también es inferior al promedio global, lo que nos da a entender, en resumen, que esta clase se caracteriza por tener indicadores demográficos y económicos desfavorables en comparación con otros países.

- En conclusión…

La Clase 1 se distingue por presentar un alto índice de fertilidad, tasas de mortalidad superiores a la media global, inflación elevada, una tasa de empleo ligeramente inferior, un menor nivel de comercio exterior y gasto gubernamental, acceso limitado a la electricidad y una esperanza de vida al nacer por debajo del promedio global. Estos indicadores reflejan un panorama demográfico y económico desfavorable en comparación con otros países. Además, los resultados obtenidos a partir de los indicadores que conforman esta clase concuerdan con los países que la integran, ya que como se puede apreciar en el dendograma, este bloque lo integran en su totalidad países pertenecientes al continente africano, que como ya se ha discutido y argumentado en apartados anteriores, presentan resultados desfavorables en este tipo de variables analizadas. Dicho lo anterior esta clase será renombrada como “Países Subdesarrollados”.

Clase 2: Países Desarrollados

En esta clase, se observan valores superiores a la media global en indicadores relacionados con la esperanza de vida, el acceso a servicios y el crecimiento económico. La esperanza de vida al nacer (SP.DYN.LE00.IN) es significativamente mayor que el promedio global, lo que indica una mayor longevidad en comparación con otras clases. Además, el acceso a la electricidad (EG.CFT.ACCS.ZS) y el acceso a la electricidad en zonas rurales (EG.ELC.ACCS.RU.ZS) tienen valores altos, lo que indica un mayor acceso a este recurso en comparación con el resto de países. En términos económicos, el crecimiento anual del índice de precios al consumidor (FP.CPI.TOTL.ZG) es negativo, lo que se traduce en que estos países experimentan una menor inflación. Además, se observa una proporción de exportaciones de bienes y servicios (NE.EXP.GNFS.ZS) mayor que el promedio global, lo que sugiere un mayor nivel de comercio exterior. Finalmente, se destaca el hecho de que el gasto total del gobierno como porcentaje del PIB (GC.XPN.TOTL.GD.ZS) está por encima de la media global, lo que indica un mayor gasto e inversión por parte de los gobiernos de estos países. En resumen, esta clase se caracteriza por tener indicadores positivos en términos de esperanza de vida, acceso a servicios y crecimiento económico en comparación con otros países.

- En conclusión…

la Clase 2 se distingue por presentar una mayor esperanza de vida, un mejor acceso a servicios como la electricidad, una menor inflación, un mayor nivel de comercio exterior y un mayor gasto e inversión gubernamental en comparación con otros países. Estos indicadores reflejan un panorama más favorable en términos de desarrollo humano y económico para los países de esta clase. Además, los resultados obtenidos a partir de los indicadores que conforman esta clase concuerdan con los países que la integran, ya que como se puede apreciar en el dendograma, este bloque lo integran en su gran mayoría países europeos o denominados “primermundistas”, que como ya se ha discutido y argumentado en apartados anteriores, presentan resultados altamente favorables en este tipo de variables analizadas. Dicho lo anterior esta clase será renombrada como “Países Desarrollados”.

Clase 3: Países en Vía de Desarrollo

Los países en esta clase muestran una tasa de inflación de precios al consumidor relativamente baja en comparación con la media global. Además, tienen un alto acceso a la electricidad tanto en términos generales como en áreas rurales, lo que indica un buen nivel de desarrollo en infraestructura eléctrica. Sin embargo, su proporción de exportaciones de bienes y servicios y el gasto gubernamental total como porcentaje del PIB se sitúan por debajo de la media global, lo que sugiere que hay margen para mejorar en términos de comercio exterior y asignación de recursos por parte de los gobiernos.

- En conclusión…

La clase 3 representa países con un desarrollo socioeconómico moderado. Estos países se caracterizan por tener una estabilidad económica, una baja tasa de inflación y un acceso notable a la electricidad. Sin embargo, es importante destacar que aún enfrentan desafíos en áreas como el comercio exterior y el gasto gubernamental. Estas áreas podrían beneficiarse de políticas y estrategias orientadas a impulsar el comercio internacional y fortalecer la inversión y el gasto gubernamental en el desarrollo socioeconómico. Además, los resultados obtenidos a partir de los indicadores que conforman esta clase concuerdan con los países que la integran, ya que como se puede apreciar en el dendograma, este bloque lo integran en su mayoría países Latinoamericanos, de Oceanía y del medio oriente o también denominados “economías emergentes” que como ya se ha discutido y argumentado en apartados anteriores, presentan una combinación de resultados positivos en algunas variables analizadas y negativos en otras. Dicho lo anterior esta clase será renombrada como “Países en Vía de Desarrollo”.

Clase 4: Países con Alta Densidad Poblacional y Actividad Turística

En esta clase, los países se caracterizan por tener una población total significativamente alta en comparación con la media global. Esta densidad poblacional puede ser atribuida a una combinación de factores, como altas tasas de natalidad, migración interna o una combinación de ambos. Además, estos países muestran una alta cantidad de pasajeros de transporte aéreo, lo que indica una mayor actividad en términos de viajes y turismo. El hecho de tener una población numerosa puede generar tanto oportunidades como desafíos para estos países. Por un lado, una gran población puede impulsar el crecimiento económico, la diversidad cultural y la innovación. Sin embargo, también puede poner presión en los recursos disponibles, como vivienda, infraestructura y servicios básicos. La alta demanda y movilidad de personas en estos países sugiere un flujo constante de visitantes y turistas, lo que puede tener un impacto positivo en la economía local a través del turismo, la generación de empleo y el intercambio cultural. Sin embargo, también es necesario gestionar adecuadamente esta afluencia para garantizar una experiencia positiva tanto para los visitantes como para los residentes locales.

- En conclusión…

La clase 4 representa países con una alta densidad de población y una mayor actividad en términos de viajes y turismo. Estos países enfrentan desafíos y oportunidades asociados con su tamaño poblacional, y la gestión adecuada de estos aspectos puede ser clave para su desarrollo sostenible y equitativo. Además, los resultados obtenidos a partir de los indicadores que conforman esta clase concuerdan con los países que la integran, ya que como se puede apreciar en el dendograma, este bloque lo integran solamente dos países, los cuales son India y Estados Unidos, que como ya se ha discutido y argumentado en apartados anteriores, presentan puntos extremos en cuanto a densidad poblacional y tráfico aéreo. Dicho lo anterior esta clase será renombrada como “Países con Alta Densidad Poblacional y Actividad Turística”.

Conclusiones

Después de revisar y analizar los diferentes resultados presentados a lo largo de este documento, se pueden extraer varias conclusiones generales y específicas sobre los datos y los patrones observados:

C.E.

CONCLUSIONES ESPECÍFICAS

Análisis de componentes principales:

Se identificaron dos componentes principales que representan la “Salud y Desarrollo Socioeconómico” y la “Movilidad y Demografía”, donde los países africanos tienden a tener bajos resultados en relación a la primera componente mencionada, mientras que los países europeos y otras potencias mundiales muestran altos niveles en esta área. Por otro lado, India se destaca en la componente de “Movilidad y Demografía” debido a su alta densidad poblacional, mientras que países como Irlanda e Indonesia le siguen la pista dentro de esta componente debido a su tráfico aéreo. Los análisis realizados, por lo tanto, han proporcionado una comprensión profunda de las características y patrones de los países en términos de salud, desarrollo socioeconómico, movilidad y demografía.

Predicción de nuevos individuos:

Los nuevos países ingresados en el análisis se posicionan de manera coherente con las tendencias observadas en el análisis de componentes principales, tanto en la componente de “Salud y Desarrollo Socioeconómico” como en “Movilidad y Demografía”, observándose una clara distinción entre los países africanos y los países europeos / primermundistas en relación a su desarrollo socioeconómico. Además se destaca la presencia de Estados Unidos como un punto atípico en la componente de “Movilidad y Demografía” debido a su alta densidad poblacional y tráfico aéreo.

Agrupamiento de países:

El análisis de clustering reveló la formación de dos grupos distintos en los datos, donde India se separa como un clúster único debido a su gran diferencia en términos de población con respecto a otros países, por lo que se asume que la población total de un país tiene un impacto significativo en la estructura de los datos y en la formación de los clusters. Por lo que esta conclusión resalta la importancia de considerar tanto las variables socioeconómicas como demográficas al analizar y comparar países a nivel mundial.

Además se resalta el hecho de que la representación conjunta de variables e individuos mediante gráficos permitió visualizar de manera clara las diferencias y similitudes entre los países en términos de salud, desarrollo socioeconómico, movilidad y demografía. Esta representación visual resulta una herramienta útil para identificar patrones, tendencias y relaciones en los datos, brindando una visión más completa y comprensible de la situación de cada país.

C.G.

CONCLUSIONES GENERALES

El análisis de componentes principales reveló que los países africanos presentan características y patrones distintivos en términos de salud, desarrollo socioeconómico y movilidad demográfica. Esta agrupación geográfica sugiere desafíos comunes que requieren enfoques específicos para abordar problemas de salud materno-infantil, acceso a servicios de salud y desarrollo socioeconómico en la región. Es necesario implementar políticas y programas adecuados que se ajusten a las necesidades y realidades de estos países.

El modelo de predicción demostró su capacidad para generalizar y predecir el comportamiento de nuevos países con base en los patrones y tendencias observadas en la muestra inicial. Esto implica que los resultados y conclusiones obtenidos pueden ser extrapolados a otros países no incluidos en el estudio original, lo que brinda una herramienta valiosa para analizar y comprender el estado de salud, desarrollo socioeconómico y movilidad demográfica de diversas naciones.

La presencia de Estados Unidos como un punto atípico en la componente de “Movilidad y Demografía” resalta su posición destacada en términos de densidad poblacional y tráfico aéreo. Estos indicadores reflejan el tamaño de su población y su importancia económica, lo cual influye en su singularidad en el análisis. Esto sugiere que Estados Unidos enfrenta desafíos específicos en términos de movilidad y demografía que pueden requerir políticas y estrategias adaptadas a su situación particular.

La estructura de dos clusters identificada en el análisis de agrupamiento indica una clara separación entre los países en términos de desarrollo socioeconómico, salud y movilidad demográfica. Esta separación puede atribuirse a diferencias significativas en factores como el ingreso per cápita, el acceso a servicios de salud y la calidad de vida. Es importante considerar estas disparidades al diseñar políticas y programas que aborden las necesidades y desafíos específicos de cada grupo de países.

La alta contribución de la variable de población total en la estructura de los datos destaca su relevancia en la comprensión de las diferencias y similitudes entre los países. La población es un factor determinante en la dinámica de salud, desarrollo socioeconómico y movilidad demográfica, y su consideración adecuada es crucial para un análisis preciso y contextualizado.

La aplicación de técnicas de visualización, como los gráficos de siluetas y dendrogramas, proporciona una comprensión más clara y efectiva de los patrones y estructuras ocultas en los datos. Estas herramientas permiten identificar y evaluar la calidad de las agrupaciones generadas, lo que facilita la interpretación y extracción de conclusiones significativas para la toma de decisiones informadas.

Referencias bibliográficas

GDP (current US$). (s/f). World Bank Open Data. Recuperado el 1 de junio de 2023, de https://data.worldbank.org/indicator/NY.GDP.MKTP.CD
Food and Agriculture Organization. (1955). International Organization, 9(3), 420–421. https://doi.org/10.1017/s0020818300022980
FAO. (2000). Faostat: FAO Statistical Databases. Food & Agriculture Organization of the United Nations (FAO). https://www.fao.org/faostat/en/
Poverty and inequality platform. (s/f). Worldbank.org. Recuperado el 1 de junio de 2023, de https://pip.worldbank.org/home
EDGAR - the emissions database for global atmospheric research. (s/f). Europa.Eu. Recuperado el 1 de junio de 2023, de http://edgar.jrc.ec.europa.eu/
ILOSTAT data tools to find and download labour statistics. (s/f). ILOSTAT. Recuperado el 1 de junio de 2023, de https://ilostat.ilo.org/data/
(S/f-b). Imf.org. Recuperado el 1 de junio de 2023, de https://data.imf.org/?sk=a0867067-d23c-4ebc-ad23-d3b015045405
(S/f-a). Recuperado el 1 de junio de 2023, de http://(https://www.who.int/data/gho/data/themes/air-pollution/household-air-pollution
Statistics. (s/f). Icao.int. Recuperado el 1 de junio de 2023, de https://www.icao.int/sustainability/Pages/Statistics.aspx
World Bank Group. (2022). Tracking SDG 7 – the Energy Progress Report 2022. World Bank Group.

REPORTE APRENDIZAJE NO SUPERVISADO

Realizado por:

Diego Salcedo - Analista de Datos

2023-06-09

Introducción sobre el contexto

✓ Matriz de correlación de las variables a estudiar:

✓ Infraestructura y servicios básicos:

✓ Aspectos económicos:

✓ Aspectos demográficos:

✓ Aspectos forestales y poblacionales:

✓ Conectividad y evolución económica:

✓ Por lo tanto…

Descripción de las variables

#1

#2

#3

#4

#5

#6

#7

#8

#9

#10

#11

#12

#13

#14

#15

Presentación de la metodología

Resultados principales

Resultado #1

Resultado #2

Resultado #3

Resultado #4

Resultado #5

Resultado #6

Conclusiones

C.E.

C.G.

Referencias bibliográficas

REPORTE APRENDIZAJE NO SUPERVISADO

Realizado por: Diego Salcedo - Analista de Datos

2023-06-09

Introducción sobre el contexto

✓ Matriz de correlación de las variables a estudiar:

✓ Infraestructura y servicios básicos:

✓ Aspectos económicos:

✓ Aspectos demográficos:

✓ Aspectos forestales y poblacionales:

✓ Conectividad y evolución económica:

✓ Por lo tanto…

Descripción de las variables

#1

#2

#3

#4

#5

#6

#7

#8

#9

#10

#11

#12

#13

#14

#15

Presentación de la metodología

Resultados principales

Resultado #1

Resultado #2

Resultado #3

Resultado #4

Resultado #5

Resultado #6

Conclusiones

C.E.

C.G.

Referencias bibliográficas

Realizado por:

Diego Salcedo - Analista de Datos