#install.packages("tables") #para tabular
library(readxl) #Libreria para abrir archivos en Excel
library(readr)
library(ggplot2) #Graficar en GGPLOT
library(tidyverse) #Para ordenar
library(viridis) #Paleta de Colores
library(stringr) #Separar una columna por "_"
library(tidyr)
library(reshape2)
library(ggdendro)
library(ggimage)
library(factoextra)
library(dplyr)
# Se carga la base de datos completa:
datos <- read_excel("2018_HDI.xlsx")
El desarrollo humano es un proceso mediante el cual se amplían las oportunidades del ser humano. En principio, estas oportunidades pueden ser infinitas y cambiar con el tiempo. Sin embargo, a todos los niveles del desarrollo, las tres más esenciales son disfrutar de una vida prolongada y saludable, adquirir conocimientos y tener acceso a los recursos necesarios para lograr un nivel de vida digno. Si no se poseen estas oportunidades esenciales, muchas otras alternativas continuarán siendo inaccesibles” (Informe del Desarrollo Humano, 1992).
Entre los indicadores utilizados para medir el Desarrollo Humano de los paises, se encuentran el Índice de Desarrollo Humano (IDH) que es un indicador que en su medición contempla 3 aspectos: Esperanza de vida, Educación e Ingresos Per Cápita. Es utilizado para clasificar a los paises en cuanto a su desarrollo humano.
Una de las variaciones del IDH es el Índice de Desarrollo Humano ajustado por la Desigualdad (IHDI), el cual ajusta el IDH según la desigualdad en la distribución de las dimensiones entre la población. El IHDI da cuenta de las desigualdades en las dimensiones del IDH “descontando” el valor promedio de cada dimensión según su nivel de desigualdad.
El siguiente trabajo, analiza el Desarrollo Humano en América del sur a través del (IHDI) y lo relaciona con otros indicadores de Desarrollo Humano que den cuenta del estado de los paises de la región. Está compuesto de cuatro secciones, en la primera, se plantea la pregunta de investigación, en la segunda se presentan las estadísticas de los datos a trabajar, la tercera muestra el análisis de la información apoyado en la visualización de datos y en la última sección se presentan las conclusiones.
El trabajo plantea la siguiente pregunta de investigación para responder.
¿Cómo ha sido el comportamiento del Indice de Desarrollo Humano ajustado por Desigualdad (IHDI) para la región de América del Sur, entre el año 2010 al 2017?
En la tabla que se muestra a continuación, se destaca que la región de la UE presenta el mejor indicador de (IHDI), en contraste, el último es Africa. América del Sur se ubica en la quinta posición con una diferencia de 0,20 de la media del mejor.
#Se toma un conjunto de datos por el indicador de estudio 2010-2017
datosInd<-subset(datos[,c(1:6,27:34)], datos$indicator_name=="Inequality-adjusted HDI (IHDI)")
#Estadísticas descriptivas por región:
Media<-round(tapply(datosInd$`2017`,datosInd$Regiones,mean, na.rm=T),2)
Min<-round(tapply(datosInd$`2017`,datosInd$Regiones,min, na.rm=T),2)
Max<-round(tapply(datosInd$`2017`,datosInd$Regiones,max, na.rm=T),2)
Mediana<-round(tapply(datosInd$`2017`,datosInd$Regiones,median,na.rm=T),2)
Desviacion<-round(tapply(datosInd$`2017`,datosInd$Regiones,sd, na.rm=T),2)
Porc_coef_var<-round((Desviacion/Media)*100,2)
tabla_resumen<-cbind(Media,Mediana,Min,Max,Desviacion,Porc_coef_var)
tabla_resumen[order(tabla_resumen[,"Media"], tabla_resumen[,"Mediana"]),]
## Media Mediana Min Max Desviacion Porc_coef_var
## Africa 0.37 0.35 0.21 0.68 0.10 27.03
## Centro America 0.53 0.52 0.30 0.67 0.12 22.64
## Asia 0.59 0.58 0.31 0.88 0.14 23.73
## Sur America 0.60 0.59 0.51 0.71 0.07 11.67
## Oceania 0.68 0.68 0.50 0.86 0.26 38.24
## Norte America 0.70 0.62 0.61 0.85 0.12 17.14
## Europa 0.73 0.71 0.55 0.88 0.10 13.70
## UE 0.80 0.80 0.71 0.87 0.05 6.25
#Se filtra la base de datos: Por América del Sur y el Índice de Desarrollo Humano ajustado por desigualdad entre 2010-2017
datosAS <- subset (datos[,c(1:6,27:34)], datos$Regiones == "Sur America" & datos$indicator_name=="Inequality-adjusted HDI (IHDI)" )
Los boxplots muestran que la mediana del IHDI ha ido disminuyendo en los últimos 7 años. Además se puede evidenciar que la brecha entre los países analizados también ha disminuido, reflejando una mayor concentración de los datos.
# Sacamos un subset de la base
df<-datosAS[,c(5,7:14)]
# Realizamos el concatenado de los valores con los paises
df_consolidado <-unite(df, '2010', c(1:2), sep = "_", remove = FALSE)
df_consolidado <-unite(df_consolidado, '2011', c(2,3), sep = "_", remove = FALSE)
df_consolidado <-unite(df_consolidado, '2012', c(3,4), sep = "_", remove = FALSE)
df_consolidado <-unite(df_consolidado, '2013', c(4,5), sep = "_", remove = FALSE)
df_consolidado <-unite(df_consolidado, '2014', c(5,6), sep = "_", remove = FALSE)
df_consolidado <-unite(df_consolidado, '2015', c(6,7), sep = "_", remove = FALSE)
df_consolidado <-unite(df_consolidado, '2016', c(7,8), sep = "_", remove = FALSE)
df_consolidado <-unite(df_consolidado, '2017', c(8,9), sep = "_", remove = FALSE)
# Seleccionamos solo las columnas que acabamos de concatenar
df<-df_consolidado[,c(1:8)]
# Trasponemos la base de datos
stacked_df<-stack(df[,c(1:8)])
# Separamos la base por "_"
df <- str_split_fixed(stacked_df$values, "_", n=Inf)
# Convertimos el array en df
df <- as.data.frame(df)
# Le agregamos al data frame los años
df$años <- stacked_df[,c(2)]
# Convertimos la columna de indice en numerico
df$V2 <-as.numeric(df$V2)
names (df)[1] <- "paises"
names (df)[2] <- "Inequality-adjusted HDI (IHDI)"
# Gráfico boxplots
grafica <- ggplot(df, aes(años, `Inequality-adjusted HDI (IHDI)`))
grafica<- grafica + geom_boxplot(fill="#009ACD")+
ggtitle("Evolución histórica de Sur América Mediana del Índice de desarrollo humano ajustado por desigualdad (IHDI)", subtitle = "2010-2017")
grafica<- grafica + geom_point(alpha=0.3)
grafica
Del siguiente gráfico se puede destacar que los países que se han mantenido en los primeros lugares durante el periodo analizado son Chile, Argentina y Uruguay. Por otro lado, aunque Bolivia presenta el (IHDI) más bajo de América del Sur, es el país que más crecimiento ha tenido en los últimos 7 años.
# Gráfico de líneas
ggplot(df, aes(x=años, y=`Inequality-adjusted HDI (IHDI)`, group=paises, colour = paises )) +
geom_line() +
geom_point( size=2, shape=21, fill="white") +
theme_minimal()+
scale_fill_viridis_c(option='magma')+
ggtitle("Evolución del Indice de Desarrollo humano ajustado por desigualdad (IHDI)", subtitle="2010-2017")
Como se observa en el siguiente gráfico, Uruguay, Argentina y Chile presentan el mejor comportamiento de la región, en contraste, Bolivia, Paraguay y Brasil son los que tienen indicadores más bajos.
# Gráfico de barras
ggplot(data=datosAS, aes(x=reorder(country_name,-`2017`), y=`2017`)) +
geom_bar(stat="identity", position="dodge", fill="deepskyblue3",yend=datosAS$`2017`)+
ggtitle("Indice de Desarrollo humano ajustado por desigualdad (IHDI) " ,subtitle = "Año 2017")+
ylab("Índice")+
xlab("País")+
coord_flip()+
geom_text(aes(label=`2017`),
position=position_stack(vjust=0.95), col="white")
La matriz de correlaciones a través del heatmap, permite identificar aquellos indicadores que más están relacionados con el Índice de Desarrollo Humano ajustado (IHDI). Entre los cuales se destacan de forma positiva, los índices de ingresos, el GDP Per Cápita, la esperanza de vida, el índice de educación. Por el contrario, de forma negativa, los índices de desigualdad humana, desigualdad por esperanza de vida, educación, y mortalidad materna.
# Cargamos la base de datos
Base <- read_excel("Base.xlsx")
# Calculamos las correlaciones
Basecor<-cor(Base[,-c(1)])
Basecorr <- melt(data.matrix(Basecor))
# Gráfico heatmap
grafico<-ggplot(Basecorr, aes(Var1, Var2, fill=value))
grafico<-grafico + geom_tile()
grafico<-grafico + theme(axis.text.x=element_text(angle = 90))
grafico<-grafico + scale_fill_distiller(palette="Blues")
grafico<-grafico+xlab("Indicadores")+ylab("Indicadores")
grafico<-grafico+ggtitle("Matríz de correlaciones de los principales indicadores",
subtitle = "Sur América 2017")
grafico
Al agrupar los países por todos los indicadores relacionados con el Desarrollo Humano, se observa que los países que más se relacionan entre sí son, por un lado, Argentina, Uruguay y Chile, los cuales se han destacado por tener los mejores desempeños en los indicadores analizados, y en el otro extremo se encuentran Guyana, Bolivia y Paraguay los cuales han tenido los índicadores más bajos.
# Normalizamos los datos
Basen <- Base
Basen<- scale(Basen[,c(-1)])
Basen<-cbind(Base[,1],Basen)
rownames(Basen) <- Basen$paises
# Calculamos las distancias entre datos
distancias <- dist(Basen)
# Hacemos el agrupamiento jerárquico
clusters <- hclust(distancias)
# Dendrograma
dendrograma <- ggdendrogram (clusters, size=2)
# Gráfico dendrograma
fviz_dend(x = clusters, k = 4, cex = 0.65) +
geom_hline(yintercept = 6, linetype = "dashed") +
labs(title = "Dendrograma de los indicadores de Desarrollo Humano agrupados por país",
subtitle = "América del Sur 2017")
En este gráfico de representación simultánea, podemos observar que las agrupaciones de los países persisten, de igual forma podemos ver que Chile, Uruguay y Argentina se destacan en los índices de educación, desigualdad, GDP per cápita, esperanza de vida, ingresos y desempleo, sobresaliendo nuevamente por tener muy buenos indicadores. Por el contrario, tenemos a Paraguay, Bolivia y Ecuador los cuales presentan altos índices de desigualdad humana, mortalidad materna y desigualdad en la esperanza de vida. El otro grupo que se destaca es Brasil, Colombia y Peru, los cuales tienen desempeños promedios en los indicadores analizados.
# Tomamos la base sin la variable que muestra el nombre de los paises
X=Basen[-c(7,10),-c(1)]
# Realizamos el análisis de componentes principales al que se le pasa la bases de datos X
PCA=prcomp(X,center=TRUE,scale=TRUE)
# Gráfico de representación simultánea de los países y los componentes 1 y 2
fviz_pca_biplot(PCA, axes = c(1,2), repel = T)
Inicialmente se puede observar que la región con mejor desempeño en el índice es la Unión Europea, mientras que Africa es la de menor desempeño, a tal punto que el mejor país de Africa no alcanza a presentar el mismo desempeño del “peor” país de la Unión Europea.
Los países de América del Sur tienen un comportamiento similar, mientras que en regiones como Asia el comportamiento es mas disperso.
La dispersión de Asia refleja que existe una gran diversidad entre los 38 paises que la componen. Entre ellos hay unos que se destacan por tener desempeños similares a los de la Unión Eropea, como es el caso de Japón, y en contraste hay otros con indicadores muy bajos como el Líbano.
Si se compara América del Sur por su mediana, con las demás regiones analizadas, se ubica en el puesto No. 5, después de la UE, Europa, Oceanía y Norte América.# Base de datos por regiones
datosReg <- subset (datos[,c(1:6,34)], datos$indicator_name=="Inequality-adjusted HDI (IHDI)")
# Gráfica de boxplot
grafica <- ggplot(datosReg, aes(x=as.factor(Regiones), y=datosReg$`2017`, group = Regiones))
grafica <- grafica + geom_point(aes(color=as.factor(Regiones)), position=position_jitter(width=0.2,height=.2))
grafica <- grafica + geom_boxplot(aes(alpha=0.2))
grafica <- grafica + scale_color_manual(values = c("#596791" ,"#ca3355", "#acc11d", "#3b5c5d", "#f1e943", "#4146ca", "#e8737b", "#251141"))
grafica <- grafica + labs(title = "Índice de Desarrollo Humano ajustado por la Desigualdad (IHDI) por Regiones", subtitle = "Año 2017") + xlab("Regiones") + ylab("IDHI")
grafica <- grafica + theme(legend.position = "none")
grafica
En el siguiente mapa se puede destacar que los países con mejor IHDI son: Australia, Canada, Alemania, Japón, Noruega, Suecia y los países de la UE. Mientras que países del Africa presentan los mas bajos desempeños del mundo, entre los que se destacan Nigeria y Chad, seguido de Afganistán y Paquistán en Asia.
Por otro lado, se evidencia que países como Colombia, Brasil y China presentan un desempeño promedio en este indicador. Es importante mencionar que el comportamiento del indicador en Asia se puede explicar porque tiene unos países con un alto desempeño, como es el caso de Japón y otros países con bajo desempeño como Líbano.
# Base de datos por el indicador de IHDI
datosInd<-subset(datos[,c(1:6,27:34)], datos$indicator_name=="Inequality-adjusted HDI (IHDI)")
# Filtramos por 2017
IHDI_2017<-subset(datosInd[,c(4,5,14)],na.strings="")
# Cambiamos nombre a la primera columna
colnames(IHDI_2017)[1]<-"Three_Letter"
# Cargamos la base de datos de longitudes y latitudes
globeMap <- read_csv("globeMap.csv")
# Cambiamos nombre a la octava columna
colnames(globeMap)[8]<- "Three_Letter"
# Reordenamos las columnas del dataset
globeMap<-subset(globeMap[,c(8,4,6,10,2,3)])
# Cruzamos las 2 bases de datos por ISO3 de los países
mapData <- left_join(globeMap,IHDI_2017, by = NULL)
# Gráfica del Mapa
myMap <- ggplot(mapData, aes(x=globeMap$long, y=globeMap$lat, group = as.factor(globeMap$group)))
myMap <- myMap + geom_polygon(aes(fill = `2017`))
myMap <- myMap + scale_fill_viridis_c(option="plasma")
myMap <- myMap + labs(title = "Índice de Desarrollo Humano ajustado por la Desigualdad (IHDI)", subtitle = "2017", caption = "No se tiene información de los territorios en color gris", x = "Longitude", y= "Latitude")
myMap <- myMap + theme_bw()
myMap
En primer lugar, se destaca que en el periodo analizado, 2010-2017, América del Sur ha mejorado su desempeño en indicadores de desiguadad, lo cual se puede ver explicado porque los gobiernos han estimulado políticas y mediciones para impulsar el desarrollo humano, tanto a nivel nacional como internacional.
A pesar de esto, cuando hacemos una comparación a nivel internacional, se puede observar que América del Sur ocupa el puesto No.5 debajo de la UE, Europa, Oceanía y Norte América, lo que puede representar oportunidades de mejora para las políticas públicas de los países de América del Sur.
Por otro lado, cuando analizamos los países de América del Sur, se puede concluir que los países con mejor desempeño en indicadores de Desarrollo Humano son Argentina, Chile y Uruguay, mientras que Bolivia presenta un bajo desempeño, no obstante, es el país que presenta mayor crecimiento en el periodo analizado. En constraste con este caso, encontramos a los países de Brasil, Colombia y Ecuador que presentan un desempeño promedio que se ha sostenido durante los últimos 7 años sin presentar mejoras.
Por último, es importante mencionar que al analizar los indicadores de Desarrollo Humano, encontramos altas correlaciones entre los indicadores de desigualdad, educación, ingresos, GDP per capita y esperanza de vida, lo cual nos indica que estos indicadores no se deben analizar individualmente sino en conjunto para mostrar un panorama más amplio del estado del Desarrollo Humano en estos países.