La inequidad se define como una desigualdad considerada injusta. El Índice de Desarrollo Humano (IDH), informado por las Naciones Unidas, está medido por tres elementos directamente vinculados al bienestar material y las capacidades de consumo familiar. Estos elementos son el nivel de educación, nivel de ingresos y la esperanza de vida. El conjunto de datos análizado pertenece al coeficiente de desigualdad humana a nivel grupal y segregado por cada uno de los elementos anteriormente mencionado. A través del análisis descriptivo de los datos se busca responder el siguiente interrogante:

¿cómo se ubica Colombia, de acuerdo al inidce de inequidad y sus tres dimensiones (educación, ingreso y esperanza de vida), en comparación a los demás paises de lationamerica y la región Caribe?

ggplot(map_2022, aes(x = long, y = lat, group = group)) +
  geom_polygon(aes(fill=map_2022$sub.region=="Latin America and the Caribbean"),show.legend=F)+
  scale_fill_manual(values = c("#d9d4d4","#580699"))+
  labs(title = "Latin America and the Caribbean", caption = "Empty territories have no index. Source Uknown", x = "Longitude", y= "Latitude")+ theme_bw()

America Latina y la Región Caribe se han caracterizado por sus altos niveles de desigualdad y bajo crecimiento económico. Estos paises han sido fuertemente golpeados a través de los años por diferentes formas de volencia: politica, criminal y social, factores que restrigen el cierre de la brecha de la desigualdad. Tras un conflico de más de 50 años, Colombia no es agena a esta desigualdad en America, la concentración del poder y la riqueza han dejado zonas rurales altamente desprotgidas. Se observa que Argentiva y Brasil se mantiene con los indices menores de inequidad.

#summary(coefhumaninequality2010_2019)
str(coefhumaninequality2010_2019)
## 'data.frame':    1670 obs. of  6 variables:
##  $ X       : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ HDI.Rank: int  169 69 91 148 46 81 8 18 88 58 ...
##  $ Country : chr  "Afghanistan" "Albania" "Algeria" "Angola" ...
##  $ ISO3    : chr  "AFG" "ALB" "DZA" "AGO" ...
##  $ variable: int  2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 ...
##  $ value   : num  NA 12.7 NA 38.8 19 10.9 7.7 7.3 13.4 14 ...

##Visualización general de los datos.

Cada uno de los dataseet esta compuesto por seis veriables, la primera varible es un inidice que indica la secuncia de los datos pero no es objeto de uso para análisis, la segunda variable indica el ranking de acuerdo al coeficiente, la tercera variable el nombre del pais, la cuarta muestra el nombre del pais agrupado, la quita indicado el año al que pertenece el dato y por útimo, la variable “value” indica el coeficiente expresado en porcentaje de desigualdad de cada país a lo largo de los años. Significa que la desigualdad en un país con bajo porcentaje se distribuye más uniformemente que en uno con un porcentaje más alto.

En tototal se utilizan cuatro datasetsse para el desarrollo del presente análisis, se pueden encontrar en el siguiente vinculo:datasets available.EL primer dataset corresponde al indice de inequidad humano, y los tres siguientes corresponde a cada una de los elementos que componente este indice (educación, espectativa de vida e ingresos).

Según el conjunto de datos, los promedios del coeficiente de inequidad humana, en la sub región de Amerca Latina y el Caribe, en los años 2017,2018 y 2019 fueron del 19.10%, 19.72% y 19% respectivamente.

A conuación se representa gráficamente los paises que estuvieron por encima de los promedios anteriormente mencionados, en donde Colombia no alcazó el puntaje en este periodo.

Diviciones <- left_join(coefhumaninequality2010_2019, distinct(map_2022[,c(-1,-2,-3,-4,-5,-6,-7)]), by="ISO3",)
DivicionesLatcarb<-subset(Diviciones,Diviciones$sub.region=="Latin America and the Caribbean")
DivicionesLatcarb<-subset(DivicionesLatcarb,DivicionesLatcarb$value< 20)
DivicionesLatcarb<-subset(DivicionesLatcarb,DivicionesLatcarb$variable>=2017)
DivicionesLatcarb$X<-c(1:33)
row.names(DivicionesLatcarb)<-DivicionesLatcarb$X


Labelmodf = paste(DivicionesLatcarb$ISO3, DivicionesLatcarb$value , sep = " - ")
empty_bar <- 6
to_add <- data.frame( matrix(NA, empty_bar*nlevels(DivicionesLatcarb$variable), ncol(DivicionesLatcarb)) )
colnames(to_add) <- colnames(DivicionesLatcarb)
to_add$variable <- rep(levels(DivicionesLatcarb$variable), each=empty_bar)
DivicionesLatcarb <- rbind(DivicionesLatcarb, to_add)
DivicionesLatcarb <- DivicionesLatcarb %>% arrange(variable,value)
DivicionesLatcarb$X <- seq(1, nrow(DivicionesLatcarb))

label_data <- DivicionesLatcarb
number_of_bar <- nrow(label_data)
angle <-  90 - 360 * (label_data$X-0.5) /number_of_bar     

label_data$hjust<-ifelse( angle < -90, 1, 0)

label_data$angle<-ifelse(angle < -90, angle+180, angle)

p <- ggplot(DivicionesLatcarb, aes(x=as.factor(X), y=value, fill=variable )) +       
  
  geom_bar(stat="identity", alpha= 0.5) +
  
  ylim(-20,80) +
  
  
  theme_minimal() +
  theme(
    axis.text = element_blank(),
    axis.title = element_blank(),
    panel.grid = element_blank(),
    plot.margin = unit(rep(-1,4), "cm")    
  ) +
  
  coord_polar(start = 0) + 


geom_text(data=label_data, aes(x=X, y=value, label=Labelmodf , hjust=hjust), color="black", fontface="bold",alpha=0.8, size=3.5, angle= label_data$angle, inherit.aes = FALSE ) 

p

Se evidencian paises como Argentina, Barbados,Chile y Costa Rica, entre los primeros luegares, con coeficientes de inequidad humanda por debajo del promedio general de America Latina y Caribe.

La gráfica siguiente, muestra los paises que estuvieron por debajo del promedio general.

Se evidencia Haití en el primer lugar, duplicando los coeficientes de los demás paises, Guatemala,Honduras,Suriname, Bolivia, se ubican en los paises de mayores indices por encima del promedio general, dentro de entre grupo, se ubica Colombia.

DivicionesLatcarb1<-subset(Diviciones,Diviciones$sub.region=="Latin America and the Caribbean")
DivicionesLatcarb1<-subset(DivicionesLatcarb1,DivicionesLatcarb1$value>=20)
DivicionesLatcarb1<-subset(DivicionesLatcarb1,DivicionesLatcarb1$variable>=2017)
DivicionesLatcarb1$X<-c(1:42)
row.names(DivicionesLatcarb1)<-DivicionesLatcarb1$X

empty_bar1 <- 3
to_add1 <- data.frame( matrix(NA, empty_bar1*nlevels(DivicionesLatcarb1$variable), ncol(DivicionesLatcarb1)) )
colnames(to_add1) <- colnames(DivicionesLatcarb1)
to_add1$variable <- rep(levels(DivicionesLatcarb1$variable), each=empty_bar1)
DivicionesLatcarb1 <- rbind(DivicionesLatcarb1, to_add1)
DivicionesLatcarb1 <- DivicionesLatcarb1 %>% arrange(variable,value)
DivicionesLatcarb1$X <- seq(1, nrow(DivicionesLatcarb1))



label_data1 <- DivicionesLatcarb1

number_of_bar1 <- nrow(label_data1)
angle1 <-  90 - 360 * (label_data1$X-0.5) /number_of_bar1     
label_data1$hjust<-ifelse( angle1 < -90, 1, 0)
label_data1$angle1<-ifelse(angle1 < -90, angle1+180, angle1)
Labelmodf = paste(DivicionesLatcarb1$ISO3, DivicionesLatcarb1$value , "  " ,sep = " ")
p_ <- ggplot(DivicionesLatcarb1, aes(x=as.factor(X), y=value, fill=variable )) +       geom_bar(stat="identity", alpha= 0.7) +
  ylim(-75,160) +
  
  theme_minimal() +
  theme(
    axis.text = element_blank(),
    axis.title = element_blank(),
    panel.grid = element_blank(),
    plot.margin = unit(rep(-1,4), "cm")     
  ) +
 
  coord_polar(start = 0) + 
  geom_text(data=label_data1, aes(x=X, y=value, label=Labelmodf, hjust=hjust), color="black", fontface="bold",alpha=0.6, size=2.2, angle= label_data1$angle1, inherit.aes = FALSE ) 
p_

A través del mapa de calor, se identifica visualmente el indice de inequidad humnada en una escala de color.

Latcarb<-subset(map_2022,map_2022$sub.region=="Latin America and the Caribbean")
latCabmapa <- left_join(Latcarb,coefhumaninequality2010_2019, by="ISO3",)
latCabmapa2019 <- subset(latCabmapa,latCabmapa$variable==2019)

latcabmap19 <- ggplot(latCabmapa2019, aes(x=long, y=lat, group = as.factor(group)))

latcabmap19 <-latcabmap19 + geom_polygon(aes(fill = value))


latcabmap19 <- latcabmap19 + scale_fill_viridis_c(option="turbo")


latcabmap19 <- latcabmap19 + labs(title = "Mapa de calor-Inequidad humana en America Latina y el Caribe para el 2019", caption = "Grey territories have no index. Source UN", x = "Longitude", y= "Latitude")

latcabmap19 <- latcabmap19 + theme_bw()

latcabmap19

Se analiza a continuación el comportamiento para los inidices de enducación, esperanza de vida e ingresos.

coefhumaninequality2010_20191<- read.csv2("C:\\Users\\betancury\\OneDrive - AptarGroup, Inc\\Documents\\Maestria\\Visialización de datos\\Proyecto Final\\Inequality_Education\\Coefficient_of_human_inequality_2010-2019.csv")

Inequality_Education1<- read.csv2("C:\\Users\\betancury\\OneDrive - AptarGroup, Inc\\Documents\\Maestria\\Visialización de datos\\Proyecto Final\\Inequality_Education\\Inequality_Education_2010-2019.csv")

Inequality_Income1<- read.csv2("C:\\Users\\betancury\\OneDrive - AptarGroup, Inc\\Documents\\Maestria\\Visialización de datos\\Proyecto Final\\Inequality_Education\\Inequality_Income_2010-2019.csv")

Inequality_life_Expectancy1<- read.csv2("C:\\Users\\betancury\\OneDrive - AptarGroup, Inc\\Documents\\Maestria\\Visialización de datos\\Proyecto Final\\Inequality_Education\\Inequality_life_Expectancy_2010-2019.csv")





coefhumaninequality2010_20191<-left_join(coefhumaninequality2010_20191,distinct(map_2022[,c(-1,-2,-3,-4,-5,-6,-7)]),by='ISO3')
#IH_2019<-subset(coefhumaninequality2010_2019, sub.region=="Latin America and the Caribbean")

Inequality_Education1<-left_join(Inequality_Education1,distinct(map_2022[,c(-1,-2,-3,-4,-5,-6,-7)]),by='ISO3')
IE_2019_2<-subset(Inequality_Education1,sub.region=="Latin America and the Caribbean")

Inequality_Income1<-left_join(Inequality_Income1,distinct(map_2022[,c(-1,-2,-3,-4,-5,-6,-7)]),by='ISO3')
II_2019_2<-subset(Inequality_Income1, sub.region=="Latin America and the Caribbean")

Inequality_life_Expectancy1<-left_join(Inequality_life_Expectancy1,distinct(map_2022[,c(-1,-2,-3,-4,-5,-6,-7)]),by='ISO3')
ILE_2019_2<-subset(Inequality_life_Expectancy1,sub.region=="Latin America and the Caribbean")

IE_2019_2$name <- "Education"
II_2019_2$name <- "Income"
ILE_2019_2$name <- "Life Expectancy"


# ∫ind all the datasets
IH_aggregated <- IE_2019_2
IH_aggregated <- rbind(IH_aggregated,II_2019_2)
IH_aggregated <- rbind(IH_aggregated,ILE_2019_2)
overallDist <- ggplot(IH_aggregated,aes(x=value, fill=name))
overallDist <- overallDist + geom_histogram(aes(y=..density..), binwidth=.5,alpha=0)
overallDist <- overallDist + geom_density(aes(x=value, fill=name),alpha=.2,)
#overallDist <- overallDist + geom_vline (aes ( xintercept = 21, color = 'red'))
overallDist <- overallDist + geom_text (x=29, y=0.18, label="Coeficientes de inequidad humanda en America Latina \n y Región Caribe 2010-2019",size=5)
overallDist 

Se observa que la inequidad en el ingreso es la variable que representa mayor porcentaje en nivel de los tres elemento que conforman el indice de inequidad en america latima y la región Caribe.

A continuación se analiza canda una de estas variables para el año 2019.

Coeficiente de inequidad en Educación

Inequality_Education<- read.csv2("C:\\Users\\betancury\\OneDrive - AptarGroup, Inc\\Documents\\Maestria\\Visialización de datos\\Proyecto Final\\Inequality_Education\\Inequality_Education_2010-2019.csv")



Inequality_Education<-left_join(Inequality_Education,distinct(map_2022[,c(-1,-2,-3,-4,-5,-6,-7)]),by='ISO3')
IE_2019<-subset(Inequality_Education,variable=="2019" & sub.region=="Latin America and the Caribbean")

IE_2019 <-IE_2019 %>% arrange(value)

p1 <- ggplot(IE_2019, aes(x=ISO3, y=value, fill=ISO3)) + geom_bar(stat="identity", alpha= 0.6)+theme(axis.text.x = element_text(angle = 90))
p1

Haití se ubica en el más bajo nivel de educación con respecto a los demas paise de latinomaerica y la región Caribe, seguido se encuentran Guatemala, El Salvador y Nicaragua. Se observa que Colombia tiene un coeficiente del 19%, situandose cerca de paises como Suriname y Bolivia. Entre los paises de menor desigualdad en cuando al indice de enducación se encuentra Brasil, Argentina y Jamaica.

IE <- scale(IE_2019[,c(2,6)], center=FALSE)
rownames(IE)<-IE_2019$Country
IE<-na.omit(IE)
distancias <- dist(IE)
clusters<-(hclust(distancias))
grafica<-ggdendrogram(clusters, size=3)+labs(title="Ranking HDI - Inequidad en Educación para Lationamerica y Región Caribe")
grafica

El dendograma de acuerdo a los datos del coeficiente de educación, nos muestra el nivel de similitud que tienen cada uno de los países. Se observa que Colombia tiene una relación cercana con México, Perú, Ecuador y Saint Lucia. Argentina, por ejemplo, se encuntra en un mismo grupo con Cuba, Barbados, Bahamas y Urugay.

Coeficiente de inequidad en Ingresos

Inequality_Income<- read.csv2("C:\\Users\\betancury\\OneDrive - AptarGroup, Inc\\Documents\\Maestria\\Visialización de datos\\Proyecto Final\\Inequality_Education\\Inequality_Income_2010-2019.csv")


#Revisión de acuerdo al inidice de ingresos para el año 2019.

Inequality_Income<-left_join(Inequality_Income,distinct(map_2022[,c(-1,-2,-3,-4,-5,-6,-7)]),by='ISO3')
II_2019<-subset(Inequality_Income,variable=="2019" & sub.region=="Latin America and the Caribbean")


II_2019 <-II_2019 %>% arrange(value)
p2 <- ggplot(II_2019, aes(x=ISO3, y=value, fill=ISO3)) + geom_bar(stat="identity", alpha= 0.6)+theme(axis.text.x = element_text(angle = 90))
p2

De acuerdo al coeficiente de ingresos, se observa que la mayoria de paises tienen indices bajos de inequidad en cuanto a ingresos, viauslamente hay una mayor concentraciones de barras altas, a diferencia del indice de enducación.

La puntuación para colombia fue del 36%, cerca de Costa Rica y Guatemala.

Se evidencia que Brasil es un pais que tiene una alto indice de desigualdad en cuando a nivel de ingreso pero es uno de lo más bajos en inequidad a nivel educativo. Es una muestra de que las variables no son necesariamente dependientes.

#Dendograma para indice ingresos

II<- scale(II_2019[,c(2,6)], center=FALSE)
rownames(II)<-II_2019$Country
II<-na.omit(II)
distancias <- dist(II)
clusters<-(hclust(distancias))
grafica2<-ggdendrogram(clusters, size=3)+labs(title="Ranking HDI - Inequidad en Ingresos para Lationamerica y Región Caribe")
grafica2

Según el coefieciente de ingresos, Colombia continua situada en un mismo grupo que México y tiene similitud con paises como Perú, Santa Lucia, Republica Dominicada y Ecuador. Brasil hace grupo con Suriname, ambos tiene muy altos coeficientes de inequidad en ingresos económico.

Coeficiente de inequidad en Expectactiva de vida

Inequality_life_Expectancy<- read.csv2("C:\\Users\\betancury\\OneDrive - AptarGroup, Inc\\Documents\\Maestria\\Visialización de datos\\Proyecto Final\\Inequality_Education\\Inequality_life_Expectancy_2010-2019.csv")

#Revisión de acuerdo al inidice de Expectativa de vida. 

Inequality_life_Expectancy<-left_join(Inequality_life_Expectancy,distinct(map_2022[,c(-1,-2,-3,-4,-5,-6,-7)]),by='ISO3')
ILE_2019<-subset(Inequality_life_Expectancy,variable=="2019" & sub.region=="Latin America and the Caribbean")
ILE_2019 <-ILE_2019 %>% arrange(value)
p3 <- ggplot(ILE_2019, aes(x=ISO3, y=value, fill=ISO3)) + geom_bar(stat="identity", alpha= 0.6)+theme(axis.text.x = element_text(angle = 90))
p3

En cuanto a espectavida de vida, entre los más altos coeficientes de inequidad se encuntra Haití, Bolivia, Guayana, venezuela y Republica Dominicana. En los más bajos se encuentra Cuba y Chile.

#Dendograma para indice Expectativa de vida

ILE<- scale(ILE_2019[,c(2,6)], center=FALSE)
rownames(ILE)<-ILE_2019$Country
ILE<-na.omit(ILE)
distancias <- dist(ILE)
clusters<-(hclust(distancias))
grafica3<-ggdendrogram(clusters, size=3)+labs(title="Ranking HDI - Inequidad en Expectativa de Vida para Lationamerica y Región Caribe")
grafica3

Colombia hace grupo con Brasil, es decir, tiene alta simulidud en cuanto al coeficiente de inequidad en expectativa de vida y se situa cerca de paises como Santa Luica y Ecuador.

Conclusión:

El coeficiente de inequidad humana, no está condicionado, necesariamente, por el coeficiente de los tres valores que lo representan, es decir, un pais con un bajo nivel de inequidad en educación puede representan altos niveles de inequidad en ingreso. En America Latina y la región Caribe la mayoria de sus paises tiene altos niveles de inequidad humana y audando en sus tres elementos, los mayores noveles de inequidad se encuentran en la variable de ingresos. Colombia tiene altos niveles de inequidad en sus tres elementos pero en comporación a la región anaílizada se encuentra en un rago medio, sus indicadores tienen un comportamiento similar al de los paises como México, Perú.