Equidad Vs Ingreso - Ejemplo de relacion en el contexto Suramericano”

Durante la ejecución del proyecto se abordaron conceptos asociados a modelos relacionales, ya que se necesitó trabajar los datasets mediante union de bases con el objetivo de generar un archivo total que nos permitiera lanzar gráficos basados en coordenadas. se utilizaron medidas de tendencia central como parte del análisis descriptivo del evolutivo de índice de inequidad, educación e ingreso.

#Libreria a Emplear

library('dplyr')

# Cargue de la Data

income <- read.csv('C://Users//felip//OneDrive//Documentos//Archivos R//Inequality_Income_2010-2019.csv',header = TRUE, sep = ';')

education <- read.csv('C://Users//felip//OneDrive//Documentos//Archivos R//Inequality_Education_2010-2019.csv',header = TRUE, sep = ';')

con <- read.csv('C://Users//felip//OneDrive//Documentos//Archivos R//Info continet.csv',header = TRUE, sep = ';',fileEncoding = "UTF-8-BOM")

map<-read.csv('C://Users//felip//OneDrive//Documentos//Archivos R//map_2022.csv',header = TRUE, sep = ';')


##Preparaticion de la data.

data1<- full_join(income,education, by = c('variable','ISO3'))

datafinal<-full_join(data1,con,by = c('ISO3'='ISO3'))

datafinal<-rename(datafinal,'Indice Income'='value.x' ,'Indice education '='value.y','Año'='variable','Pais'='NAME','Ranking HDI'='HDI.Rank.x')
datafinal<-select(datafinal, c(-'X.x',-'X.y',-'Country.x',-'Country.y',-'HDI.Rank.y'))
datafinal<-arrange(datafinal,datafinal$CON)


### Diagramas :

library('ggplot2')

datafinal %>%  filter(CON=="SA")-> SA

boxplot por indice de ingresos por paises de suramerica

library(ggplot2)

windows(height=10,width=25)

par(mfrow=c(2,2))

## cajas y alambres para educacion
ggplot(data = SA) +
  aes(x = ISO3, y =`Indice Income` ) +
  labs(y = "Indice", x = "Paises")+
  scale_y_continuous(name="Indice", limits=c(15,45),breaks=c(15,20,25,30,35,40,45))+
  geom_point(size=2.8,aes(color = as.factor(ISO3)),position=position_jitter(width=0.2,height=.2))+
  geom_boxplot(aes(alpha=0.01))+ ggtitle('Distribución Indice de Ingresos')+  theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))

los paises que presentan los niveles mas altos de inequidad con bajos niveles de ingreso son Colombia, Brasil, chile, Bolivia y Peru, seguidos por Argentina, Ecuador, Venezuela y uruguay en menor instancia, con un alto nivel de inequidad en ingreso de manera generalizada para toda suramerica. la dispersion de registros con densidad en extremos nos permite evidenciar con facilidad la inequidad en ingreso para los paises suramericanos.

## cajas y alambres para educacion
  
  ggplot(data = SA) +
    aes(x = ISO3, y =`Indice education ` ) +
    labs(y = "Indice", x = "Paises")+
    scale_y_continuous(name="Indice", limits=c(0,35),breaks=c(5,10,15,20,25,30,35))+
    geom_point(size=2.8,aes(color = as.factor(ISO3)),position=position_jitter(width=0.2,height=.2))+
    geom_boxplot(aes(alpha=0.01))+ ggtitle('Distribución Indice de Educacion')+  theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))

de igual manera con un nivel de similitud relevante, encontramos que los grupos formados por el grafico anterior presentan un parecido importante con el indice de educación, donde los paises como Brazil, Bolivia, Colombia y Peru presentan altos niveles reflejando bajos niveles educativos, lo cual es fiel a la evidencia donde la educacion es un movilizador social que catapulta los niveles de produccion y por ende el ingreso partiendo del incremento en capital humano.

Distribucion Indice de educacíon por año

SA %>%
  ggplot(aes(x=Año, y=`Indice education `,color=ISO3))  + geom_line(aes(linetype = ISO3))+ geom_point(shape = factor(SA$ISO3))+ scale_x_continuous(breaks = seq(2010,2019,by= 1))+ theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+labs(y = "Indice de inequidad educacion", x = "Años")+ggtitle('Evolutivo Indice inequidad educación en Suramerica')+guides(fill=guide_legend(title="Indice de educacion"))

la evolucion del indice de inequidad en educacion presenta una tendencia generalizada a disminuir para toda suramerica, presentado un ralentizamiento a partir del 2018 inclusive crecimiento para algunos paises manteniendo una tendencia decreciente de manera generalizada

Distribucion Indice de inequidad por ingreso por año

SA %>%
  ggplot(aes(x=Año, y=`Indice Income`,color=ISO3))  + geom_line(aes(linetype=ISO3),size =1)+ geom_point()+ scale_x_continuous(breaks = seq(2010,2019,by= 1))+ theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+labs(y = "Indice de inequidad ingresos", x = "Años")+ggtitle('Evolutivo Indice inequidad ingresos en Suramerica')+guides(fill=guide_legend(title="Indice de ingresos"))

la evolucion del indice de inequidad en ingreso presenta una tendencia generalizada a disminuir para toda suramerica, comenzando a revertir la tendencia decreciente a partir de 2019.

INDICE PROMEDIO POR CONTINENTE EDUCACION

dataresumen <- datafinal %>%
  group_by(CON)%>%
  summarise(media_ingresos=mean(`Indice Income`,na.rm=TRUE),media_educacion=mean(`Indice education `,na.rm=TRUE))


heatmap <- ggplot(dataresumen, aes(x=dataresumen$CON, y=dataresumen$media_educacion, fill=dataresumen$media_educacion)) 
heatmap <- heatmap + geom_tile()
heatmap <- heatmap + scale_fill_viridis_c(option="magma",limits = c(0,50))+labs(y = "Indice medio", x = "Continentes")+ggtitle('Indice de Inequidad Educación Medio por Continente')+guides(fill=guide_legend(title="Indice de educacion"))
heatmap <- heatmap + theme(axis.text.x = element_text(angle = 90)) +theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))
heatmap 

Podemos observar la clara relación de inequidad del continente Africano en comparación con el continente Europeo el cual presenta los mejores niveles de equidad educativa a nivel continental, dentro de la escala ordinal el continente Asiático y el continente Suramericano ostentan altos niveles de inequidad educativa. Por otro lado, podemos observar el grupo que se forma por el continente Asiático y Suramericano que, de acuerdo a los evolutivos de la última década, vienen mejorando exponencialmente en términos de equidad educativa.

Indice Promedio por continente Ingresos.

heatmap <- ggplot(dataresumen, aes(x=dataresumen$CON, y=dataresumen$media_ingresos, fill=dataresumen$media_ingresos)) 
heatmap <- heatmap + geom_tile()
heatmap <- heatmap + scale_fill_viridis_c(option="inferno",limits = c(0,50))+labs(y = "Indice medio", x = "Continentes")+ggtitle('Indice de Inequidad Ingresos Medio por Continente')+guides(fill=guide_legend(title="Indice de educacion"))
heatmap <- heatmap + theme(axis.text.x = element_text(angle = 90)) +theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))
heatmap 

El índice de inequidad por ingreso presenta una similitud casi proporcional al indicador de inequidad educativo; nuevamente se evidencia la sinergia y cointegración de estas variables, donde el fortalecimiento de esquemas educativos en las distintas naciones genera un fortalecimiento con igual o mayor fuerza en indicadores de producción y por ende de ingreso. El gráfico nos presenta nuevamente al continente Europeo con los mejores estándares de equidad en ingreso, seguido por los continentes Suramericano y Asiático, finalizando con el continente Africano.

MAPA DE SUDAMERICA PROMEDIO INGRESOS

datatotal<-left_join(data1,map,by = 'ISO3')
datatotal<-rename(datatotal,'Indice Income'='value.x' ,'Indice education '='value.y','Año'='variable','Pais'='Country_Name','Ranking HDI'='HDI.Rank.x')
datatotal<-select(datatotal, c(-'X.x',-'X.y',-'Country.x',-'Country.y',-'HDI.Rank.y'))


datatotal %>%  filter(sub.region=="Latin America and the Caribbean")-> Sudamerica



dataresumen2 <- Sudamerica %>%
  group_by(ISO3)%>%
  summarise(Indice_medio_ingresos=mean(`Indice Income`,na.rm=TRUE),Indice_medio_educacion=mean(`Indice education `,na.rm=TRUE))



mapData<-left_join(dataresumen2,map,by = 'ISO3')

MAPA EDUCACION

myMap <- ggplot(mapData, aes(x=long, y=lat,group = as.factor(group)))
# add geometry
myMap <- myMap + geom_polygon(aes(fill = Indice_medio_educacion))
# add color palettes
myMap <- myMap + scale_fill_viridis_c(option="City\nCenter")
# add labels
myMap <- myMap + labs(title = "Indice Promedio Inequidad Educacion Suramerica (2010-2019)", caption = "Los territorios en gris no presentan indice", x = "Longitud", y= "Latitud",guide_legend="Indice de educación")
# add margins
myMap <- myMap + theme_bw()+theme(plot.title=element_text(hjust=0.5))
myMap

##INGRESOS

myMap2 <- ggplot(mapData, aes(x=long, y=lat,group = as.factor(group)))
# add geometry
myMap2 <- myMap2 + geom_polygon(aes(fill = Indice_medio_ingresos))
# add color palettes
myMap2 <- myMap2 + scale_fill_viridis_c(option="inferno")
# add labels
myMap2 <- myMap2 + labs(title = "Indice Promedio Inequidad Ingreso Suramerica (2010-2019)", caption = "Los territorios en gris no presentan indice", x = "Longitud", y= "Latitud",guide_legend="Indice de ingresos")
# add margins
myMap2 <- myMap2 + theme_bw()+theme(plot.title=element_text(hjust=0.5))
myMap2

Ahora, haciendo uso de mapas, podemos observar la similitud de los indicadores de equidad educativa y equidad en ingresos donde por ejemplo los paises como Chile, Argentina y Brasil son similares para ambos índices.

## colombia  correlacion

SA %>%  filter(ISO3=="COL")-> colombia

##ingresos

ggplot(data = colombia, aes(x = colombia$Año, y = colombia$`Indice Income`,col=colombia$`Indice Income`))+
  geom_point() +
  geom_smooth(method = "lm", col = "cadetblue") +
   theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+scale_x_continuous(breaks = seq(2010,2019,by= 1))+labs(y = "Indice de inequidad ingresos", x = "Años")+ggtitle('Relacion Indice inequidad ingresos en colombia')

Hablando para el caso colombiano , La evolución de la última década del indicador de inequidad en ingreso presentó una tendencia decreciente realentizándose en los últimos dos años de observación.

##educacion

ggplot(data = colombia, aes(x = colombia$Año, y = colombia$`Indice education `,col=colombia$`Indice education `))+
  geom_point() +
  geom_smooth(method = "lm", col = "firebrick2") +
 theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+scale_x_continuous(breaks = seq(2010,2019,by= 1))+labs(y = "Indice de inequidad educación", x = "Años")+ggtitle('Relacion Indice inequidad educación en colombia')

siguiendo con el caso colombiano y de la misma manera, la evolución de la última década del indicador de inequidad en educacion presentó una tendencia decreciente realentizándose en los últimos dos años de observación.

##educacion vs ingresos

ggplot(data = colombia, aes(x = colombia$`Indice Income`, y = colombia$`Indice education `))+
  geom_point() +
  geom_smooth(method = "lm", col = "green2") +
  theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+labs(y = "Indice de inequidad Ingresos", x = "Indice de inequidad educación")+ggtitle('Relacion Indice inequidad educación e ingresos en Colombia')

##grafico total de correlaciones

windows(height=10,width=15)
pairs(colombia[,3:5],pch=20,cex=1.5,upper.panel = NULL)
M.cor = cor(colombia[,3:5],method="pearson")
print(M.cor,2)+title(main = "Correlación de las vairables para Colombia",adj = 0.65)

##                     Año Indice Income Indice education 
## Año                1.00         -0.81             -0.76
## Indice Income     -0.81          1.00              0.63
## Indice education  -0.76          0.63              1.00
## numeric(0)
### tabla de correlacion

p.cor=corrplot::cor.mtest(colombia[3:5])
print(p.cor,3)
## $p
##                       Año Indice Income Indice education 
## Año               0.00000       0.00491            0.0109
## Indice Income     0.00491       0.00000            0.0513
## Indice education  0.01086       0.05131            0.0000
## 
## $lowCI
##                      Año Indice Income Indice education 
## Año                1.000     -0.952212         -0.939671
## Indice Income     -0.952      1.000000         -0.000792
## Indice education  -0.940     -0.000792          1.000000
## 
## $uppCI
##                      Año Indice Income Indice education 
## Año                1.000        -0.357            -0.248
## Indice Income     -0.357         1.000             0.902
## Indice education  -0.248         0.902             1.000

Conclusión

Teniendo en cuenta la similitud entre los indicadores de inequidad de ingreso y educación, revisamos la correlación entre dichas variables encontrando una relación importante del 63%, validando la hipótesis previa discutida en lo corrido del taller.

Durante la ejecución del proyecto abordaron conceptos asociados a modelos relacionales, ya que se necesitó trabajar los datasets mediante uniones con el objetivo de generar un archivo total que nos permitiera lanzar gráficos basados en coordenadas. se utilizaron medidas de tendencia central como parte del análisis descriptivo del evolutivo de índice de inequidad e ingreso y educación, mostrando una clara diferencia entre países del primer mundo y el resto. adicional se logró identificar una tendencia a la baja de estos índices en Suramérica en donde se exploró la relación entre los índices y el tiempo además de la correlación de estos. Se hizo uso de la librería DPLYR para el manejo de la data como recurso para la segmentación y finalmente se utilizó la metodología por capas para el desarrollo de piezas graficas con la librería GGPLOT

```