Durante la ejecución del proyecto se abordaron conceptos asociados a modelos relacionales, ya que se necesitó trabajar los datasets mediante union de bases con el objetivo de generar un archivo total que nos permitiera lanzar gráficos basados en coordenadas. se utilizaron medidas de tendencia central como parte del análisis descriptivo del evolutivo de índice de inequidad, educación e ingreso.
#Libreria a Emplear
library('dplyr')
# Cargue de la Data
income <- read.csv('C://Users//felip//OneDrive//Documentos//Archivos R//Inequality_Income_2010-2019.csv',header = TRUE, sep = ';')
education <- read.csv('C://Users//felip//OneDrive//Documentos//Archivos R//Inequality_Education_2010-2019.csv',header = TRUE, sep = ';')
con <- read.csv('C://Users//felip//OneDrive//Documentos//Archivos R//Info continet.csv',header = TRUE, sep = ';',fileEncoding = "UTF-8-BOM")
map<-read.csv('C://Users//felip//OneDrive//Documentos//Archivos R//map_2022.csv',header = TRUE, sep = ';')
##Preparaticion de la data.
data1<- full_join(income,education, by = c('variable','ISO3'))
datafinal<-full_join(data1,con,by = c('ISO3'='ISO3'))
datafinal<-rename(datafinal,'Indice Income'='value.x' ,'Indice education '='value.y','Año'='variable','Pais'='NAME','Ranking HDI'='HDI.Rank.x')
datafinal<-select(datafinal, c(-'X.x',-'X.y',-'Country.x',-'Country.y',-'HDI.Rank.y'))
datafinal<-arrange(datafinal,datafinal$CON)
### Diagramas :
library('ggplot2')
datafinal %>% filter(CON=="SA")-> SA
library(ggplot2)
windows(height=10,width=25)
par(mfrow=c(2,2))
## cajas y alambres para educacion
ggplot(data = SA) +
aes(x = ISO3, y =`Indice Income` ) +
labs(y = "Indice", x = "Paises")+
scale_y_continuous(name="Indice", limits=c(15,45),breaks=c(15,20,25,30,35,40,45))+
geom_point(size=2.8,aes(color = as.factor(ISO3)),position=position_jitter(width=0.2,height=.2))+
geom_boxplot(aes(alpha=0.01))+ ggtitle('Distribución Indice de Ingresos')+ theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))
los paises que presentan los niveles mas altos de inequidad con bajos niveles de ingreso son Colombia, Brasil, chile, Bolivia y Peru, seguidos por Argentina, Ecuador, Venezuela y uruguay en menor instancia, con un alto nivel de inequidad en ingreso de manera generalizada para toda suramerica. la dispersion de registros con densidad en extremos nos permite evidenciar con facilidad la inequidad en ingreso para los paises suramericanos.
## cajas y alambres para educacion
ggplot(data = SA) +
aes(x = ISO3, y =`Indice education ` ) +
labs(y = "Indice", x = "Paises")+
scale_y_continuous(name="Indice", limits=c(0,35),breaks=c(5,10,15,20,25,30,35))+
geom_point(size=2.8,aes(color = as.factor(ISO3)),position=position_jitter(width=0.2,height=.2))+
geom_boxplot(aes(alpha=0.01))+ ggtitle('Distribución Indice de Educacion')+ theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))
de igual manera con un nivel de similitud relevante, encontramos que los
grupos formados por el grafico anterior presentan un parecido importante
con el indice de educación, donde los paises como Brazil, Bolivia,
Colombia y Peru presentan altos niveles reflejando bajos niveles
educativos, lo cual es fiel a la evidencia donde la educacion es un
movilizador social que catapulta los niveles de produccion y por ende el
ingreso partiendo del incremento en capital humano.
SA %>%
ggplot(aes(x=Año, y=`Indice education `,color=ISO3)) + geom_line(aes(linetype = ISO3))+ geom_point(shape = factor(SA$ISO3))+ scale_x_continuous(breaks = seq(2010,2019,by= 1))+ theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+labs(y = "Indice de inequidad educacion", x = "Años")+ggtitle('Evolutivo Indice inequidad educación en Suramerica')+guides(fill=guide_legend(title="Indice de educacion"))
la evolucion del indice de inequidad en educacion presenta una tendencia
generalizada a disminuir para toda suramerica, presentado un
ralentizamiento a partir del 2018 inclusive crecimiento para algunos
paises manteniendo una tendencia decreciente de manera generalizada
SA %>%
ggplot(aes(x=Año, y=`Indice Income`,color=ISO3)) + geom_line(aes(linetype=ISO3),size =1)+ geom_point()+ scale_x_continuous(breaks = seq(2010,2019,by= 1))+ theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+labs(y = "Indice de inequidad ingresos", x = "Años")+ggtitle('Evolutivo Indice inequidad ingresos en Suramerica')+guides(fill=guide_legend(title="Indice de ingresos"))
la evolucion del indice de inequidad en ingreso presenta una tendencia generalizada a disminuir para toda suramerica, comenzando a revertir la tendencia decreciente a partir de 2019.
dataresumen <- datafinal %>%
group_by(CON)%>%
summarise(media_ingresos=mean(`Indice Income`,na.rm=TRUE),media_educacion=mean(`Indice education `,na.rm=TRUE))
heatmap <- ggplot(dataresumen, aes(x=dataresumen$CON, y=dataresumen$media_educacion, fill=dataresumen$media_educacion))
heatmap <- heatmap + geom_tile()
heatmap <- heatmap + scale_fill_viridis_c(option="magma",limits = c(0,50))+labs(y = "Indice medio", x = "Continentes")+ggtitle('Indice de Inequidad Educación Medio por Continente')+guides(fill=guide_legend(title="Indice de educacion"))
heatmap <- heatmap + theme(axis.text.x = element_text(angle = 90)) +theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))
heatmap
Podemos observar la clara relación de inequidad del continente Africano en comparación con el continente Europeo el cual presenta los mejores niveles de equidad educativa a nivel continental, dentro de la escala ordinal el continente Asiático y el continente Suramericano ostentan altos niveles de inequidad educativa. Por otro lado, podemos observar el grupo que se forma por el continente Asiático y Suramericano que, de acuerdo a los evolutivos de la última década, vienen mejorando exponencialmente en términos de equidad educativa.
heatmap <- ggplot(dataresumen, aes(x=dataresumen$CON, y=dataresumen$media_ingresos, fill=dataresumen$media_ingresos))
heatmap <- heatmap + geom_tile()
heatmap <- heatmap + scale_fill_viridis_c(option="inferno",limits = c(0,50))+labs(y = "Indice medio", x = "Continentes")+ggtitle('Indice de Inequidad Ingresos Medio por Continente')+guides(fill=guide_legend(title="Indice de educacion"))
heatmap <- heatmap + theme(axis.text.x = element_text(angle = 90)) +theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))
heatmap
El índice de inequidad por ingreso presenta una similitud casi
proporcional al indicador de inequidad educativo; nuevamente se
evidencia la sinergia y cointegración de estas variables, donde el
fortalecimiento de esquemas educativos en las distintas naciones genera
un fortalecimiento con igual o mayor fuerza en indicadores de producción
y por ende de ingreso. El gráfico nos presenta nuevamente al continente
Europeo con los mejores estándares de equidad en ingreso, seguido por
los continentes Suramericano y Asiático, finalizando con el continente
Africano.
datatotal<-left_join(data1,map,by = 'ISO3')
datatotal<-rename(datatotal,'Indice Income'='value.x' ,'Indice education '='value.y','Año'='variable','Pais'='Country_Name','Ranking HDI'='HDI.Rank.x')
datatotal<-select(datatotal, c(-'X.x',-'X.y',-'Country.x',-'Country.y',-'HDI.Rank.y'))
datatotal %>% filter(sub.region=="Latin America and the Caribbean")-> Sudamerica
dataresumen2 <- Sudamerica %>%
group_by(ISO3)%>%
summarise(Indice_medio_ingresos=mean(`Indice Income`,na.rm=TRUE),Indice_medio_educacion=mean(`Indice education `,na.rm=TRUE))
mapData<-left_join(dataresumen2,map,by = 'ISO3')
myMap <- ggplot(mapData, aes(x=long, y=lat,group = as.factor(group)))
# add geometry
myMap <- myMap + geom_polygon(aes(fill = Indice_medio_educacion))
# add color palettes
myMap <- myMap + scale_fill_viridis_c(option="City\nCenter")
# add labels
myMap <- myMap + labs(title = "Indice Promedio Inequidad Educacion Suramerica (2010-2019)", caption = "Los territorios en gris no presentan indice", x = "Longitud", y= "Latitud",guide_legend="Indice de educación")
# add margins
myMap <- myMap + theme_bw()+theme(plot.title=element_text(hjust=0.5))
myMap
##INGRESOS
myMap2 <- ggplot(mapData, aes(x=long, y=lat,group = as.factor(group)))
# add geometry
myMap2 <- myMap2 + geom_polygon(aes(fill = Indice_medio_ingresos))
# add color palettes
myMap2 <- myMap2 + scale_fill_viridis_c(option="inferno")
# add labels
myMap2 <- myMap2 + labs(title = "Indice Promedio Inequidad Ingreso Suramerica (2010-2019)", caption = "Los territorios en gris no presentan indice", x = "Longitud", y= "Latitud",guide_legend="Indice de ingresos")
# add margins
myMap2 <- myMap2 + theme_bw()+theme(plot.title=element_text(hjust=0.5))
myMap2
Ahora, haciendo uso de mapas, podemos observar la similitud de los
indicadores de equidad educativa y equidad en ingresos donde por ejemplo
los paises como Chile, Argentina y Brasil son similares para ambos
índices.
## colombia correlacion
SA %>% filter(ISO3=="COL")-> colombia
##ingresos
ggplot(data = colombia, aes(x = colombia$Año, y = colombia$`Indice Income`,col=colombia$`Indice Income`))+
geom_point() +
geom_smooth(method = "lm", col = "cadetblue") +
theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+scale_x_continuous(breaks = seq(2010,2019,by= 1))+labs(y = "Indice de inequidad ingresos", x = "Años")+ggtitle('Relacion Indice inequidad ingresos en colombia')
Hablando para el caso colombiano , La evolución de la última década del
indicador de inequidad en ingreso presentó una tendencia decreciente
realentizándose en los últimos dos años de observación.
##educacion
ggplot(data = colombia, aes(x = colombia$Año, y = colombia$`Indice education `,col=colombia$`Indice education `))+
geom_point() +
geom_smooth(method = "lm", col = "firebrick2") +
theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+scale_x_continuous(breaks = seq(2010,2019,by= 1))+labs(y = "Indice de inequidad educación", x = "Años")+ggtitle('Relacion Indice inequidad educación en colombia')
siguiendo con el caso colombiano y de la misma manera, la evolución de
la última década del indicador de inequidad en educacion presentó una
tendencia decreciente realentizándose en los últimos dos años de
observación.
##educacion vs ingresos
ggplot(data = colombia, aes(x = colombia$`Indice Income`, y = colombia$`Indice education `))+
geom_point() +
geom_smooth(method = "lm", col = "green2") +
theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"),plot.title=element_text(hjust=0.5))+labs(y = "Indice de inequidad Ingresos", x = "Indice de inequidad educación")+ggtitle('Relacion Indice inequidad educación e ingresos en Colombia')
##grafico total de correlaciones
windows(height=10,width=15)
pairs(colombia[,3:5],pch=20,cex=1.5,upper.panel = NULL)
M.cor = cor(colombia[,3:5],method="pearson")
print(M.cor,2)+title(main = "Correlación de las vairables para Colombia",adj = 0.65)
## Año Indice Income Indice education
## Año 1.00 -0.81 -0.76
## Indice Income -0.81 1.00 0.63
## Indice education -0.76 0.63 1.00
## numeric(0)
### tabla de correlacion
p.cor=corrplot::cor.mtest(colombia[3:5])
print(p.cor,3)
## $p
## Año Indice Income Indice education
## Año 0.00000 0.00491 0.0109
## Indice Income 0.00491 0.00000 0.0513
## Indice education 0.01086 0.05131 0.0000
##
## $lowCI
## Año Indice Income Indice education
## Año 1.000 -0.952212 -0.939671
## Indice Income -0.952 1.000000 -0.000792
## Indice education -0.940 -0.000792 1.000000
##
## $uppCI
## Año Indice Income Indice education
## Año 1.000 -0.357 -0.248
## Indice Income -0.357 1.000 0.902
## Indice education -0.248 0.902 1.000
Teniendo en cuenta la similitud entre los indicadores de inequidad de ingreso y educación, revisamos la correlación entre dichas variables encontrando una relación importante del 63%, validando la hipótesis previa discutida en lo corrido del taller.
Durante la ejecución del proyecto abordaron conceptos asociados a modelos relacionales, ya que se necesitó trabajar los datasets mediante uniones con el objetivo de generar un archivo total que nos permitiera lanzar gráficos basados en coordenadas. se utilizaron medidas de tendencia central como parte del análisis descriptivo del evolutivo de índice de inequidad e ingreso y educación, mostrando una clara diferencia entre países del primer mundo y el resto. adicional se logró identificar una tendencia a la baja de estos índices en Suramérica en donde se exploró la relación entre los índices y el tiempo además de la correlación de estos. Se hizo uso de la librería DPLYR para el manejo de la data como recurso para la segmentación y finalmente se utilizó la metodología por capas para el desarrollo de piezas graficas con la librería GGPLOT
```