Este documento proporciona códigos en R para la lectura de datos del Indice de Gini internacional, así como la depuración de datos, el análisis de escalas, pruebas y estudio de su comportamiento evolutivo.
La fuente de datos es ourworldindata.org, por ello, el script está diseñado para leer los datos actualizados de dicha página web.
El índice de Gini es un coeficiente medido por país, que determina el nivel de repartición de los ingresos y recursos. Es medido entre 0 y 1, y se dice que a menor valor, más equidad, a más valor, más inequidad en la asignación de recursos, es uno de los indicadores más comunes para medir dicho factor (Hasell, 2023).
Se eliminan los datos faltantes y se filtra la base quitando datos inferiores a 1985, por ser tan distantes.
# Lectura de datos de la página web
df <- read.csv("https://ourworldindata.org/grapher/economic-inequality-gini-index.csv?v=1&csvType=full&useColumnShortNames=true")
attach(df)
View(df)
# Fetch the metadata
#metadata <- fromJSON("https://ourworldindata.org/grapher/economic-inequality-gini-index.metadata.json?v=1&csvType=full&useColumnShortNames=true")
Los indicadores de Gini varían mucho entre regiones, en su mediana y media.
La media del indicador de Gini es alta en especial en la región de Sur América, también Africa y Norte América, lo que muestra inequidad en la repartición de ingresos y recursos, a diferencia de Europa, donde siempre se muestra un indicador muy bajo, lo que muestra más equidad en la repartición de los ingresos y recursos.
Luego de la lectura y depuración de la base de datos eliminando los datos faltantes, se estiman las estadísticas básicas para el índice de Gini general y por regiones.
basicStats(gini3)
## gini3
## nobs 2193.000000
## NAs 0.000000
## Minimum 0.201873
## Maximum 0.710505
## 1. Quartile 0.309059
## 3. Quartile 0.423716
## Mean 0.373320
## Median 0.352967
## Sum 818.691742
## SE Mean 0.001860
## LCL Mean 0.369674
## UCL Mean 0.376967
## Variance 0.007584
## Stdev 0.087083
## Skewness 0.769303
## Kurtosis -0.064436
matridata=cbind(basicStats(gini3),
tapply(gini3,nueva2$owid_region,basicStats))
round(matridata,2)
## gini3 Africa Asia Europe North America Oceania South America
## nobs 2193.00 267.00 460.00 922.00 287.00 37.00 220.00
## NAs 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## Minimum 0.20 0.28 0.25 0.20 0.30 0.25 0.39
## Maximum 0.71 0.71 0.49 0.57 0.60 0.46 0.63
## 1. Quartile 0.31 0.37 0.31 0.28 0.40 0.33 0.45
## 3. Quartile 0.42 0.46 0.39 0.34 0.51 0.39 0.54
## Mean 0.37 0.43 0.35 0.31 0.46 0.36 0.50
## Median 0.35 0.41 0.35 0.31 0.47 0.35 0.50
## Sum 818.69 113.60 162.33 289.31 130.68 13.27 109.50
## SE Mean 0.00 0.00 0.00 0.00 0.00 0.01 0.00
## LCL Mean 0.37 0.42 0.35 0.31 0.45 0.34 0.49
## UCL Mean 0.38 0.44 0.36 0.32 0.46 0.37 0.51
## Variance 0.01 0.01 0.00 0.00 0.01 0.00 0.00
## Stdev 0.09 0.08 0.05 0.04 0.07 0.05 0.06
## Skewness 0.77 0.79 0.23 0.49 -0.28 0.04 -0.01
## Kurtosis -0.06 0.36 -0.60 1.06 -0.84 -0.09 -1.03
Si bien no son altos los índices de Asimetría, la prueba de normalidad de Shapiro Wilks da no normalidad en la mayoría de las regiones, excepto Oceanía. Al tener pocos datos el test de distribución normal de Shapiro Wilk es el recomendado, lo que generaliza que este indicador no presenta una distribución normal por la existencia de valores atípicos, o países con muy grandes valores de Inequidad, alejados de la media.
tapply(gini3,owid_region2,shapiro.test)
## $Africa
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.95464, p-value = 2.164e-07
##
##
## $Asia
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.9861, p-value = 0.0002201
##
##
## $Europe
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.97947, p-value = 4.179e-10
##
##
## $`North America`
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.9659, p-value = 2.644e-06
##
##
## $Oceania
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.97736, p-value = 0.6396
##
##
## $`South America`
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.96861, p-value = 8.433e-05
Es claro que las muestras de datos cuentan con valores atípicos que desvían los valores de varianza en datos más altos, razón por la cual se filtra la base de datos, y se muestra el diagrama de cajas y bigotes por año.
Especialmente, se observa mayor inequidad en las regiones de Sur América y Africa, en especial la media y medianas prevalecen mayores que los de Europa, y si se mide anualmente, dicho indicador también muestra así, siendo Asia y Europa donde prevalecen valores inferiores, indicando que es en dichas regiones donde hay menores indicadores de Gini, traduciéndolo en una mayor equidad en la repartición o asignación de recursos.
Al separar los indicadores para cada año, es posible realizar, por ejemplo, diagramas de caja por región para cada año y así analizar un grado de evolución o detrimendo de dicho indicador.
Para ello se usará la instrucción for, así es posible ejecutar una base de datos diferente cada año y realizar el gráfico del índice de Gini por región.
YEAR2=nueva2$year
table(YEAR2)
## YEAR2
## 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
## 16 17 25 15 20 22 22 38 32 27 42 37 32 39 38 48
## 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
## 39 56 57 70 75 77 70 74 79 83 79 85 76 82 86 82
## 2017 2018 2019 2020 2021 2022 2023 2024 2025
## 78 93 78 70 80 71 55 24 4
for(i in 2015:2024){
iden=which(year==i)
boxplot(gini3[iden]~owid_region2[iden], col = "bisque", ylab='Indice de Gini',xlab=c('Region en año:',i),cex.axis=0.5)
mn.t <- tapply(gini3[iden],owid_region2[iden],mean)
sd.t <- tapply(gini3[iden],owid_region2[iden],sd)
points(mn.t, col = "red", pch = 18)
}
year2=year[-quitar]
Es evidente que hay una diferencia en los comportamientos del índice de Gini de una región a otra, en especial entre 2015 y 2024, ya que es claro que hay altos valores de este en algunas regiones, como en Sur América, África, Norte América, en comparación con otras bajas como Europa, en estos la media y mediana más altas las tienen las regiones de América. Específicamente Sur América y Norte América presentan media y mediana más altas que Europa y Asia, pero Africa no parece muy diferente de América. Esto indica que el análisis no puede generalizarse, sino especificarse por región, sin embargo, lo que es más claro es que los países europeos tienen menores índices de mediana y media de inequidad en todo el periodo evaluado, incluso, en años más recientes, la mediana de Gini de Asia es muy baja, comparada con las demás regiones.
Hasell, Joe. (2023) - “Measuring inequality: what is the Gini coefficient?” Published online at OurWorldinData.org. Retrieved from: ‘https://archive.ourworldindata.org/20260519-173011/what-is-the-gini-coefficient.html’ [Online Resource] (archived on May 19, 2026).
Ourworldindata.org. (2026).Income inequality: Gini coefficient, 2025. https://ourworldindata.org/what-is-the-gini-coefficient