La desigualdad en varios aspectos sobre todo en el campo económico es un problema que lleva a diferentes consideraciones y por lo tanto puede ser difícil de cuantificar, sin embargo se hace necesario estudiar la forma en que una variable económica se distribuye entre diferentes individuos.
Los índices permiten resumir en una sola cifra un conjunto de magnitudes, y realizar comparaciones entre situaciones distintas basándonos en su nivel de desigualdad.
No existe una única medida que resuma el concepto de desigualdad. Pueden emplearse numerosos índices que, además, conducen a valoraciones diferentes cuando se aplican sobre un mismo conjunto de datos.
Existen numerosos índices para medir la desigualdad pero más utilizados son la curva de Lorenz y los coeficientes de Gini y de Theil, los cuales se describen a continuación.
Curva que relaciona el porcentaje acumulado de una población, con el porcentaje acumulado del ingreso (u otra variable) que posee esa población. Esta curva permite representar graficamente la concentración del ingreso ( u otra variable) de una región en un período determinado.
Puede suponerse que el ingreso (u otra variable) se encuentra distribuido equitativamente entre los miembros de una población cuando a cada uno le corresponde una fracción proporcional del total del ingreso. De esta manera, a un porcentaje de la población debe corresponder el mismo porcentaje del ingreso; así, al 1% de la población debe corresponder el 1% del ingreso; al 10% del ingreso le corresponde el 10% del ingreso, y así sucesivamente.
Si estos porcentajes se representan graficamente se obtiene una recta llamada diagonal de equidistribución.
La diagonal de equidistribución sirve de base de comparación para la forma en que en realidad se distribuye la variable, la cual se puede representar en el mismo gráfico con una curva que se alejará más de la diagonal entre mayor sea la concentración de la variable.
Para construir la curva de Lorenz se comienza por organizar la información de la variable en sentido ascendente, a partir de los individuos que presentan el menor valor de variable; luego, se obtienen las proporciones o porcentajes acumulados de los individuos y sus correspondientes valores acumulados de la variable. Cada par de valores acumulados se ubica como un punto en el gráfico. Al unir los puntos se obtiene la curva de Lorenz.
Se dispone del número de hectareas poseídas (ha) por los propietarios (nu) en una región.
ha<-c(2,4,6,8,10,12,14,16,18,25,46)
nu<-c(80,45,38,28,20,15,10,7,4,2,1)
h<-length(nu)
N<-cumsum(nu)
m<-c(ha*nu)
h<-length(ha)
M<-cumsum(m)
p<-c(N/sum(nu))
q<-c(M/sum(m))
p1<-c(0,p)
q1<-c(0,q)
Se muestran a continuación los cálculos realizados y que son necesarios para la curva de Lorenz.
cbind(ha,nu,N,M,p,q)
## ha nu N M p q
## [1,] 2 80 80 160 0.320 0.1005025
## [2,] 4 45 125 340 0.500 0.2135678
## [3,] 6 38 163 568 0.652 0.3567839
## [4,] 8 28 191 792 0.764 0.4974874
## [5,] 10 20 211 992 0.844 0.6231156
## [6,] 12 15 226 1172 0.904 0.7361809
## [7,] 14 10 236 1312 0.944 0.8241206
## [8,] 16 7 243 1424 0.972 0.8944724
## [9,] 18 4 247 1496 0.988 0.9396985
## [10,] 25 2 249 1546 0.996 0.9711055
## [11,] 46 1 250 1592 1.000 1.0000000
plot(p1,q1,type="l",xlim=c(0,1),lwd=2)
curve(1*x,add=TRUE,lwd=2)
Utilizando el paquete DescTools
library(DescTools)
plot(Lc(ha,nu))
La distancia entre la diagonal de equidistribución y la curva de Lorenz es una indicación del grado de concentración de una variable en una población cualquiera. El índice de Gini se define como el cociente que relaciona el área entre la curva de Lorenz y la diagonal con el área total bajo la diagonal. Es una medida que varía entre 0 y 1. Cuando el índice vale cero existe equidistribución y si su valor es 1, todo el valor de la variable está concentrado en un elemento de la población.
Para calcular el coeficiente de de Gini puede suponerse que el área bajo la curva de Lorenz puede descomponerse en una serie de trapecios, como se observa en el gráfico.
ha<-c(2,4,6,8,10,12,14,16,18,25,46)
nu<-c(80,45,38,28,20,15,10,7,4,2,1)
h<-length(nu)
N<-cumsum(nu);m<-c(ha*nu);h<-length(ha);M<-cumsum(m)
p<-c(N/sum(nu));q<-c(M/sum(m));p1<-c(0,p);q1<-c(0,q)
plot(p1,q1,type="l",xlim=c(0,1),lwd=2)
curve(1*x,add=TRUE,lwd=2)
text(0.2,0,"A");text(0.4,0,"B");text(0.6,0,"C");text(0.8,0,"D");text(0.5,0.4,"X")
text(0.2,0.1,"a");text(0.4,0.2,"b");text(0.6,0.35,"c");text(0.8,0.6,"d");text(0.5,0.1,"Y")
segments(0.2,0,0.2,0.06,lty=2);segments(0.4,0,0.4,0.14,lty=2)
segments(0.6,0,0.6,0.29,lty=2);segments(0.8,0,0.8,0.55,lty=2)
Puesto que el área total bajo la diagonal es 0.5,
\(X+Y = 0.5\)
$ X= 0.5 - Y$ Por lo tanto,
\(G=\dfrac{X}{0.5}=\dfrac{0.5 -Y}{0.5} = 1- 2\cdot Y\)
Pero \(Y\) es el área total de los trapecios del gráfico. Para calcularla se tiene en cuenta que las distancia \(A-a\), \(B-b\cdots\) son las proporciones acumuladas del ingreso (u otra variable) y que las distancia \(0-A\), \(A-B\cdots\) son las proporciones acumuladas de individuos, entonces
\(Y=\displaystyle\sum_{i=1}^{k}\dfrac{q_{i-1}+q_{i}}{2}\cdot (p_{i}-p_{i-1})\)
donde \(q_{i}\) y \(p_{i}\) son las proporciones acumuladas de ingresos (u otra variable) y de individuos, respectivamente.
Por lo tanto el coeficiente de Gini puede obtenerse como:
\[\begin{equation*} G=1- \displaystyle\sum_{i=1}^{k} (q_{i-1}+q_{i})\cdot (p_{i}-p_{i-1}) \end{equation*}\]
porind<-N/sum(nu);porind
## [1] 0.320 0.500 0.652 0.764 0.844 0.904 0.944 0.972 0.988 0.996 1.000
poring<-M/sum(m);poring
## [1] 0.1005025 0.2135678 0.3567839 0.4974874 0.6231156 0.7361809 0.8241206
## [8] 0.8944724 0.9396985 0.9711055 1.0000000
mac<-c()
mac[1]<-poring[1]
for(i in 2:h-1){
mac[i+1]<-poring[i]+poring[i+1]}
nac<-c()
nac[1]<-porind[1]
for(i in 2:h){
nac[i]<-porind[i]-porind[i-1]}
nac
## [1] 0.320 0.180 0.152 0.112 0.080 0.060 0.040 0.028 0.016 0.008 0.004
prod<-mac*nac
Los cálculos necesarios se muestran a continuación.
cbind(ha,nu,p,q,mac,nac)
## ha nu p q mac nac
## [1,] 2 80 0.320 0.1005025 0.1005025 0.320
## [2,] 4 45 0.500 0.2135678 0.3140704 0.180
## [3,] 6 38 0.652 0.3567839 0.5703518 0.152
## [4,] 8 28 0.764 0.4974874 0.8542714 0.112
## [5,] 10 20 0.844 0.6231156 1.1206030 0.080
## [6,] 12 15 0.904 0.7361809 1.3592965 0.060
## [7,] 14 10 0.944 0.8241206 1.5603015 0.040
## [8,] 16 7 0.972 0.8944724 1.7185930 0.028
## [9,] 18 4 0.988 0.9396985 1.8341709 0.016
## [10,] 25 2 0.996 0.9711055 1.9108040 0.008
## [11,] 46 1 1.000 1.0000000 1.9711055 0.004
Gini<-1-sum(prod);Gini
## [1] 0.3946784
Gini(ha,nu,conf.level=0.95,unbiased=FALSE)
## gini lwr.ci upr.ci
## 0.3946784 0.3697265 0.4391220
Es una medida de entropía desarrollado por Henry Theil como una aplicación a la teoría de la información. es una medida que es invariable respecto a la escala de medición y descomposición respecto al ingreso de los individuos de diferentes niveles.
El índice de Theil está dado por:
\[\begin{equation*} T=\displaystyle\sum_{i=1}^{k}y_{i}\cdot ln\left( \frac{y_{i}}{p_{i}}\right) \end{equation*}\]
donde:
\[\begin{equation*} y_{i}=\dfrac{x_{i}n_{i}}{\sum x_{i}{ni}} \end{equation*}\]
Representa la proporción del ingreso total que reparte el \(i-\)ésimo conjunto de tal forma que \(\frac{y_{i}}{p_{i}}\) es el ingreso per cápita que el \(i-\)ésimo conjunto de individuos deflactado por el ingreso per cápita de la población.
Se utilizan los datos anteriores. La tabla muestra los cálculos necesarios para el índice.
total<-c(ha*nu)
parti<-c(total/sum(total))
porce<-c(nu/sum(nu))
pro<-parti*log(parti/porce)
cbind(ha,nu,parti,porce,pro)
## ha nu parti porce pro
## [1,] 2 80 0.10050251 0.320 -0.116395806
## [2,] 4 45 0.11306533 0.180 -0.052574369
## [3,] 6 38 0.14321608 0.152 -0.008525077
## [4,] 8 28 0.14070352 0.112 0.032102365
## [5,] 10 20 0.12562814 0.080 0.056695935
## [6,] 12 15 0.11306533 0.060 0.071640588
## [7,] 14 10 0.08793970 0.040 0.069276422
## [8,] 16 7 0.07035176 0.028 0.064815306
## [9,] 18 4 0.04522613 0.016 0.046993853
## [10,] 25 2 0.03140704 0.008 0.042951959
## [11,] 46 1 0.02889447 0.004 0.057134657
theil<-sum(pro)
theil
## [1] 0.2641158
Utilizando el paquete dineq
library(dineq)
theil.wtd(ha,nu)
## [1] 0.2641158
También llamado índice de Robin Hood, puede definirse como la parte de los ingresos ( u otra variable) totales que tendría que ser distribuida por parte de la mitad que más posee de la población y entregada a la mitad que menos posee para que se presentara igualdad en los ingresos (u otra variable).
Este índice varía entre 0 (distribución perfecta) y 1 (máxima concentración).
Se puede representar graficamente como la mayor distancia vertical entre la curva de Lorenz y la diagonal de equidistribución.
Sean: \(X_{i}\): los ingresos de cada uno de los elementos de la población.
\(Y_{i}\): el número de elementos de la población que tiene cada nivel de ingreso.
\(X_{Total} = \displaystyle \sum X_{i}\)
\(Y_{Total} = \displaystyle \sum Y_{i}\)
El índice de Hoover está dado por
\[\begin{equation*} H=\dfrac{1}{2}\displaystyle \sum \left| \dfrac{X_{i}}{X_{Total}}-\dfrac{Y_{i}}{Y_{Total}} \right| \end{equation*}\]
Se utilizan los datos anteriores.
h1<-ha/sum(ha)
h2<-nu/sum(nu)
h3<-abs(h1-h2)
h4<-sum(h3)
La tabla muestra los cálculos necesarios.
cbind(ha,nu,h1,h2,h3,h4)
## ha nu h1 h2 h3 h4
## [1,] 2 80 0.01242236 0.320 0.30757764 1.315329
## [2,] 4 45 0.02484472 0.180 0.15515528 1.315329
## [3,] 6 38 0.03726708 0.152 0.11473292 1.315329
## [4,] 8 28 0.04968944 0.112 0.06231056 1.315329
## [5,] 10 20 0.06211180 0.080 0.01788820 1.315329
## [6,] 12 15 0.07453416 0.060 0.01453416 1.315329
## [7,] 14 10 0.08695652 0.040 0.04695652 1.315329
## [8,] 16 7 0.09937888 0.028 0.07137888 1.315329
## [9,] 18 4 0.11180124 0.016 0.09580124 1.315329
## [10,] 25 2 0.15527950 0.008 0.14727950 1.315329
## [11,] 46 1 0.28571429 0.004 0.28171429 1.315329
Hoover<-h4/2;Hoover
## [1] 0.6576646
Utilizando el paquete REAT
library(REAT)
hoover(ha,nu)
## [1] 0.6576646
.