Revisión del índice de desarrollo humano ajustado por desigualdad mundial

Visualización de conjunto de datos de amplio nivel

Estamos utilizando el conjunto de datos del coeficiente de desigualdad humana, que es un subconjunto del gran conjunto de datos del IHDI. Una exploración rápida del conjunto de datos muestra que tiene 1153 puntos de datos (también llamados observaciones) y recopila datos de 8 años (2010-2017). La columna de valor presenta el porcentaje de desigualdad de cada país durante años. Significa que la desigualdad en un país con un porcentaje bajo se distribuye más uniformemente que en uno con un porcentaje más alto. El cero por ciento significa que no hay desigualdad, mientras que el 100% significa la desigualdad total. Como referencia vale la pena echar un vistazo al análisis de la desigualdad de ingresos en Estados Unidos sobre la desigualdad realizado por el think-tank Economic Policy Institute http://inequality.is/.
## 'data.frame':    1153 obs. of  9 variables:
##  $ X             : int  40282 40284 40285 40286 40287 40288 40289 40290 40291 40293 ...
##  $ dimension     : Factor w/ 1 level "Inequality": 1 1 1 1 1 1 1 1 1 1 ...
##  $ indicator_id  : int  135006 135006 135006 135006 135006 135006 135006 135006 135006 135006 ...
##  $ indicator_name: Factor w/ 1 level "Coefficient of human inequality": 1 1 1 1 1 1 1 1 1 1 ...
##  $ iso3          : Factor w/ 164 levels "AFG","AGO","ALB",..: 3 2 4 5 6 7 8 15 13 17 ...
##  $ country_name  : Factor w/ 164 levels "Afghanistan",..: 2 4 5 6 7 8 9 10 11 13 ...
##  $ Continent     : int  4 1 7 3 6 4 3 5 3 4 ...
##  $ year          : Factor w/ 8 levels "X2010","X2011",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ value         : num  12.7 38.8 19 10.9 7.7 7.3 13.4 14 28.3 9.3 ...
En particular, la desigualdad de ingresos a lo largo de 8 años tiene esta distribución:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3.60   11.20   19.90   20.76   30.10   45.90
La desigualdad más baja es del 3,6% y la más alta es del 45,90%. La mediana es 19,9%, lo que significa que la mitad del conjunto de datos tiene un índice de desigualdad superior al 19,9%. Visualicemos eso en un gráfico.

¡No tan mal! La mitad del mundo es una condición aceptable. Pero echar un vistazo al mismo conjunto de datos desglosado por región muestra una situación preocupante. ¡El IHDI también se distribuye por igual!

Los mismos datos trazados en una combinación de diagrama de dispersión y diagrama de caja

Cavar más profundo

Un mapa de calor es una matriz de mosaicos de colores que muestran un valor numérico en cada intersección de dos conjuntos de variables categóricas. Los mapas de calor son simétricos cuando las variables categóricas en las coordenadas xey son las mismas, y la interacción entre las dos lecturas es bidireccional. Significa que la interacción de la variable A sobre B se aplica también de B a A. Si las coordenadas de la matriz son diferentes entre sí, el mapa de calor es asimétrico. Las redes no dirigidas se representan como mapas de calor simétricos, mientras que las redes dirigidas son asimétricas.
La biblioteca que se utilizará es ggplot y la geometría es tile. La idea es crear una cuadrícula con las dos variables categóricas y asignar el relleno de cada mosaico al valor numérico.
La idea es visualizar cada región por separado, por lo que necesitamos subconjuntos del índice de coeficiente por región.

Este gráfico presenta una evolución temporal del IHDI en América del Sur.

Descomposición de estadísticas agregadas

Centrémonos en América del Sur y desagreguemos el coeficiente IHDI. Recuerde que el IHDI es el promedio de los índices de esperanza de vida, educación e ingresos. Necesitamos importar cada conjunto de datos, extraer datos de América del Sur y unirlos en un solo marco de datos.

Vemos claramente que lo que más explica el IDH de América del Sur entre 2010 y 2017 es la desigualdad en los ingresos.

Correlogramas

Ahora intentemos explorar la correlación entre estos índices. Para ello necesitamos calcular la correlación entre estas variables y visualizarla en un mapa de calor personalizado.
## corrplot 0.84 loaded

Visualizando año tras año
Usando un mapa de coropletas podemos comparar la evolución de la desigualdad a nivel mundial
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union