Está publicación es para evidenciar la desigualdad que hay en Colombia frente al aspecto de la distribución de los ingresos en los hogares, estos datos fueron abstraidos de la pagina del DANE - Encuesta Nacional de Presupuestos de los Hogares - ENPH- Julio 2016 - Julio 2017 (http://microdatos.dane.gov.co/index.php/catalog/566/datafile/F27), el item que necesitamos es la columna IT en la cual se encuentran el ingreso total del Hogar censado, a continuación se presentaran los datos
#Librerias necesarias
library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(agricolae)
library(ggplot2)
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
base<- read.csv(file="Viviendas y hogares.csv", #Lectura del archivo abstraido
header = T, #Cada columna cuenta con nombre de la columna
sep=";", #Separar los datos por ;
dec=",") #Instrucción para que los decimales los lea desde la coma
base[1:10,]
## ï..VIVIENDA DIRECTORIO SECUENCIA_ENCUESTA SECUENCIA_P ORDEN
## 1 76892|1413|06|0014|0001 118277 1 1 1
## 2 76892|1413|06|0017|0001 118278 1 1 1
## 3 76892|1413|06|0016|0003 118279 1 1 1
## 4 76892|1413|06|0016|0002 118280 1 1 1
## 5 76109|2132|19|0007|0001 118282 1 1 1
## 6 76109|2106|36|0027|0001 118285 1 1 1
## 7 76109|2106|36|0023|0001 118286 1 1 1
## 8 76892|1257|23|0003|0001 118291 1 1 1
## 9 76892|1257|23|0004|0001 118292 1 1 1
## 10 76892|1257|23|0008|0001 118295 1 1 1
## REGION DOMINIO P3 P5747 P448 P811 P8520S1 P8520S1A1 P8520S2
## 1 PACÃ\215FICA YUMBO 1 1 1 4 1 2 1
## 2 PACÃ\215FICA YUMBO 1 1 1 2 1 2 1
## 3 PACÃ\215FICA YUMBO 1 2 1 4 1 1 1
## 4 PACÃ\215FICA YUMBO 1 2 1 4 1 2 2
## 5 PACÃ\215FICA BUENAVENTURA 1 1 2 2 1 1 2
## 6 PACÃ\215FICA BUENAVENTURA 1 1 2 2 1 1 2
## 7 PACÃ\215FICA BUENAVENTURA 1 1 1 2 1 1 1
## 8 PACÃ\215FICA YUMBO 1 1 1 2 1 1 2
## 9 PACÃ\215FICA YUMBO 1 1 1 2 1 1 2
## 10 PACÃ\215FICA YUMBO 1 1 1 4 1 1 1
## P8520S3 P8520S4 P8520S4A1 P8520S5 P4040 P1647 P5010 P814 P449 P5050
## 1 1 1 3 1 2 5 3 1 1 1
## 2 1 1 3 1 1 4 3 1 1 1
## 3 1 1 3 1 1 3 2 1 1 1
## 4 1 1 3 1 1 1 1 1 1 1
## 5 1 1 3 1 2 3 2 1 1 1
## 6 2 1 3 1 2 4 3 3 1 1
## 7 2 1 3 1 2 3 2 3 1 1
## 8 1 1 3 1 2 2 1 1 1 1
## 9 1 1 3 1 1 1 1 1 1 1
## 10 1 1 3 1 1 3 1 1 1 1
## P5070 P5080 P5160 P5161S1 P5161S1A1 P5161S1A2 P5161S1A3 P5161S1A4
## 1 3 3 2 NA NA NA NA NA
## 2 1 3 2 NA NA NA NA NA
## 3 1 3 2 NA NA NA NA NA
## 4 6 NA 2 NA NA NA NA NA
## 5 1 4 2 NA NA NA NA NA
## 6 1 4 2 NA NA NA NA NA
## 7 1 3 2 NA NA NA NA NA
## 8 1 4 2 NA NA NA NA NA
## 9 2 4 2 NA NA NA NA NA
## 10 1 3 2 NA NA NA NA NA
## P5161S2 P5161S2A1 P5161S2A2 P5161S2A3 P5161S2A4 P5090 P917 P5100S1
## 1 NA NA NA NA NA 3 NA NA
## 2 NA NA NA NA NA 3 NA NA
## 3 NA NA NA NA NA 3 NA NA
## 4 NA NA NA NA NA 1 2 NA
## 5 NA NA NA NA NA 1 2 NA
## 6 NA NA NA NA NA 1 1 NA
## 7 NA NA NA NA NA 3 NA NA
## 8 NA NA NA NA NA 3 NA NA
## 9 NA NA NA NA NA 1 2 NA
## 10 NA NA NA NA NA 1 1 NA
## P5100S2 P5100S3 P5100S4 P5102 P5103 P5105 P1644M1 P1644M2 P1644M3
## 1 NA NA NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA NA NA NA
## 3 NA NA NA NA NA NA NA NA NA
## 4 NA NA NA NA NA NA NA NA NA
## 5 NA NA NA NA NA NA 1 NA NA
## 6 NA NA NA NA NA NA 1 NA NA
## 7 NA NA NA NA NA NA NA NA NA
## 8 NA NA NA NA NA NA NA NA NA
## 9 NA NA NA NA NA NA 1 NA NA
## 10 NA NA NA NA NA NA 1 NA NA
## P1644M4 P1644M5 P1644M6 P1644M7 P1644S1 P1644S3 P1645 P5110 P5140
## 1 NA NA NA NA NA NA NA NA 200000
## 2 NA NA NA NA NA NA NA NA 280000
## 3 NA NA NA NA NA NA NA NA 230000
## 4 NA NA NA 1 NA NA 8.1e+07 230000 NA
## 5 NA NA NA NA NA NA 1.2e+07 100000 NA
## 6 NA NA NA NA NA NA 1.2e+07 120000 NA
## 7 NA NA NA NA NA NA NA NA 200000
## 8 NA NA NA NA NA NA NA NA 200000
## 9 NA NA NA NA NA NA 1.5e+07 250000 NA
## 10 NA NA NA NA NA NA 5.0e+07 300000 NA
## P5240 P5250 P5230 P1646S1 P1646S2 P1646S3 P1646S4 P1646S5 P1646S6
## 1 3 1000000 1 2 1 2 1 1 1
## 2 3 800000 1 2 1 2 2 1 1
## 3 2 1000000 2 2 1 1 1 1 1
## 4 3 2000000 2 2 1 2 2 2 2
## 5 3 2000000 2 2 1 2 1 1 1
## 6 3 900000 2 2 1 2 2 1 1
## 7 3 700000 2 2 1 2 2 1 1
## 8 3 600000 2 2 1 2 2 1 1
## 9 3 1200000 2 2 2 2 2 2 2
## 10 2 1500000 2 2 1 2 1 1 1
## P1646S7 P1646S8 P1646S9 P1646S10 P1646S11 P1646S12 P1646S13 P1646S14
## 1 1 2 1 2 2 2 1 2
## 2 1 2 2 2 2 2 1 2
## 3 1 2 2 2 2 2 1 2
## 4 2 2 2 2 2 2 1 2
## 5 1 2 2 2 2 2 1 2
## 6 1 2 2 2 2 2 2 2
## 7 1 2 2 2 2 2 1 2
## 8 1 2 2 2 2 2 2 2
## 9 1 2 2 2 2 2 2 2
## 10 1 2 2 2 2 2 1 2
## P1646S15 P1646S16 P1646S17 P1646S18 P1646S19 P1646S20 P1646S21 P1646S22
## 1 1 2 2 1 2 2 2 2
## 2 1 2 2 1 2 2 2 2
## 3 1 2 2 2 2 2 2 2
## 4 2 1 2 2 2 2 2 2
## 5 1 2 2 2 2 2 2 2
## 6 1 2 2 2 2 2 2 2
## 7 1 2 2 2 2 2 1 2
## 8 1 2 2 2 2 2 2 2
## 9 1 2 2 2 2 2 2 2
## 10 1 2 2 1 2 2 2 2
## P1646S23 P1646S24 P1646S25 P1646S26 P1646S27 P1646S28 P1646S29 P1646S30
## 1 2 2 2 2 1 2 2 2
## 2 2 2 2 1 1 2 2 2
## 3 2 2 2 2 2 1 2 2
## 4 2 2 2 2 1 2 2 2
## 5 2 2 2 1 1 2 2 2
## 6 2 2 2 2 2 2 2 2
## 7 1 2 2 2 2 2 2 2
## 8 2 2 2 2 2 2 2 2
## 9 2 2 2 2 2 2 2 2
## 10 2 2 1 2 2 2 2 2
## P1646S28A1 P1646S29A1 P6008 NC2R_CC_P5 NC2R_CC_P6 FEX_C PERIODO
## 1 NA NA 5 NA NA 39.36870 201607
## 2 NA NA 7 NA NA 36.74887 201607
## 3 1 NA 3 NA NA 35.60530 201607
## 4 NA NA 1 NA NA 34.72247 201607
## 5 NA NA 4 2 3 142.20647 201607
## 6 NA NA 5 2 3 145.15844 201607
## 7 NA NA 4 2 3 135.33754 201607
## 8 NA NA 2 2 3 31.35814 201607
## 9 NA NA 4 NA NA 32.72859 201607
## 10 NA NA 2 2 3 29.69806 201607
## IT ICGU ICMUG ICMDUG GTUG GCUG GCMUG
## 1 2147916.7 2147916.7 2147916.7 2057372.7 1859959.3 1859959.3 1859959.3
## 2 760000.0 760000.0 760000.0 760000.0 1059740.0 1059740.0 1059740.0
## 3 1945000.0 1945000.0 1945000.0 1945000.0 1237871.3 1237871.3 1237871.3
## 4 930000.0 930000.0 700000.0 660000.0 768300.0 768300.0 538300.0
## 5 1632500.0 1632500.0 1370000.0 1300000.0 767437.3 767437.3 664937.3
## 6 1931666.7 1931666.7 1711666.7 1646666.7 926578.7 926578.7 795662.0
## 7 1155900.0 1155900.0 1070900.0 1043340.0 1226269.3 1226269.3 1202102.7
## 8 600000.0 600000.0 600000.0 600000.0 806959.0 806959.0 806959.0
## 9 673333.3 673333.3 411666.7 411666.7 494200.7 494200.7 244200.7
## 10 2100000.0 2100000.0 1800000.0 1680000.0 684463.3 684463.3 384463.3
Fuente: DANE - http://microdatos.dane.gov.co/index.php/catalog/566/datafile/F27
Una vez cargada la base de datos se procede a realizar una normalización y tratamiento para poder manejarlos estadisticamente.
#Tratamiento y normalización de la base
base <- select(base, ï..VIVIENDA, IT) #Seleccionamos solo los datos que necesitamos
names(base) <- c("Vivienda", "Ingresos") #Cambia nombres de las columnas para un mejor tratamiento
range(base$Ingresos) #Muestra el rando de la columna ingresos
## [1] 0 290250000
options("scipen"=150, "digits"=22) #Mostrar datos sin notación cientifica
tbFreqIngresos=table.freq(hist(base$Ingresos,
plot=FALSE,
breaks = "scott")) #Crea una tabla de #frecuencia con intervalos dados por el metodo de Scott
tbFreqIngresos <- arrange(tbFreqIngresos, Main) #Organiza de menor a mayor la Columna Main
sum(tbFreqIngresos$Frequency)
## [1] 87201
tbFreqIngresos$FrecuenciaRelativa<- tbFreqIngresos$Frequency/87201 #Comprobando frecuencia relativa con la tabla realizada
tbFreqIngresos$FrecuenciaRelativaAcumulada<- cumsum(tbFreqIngresos$FrecuenciaRelativa) #Creación de columna con la frecuenia relativa acumulada
tbFreqIngresos$LineaRecta<- seq(0,1,length=1452) #Crear Línea recta perfecta
tbFreqIngresos [c(1:10, 1450:1452),] #Vista de los datos
## Lower Upper Main Frequency Percentage CF
## 1 0 200000 100000 2568 2.8999999999999999 2568
## 2 200000 400000 300000 3887 4.5000000000000000 6455
## 3 400000 600000 500000 5401 6.2000000000000002 11856
## 4 600000 800000 700000 6847 7.9000000000000004 18703
## 5 800000 1000000 900000 7743 8.9000000000000004 26446
## 6 1000000 1200000 1100000 7260 8.3000000000000007 33706
## 7 1200000 1400000 1300000 6258 7.2000000000000002 39964
## 8 1400000 1600000 1500000 5608 6.4000000000000004 45572
## 9 1600000 1800000 1700000 5004 5.7000000000000002 50576
## 10 1800000 2000000 1900000 4495 5.2000000000000002 55071
## 1450 289800000 290000000 289900000 0 0.0000000000000000 87200
## 1451 290000000 290200000 290100000 0 0.0000000000000000 87200
## 1452 290200000 290400000 290300000 1 0.0000000000000000 87201
## CPF FrecuenciaRelativa
## 1 2.8999999999999999 0.029449203564179311093
## 2 7.4000000000000004 0.044575176890173276445
## 3 13.5999999999999996 0.061937363103634131278
## 4 21.3999999999999986 0.078519741746080895517
## 5 30.3000000000000007 0.088794853270031309789
## 6 38.7000000000000028 0.083255925964151780705
## 7 45.7999999999999972 0.071765232050091165572
## 8 52.2999999999999972 0.064311189091868212198
## 9 58.0000000000000000 0.057384663019919499027
## 10 63.2000000000000028 0.051547573995711061523
## 1450 100.0000000000000000 0.000000000000000000000
## 1451 100.0000000000000000 0.000000000000000000000
## 1452 100.0000000000000000 0.000011467758397266086
## FrecuenciaRelativaAcumulada LineaRecta
## 1 0.029449203564179311 0.00000000000000000000
## 2 0.074024380454352584 0.00068917987594762232
## 3 0.135961743557986708 0.00137835975189524464
## 4 0.214481485304067604 0.00206753962784286685
## 5 0.303276338574098914 0.00275671950379048928
## 6 0.386532264538250681 0.00344589937973811171
## 7 0.458297496588341846 0.00413507925568573371
## 8 0.522608685680210128 0.00482425913163335614
## 9 0.579993348700129530 0.00551343900758097857
## 10 0.631540922695840612 0.00620261888352860100
## 1450 0.999988532241602779 0.99862164024810473606
## 1451 0.999988532241602779 0.99931082012405236803
## 1452 1.000000000000000000 1.00000000000000000000
Una vez realizados los ajustes estadisticos, se procede a realizar la grafica de la curva de Lorenz para tener una referencia visual de la distribución de los ingresos en Colombia.
#Realización de grafica de la curva de Lorenz
curvaLorenz<- select(tbFreqIngresos, Main, FrecuenciaRelativaAcumulada)
#Anotación en grafica
a <- list(
x = 0.5,
y = 50000000,
text = "Ginni: 0,517 - DANE 2016?",
xref = "x",
yref = "y",
showarrow = TRUE,
arrowhead = 7,
ax = 20,
ay = -20
)
plot_ly(data = curvaLorenz,
x = ~FrecuenciaRelativaAcumulada,
y = ~Main,
name = 'Curva de Lorenz',
type = "scatter")%>%
layout(title = "Curva de Lorenz",
xaxis = list(title = "Porcentaje de hogares"),
yaxis = list (title = "Ingresos"))%>%
layout(annotations = a)%>%
add_trace(x = ~tbFreqIngresos$LineaRecta, name = 'Linea perfecta', mode = 'lines', col="blue")
## No scatter mode specifed:
## Setting the mode to markers
## Read more about this attribute -> https://plot.ly/r/reference/#scatter-mode
## Warning: 'scatter' objects don't have these attributes: 'col'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'text', 'hovertext', 'mode', 'hoveron', 'line', 'connectgaps', 'cliponaxis', 'fill', 'fillcolor', 'marker', 'selected', 'unselected', 'textposition', 'textfont', 'r', 't', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'hovertextsrc', 'textpositionsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'
Por ultimo el DANE da una referencia del coeficiente de Ginni de 0.517 en el 2016 que es una medida de concentración del ingreso entre los hogares, su calculo se realiza midiendo el area bajo la curva de la línea perfecta en este caso y se le resta el area bajo la curva de la Curva de Lorenz.
Indicadores Financieros de otros países
Fuente: Fundación Ramón Areces Madrid - https://www.google.com/url?sa=i&source=images&cd=&cad=rja&uact=8&ved=2ahUKEwiXrtXfvKzgAhWw1lkKHSf2B8IQjRx6BAgBEAU&url=https%3A%2F%2Fslideplayer.es%2Fslide%2F3164237%2F&psig=AOvVaw0JhkiR2wDdiGYwjboeaalX&ust=1549726905589592
La imagen anterior nos muestra la distribución de los ingresos en diferenctes países para tener una comparación con la Cirva de Lorenz de Colombia