Análisis propios de los ingresos de la Casen

por comunas y regiones

VE-CC-AJ

DataIntelligence
date: 15-08-2021

1 Introducción

1 Información de las Casen:
http://observatorio.ministeriodesarrollosocial.gob.cl/encuesta-casen-2011

2 En difícil encontar datos oficiales que entreguen información de los ingresos a nivel de persona por comunas en la Casen, porque es de hogares, lo que sociológicamente tiene sentido. La sociedad se comporta como órganos individuales funcionando dentro de los hogares. La enfermedad, como así mismo la caída del ingreso de un integrante de la familia los afecta a todos. Pensemos en la etnia, el sexo, edad, etc.

3 Fue un error haber eliminado outliers de las distribuciones de ingresos pues los resultados obtenidos de esta manera los hacen incomparables con cualquier otro tipo de análisis que no siga la misma metodologia. Casen no excluye outliers.

1.1 Cuatro fuentes de datos (las dos últimas las mismas, pero dupicadas)

Logramos obtener tres fuentes de datos:

Uno a nivel comunal en la Región Metropolitana y tres a nivel Regional:

  1. Ingreso autónomo percápita del hogar, CASEN 2011 ($ de noviembre de 2011) de la pagina 16 de aquí.

  2. Ingreso autónomo promedio e ingreso monetario promedio del hogar a nivel regional el 2015:

https://www.bcn.cl/portal/noticias?id=principales-resultados-sobre-pobreza-e-ingresos-regionales-encuesta-casen-2015

Por dos instrumentos diferentes oficiales llegamos a los mismos resultados y son a los cuales intentamos aproximarnos.

  1. Una es por una tabla extensa obtenida de (ver aquí)

  1. Y la otra con una página interactiva con datos por región (ver aquí)


1.2 Los ingresos

Recordemos los cuatro datos cuantitativos fundamentales de la generación de los ingresos:

Tipo Ingreso total Ingreso autónomo Ingreso del trabajo Ingreso de la ocupación principal
año
2020 ytotcor yautcor ytrabajocor yoprcor
2017 ytotcor yautcor ytrabajocor yoprcor
2015 ytotcor yautcor ytrabajocor yoprcor
2013 ytotcor yautcor ytrabajocor yoprcor
2011 ytrabaj yautaj ytrabaj yopraj
2009 ytrabaj yautaj ytrabaj yopraj
2006 ytrabaj yautaj ytrabaj yopraj

2 El ingreso autónomo per cápita del hogar

2.1 Ingreso autónomo percápita del hogar, CASEN 2011 ($ de noviembre de 2011)

Ingreso autónomo per cápita del hogar, promedio de los hogares es el Valor correspondiente a la suma de los ingresos autónomos per cápita de todos los hogares, dividido por el total de hogares.

El ingreso autónomo se define como todos los pagos que recibe el hogar, provenientes tanto del trabajo como de la propiedad de los activos. Estos incluyen sueldos y salarios (monetarios y en especies), ganancias provenientes del trabajo independiente, la auto provisión de bienes producidos por el hogar, rentas, intereses, jubilaciones, pensiones, montepíos y transferencias corrientes entre privados.

El ingreso autónomo per cápita del hogar es la suma de los ingresos autónomos de todos los miembros del hogar, dividido por el número de integrantes del hogar, excluido el servicio doméstico puertas adentro.

folio: Identificación del hogar.

2.2 Calculos propios sin expandir

Haremos un primer cálculo tal como lo entendemos

2.2.1 Lectura de casen 2011

casen2011 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2011_c.rds")
casen2011  <- mutate_if(casen2011, is.factor, as.character)
# head(casen2011,5)

2.2.2 Hacemos un subset con la region metropolitana

casen2011_rm <- filter(casen2011, casen2011$region == "Metropolitana")
# comuna_ing <- unique(casen2011_rm$comuna)
tabla <- table(casen2011_rm$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
head(tabla,10)
##           folio freq_folio
## 1  131011001011          1
## 2  131011001041          1
## 3  131011001061          1
## 4  131011001121          1
## 5  131011001131          1
## 6  131011001161          1
## 7  131011001191          3
## 8  131011001201          1
## 9  131011001211          1
## 10 131011001221          2
casen_fh <- casen2011_rm[,c("comuna","folio","yauthaj","expc_full","numper")] 
casen_fh$folio <- as.character(casen_fh$folio)
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
#repetidos2 <- repetidos2[,c(2,1,6,4,5)]
rr <- repetidos2[!duplicated(repetidos2$folio), ]
head(rr,10)
##           folio   comuna yauthaj expc_full numper freq_folio
## 1  131011001011 Santiago 1653583        94      1          1
## 2  131011001041 Santiago  560401        94      1          1
## 3  131011001061 Santiago 1044093        94      1          1
## 4  131011001121 Santiago 1430074        94      1          1
## 5  131011001131 Santiago  444180        94      1          1
## 6  131011001161 Santiago  613347        94      1          1
## 7  131011001191 Santiago 1235752        94      3          3
## 10 131011001201 Santiago 1674543        94      1          1
## 11 131011001211 Santiago  295815        94      1          1
## 12 131011001221 Santiago 3461482        94      2          2

Aca vamos a calcular promedios de personas por hogar:

rr$ing_per_h <- rr$yauthaj/rr$freq_folio
head(rr,10)
##           folio   comuna yauthaj expc_full numper freq_folio ing_per_h
## 1  131011001011 Santiago 1653583        94      1          1 1653583.0
## 2  131011001041 Santiago  560401        94      1          1  560401.0
## 3  131011001061 Santiago 1044093        94      1          1 1044093.0
## 4  131011001121 Santiago 1430074        94      1          1 1430074.0
## 5  131011001131 Santiago  444180        94      1          1  444180.0
## 6  131011001161 Santiago  613347        94      1          1  613347.0
## 7  131011001191 Santiago 1235752        94      3          3  411917.3
## 10 131011001201 Santiago 1674543        94      1          1 1674543.0
## 11 131011001211 Santiago  295815        94      1          1  295815.0
## 12 131011001221 Santiago 3461482        94      2          2 1730741.0
aaa <- aggregate(rr$ing_per_h, list(rr$comuna), FUN=mean) 
names(aaa)[1]<-c("Comuna")
aaa$`mean.rr$ing_per_h` <- as.numeric(aaa$`mean.rr$ing_per_h`)
names(aaa)[2]<-c("calculo_propio")
write_xlsx(aaa, "aaaa.xlsx")
bbb <- read.csv2("ing_aut_percap_del_hogar_casen2011.csv")
bbb$`iaph` <- as.numeric(bbb$`iaph`)
names(bbb)[1] <- "Comuna"
ccc <- merge(x = aaa, y = bbb, by = "Comuna", all.x = TRUE)
ccc
##                 Comuna calculo_propio    iaph
## 1                Alhué       168675.6  144652
## 2                 Buin       218985.7  203541
## 3      Calera de Tango       291949.4  324293
## 4            Cerrillos       202794.2  197710
## 5          Cerro Navia       149432.5  148263
## 6               Colina       213741.0  179263
## 7             Conchalí       187879.0  195703
## 8             Curacaví       186212.3  162086
## 9            El Bosque       170325.7  144495
## 10            El Monte       169719.5  201699
## 11    Estación Central       243990.3  179162
## 12          Huechuraba       222148.8  229419
## 13       Independencia       250999.7  267019
## 14       Isla de Maipo       176312.1  150134
## 15         La Cisterna       231731.9  186430
## 16          La Florida       257764.3  259333
## 17           La Granja       169759.9  169600
## 18          La Pintana       135735.3  154957
## 19            La Reina       644621.8  428702
## 20               Lampa       187727.1  135862
## 21          Las Condes      1003428.8  894135
## 22        Lo Barnechea      1000853.0  495359
## 23           Lo Espejo       161518.9  145482
## 24            Lo Prado       163049.7  161384
## 25               Macul       273624.5  183870
## 26               Maipú       281692.9  257721
## 27         María Pinto       157567.5  161767
## 28           Melipilla       177735.2  161351
## 29               Ñuñoa       748310.6  600111
## 30       Padre Hurtado       246800.6  193681
## 31               Paine       183600.7  181854
## 32 Pedro Aguirre Cerda       194355.9  163069
## 33            Peñaflor       230916.3  230382
## 34           Peñalolén       265279.0  231919
## 35              Pirque       166938.3  168233
## 36         Providencia      1225991.8 1144792
## 37            Pudahuel       179581.3  155120
## 38         Puente Alto       199446.3  164008
## 39           Quilicura       218241.3  178118
## 40       Quinta Normal       247099.2  207358
## 41            Recoleta       206550.5  155368
## 42               Renca       156441.7  127613
## 43        San Bernardo       182677.2  143142
## 44         San Joaquín       167346.1  144703
## 45   San José de Maipo       253224.1  251301
## 46          San Miguel       254876.1  219813
## 47           San Pedro       139217.0  132641
## 48           San Ramón       198699.8  186769
## 49            Santiago       558701.2  454444
## 50           Talagante       239234.4  277584
## 51              Tiltil       220591.1  142795
## 52            Vitacura      1438107.1 1340692
p <- plot_ly(ccc, width = 1200, x = ~
Comuna, y = ~calculo_propio) %>%
  add_lines()
#p <- plot_ly(width = 800, height = 800)
p <- p %>% add_trace(y = ~iaph, name = 'iaph', mode = 'markers')
p 
## No trace type specified:
##   Based on info supplied, a 'bar' trace seems appropriate.
##   Read more about this trace type -> https://plotly.com/r/reference/#bar
## Warning: 'bar' objects don't have these attributes: 'mode'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'meta', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'uirevision', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'xperiod', 'yperiod', 'xperiod0', 'yperiod0', 'xperiodalignment', 'yperiodalignment', 'text', 'texttemplate', 'hovertext', 'hovertemplate', 'textposition', 'insidetextanchor', 'textangle', 'textfont', 'insidetextfont', 'outsidetextfont', 'constraintext', 'cliponaxis', 'orientation', 'base', 'offset', 'width', 'marker', 'offsetgroup', 'alignmentgroup', 'selected', 'unselected', 'r', 't', '_deprecated', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'metasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'texttemplatesrc', 'hovertextsrc', 'hovertemplatesrc', 'textpositionsrc', 'basesrc', 'offsetsrc', 'widthsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'
cor(x=ccc$calculo_propio, y=ccc$iaph, method="spearman")
## [1] 0.8504226

2.3 Fórmula propuesta en stata por la Casen

Existe una metodología del 2020 extrapolable a las anteriores aquí que nos permite calcular éstos valores, pero están en stata:

ING04: Ingreso autónomo per cápita del hogar, promedio de los hogares pp. 49

\[\frac{\sum_{n=j}^{n} yauth_j / numper_j} {{Total de hogares}}\]

Veamos la comuna de Santiago

 el_dato <- sum(rr$ing_per_h)/sum(rr$freq_folio)
 el_dato
## [1] 99357.97

3 Lectura base de datos Casen 2015

Obtuvimos valores oficiales para hogares, para regiones, para Ingreso autónomo del hogar corregido e Ingreso Monetario del hogar corregido sin expandir.

https://www.bcn.cl/portal/noticias?id=principales-resultados-sobre-pobreza-e-ingresos-regionales-encuesta-casen-2015

ampliar

casen2015 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2015_c.rds")
casen2015 <- mutate_if(casen2015, is.factor, as.character)
y <- unique(casen2015$region)
y[1]
## [1] "Región de Valparaíso"

yautcorh Ingreso autónomo del hogar corregido

ymonecorh Ingreso Monetario del hogar corregido

dataframe_001 <- data.frame()
for(h in y){
  casen2015_r <- filter(casen2015, casen2015$region ==  h)
  casen2015_r$yautcorh <- as.numeric(casen2015_r$yautcorh)
  a <- mean(casen2015_r$yautcorh)
  casen2015_r$ymoneCorh <- as.numeric(casen2015_r$ymoneCorh)
  b <- mean(casen2015_r$ymoneCorh)
  dataframe_002 <- cbind(h,a,b)
  dataframe_001 <- rbind(dataframe_001,dataframe_002)
}
dataframe_001 <- as.data.frame(dataframe_001)
names(dataframe_001)[2]<-c("yautcorh")
names(dataframe_001)[3]<-c("ymoneCorh")
dataframe_001
##                                                    h         yautcorh
## 1                               Región de Valparaíso  787655.54268162
## 2                   Región Metropolitana de Santiago 1259442.43942417
## 3                                  Región del Biobío 630702.003019558
## 4                                  Región de Atacama 989255.021275056
## 5                                 Región de Tarapacá  868925.25325136
## 6                                Región de Los Lagos 645944.740328072
## 7                                 Región de Coquimbo 758591.285863286
## 8                             Región de La Araucanía 562587.681880047
## 9                              Región de Antofagasta 1098726.90277986
## 10                      Región de Arica y Parinacota 732573.472948104
## 11 Región de Aysén del Gral. Carlos Ibáñez del Campo 880739.283924843
## 12                                  Región del Maule 625456.596133872
## 13    Región del Libertador Gral. Bernardo O Higgins 754070.701337426
## 14                                Región de Los Ríos 591682.326860532
## 15    Región de Magallanes y de la Antártica Chilena 991444.102915952
##           ymoneCorh
## 1   818367.25877825
## 2  1283902.58026963
## 3   669688.76000142
## 4  1022847.80054112
## 5  893634.001998847
## 6  690286.979375218
## 7  791635.881140889
## 8   612687.94022181
## 9    1114098.662689
## 10 763632.043349742
## 11 923653.574662616
## 12 665523.935787381
## 13 785711.562071178
## 14 639485.546721052
## 15 1013974.54945534
write_xlsx(dataframe_001, "dataframe_001.xlsx")
d001 <- read_xlsx("dataframe_001.xlsx")
names(d001)[1]<-c("Region")
d002 <- read_xlsx("regiones_001.xlsx")
d001
## # A tibble: 15 x 3
##    Region                                        yautcorh        ymoneCorh      
##    <chr>                                         <chr>           <chr>          
##  1 Región de Valparaíso                          787655.54268162 818367.25877825
##  2 Región Metropolitana de Santiago              1259442.439424~ 1283902.580269~
##  3 Región del Biobío                             630702.0030195~ 669688.76000142
##  4 Región de Atacama                             989255.0212750~ 1022847.800541~
##  5 Región de Tarapacá                            868925.25325136 893634.0019988~
##  6 Región de Los Lagos                           645944.7403280~ 690286.9793752~
##  7 Región de Coquimbo                            758591.2858632~ 791635.8811408~
##  8 Región de La Araucanía                        562587.6818800~ 612687.94022181
##  9 Región de Antofagasta                         1098726.902779~ 1114098.662689 
## 10 Región de Arica y Parinacota                  732573.4729481~ 763632.0433497~
## 11 Región de Aysén del Gral. Carlos Ibáñez del ~ 880739.2839248~ 923653.5746626~
## 12 Región del Maule                              625456.5961338~ 665523.9357873~
## 13 Región del Libertador Gral. Bernardo O Higgi~ 754070.7013374~ 785711.5620711~
## 14 Región de Los Ríos                            591682.3268605~ 639485.5467210~
## 15 Región de Magallanes y de la Antártica Chile~ 991444.1029159~ 1013974.549455~
d002
## # A tibble: 15 x 3
##    Region                                            autonomo monetario
##    <chr>                                                <dbl>     <dbl>
##  1 Región de Arica y Parinacota                        701921    728760
##  2 Región de Tarapacá                                 1013692   1030967
##  3 Región de Antofagasta                              1030785   1043365
##  4 Región de Atacama                                   845319    875657
##  5 Región de Coquimbo                                  676049    704604
##  6 Región de Valparaíso                                730133    755572
##  7 Región Metropolitana de Santiago                   1063093   1084766
##  8 Región del Libertador Gral. Bernardo O Higgins      671378    698548
##  9 Región del Maule                                    573882    607551
## 10 Región del Biobío                                   600408    633081
## 11 Región de La Araucanía                              551447    594778
## 12 Región de Los Ríos                                  667653    704471
## 13 Región de Los Lagos                                 593413    629812
## 14 Región de Aysén del Gral. Carlos Ibáñez del Campo   835305    875099
## 15 Región de Magallanes y de la Antártica Chilena      945704    963292
d001_d002 <- merge(x = d001, y = d002, by = "Region", all.x = TRUE)
d001_d002
##                                               Region         yautcorh
## 1                              Región de Antofagasta 1098726.90277986
## 2                       Región de Arica y Parinacota 732573.472948104
## 3                                  Región de Atacama 989255.021275056
## 4  Región de Aysén del Gral. Carlos Ibáñez del Campo 880739.283924843
## 5                                 Región de Coquimbo 758591.285863286
## 6                             Región de La Araucanía 562587.681880047
## 7                                Región de Los Lagos 645944.740328072
## 8                                 Región de Los Ríos 591682.326860532
## 9     Región de Magallanes y de la Antártica Chilena 991444.102915952
## 10                                Región de Tarapacá  868925.25325136
## 11                              Región de Valparaíso  787655.54268162
## 12                                 Región del Biobío 630702.003019558
## 13    Región del Libertador Gral. Bernardo O Higgins 754070.701337426
## 14                                  Región del Maule 625456.596133872
## 15                  Región Metropolitana de Santiago 1259442.43942417
##           ymoneCorh autonomo monetario
## 1    1114098.662689  1030785   1043365
## 2  763632.043349742   701921    728760
## 3  1022847.80054112   845319    875657
## 4  923653.574662616   835305    875099
## 5  791635.881140889   676049    704604
## 6   612687.94022181   551447    594778
## 7  690286.979375218   593413    629812
## 8  639485.546721052   667653    704471
## 9  1013974.54945534   945704    963292
## 10 893634.001998847  1013692   1030967
## 11  818367.25877825   730133    755572
## 12  669688.76000142   600408    633081
## 13 785711.562071178   671378    698548
## 14 665523.935787381   573882    607551
## 15 1283902.58026963  1063093   1084766
p <- plot_ly(d001_d002, width = 1200, x = ~
Region, y = ~yautcorh) %>%
  add_lines()
#p <- plot_ly(width = 800, height = 800)
p <- p %>% add_trace(y = ~autonomo, name = 'autonomo', mode = 'markers')
p 
## No trace type specified:
##   Based on info supplied, a 'bar' trace seems appropriate.
##   Read more about this trace type -> https://plotly.com/r/reference/#bar
## Warning: Can't display both discrete & non-discrete data on same axis
## Warning: 'bar' objects don't have these attributes: 'mode'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'meta', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'uirevision', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'xperiod', 'yperiod', 'xperiod0', 'yperiod0', 'xperiodalignment', 'yperiodalignment', 'text', 'texttemplate', 'hovertext', 'hovertemplate', 'textposition', 'insidetextanchor', 'textangle', 'textfont', 'insidetextfont', 'outsidetextfont', 'constraintext', 'cliponaxis', 'orientation', 'base', 'offset', 'width', 'marker', 'offsetgroup', 'alignmentgroup', 'selected', 'unselected', 'r', 't', '_deprecated', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'metasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'texttemplatesrc', 'hovertextsrc', 'hovertemplatesrc', 'textpositionsrc', 'basesrc', 'offsetsrc', 'widthsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'
p <- plot_ly(d001_d002, width = 1200, x = ~
Region, y = ~ymoneCorh) %>%
  add_lines()
#p <- plot_ly(width = 800, height = 800)
p <- p %>% add_trace(y = ~monetario, name = 'monetario', mode = 'markers')
p 
## No trace type specified:
##   Based on info supplied, a 'bar' trace seems appropriate.
##   Read more about this trace type -> https://plotly.com/r/reference/#bar
## Warning: Can't display both discrete & non-discrete data on same axis
## Warning: 'bar' objects don't have these attributes: 'mode'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'meta', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'uirevision', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'xperiod', 'yperiod', 'xperiod0', 'yperiod0', 'xperiodalignment', 'yperiodalignment', 'text', 'texttemplate', 'hovertext', 'hovertemplate', 'textposition', 'insidetextanchor', 'textangle', 'textfont', 'insidetextfont', 'outsidetextfont', 'constraintext', 'cliponaxis', 'orientation', 'base', 'offset', 'width', 'marker', 'offsetgroup', 'alignmentgroup', 'selected', 'unselected', 'r', 't', '_deprecated', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'metasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'texttemplatesrc', 'hovertextsrc', 'hovertemplatesrc', 'textpositionsrc', 'basesrc', 'offsetsrc', 'widthsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'

4 Ejercicio con regiones y nuevas variables para la Casen 2015

Utilizaremos el set de variables duplicadas (las dos últimas) para construir cuatro tablas de nuestros ingresos con variable que aun no hemos utilizado.

ytotcor*

casen_fh <- filter(casen2015, casen2015$region == "Región Metropolitana de Santiago")
 
casen_fh <- casen_fh[,c("region","folio.x","o.x","ytrabajoCorh","expr_div")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
  
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,6,4,5)]
 
# rr <- repetidos2
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]

# rr$ing_per_h <- rr$ytrabajoCorh*rr$freq_folio*rr$expr_div


kbl(head(rr,30)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region folio.x freq_folio ytrabajoCorh expr_div
1 Región Metropolitana de Santiago 131011001011 2 0 261
3 Región Metropolitana de Santiago 131011001021 1 1690000 387
4 Región Metropolitana de Santiago 131011001031 4 2270000 387
8 Región Metropolitana de Santiago 131011001041 2 2160000 387
10 Región Metropolitana de Santiago 131011001061 2 4272333 387
12 Región Metropolitana de Santiago 131011001071 1 0 349
13 Región Metropolitana de Santiago 131011002011 2 1430000 NA
15 Región Metropolitana de Santiago 131011002051 2 2088862 NA
17 Región Metropolitana de Santiago 131011002071 1 804167 326
18 Región Metropolitana de Santiago 131011002101 1 1422000 313
19 Región Metropolitana de Santiago 131011002111 1 862500 223
20 Región Metropolitana de Santiago 131011002131 2 1370000 223
22 Región Metropolitana de Santiago 131011002141 3 2479167 313
25 Región Metropolitana de Santiago 131011002171 1 900000 223
26 Región Metropolitana de Santiago 131011002191 1 2705000 313
27 Región Metropolitana de Santiago 131011002201 1 1015833 326
28 Región Metropolitana de Santiago 131011002221 2 2400000 313
30 Región Metropolitana de Santiago 131011002231 4 657462 313
34 Región Metropolitana de Santiago 131011002281 3 3263334 NA
37 Región Metropolitana de Santiago 131011002301 2 0 211
39 Región Metropolitana de Santiago 131011002321 1 120000 232
40 Región Metropolitana de Santiago 131011002341 2 1188333 223
42 Región Metropolitana de Santiago 131011003011 5 2900000 NA
47 Región Metropolitana de Santiago 131011003031 3 3180000 NA
50 Región Metropolitana de Santiago 131011003041 5 885000 NA
55 Región Metropolitana de Santiago 131011003071 4 482000 NA
59 Región Metropolitana de Santiago 131011003181 1 450000 703
60 Región Metropolitana de Santiago 131011003191 1 2179000 865
61 Región Metropolitana de Santiago 131011003221 2 190000 616
63 Región Metropolitana de Santiago 131011003222 1 637500 616
mean(rr$ytrabajoCorh)
## [1] 977917.8

Debimos llega a:

913907,141084357

Región Metropolitana de Santiago yautcorh

casen_fh <- filter(casen2015, casen2015$region == "Región Metropolitana de Santiago")
 
casen_fh <- casen_fh[,c("region","folio.x","o.x","yautcorh","expr_div")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
  
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,6,4,5)]
 
# rr <- repetidos2
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]

# rr$ing_per_h <- rr$ytrabajoCorh*rr$freq_folio*rr$expr_div


kbl(head(rr,30)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region folio.x freq_folio yautcorh expr_div
1 Región Metropolitana de Santiago 131011001011 2 1142000 261
3 Región Metropolitana de Santiago 131011001021 1 1690000 387
4 Región Metropolitana de Santiago 131011001031 4 2270000 387
8 Región Metropolitana de Santiago 131011001041 2 2160000 387
10 Región Metropolitana de Santiago 131011001061 2 4684832 387
12 Región Metropolitana de Santiago 131011001071 1 700000 349
13 Región Metropolitana de Santiago 131011002011 2 1430000 NA
15 Región Metropolitana de Santiago 131011002051 2 2088862 NA
17 Región Metropolitana de Santiago 131011002071 1 1370834 326
18 Región Metropolitana de Santiago 131011002101 1 1422000 313
19 Región Metropolitana de Santiago 131011002111 1 862500 223
20 Región Metropolitana de Santiago 131011002131 2 1536667 223
22 Región Metropolitana de Santiago 131011002141 3 3179167 313
25 Región Metropolitana de Santiago 131011002171 1 1233333 223
26 Región Metropolitana de Santiago 131011002191 1 2705000 313
27 Región Metropolitana de Santiago 131011002201 1 1015833 326
28 Región Metropolitana de Santiago 131011002221 2 2466667 313
30 Región Metropolitana de Santiago 131011002231 4 827462 313
34 Región Metropolitana de Santiago 131011002281 3 3383334 NA
37 Región Metropolitana de Santiago 131011002301 2 608333 211
39 Región Metropolitana de Santiago 131011002321 1 319157 232
40 Región Metropolitana de Santiago 131011002341 2 1192916 223
42 Región Metropolitana de Santiago 131011003011 5 2916667 NA
47 Región Metropolitana de Santiago 131011003031 3 3180000 NA
50 Región Metropolitana de Santiago 131011003041 5 885000 NA
55 Región Metropolitana de Santiago 131011003071 4 482000 NA
59 Región Metropolitana de Santiago 131011003181 1 450000 703
60 Región Metropolitana de Santiago 131011003191 1 2190511 865
61 Región Metropolitana de Santiago 131011003221 2 190000 616
63 Región Metropolitana de Santiago 131011003222 1 637500 616
mean(rr$yautcorh)
## [1] 1154596

Debimos llegar a: 958652,034702053

Región de Valparaíso

casen_fh <- filter(casen2015, casen2015$region == "Región de Valparaíso")
 
casen_fh <- casen_fh[,c("region","folio.x","o.x","ytrabajoCorh","expr")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
  
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,6,4,5)]

# rr <- repetidos2
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]

rr$ing_ponderado <- rr$ytrabajoCorh*rr$expr
rr <- filter(rr, rr$ytrabajoCorh != 0)

kbl(head(rr,30)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region folio.x freq_folio ytrabajoCorh expr ing_ponderado
Región de Valparaíso 51011001021 2 500000 74 37000000
Región de Valparaíso 51011001041 4 1437500 74 106375000
Región de Valparaíso 51011001051 7 867333 74 64182642
Región de Valparaíso 51011001101 3 1230083 74 91026142
Región de Valparaíso 51011001131 3 1580000 74 116920000
Región de Valparaíso 51011001141 4 2561666 74 189563284
Región de Valparaíso 51011002031 2 200000 91 18200000
Región de Valparaíso 51011002041 3 278750 91 25366250
Región de Valparaíso 51011003011 3 920000 65 59800000
Región de Valparaíso 51011003051 2 400000 65 26000000
Región de Valparaíso 51011003061 2 25000 65 1625000
Región de Valparaíso 51011003081 3 450000 65 29250000
Región de Valparaíso 51011003091 2 40000 65 2600000
Región de Valparaíso 51011004031 4 1500000 123 184500000
Región de Valparaíso 51011004041 1 280000 123 34440000
Región de Valparaíso 51011004051 5 1204167 123 148112541
Región de Valparaíso 51011004071 3 1352500 123 166357500
Región de Valparaíso 51011005011 6 500000 107 53500000
Región de Valparaíso 51011005021 2 480000 107 51360000
Región de Valparaíso 51011005041 2 480000 107 51360000
Región de Valparaíso 51011005051 3 262000 107 28034000
Región de Valparaíso 51011005061 5 786500 107 84155500
Región de Valparaíso 51011005091 5 273000 107 29211000
Región de Valparaíso 51011005101 2 40000 107 4280000
Región de Valparaíso 51011005141 1 705000 107 75435000
Región de Valparaíso 51011005151 3 1480833 107 158449131
Región de Valparaíso 51011005161 4 241667 107 25858369
Región de Valparaíso 51011006011 2 302500 86 26015000
Región de Valparaíso 51011006021 4 1732083 86 148959138
Región de Valparaíso 51011006041 4 3603500 86 309901000
mean(rr$ytrabajoCorh)
## [1] 691337.5

debimos llega a:

608083,47649721

5 intento de expansión sobre comunas

Creemos que el error esta en la expansión, intentamos aplicarla

# casen_fh <- filter(recptaculo, recptaculo$comuna == "Santiago")  
# casen_fh <- casen_fh[,c("comuna","folio","o","yauthaj","expc_full","tot_hogviv","numper")]
# # na.omit(casen_fh)
#  
# casen_fh$folio <- as.character(casen_fh$folio)
#  
# tabla <- table(casen_fh$folio)
# tabla <- as.data.frame(tabla)
# colnames(tabla) <- c("folio","freq_folio")
# repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
# repetidos2 <- repetidos2[,c(2,1,6,4,5)]
#  
# rr <- repetidos2[!duplicated(repetidos2$folio), ]
# 
# head(rr,10)
# # rr$ing_per_h <- rr$yauthaj/rr$freq_folio
# #rr$ing_per_hexp <- (rr$yauthaj)*rr$expc_full
# # rr$ing_per_h <- sum(rr$yauthaj)/sum(rr$freq_folio*rr$expc_full)
# rr$ing_per_h <- rr$yauthaj*(rr$freq_folio*rr$expc_full)
#  head(rr,10)
# promedio <- mean((rr$ing_per_h)/(rr$freq_folio*rr$expc_full))
# promedio