1 Introducción
1 Información de las Casen:
http://observatorio.ministeriodesarrollosocial.gob.cl/encuesta-casen-2011
2 En difícil encontar datos oficiales que entreguen información de los ingresos a nivel de persona por comunas en la Casen, porque es de hogares, lo que sociológicamente tiene sentido. La sociedad se comporta como órganos individuales funcionando dentro de los hogares. La enfermedad, como así mismo la caída del ingreso de un integrante de la familia los afecta a todos. Pensemos en la etnia, el sexo, edad, etc.
3 Fue un error haber eliminado outliers de las distribuciones de ingresos pues los resultados obtenidos de esta manera los hacen incomparables con cualquier otro tipo de análisis que no siga la misma metodologia. Casen no excluye outliers.
1.1 Cuatro fuentes de datos (las dos últimas las mismas, pero dupicadas)
Logramos obtener tres fuentes de datos:
Uno a nivel comunal en la Región Metropolitana y tres a nivel Regional:
Ingreso autónomo percápita del hogar, CASEN 2011 ($ de noviembre de 2011) de la pagina 16 de aquí.
Ingreso autónomo promedio e ingreso monetario promedio del hogar a nivel regional el 2015:
Por dos instrumentos diferentes oficiales llegamos a los mismos resultados y son a los cuales intentamos aproximarnos.
- Una es por una tabla extensa obtenida de (ver aquí)
- Y la otra con una página interactiva con datos por región (ver aquí)
1.2 Los ingresos
Recordemos los cuatro datos cuantitativos fundamentales de la generación de los ingresos:
Tipo | Ingreso total | Ingreso autónomo | Ingreso del trabajo | Ingreso de la ocupación principal |
año | ||||
2020 | ytotcor | yautcor | ytrabajocor | yoprcor |
2017 | ytotcor | yautcor | ytrabajocor | yoprcor |
2015 | ytotcor | yautcor | ytrabajocor | yoprcor |
2013 | ytotcor | yautcor | ytrabajocor | yoprcor |
2011 | ytrabaj | yautaj | ytrabaj | yopraj |
2009 | ytrabaj | yautaj | ytrabaj | yopraj |
2006 | ytrabaj | yautaj | ytrabaj | yopraj |
2 El ingreso autónomo per cápita del hogar
2.1 Ingreso autónomo percápita del hogar, CASEN 2011 ($ de noviembre de 2011)
Ingreso autónomo per cápita del hogar, promedio de los hogares es el Valor correspondiente a la suma de los ingresos autónomos per cápita de todos los hogares, dividido por el total de hogares.
El ingreso autónomo se define como todos los pagos que recibe el hogar, provenientes tanto del trabajo como de la propiedad de los activos. Estos incluyen sueldos y salarios (monetarios y en especies), ganancias provenientes del trabajo independiente, la auto provisión de bienes producidos por el hogar, rentas, intereses, jubilaciones, pensiones, montepíos y transferencias corrientes entre privados.
El ingreso autónomo per cápita del hogar es la suma de los ingresos autónomos de todos los miembros del hogar, dividido por el número de integrantes del hogar, excluido el servicio doméstico puertas adentro.
folio: Identificación del hogar.
2.2 Calculos propios sin expandir
Haremos un primer cálculo tal como lo entendemos
2.2.1 Lectura de casen 2011
<- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2011_c.rds")
casen2011 <- mutate_if(casen2011, is.factor, as.character)
casen2011 # head(casen2011,5)
2.2.2 Hacemos un subset con la region metropolitana
<- filter(casen2011, casen2011$region == "Metropolitana") casen2011_rm
# comuna_ing <- unique(casen2011_rm$comuna)
<- table(casen2011_rm$folio)
tabla <- as.data.frame(tabla)
tabla colnames(tabla) <- c("folio","freq_folio")
head(tabla,10)
## folio freq_folio
## 1 131011001011 1
## 2 131011001041 1
## 3 131011001061 1
## 4 131011001121 1
## 5 131011001131 1
## 6 131011001161 1
## 7 131011001191 3
## 8 131011001201 1
## 9 131011001211 1
## 10 131011001221 2
<- casen2011_rm[,c("comuna","folio","yauthaj","expc_full","numper")]
casen_fh $folio <- as.character(casen_fh$folio)
casen_fh<- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 #repetidos2 <- repetidos2[,c(2,1,6,4,5)]
<- repetidos2[!duplicated(repetidos2$folio), ]
rr head(rr,10)
## folio comuna yauthaj expc_full numper freq_folio
## 1 131011001011 Santiago 1653583 94 1 1
## 2 131011001041 Santiago 560401 94 1 1
## 3 131011001061 Santiago 1044093 94 1 1
## 4 131011001121 Santiago 1430074 94 1 1
## 5 131011001131 Santiago 444180 94 1 1
## 6 131011001161 Santiago 613347 94 1 1
## 7 131011001191 Santiago 1235752 94 3 3
## 10 131011001201 Santiago 1674543 94 1 1
## 11 131011001211 Santiago 295815 94 1 1
## 12 131011001221 Santiago 3461482 94 2 2
Aca vamos a calcular promedios de personas por hogar:
$ing_per_h <- rr$yauthaj/rr$freq_folio
rrhead(rr,10)
## folio comuna yauthaj expc_full numper freq_folio ing_per_h
## 1 131011001011 Santiago 1653583 94 1 1 1653583.0
## 2 131011001041 Santiago 560401 94 1 1 560401.0
## 3 131011001061 Santiago 1044093 94 1 1 1044093.0
## 4 131011001121 Santiago 1430074 94 1 1 1430074.0
## 5 131011001131 Santiago 444180 94 1 1 444180.0
## 6 131011001161 Santiago 613347 94 1 1 613347.0
## 7 131011001191 Santiago 1235752 94 3 3 411917.3
## 10 131011001201 Santiago 1674543 94 1 1 1674543.0
## 11 131011001211 Santiago 295815 94 1 1 295815.0
## 12 131011001221 Santiago 3461482 94 2 2 1730741.0
<- aggregate(rr$ing_per_h, list(rr$comuna), FUN=mean)
aaa names(aaa)[1]<-c("Comuna")
$`mean.rr$ing_per_h` <- as.numeric(aaa$`mean.rr$ing_per_h`)
aaanames(aaa)[2]<-c("calculo_propio")
write_xlsx(aaa, "aaaa.xlsx")
<- read.csv2("ing_aut_percap_del_hogar_casen2011.csv")
bbb $`iaph` <- as.numeric(bbb$`iaph`)
bbbnames(bbb)[1] <- "Comuna"
<- merge(x = aaa, y = bbb, by = "Comuna", all.x = TRUE)
ccc ccc
## Comuna calculo_propio iaph
## 1 Alhué 168675.6 144652
## 2 Buin 218985.7 203541
## 3 Calera de Tango 291949.4 324293
## 4 Cerrillos 202794.2 197710
## 5 Cerro Navia 149432.5 148263
## 6 Colina 213741.0 179263
## 7 Conchalí 187879.0 195703
## 8 Curacaví 186212.3 162086
## 9 El Bosque 170325.7 144495
## 10 El Monte 169719.5 201699
## 11 Estación Central 243990.3 179162
## 12 Huechuraba 222148.8 229419
## 13 Independencia 250999.7 267019
## 14 Isla de Maipo 176312.1 150134
## 15 La Cisterna 231731.9 186430
## 16 La Florida 257764.3 259333
## 17 La Granja 169759.9 169600
## 18 La Pintana 135735.3 154957
## 19 La Reina 644621.8 428702
## 20 Lampa 187727.1 135862
## 21 Las Condes 1003428.8 894135
## 22 Lo Barnechea 1000853.0 495359
## 23 Lo Espejo 161518.9 145482
## 24 Lo Prado 163049.7 161384
## 25 Macul 273624.5 183870
## 26 Maipú 281692.9 257721
## 27 María Pinto 157567.5 161767
## 28 Melipilla 177735.2 161351
## 29 Ñuñoa 748310.6 600111
## 30 Padre Hurtado 246800.6 193681
## 31 Paine 183600.7 181854
## 32 Pedro Aguirre Cerda 194355.9 163069
## 33 Peñaflor 230916.3 230382
## 34 Peñalolén 265279.0 231919
## 35 Pirque 166938.3 168233
## 36 Providencia 1225991.8 1144792
## 37 Pudahuel 179581.3 155120
## 38 Puente Alto 199446.3 164008
## 39 Quilicura 218241.3 178118
## 40 Quinta Normal 247099.2 207358
## 41 Recoleta 206550.5 155368
## 42 Renca 156441.7 127613
## 43 San Bernardo 182677.2 143142
## 44 San Joaquín 167346.1 144703
## 45 San José de Maipo 253224.1 251301
## 46 San Miguel 254876.1 219813
## 47 San Pedro 139217.0 132641
## 48 San Ramón 198699.8 186769
## 49 Santiago 558701.2 454444
## 50 Talagante 239234.4 277584
## 51 Tiltil 220591.1 142795
## 52 Vitacura 1438107.1 1340692
<- plot_ly(ccc, width = 1200, x = ~
p y = ~calculo_propio) %>%
Comuna, add_lines()
#p <- plot_ly(width = 800, height = 800)
<- p %>% add_trace(y = ~iaph, name = 'iaph', mode = 'markers')
p p
## No trace type specified:
## Based on info supplied, a 'bar' trace seems appropriate.
## Read more about this trace type -> https://plotly.com/r/reference/#bar
## Warning: 'bar' objects don't have these attributes: 'mode'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'meta', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'uirevision', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'xperiod', 'yperiod', 'xperiod0', 'yperiod0', 'xperiodalignment', 'yperiodalignment', 'text', 'texttemplate', 'hovertext', 'hovertemplate', 'textposition', 'insidetextanchor', 'textangle', 'textfont', 'insidetextfont', 'outsidetextfont', 'constraintext', 'cliponaxis', 'orientation', 'base', 'offset', 'width', 'marker', 'offsetgroup', 'alignmentgroup', 'selected', 'unselected', 'r', 't', '_deprecated', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'metasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'texttemplatesrc', 'hovertextsrc', 'hovertemplatesrc', 'textpositionsrc', 'basesrc', 'offsetsrc', 'widthsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'
cor(x=ccc$calculo_propio, y=ccc$iaph, method="spearman")
## [1] 0.8504226
2.3 Fórmula propuesta en stata por la Casen
Existe una metodología del 2020 extrapolable a las anteriores aquí que nos permite calcular éstos valores, pero están en stata:
ING04: Ingreso autónomo per cápita del hogar, promedio de los hogares pp. 49
\[\frac{\sum_{n=j}^{n} yauth_j / numper_j} {{Total de hogares}}\]
Veamos la comuna de Santiago
<- sum(rr$ing_per_h)/sum(rr$freq_folio)
el_dato el_dato
## [1] 99357.97
3 Lectura base de datos Casen 2015
Obtuvimos valores oficiales para hogares, para regiones, para Ingreso autónomo del hogar corregido e Ingreso Monetario del hogar corregido sin expandir.
ampliar
<- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2015_c.rds")
casen2015 <- mutate_if(casen2015, is.factor, as.character) casen2015
<- unique(casen2015$region)
y 1] y[
## [1] "Región de Valparaíso"
yautcorh Ingreso autónomo del hogar corregido
ymonecorh Ingreso Monetario del hogar corregido
<- data.frame()
dataframe_001 for(h in y){
<- filter(casen2015, casen2015$region == h)
casen2015_r $yautcorh <- as.numeric(casen2015_r$yautcorh)
casen2015_r<- mean(casen2015_r$yautcorh)
a $ymoneCorh <- as.numeric(casen2015_r$ymoneCorh)
casen2015_r<- mean(casen2015_r$ymoneCorh)
b <- cbind(h,a,b)
dataframe_002 <- rbind(dataframe_001,dataframe_002)
dataframe_001 }
<- as.data.frame(dataframe_001)
dataframe_001 names(dataframe_001)[2]<-c("yautcorh")
names(dataframe_001)[3]<-c("ymoneCorh")
dataframe_001
## h yautcorh
## 1 Región de Valparaíso 787655.54268162
## 2 Región Metropolitana de Santiago 1259442.43942417
## 3 Región del Biobío 630702.003019558
## 4 Región de Atacama 989255.021275056
## 5 Región de Tarapacá 868925.25325136
## 6 Región de Los Lagos 645944.740328072
## 7 Región de Coquimbo 758591.285863286
## 8 Región de La Araucanía 562587.681880047
## 9 Región de Antofagasta 1098726.90277986
## 10 Región de Arica y Parinacota 732573.472948104
## 11 Región de Aysén del Gral. Carlos Ibáñez del Campo 880739.283924843
## 12 Región del Maule 625456.596133872
## 13 Región del Libertador Gral. Bernardo O Higgins 754070.701337426
## 14 Región de Los Ríos 591682.326860532
## 15 Región de Magallanes y de la Antártica Chilena 991444.102915952
## ymoneCorh
## 1 818367.25877825
## 2 1283902.58026963
## 3 669688.76000142
## 4 1022847.80054112
## 5 893634.001998847
## 6 690286.979375218
## 7 791635.881140889
## 8 612687.94022181
## 9 1114098.662689
## 10 763632.043349742
## 11 923653.574662616
## 12 665523.935787381
## 13 785711.562071178
## 14 639485.546721052
## 15 1013974.54945534
write_xlsx(dataframe_001, "dataframe_001.xlsx")
<- read_xlsx("dataframe_001.xlsx")
d001 names(d001)[1]<-c("Region")
<- read_xlsx("regiones_001.xlsx")
d002 d001
## # A tibble: 15 x 3
## Region yautcorh ymoneCorh
## <chr> <chr> <chr>
## 1 Región de Valparaíso 787655.54268162 818367.25877825
## 2 Región Metropolitana de Santiago 1259442.439424~ 1283902.580269~
## 3 Región del Biobío 630702.0030195~ 669688.76000142
## 4 Región de Atacama 989255.0212750~ 1022847.800541~
## 5 Región de Tarapacá 868925.25325136 893634.0019988~
## 6 Región de Los Lagos 645944.7403280~ 690286.9793752~
## 7 Región de Coquimbo 758591.2858632~ 791635.8811408~
## 8 Región de La Araucanía 562587.6818800~ 612687.94022181
## 9 Región de Antofagasta 1098726.902779~ 1114098.662689
## 10 Región de Arica y Parinacota 732573.4729481~ 763632.0433497~
## 11 Región de Aysén del Gral. Carlos Ibáñez del ~ 880739.2839248~ 923653.5746626~
## 12 Región del Maule 625456.5961338~ 665523.9357873~
## 13 Región del Libertador Gral. Bernardo O Higgi~ 754070.7013374~ 785711.5620711~
## 14 Región de Los Ríos 591682.3268605~ 639485.5467210~
## 15 Región de Magallanes y de la Antártica Chile~ 991444.1029159~ 1013974.549455~
d002
## # A tibble: 15 x 3
## Region autonomo monetario
## <chr> <dbl> <dbl>
## 1 Región de Arica y Parinacota 701921 728760
## 2 Región de Tarapacá 1013692 1030967
## 3 Región de Antofagasta 1030785 1043365
## 4 Región de Atacama 845319 875657
## 5 Región de Coquimbo 676049 704604
## 6 Región de Valparaíso 730133 755572
## 7 Región Metropolitana de Santiago 1063093 1084766
## 8 Región del Libertador Gral. Bernardo O Higgins 671378 698548
## 9 Región del Maule 573882 607551
## 10 Región del Biobío 600408 633081
## 11 Región de La Araucanía 551447 594778
## 12 Región de Los Ríos 667653 704471
## 13 Región de Los Lagos 593413 629812
## 14 Región de Aysén del Gral. Carlos Ibáñez del Campo 835305 875099
## 15 Región de Magallanes y de la Antártica Chilena 945704 963292
<- merge(x = d001, y = d002, by = "Region", all.x = TRUE)
d001_d002 d001_d002
## Region yautcorh
## 1 Región de Antofagasta 1098726.90277986
## 2 Región de Arica y Parinacota 732573.472948104
## 3 Región de Atacama 989255.021275056
## 4 Región de Aysén del Gral. Carlos Ibáñez del Campo 880739.283924843
## 5 Región de Coquimbo 758591.285863286
## 6 Región de La Araucanía 562587.681880047
## 7 Región de Los Lagos 645944.740328072
## 8 Región de Los Ríos 591682.326860532
## 9 Región de Magallanes y de la Antártica Chilena 991444.102915952
## 10 Región de Tarapacá 868925.25325136
## 11 Región de Valparaíso 787655.54268162
## 12 Región del Biobío 630702.003019558
## 13 Región del Libertador Gral. Bernardo O Higgins 754070.701337426
## 14 Región del Maule 625456.596133872
## 15 Región Metropolitana de Santiago 1259442.43942417
## ymoneCorh autonomo monetario
## 1 1114098.662689 1030785 1043365
## 2 763632.043349742 701921 728760
## 3 1022847.80054112 845319 875657
## 4 923653.574662616 835305 875099
## 5 791635.881140889 676049 704604
## 6 612687.94022181 551447 594778
## 7 690286.979375218 593413 629812
## 8 639485.546721052 667653 704471
## 9 1013974.54945534 945704 963292
## 10 893634.001998847 1013692 1030967
## 11 818367.25877825 730133 755572
## 12 669688.76000142 600408 633081
## 13 785711.562071178 671378 698548
## 14 665523.935787381 573882 607551
## 15 1283902.58026963 1063093 1084766
<- plot_ly(d001_d002, width = 1200, x = ~
p y = ~yautcorh) %>%
Region, add_lines()
#p <- plot_ly(width = 800, height = 800)
<- p %>% add_trace(y = ~autonomo, name = 'autonomo', mode = 'markers')
p p
## No trace type specified:
## Based on info supplied, a 'bar' trace seems appropriate.
## Read more about this trace type -> https://plotly.com/r/reference/#bar
## Warning: Can't display both discrete & non-discrete data on same axis
## Warning: 'bar' objects don't have these attributes: 'mode'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'meta', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'uirevision', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'xperiod', 'yperiod', 'xperiod0', 'yperiod0', 'xperiodalignment', 'yperiodalignment', 'text', 'texttemplate', 'hovertext', 'hovertemplate', 'textposition', 'insidetextanchor', 'textangle', 'textfont', 'insidetextfont', 'outsidetextfont', 'constraintext', 'cliponaxis', 'orientation', 'base', 'offset', 'width', 'marker', 'offsetgroup', 'alignmentgroup', 'selected', 'unselected', 'r', 't', '_deprecated', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'metasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'texttemplatesrc', 'hovertextsrc', 'hovertemplatesrc', 'textpositionsrc', 'basesrc', 'offsetsrc', 'widthsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'
<- plot_ly(d001_d002, width = 1200, x = ~
p y = ~ymoneCorh) %>%
Region, add_lines()
#p <- plot_ly(width = 800, height = 800)
<- p %>% add_trace(y = ~monetario, name = 'monetario', mode = 'markers')
p p
## No trace type specified:
## Based on info supplied, a 'bar' trace seems appropriate.
## Read more about this trace type -> https://plotly.com/r/reference/#bar
## Warning: Can't display both discrete & non-discrete data on same axis
## Warning: 'bar' objects don't have these attributes: 'mode'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'meta', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'uirevision', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'xperiod', 'yperiod', 'xperiod0', 'yperiod0', 'xperiodalignment', 'yperiodalignment', 'text', 'texttemplate', 'hovertext', 'hovertemplate', 'textposition', 'insidetextanchor', 'textangle', 'textfont', 'insidetextfont', 'outsidetextfont', 'constraintext', 'cliponaxis', 'orientation', 'base', 'offset', 'width', 'marker', 'offsetgroup', 'alignmentgroup', 'selected', 'unselected', 'r', 't', '_deprecated', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'metasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'texttemplatesrc', 'hovertextsrc', 'hovertemplatesrc', 'textpositionsrc', 'basesrc', 'offsetsrc', 'widthsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'
4 Ejercicio con regiones y nuevas variables para la Casen 2015
Utilizaremos el set de variables duplicadas (las dos últimas) para construir cuatro tablas de nuestros ingresos con variable que aun no hemos utilizado.
ytotcor*
<- filter(casen2015, casen2015$region == "Región Metropolitana de Santiago")
casen_fh
<- casen_fh[,c("region","folio.x","o.x","ytrabajoCorh","expr_div")]
casen_fh $folio.x <- as.character(casen_fh$folio.x)
casen_fh
<- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
tabla colnames(tabla) <- c("folio.x","freq_folio")
<- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,6,4,5)]
repetidos2
# rr <- repetidos2
<- repetidos2[!duplicated(repetidos2$folio.x ), ]
rr
# rr$ing_per_h <- rr$ytrabajoCorh*rr$freq_folio*rr$expr_div
kbl(head(rr,30)) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")
region | folio.x | freq_folio | ytrabajoCorh | expr_div | |
---|---|---|---|---|---|
1 | Región Metropolitana de Santiago | 131011001011 | 2 | 0 | 261 |
3 | Región Metropolitana de Santiago | 131011001021 | 1 | 1690000 | 387 |
4 | Región Metropolitana de Santiago | 131011001031 | 4 | 2270000 | 387 |
8 | Región Metropolitana de Santiago | 131011001041 | 2 | 2160000 | 387 |
10 | Región Metropolitana de Santiago | 131011001061 | 2 | 4272333 | 387 |
12 | Región Metropolitana de Santiago | 131011001071 | 1 | 0 | 349 |
13 | Región Metropolitana de Santiago | 131011002011 | 2 | 1430000 | NA |
15 | Región Metropolitana de Santiago | 131011002051 | 2 | 2088862 | NA |
17 | Región Metropolitana de Santiago | 131011002071 | 1 | 804167 | 326 |
18 | Región Metropolitana de Santiago | 131011002101 | 1 | 1422000 | 313 |
19 | Región Metropolitana de Santiago | 131011002111 | 1 | 862500 | 223 |
20 | Región Metropolitana de Santiago | 131011002131 | 2 | 1370000 | 223 |
22 | Región Metropolitana de Santiago | 131011002141 | 3 | 2479167 | 313 |
25 | Región Metropolitana de Santiago | 131011002171 | 1 | 900000 | 223 |
26 | Región Metropolitana de Santiago | 131011002191 | 1 | 2705000 | 313 |
27 | Región Metropolitana de Santiago | 131011002201 | 1 | 1015833 | 326 |
28 | Región Metropolitana de Santiago | 131011002221 | 2 | 2400000 | 313 |
30 | Región Metropolitana de Santiago | 131011002231 | 4 | 657462 | 313 |
34 | Región Metropolitana de Santiago | 131011002281 | 3 | 3263334 | NA |
37 | Región Metropolitana de Santiago | 131011002301 | 2 | 0 | 211 |
39 | Región Metropolitana de Santiago | 131011002321 | 1 | 120000 | 232 |
40 | Región Metropolitana de Santiago | 131011002341 | 2 | 1188333 | 223 |
42 | Región Metropolitana de Santiago | 131011003011 | 5 | 2900000 | NA |
47 | Región Metropolitana de Santiago | 131011003031 | 3 | 3180000 | NA |
50 | Región Metropolitana de Santiago | 131011003041 | 5 | 885000 | NA |
55 | Región Metropolitana de Santiago | 131011003071 | 4 | 482000 | NA |
59 | Región Metropolitana de Santiago | 131011003181 | 1 | 450000 | 703 |
60 | Región Metropolitana de Santiago | 131011003191 | 1 | 2179000 | 865 |
61 | Región Metropolitana de Santiago | 131011003221 | 2 | 190000 | 616 |
63 | Región Metropolitana de Santiago | 131011003222 | 1 | 637500 | 616 |
mean(rr$ytrabajoCorh)
## [1] 977917.8
Debimos llega a:
913907,141084357
Región Metropolitana de Santiago yautcorh
<- filter(casen2015, casen2015$region == "Región Metropolitana de Santiago")
casen_fh
<- casen_fh[,c("region","folio.x","o.x","yautcorh","expr_div")]
casen_fh $folio.x <- as.character(casen_fh$folio.x)
casen_fh
<- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
tabla colnames(tabla) <- c("folio.x","freq_folio")
<- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,6,4,5)]
repetidos2
# rr <- repetidos2
<- repetidos2[!duplicated(repetidos2$folio.x ), ]
rr
# rr$ing_per_h <- rr$ytrabajoCorh*rr$freq_folio*rr$expr_div
kbl(head(rr,30)) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")
region | folio.x | freq_folio | yautcorh | expr_div | |
---|---|---|---|---|---|
1 | Región Metropolitana de Santiago | 131011001011 | 2 | 1142000 | 261 |
3 | Región Metropolitana de Santiago | 131011001021 | 1 | 1690000 | 387 |
4 | Región Metropolitana de Santiago | 131011001031 | 4 | 2270000 | 387 |
8 | Región Metropolitana de Santiago | 131011001041 | 2 | 2160000 | 387 |
10 | Región Metropolitana de Santiago | 131011001061 | 2 | 4684832 | 387 |
12 | Región Metropolitana de Santiago | 131011001071 | 1 | 700000 | 349 |
13 | Región Metropolitana de Santiago | 131011002011 | 2 | 1430000 | NA |
15 | Región Metropolitana de Santiago | 131011002051 | 2 | 2088862 | NA |
17 | Región Metropolitana de Santiago | 131011002071 | 1 | 1370834 | 326 |
18 | Región Metropolitana de Santiago | 131011002101 | 1 | 1422000 | 313 |
19 | Región Metropolitana de Santiago | 131011002111 | 1 | 862500 | 223 |
20 | Región Metropolitana de Santiago | 131011002131 | 2 | 1536667 | 223 |
22 | Región Metropolitana de Santiago | 131011002141 | 3 | 3179167 | 313 |
25 | Región Metropolitana de Santiago | 131011002171 | 1 | 1233333 | 223 |
26 | Región Metropolitana de Santiago | 131011002191 | 1 | 2705000 | 313 |
27 | Región Metropolitana de Santiago | 131011002201 | 1 | 1015833 | 326 |
28 | Región Metropolitana de Santiago | 131011002221 | 2 | 2466667 | 313 |
30 | Región Metropolitana de Santiago | 131011002231 | 4 | 827462 | 313 |
34 | Región Metropolitana de Santiago | 131011002281 | 3 | 3383334 | NA |
37 | Región Metropolitana de Santiago | 131011002301 | 2 | 608333 | 211 |
39 | Región Metropolitana de Santiago | 131011002321 | 1 | 319157 | 232 |
40 | Región Metropolitana de Santiago | 131011002341 | 2 | 1192916 | 223 |
42 | Región Metropolitana de Santiago | 131011003011 | 5 | 2916667 | NA |
47 | Región Metropolitana de Santiago | 131011003031 | 3 | 3180000 | NA |
50 | Región Metropolitana de Santiago | 131011003041 | 5 | 885000 | NA |
55 | Región Metropolitana de Santiago | 131011003071 | 4 | 482000 | NA |
59 | Región Metropolitana de Santiago | 131011003181 | 1 | 450000 | 703 |
60 | Región Metropolitana de Santiago | 131011003191 | 1 | 2190511 | 865 |
61 | Región Metropolitana de Santiago | 131011003221 | 2 | 190000 | 616 |
63 | Región Metropolitana de Santiago | 131011003222 | 1 | 637500 | 616 |
mean(rr$yautcorh)
## [1] 1154596
Debimos llegar a: 958652,034702053
Región de Valparaíso
<- filter(casen2015, casen2015$region == "Región de Valparaíso")
casen_fh
<- casen_fh[,c("region","folio.x","o.x","ytrabajoCorh","expr")]
casen_fh $folio.x <- as.character(casen_fh$folio.x)
casen_fh
<- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
tabla colnames(tabla) <- c("folio.x","freq_folio")
<- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,6,4,5)]
repetidos2
# rr <- repetidos2
<- repetidos2[!duplicated(repetidos2$folio.x ), ]
rr
$ing_ponderado <- rr$ytrabajoCorh*rr$expr
rr<- filter(rr, rr$ytrabajoCorh != 0)
rr
kbl(head(rr,30)) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")
region | folio.x | freq_folio | ytrabajoCorh | expr | ing_ponderado |
---|---|---|---|---|---|
Región de Valparaíso | 51011001021 | 2 | 500000 | 74 | 37000000 |
Región de Valparaíso | 51011001041 | 4 | 1437500 | 74 | 106375000 |
Región de Valparaíso | 51011001051 | 7 | 867333 | 74 | 64182642 |
Región de Valparaíso | 51011001101 | 3 | 1230083 | 74 | 91026142 |
Región de Valparaíso | 51011001131 | 3 | 1580000 | 74 | 116920000 |
Región de Valparaíso | 51011001141 | 4 | 2561666 | 74 | 189563284 |
Región de Valparaíso | 51011002031 | 2 | 200000 | 91 | 18200000 |
Región de Valparaíso | 51011002041 | 3 | 278750 | 91 | 25366250 |
Región de Valparaíso | 51011003011 | 3 | 920000 | 65 | 59800000 |
Región de Valparaíso | 51011003051 | 2 | 400000 | 65 | 26000000 |
Región de Valparaíso | 51011003061 | 2 | 25000 | 65 | 1625000 |
Región de Valparaíso | 51011003081 | 3 | 450000 | 65 | 29250000 |
Región de Valparaíso | 51011003091 | 2 | 40000 | 65 | 2600000 |
Región de Valparaíso | 51011004031 | 4 | 1500000 | 123 | 184500000 |
Región de Valparaíso | 51011004041 | 1 | 280000 | 123 | 34440000 |
Región de Valparaíso | 51011004051 | 5 | 1204167 | 123 | 148112541 |
Región de Valparaíso | 51011004071 | 3 | 1352500 | 123 | 166357500 |
Región de Valparaíso | 51011005011 | 6 | 500000 | 107 | 53500000 |
Región de Valparaíso | 51011005021 | 2 | 480000 | 107 | 51360000 |
Región de Valparaíso | 51011005041 | 2 | 480000 | 107 | 51360000 |
Región de Valparaíso | 51011005051 | 3 | 262000 | 107 | 28034000 |
Región de Valparaíso | 51011005061 | 5 | 786500 | 107 | 84155500 |
Región de Valparaíso | 51011005091 | 5 | 273000 | 107 | 29211000 |
Región de Valparaíso | 51011005101 | 2 | 40000 | 107 | 4280000 |
Región de Valparaíso | 51011005141 | 1 | 705000 | 107 | 75435000 |
Región de Valparaíso | 51011005151 | 3 | 1480833 | 107 | 158449131 |
Región de Valparaíso | 51011005161 | 4 | 241667 | 107 | 25858369 |
Región de Valparaíso | 51011006011 | 2 | 302500 | 86 | 26015000 |
Región de Valparaíso | 51011006021 | 4 | 1732083 | 86 | 148959138 |
Región de Valparaíso | 51011006041 | 4 | 3603500 | 86 | 309901000 |
mean(rr$ytrabajoCorh)
## [1] 691337.5
debimos llega a:
608083,47649721
5 intento de expansión sobre comunas
Creemos que el error esta en la expansión, intentamos aplicarla
# casen_fh <- filter(recptaculo, recptaculo$comuna == "Santiago")
# casen_fh <- casen_fh[,c("comuna","folio","o","yauthaj","expc_full","tot_hogviv","numper")]
# # na.omit(casen_fh)
#
# casen_fh$folio <- as.character(casen_fh$folio)
#
# tabla <- table(casen_fh$folio)
# tabla <- as.data.frame(tabla)
# colnames(tabla) <- c("folio","freq_folio")
# repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
# repetidos2 <- repetidos2[,c(2,1,6,4,5)]
#
# rr <- repetidos2[!duplicated(repetidos2$folio), ]
#
# head(rr,10)
# # rr$ing_per_h <- rr$yauthaj/rr$freq_folio
# #rr$ing_per_hexp <- (rr$yauthaj)*rr$expc_full
# # rr$ing_per_h <- sum(rr$yauthaj)/sum(rr$freq_folio*rr$expc_full)
# rr$ing_per_h <- rr$yauthaj*(rr$freq_folio*rr$expc_full)
# head(rr,10)
# promedio <- mean((rr$ing_per_h)/(rr$freq_folio*rr$expc_full))
# promedio