Reparación 2006

Acá debemos reparar Primavera y homologar los códigos al 2020.

ir al documento de códigos actualizados

1 Leemos la base de datos original:

2 Visibilizamos sus etiquetas:

3 Corroboramos el error para Primavera:

Primavera <- subset(casen_2006_labeled, COMUNA == "Primavera")
head(Primavera$EXPC,5)
## [1] 0.24 0.24 0.24 0.24 0.24

por definición los factores de expansión no pueden ser fracciones.

4 Comparamos con la población proyectada del INE para Provincia el 2006.

pob_chilena  <- readRDS("poblacion_chilena.rds")
pob_por_comuna_ine_2006 <- aggregate(pob_chilena$Poblacion.2006, by=list(Comuna=pob_chilena$Nombre.Comuna), FUN=sum)
Primavera <- subset(pob_por_comuna_ine_2006, Comuna == "Primavera")
Primavera
##        Comuna sum.pob_chilena$Poblacion.2006
## 229 Primavera                            909

5 Obtenemos el FEXC provisional para Primavera:

fexc_primavera <- round(909/272)
fexc_primavera
## [1] 3

6 Obtengamos el diccionario comunal para la casen_2006, renombramos e invertimos el orden. Éste diccionario lo extraemos de la base de datos original:

data_code <- stack(attr(casen_2006$COMUNA, 'labels'))
data_code <- data_code[c(2,1)]
names(data_code)[1] <- "COMUNA"
names(data_code)[2] <- "codigo"
head(data_code,10)
##           COMUNA codigo
## 1        Iquique   1101
## 2         Camiña   1102
## 3       Colchane   1103
## 4          Huara   1104
## 5           Pica   1105
## 6   Pozo Almonte   1106
## 7  Alto Hospicio   1107
## 8          Arica   1201
## 9      Camarones   1202
## 10         Putre   1301

7 Lo corregimos:

    data_code[270,2]<-11201
    data_code[8,2]<-15101
    data_code[178,2]<-16102
    data_code[9,2]<-15102
    data_code[2,2]<-1402
    data_code[177,2]<-16101
    data_code[182,2]<-16103
    data_code[96,2]<-6303
    data_code[179,2]<-16202
    data_code[180,2]<-16203
    data_code[181,2]<-16302
    data_code[3,2]<-1403
    data_code[287,2]<-13104
    data_code[261,2]<-14102
    data_code[183,2]<-16104
    data_code[262,2]<-14202
    data_code[11,2]<-15202
    data_code[4,2]<-1404
    data_code[292,2]<-13110
    data_code[263,2]<-14201
    data_code[264,2]<-14203
    data_code[265,2]<-14103
    data_code[66,2]<-5802
    data_code[266,2]<-14104
    data_code[267,2]<-14105
    data_code[268,2]<-14106
    data_code[89,2]<-6110
    data_code[184,2]<-16204
    data_code[185,2]<-16303
    data_code[68,2]<-5803
    data_code[271,2]<-14107
    data_code[272,2]<-14108
    data_code[186,2]<-16105
    data_code[5,2]<-1405
    data_code[187,2]<-16106
    data_code[188,2]<-16205
    data_code[6,2]<-1401
    data_code[10,2]<-15201
    data_code[246,2]<-16107
    data_code[49,2]<-5801
    data_code[92,2]<-6114
    data_code[190,2]<-16201
    data_code[191,2]<-16206
    data_code[273,2]<-14204
    data_code[192,2]<-16301
    data_code[193,2]<-16304
    data_code[194,2]<-16108
    data_code[195,2]<-16305
    data_code[286,2]<-13505
    data_code[196,2]<-16207
    data_code[260,2]<-14101
    data_code[51,2]<-5804
    data_code[197,2]<-16109

8 Hacemos un left-join para integrar correctamente los códigos:

df_final = merge( x = casen_2006_labeled, y = data_code, by = "COMUNA", all.x = TRUE)

9 Corregimos los factores de expansión para Primavera:

df_final$EXPC[(df_final$COMUNA == "Primavera")] <- 3

10 Guardamos el rds:

#saveRDS(df_final, file = "casen_2006_c.rds")

Reparación 2009

casen_2009 <- read_sav("Casen2009.sav")
casen_2009_labeled  <- as_factor(casen_2009, only_labelled = TRUE)
data_code <- stack(attr(casen_2009$COMUNA, 'labels'))
data_code <- data_code[c(2,1)]
names(data_code)[2] <- "codigo"
names(data_code)[1] <- "COMUNA"
head(data_code,10)
##           COMUNA codigo
## 1        Iquique   1101
## 2  Alto Hospicio   1107
## 3   Pozo Almonte   1401
## 4         Camiña   1402
## 5       Colchane   1403
## 6          Huara   1404
## 7           Pica   1405
## 8    Antofagasta   2101
## 9     Mejillones   2102
## 10  Sierra Gorda   2103
    data_code[253,2]<-16102
    data_code[149,2]<-16101
    data_code[150,2]<-16103
    data_code[305,2]<-16202
    data_code[306,2]<-16203
    data_code[44,2]<-16302
    data_code[45,2]<-16104
    data_code[106,2]<-5802
    data_code[332,2]<-16204
    data_code[46,2]<-16303
    data_code[107,2]<-5803
    data_code[47,2]<-16105
    data_code[48,2]<-16106
    data_code[307,2]<-16205
    data_code[254,2]<-16107
    data_code[98,2]<-5801
    data_code[308,2]<-16201
    data_code[309,2]<-16206
    data_code[49,2]<-16301
    data_code[310,2]<-16304
    data_code[311,2]<-16108
    data_code[255,2]<-16305
    data_code[256,2]<-16207
    data_code[99,2]<-5804
    data_code[312,2]<-16109
df_final = merge( x = casen_2009_labeled, y = data_code, by = "COMUNA", all.x = TRUE)
#saveRDS(df_final, file = "casen_2009_c.rds")

Reparación 2011

casen_2011 <- read_sav("Casen2011.sav")
casen_2011_labeled  <- as_factor(casen_2011, only_labelled = TRUE)
data_code <- stack(attr(casen_2011$comuna, 'labels'))
data_code <- data_code[c(2,1)]
names(data_code)[1] <- "comuna"
names(data_code)[2] <- "codigo"
head(data_code,10)
##           comuna codigo
## 1        Iquique   1101
## 2  Alto Hospicio   1107
## 3   Pozo Almonte   1401
## 4         Camiña   1402
## 5       Colchane   1403
## 6          Huara   1404
## 7           Pica   1405
## 8    Antofagasta   2101
## 9     Mejillones   2102
## 10  Sierra Gorda   2103
    data_code[171,2]<-16101
    data_code[172,2]<-16102
    data_code[173,2]<-16202
    data_code[174,2]<-16203
    data_code[175,2]<-16302
    data_code[176,2]<-16103
    data_code[177,2]<-16104
    data_code[178,2]<-16204
    data_code[179,2]<-16303
    data_code[180,2]<-16105
    data_code[181,2]<-16106
    data_code[182,2]<-16205
    data_code[183,2]<-16107
    data_code[184,2]<-16201
    data_code[185,2]<-16206
    data_code[186,2]<-16301
    data_code[187,2]<-16304
    data_code[188,2]<-16108
    data_code[189,2]<-16305
    data_code[190,2]<-16207
    data_code[191,2]<-16109
df_final = merge( x = casen_2011_labeled, y = data_code, by = "comuna", all.x = TRUE)
#saveRDS(df_final, file = "casen_2011_c.rds")