Preguntas
01 - Cargue la librería data.table (1 pto.)
library(data.table)
02 - Cargue la base de datos “ene-2021-06.csv” y guardela como “ene”. Luego cargue la base de datos “Codigos comunales.csv” y llamela “comunas” (2 pto.)
ene <- fread('ene-2021-06.csv')
comunas <- fread('Codigos comunales.csv')
04 - Cree una variable “ocup” en objeto “ene”, en donde ocup = “Ocupados” si “cae_general” es 1,2, o 3, “Desocupados” si “cae_general” es 4 o 5, e “Inactivo” si “cae_general” es igual o mayor a 6.(4ptos.)
ene[cae_general %in% c(1:3), ocup := 'Ocupado']
ene[cae_general %in% c(4:5), ocup := 'Desocupado']
ene[cae_general >= 6, ocup := 'Inactivo']
ene[cae_general == 1 | cae_general == 2 | cae_general == 3 , ocup := 'Ocupado']
ene[cae_general == 4 | cae_general == 5, ocup := 'Desocupado']
ene[cae_general >= 6, ocup := 'Inactivo']
05 - En objeto “ene” cree la variable categórica “tramo_edad2”, en donde existan las categorías “De 15 a 29 años”, “De 30 a 44 años”, “De 45 a 59 años” y “De 60 o más años” en base a variable “edad”.(5 ptos)
ene[edad %in% c(15:29), tramo_edad2 := "De 15 a 29 años"]
ene[edad %in% c(30:44), tramo_edad2 := "De 30 a 44 años"]
ene[edad %in% c(45:59), tramo_edad2 := "De 45 a 59 años"]
ene[edad >= 60, tramo_edad2 := "De 60 o más años"]
06 - Realice un merge entre los objetos ene y comunas y a este objeto llamelo ene1. Las variables de comuna son, por parte de ene “r_p_c” y en comunas “codigo_comuna”.(5 ptos)
ene1 <- merge(x=ene,y=comunas, by.x = 'r_p_c', by.y = 'codigo_comuna')
ene1 <- merge(ene, comunas, by.x = "r_p_c", by.y = "codigo_comuna", all.x = T)
07 - ¿A cuantas personas representa la encuesta? En “ene1”, utilice el factor de expanción (fact_cal) para indicar el número de personas por “nombre_region”, “ocup” y “tramo_edad2”. Guarde esta nueva base como “ene2”(4 ptos)
ene2 <- ene1[,.(Total = sum(fact_cal,na.rm=T)),by=.(nombre_region,ocup,tramo_edad2)]
08 - Haga un dcast de “ene2”, en donde las filas sean los nombres regionales y tramo etario, mientras las columnas sean el número de personas por cada categoría ocupacional. Guarde este nuevo objeto como “ene3”. (5 ptos.) Ayuda:
| Antofagasta |
De 15 a 29 años |
9561.56396 |
97123.234 |
66667.879 |
| Antofagasta |
De 30 a 44 años |
13061.14645 |
33344.053 |
121622.916 |
ene3 <- dcast.data.table(ene2, nombre_region + tramo_edad2 ~ ocup)
BONUS - ¿Cual es la tasa de inactividad más alta de cada tramo etario? Señale el valor de cada una de estas tasas.(3 décimas)
ene3 <- ene3[,.(nombre_region,tasa_inactividad,max(tasa_inactividad,na.rm=T) == tasa_inactividad),by=.(tramo_edad2)]
ene3[V3 == T,]
## tramo_edad2 nombre_region tasa_inactividad V3
## 1: De 15 a 29 años Los Lagos 68.76278 TRUE
## 2: De 30 a 44 años La Araucania 33.39053 TRUE
## 3: De 45 a 59 años Los Lagos 38.92652 TRUE
## 4: De 60 o más años Los Lagos 78.37252 TRUE