Preguntas

01 - Cargue la librería data.table (1 pto.)

library(data.table)


02 - Cargue la base de datos “ene-2021-06.csv” y guardela como “ene”. Luego cargue la base de datos “Codigos comunales.csv” y llamela “comunas” (2 pto.)

ene <- fread('ene-2021-06.csv') 
comunas <- fread('Codigos comunales.csv') 


03 - Filtre el objeto “ene”, de forma que solo queden personas mayores o iguales a 15 años. Guarde el objeto como “ene”. (ayuda: use variable “edad”) (2 ptos.)

ene <- ene[edad >= 15]


04 - Cree una variable “ocup” en objeto “ene”, en donde ocup = “Ocupados” si “cae_general” es 1,2, o 3, “Desocupados” si “cae_general” es 4 o 5, e “Inactivo” si “cae_general” es igual o mayor a 6.(4ptos.)

ene[cae_general %in% c(1:3), ocup := 'Ocupado']
ene[cae_general %in% c(4:5), ocup := 'Desocupado']
ene[cae_general >= 6, ocup := 'Inactivo']

ene[cae_general == 1 | cae_general == 2 | cae_general == 3 , ocup := 'Ocupado']
ene[cae_general == 4 | cae_general == 5, ocup := 'Desocupado']
ene[cae_general >= 6, ocup := 'Inactivo']


05 - En objeto “ene” cree la variable categórica “tramo_edad2”, en donde existan las categorías “De 15 a 29 años”, “De 30 a 44 años”, “De 45 a 59 años” y “De 60 o más años” en base a variable “edad”.(5 ptos)

ene[edad %in% c(15:29), tramo_edad2 := "De 15 a 29 años"]
ene[edad %in% c(30:44), tramo_edad2 := "De 30 a 44 años"]
ene[edad %in% c(45:59), tramo_edad2 := "De 45 a 59 años"]
ene[edad >= 60, tramo_edad2 := "De 60 o más años"]


06 - Realice un merge entre los objetos ene y comunas y a este objeto llamelo ene1. Las variables de comuna son, por parte de ene “r_p_c” y en comunas “codigo_comuna”.(5 ptos)

ene1 <- merge(x=ene,y=comunas, by.x = 'r_p_c', by.y = 'codigo_comuna')
ene1 <- merge(ene, comunas, by.x = "r_p_c", by.y = "codigo_comuna", all.x = T)


07 - ¿A cuantas personas representa la encuesta? En “ene1”, utilice el factor de expanción (fact_cal) para indicar el número de personas por “nombre_region”, “ocup” y “tramo_edad2”. Guarde esta nueva base como “ene2”(4 ptos)

ene2 <- ene1[,.(Total = sum(fact_cal,na.rm=T)),by=.(nombre_region,ocup,tramo_edad2)]


08 - Haga un dcast de “ene2”, en donde las filas sean los nombres regionales y tramo etario, mientras las columnas sean el número de personas por cada categoría ocupacional. Guarde este nuevo objeto como “ene3”. (5 ptos.) Ayuda:

region tramo_edad2 Ocupado Desocupado Inactivo
Antofagasta De 15 a 29 años 9561.56396 97123.234 66667.879
Antofagasta De 30 a 44 años 13061.14645 33344.053 121622.916
ene3 <- dcast.data.table(ene2, nombre_region + tramo_edad2 ~ ocup)


09 - Calcule la tasa de desempleo para cada región y tramo de edad. Esto es, crear una nueva columna en “ene3” utilizando la formula (Inactivo/(Ocupado + Desocupado + Inactivo))*100. A esta nueva variable llamela “tasa_inactividad”.(4 ptos)

ene3[,tasa_inactividad := (Inactivo/(Ocupado + Desocupado + Inactivo))*100]


BONUS - ¿Cual es la tasa de inactividad más alta de cada tramo etario? Señale el valor de cada una de estas tasas.(3 décimas)

ene3 <- ene3[,.(nombre_region,tasa_inactividad,max(tasa_inactividad,na.rm=T) == tasa_inactividad),by=.(tramo_edad2)]
ene3[V3 == T,]
##         tramo_edad2 nombre_region tasa_inactividad   V3
## 1:  De 15 a 29 años     Los Lagos         68.76278 TRUE
## 2:  De 30 a 44 años  La Araucania         33.39053 TRUE
## 3:  De 45 a 59 años     Los Lagos         38.92652 TRUE
## 4: De 60 o más años     Los Lagos         78.37252 TRUE