El formato de respuesta es el siguiente:

Abajo del encabezado, debe estar escrita la pregunta. Agregar los códigos en chunks e incluir el output de ser necesario.

La explicación de las respuestas (si es que hay análisis) debe ir como texto, fuera del chunk.

El título del informe debe ser “Tarea 2” y el nombre de los integrantes debe ir en autor. La actividad deberá ser entregado en formato HTML.

También debe enviar su archivo en formato R Markdown como respaldo.

Recuerde que puede usar todo el material visto para apoyarse.

Todos los integrantes del grupo deben enviar el archivo de Rmarkdown

Tienen hasta el final de la clase para enviar la actividad

El formato tiene puntaje.

Carge el paquete a utilizar.

library(data.table)

Cargue la base Casen 2020. Llame al objeto casen20.

path <- 'C:/Users/sebas/Desktop/tarea 2/'
casen20 <- fread(paste0(path,'casen 2020 Valpo (1).csv'))

Cargue la base Comunas. Llame al objeto nombre_comunas.

path <- 'C:/Users/sebas/Desktop/tarea 2/'
nombre_comunas <- fread(paste0(path,'Codigos comunales (1).csv'))

1 - Vea la clase de casen20.

class(casen20)
## [1] "data.table" "data.frame"

2 - ¿Cuantas observaciones hay? ¿A cuantas personas representa la encuesta?(Ayuda: utilice el factor de expansión “expr”)

nrow(casen20)
## [1] 18505

3 - Filtre la base, de forma que solo queden personas mayores a 14 años en la muestra. Llame este nuevo objeto casen2.(ayuda: la variable edad se llama “edad”)

casen2 <- casen20[edad>14]

4 - Cree una variable categórica “estado”, la cual sea “Ocupado” si activ es 1, “Desocupado” activ es 2 e “Inactivo” si activ es 3. Esto en la base casen2.(Ayuda: “activ” es una variable de la base de datos)

casen2[activ == 1, ocupado := "ocupado"]
casen2[activ == 2, desocupado := "desocupado"]
casen2[activ == 3, inactivo := "inactivo"]

5 - ¿Cuantas personas representa la encuesta en cada uno de los estados creados en la pregunta 4?(Ayuda: utilice el factor de expansión expr)

6 - Repita el proceso hecho en la pregunta 5, pero muestre el número de personas por estado y comuna. Guarde el objeto en casen3 y luego muestrelo.(Ayuda: utilice el factor de expansion expc. La comuna está en la variable “comuna”)

7 - Haga un merge entre casen3 y nombre_comunas. Asegurese que solo queden las comunas de la quinta región. LLame a este nuevo objeto casen4.

8 - Haga un dcast de casen4, en donde las cada fila sea el nombre de una comuna y cada columna sea el número de personas que hay en cada estado. Guarde este objeto como casen5 (Ayuda: use dcast.data.table() o melt())

9 - Cree una nueva variable, la cual sea la tasa de desocupación comunal. Esta se calcula Desocupados/(Ocupados + Desocupados)*100. Señale que comuna posee la tasa más alta y a.

10 - Cree una nueva variable, la cual sea la tasa de participación comunal. Esta se calcula (Ocupados + Desocupados)/(Ocupados + Desocupados + Inactivos)*100. Señale que comuna tiene la tasa más alta y baja.