Este control tiene como finalidad evaluar el trabajo de base de datos y visualizaciones. Se evaluará la correcta ejecución del código y el uso eficiente de las herramientas de codificación entregadas.

Formato:

El formato de respuesta del control es el siguiente:

  1. Antes de la respuesta debes agregar un encabezado de tercer nivel (###) con Pregunta y el número de pregunta.
  2. Abajo del encabezado, debe estar escrita la pregunta.
  3. Agregar los códigos en chunks e incluir el output de ser necesario.
  4. La explicación de las respuestas (análisis) debe ir como texto, fuera del chunk.
  5. El título del informe debe ser “Control 2” y el nombre del(los) alumno(s) debe ir en autor.
  6. El control se debe entregar en formato PDF o en HTML como un link en su RPubs. Deberán subir sus respuestas además de su archivo en formato R Markdown como respaldo. Se evaluarán solo sus respuestas en el informe en HTML o PDF
  7. Recuerde que puede usar las “cheatsheets” disponibles en webcursos para apoyarse.
  8. No habrá que conectarse a Zoom. El control estará disponible desde las 8:30 y tendrán hasta las 12:00 del día para entregarlo.
  9. Podrá ser resuelto en parejas o individualmente.

El formato tiene puntaje asignado en la nota. (3 puntos)

Para este control, deberá usar la base de datos ENE.csv, este erchivo ya esta depurada de la Encuesta Nacional de Empleo (ENE) elaborada por el INE.

Pregunta 1

Cargue las librerias data.table, readxl, ggplot2, chilemapas,sf,sp,leaflet y las bases de datos ENE.csv con el nombre ENE y comunas.csv con el nombre comunas. Luego, una ambas bases de datos con el código de la comuna (en la base de datos de la ENE se llama r_p_c.) (5 puntos)

Pregunta 2

¿Cuántas personas fueron encuestadas y a cuántas personas representa esta encuesta?

Pregunta 3

Grafíque el número de personas por región, utilice la función ggplot.

Pregunta 4

Aguegue título, subtítlo y fuente al gráfico anterior, además arregle el eje x para que sea legible.

Pregunta 5

Escoja una región al azar. Cree un objeto que se llame Desempleo que contenga el número de personas por situación ocupacional y comuna de la región que eligió. Cree una nueva variable que se llame Tdesempleo utilizando la siguiente fórmula: \[ Tdesempleo = (Cesantes / Ocupados) + Cesantes \] Hint: Después de crear el objeto, cree una columna que sea la suma de ocupados por comuna, otra que sea la suma de cesantes por comuna, para después crear la tasa de desempleo que sea la suma de cesantes por comuna dividido por la suma de ocupados por comuna más la suma de cesantes por comuna.

Pregunta 7

Haga un gráfico de barras con las comunas en el eje y, y la tasa de desempleo en el eje x.

Pregunta 8

Cree un mapa con la tasa de desempleo comunal, utilizando el paquete chilemapas. Para esto, cree un objeto llamado mapa con el merge entre la geografía y la información de las comunas.

Hint: Después de realizar el merge, elimine los duplicados de las comunas del objeto mapa y seleccione solo las variables nombre_comuna, geometry, T_desempleo