Manejo de Bases de datos con data.table + rmarkdown


Este control tiene como finalidad evaluar el trabajo de base de datos. Se evaluará la correcta ejecución del código y el uso eficiente de las herramientas de codificación entregadas.

Formato:

El formato de respuesta del control es el siguiente:

  1. Antes de la respuesta debes agregar un encabezado de tercer nivel (###) con Pregunta y el número de pregunta.
  2. Abajo del encabezado, debe estar escrita la pregunta.
  3. Agregar los códigos en chunks e incluir el output de ser necesario.
  4. La explicación de las respuestas (análisis) debe ir como texto, fuera del chunk.
  5. El título del informe debe ser “Control 1” y el nombre del alumno debe ir en autor.
  6. El control deberá ser entregado en formato PDF o HTML. Si lo hace en PDF, deberá enviar el archivo PDF por mail a la profesora, y si lo hace en HTML, deberá publicarlo en Rpubs y mandar el link. Para esto, debe crear una cuenta en https://rpubs.com e iniciar sesión. Una vez que su archivo esté terminado, cuando haga knit debe presionar el boton celeste en la esquina superior derecha (publish) y elegir la opción de publicar en Rpubs. Recuerde que debe comaprtir el link por mail.
  7. También debe enviar su archivo en formato R Markdown como respaldo. Se evaluarán solo sus respuestas en el informe en PDF
  8. Recuerde que puede usar las “cheatsheets” disponibles en webcursos para apoyarse.
  9. El control es individual y sin preguntas.

El formato tiene puntaje asignado en la nota. (3 puntos)

Pregunta 1

Limpie el environment para comenzar a trabajar. (1 punto)

Pregunta 2

Cargue los paquetes necesarios para trabajar con DT. (1 punto)

Pregunta 3

Abra la base de datos Resultados Electorales

Pista: Para los archivos .RDS utilice la función readRDS. Ojo que la base de datos no se abrirá como un DT, por lo tanto tiene que transformarla.

Pregunta 4

Elimine los individuos cuyo nombre del Candidato sea “VOTOS NULOS”, “TOTAL” o “VOTOS EN BLANCO”

Pregunta 5

¿Cuántos pactos hubo en total según los datos?

Pregunta 6

¿Cuántas comunas en total hay en la base de datos? ¿Cuál fue la comuna con más observaciones?

Pregunta 7

Genere una objeto que contenga los nombres de los candidatos. Asegurese de que la base de datos no repetirá el nombre de los candidatos.

Pregunta 8

¿Cuántas personas votaron en total? ¿Cuáles fueron las 2 coaliciones con más votos? ¿Cuántos votos obtuvieron?

Pregunta 9

¿Cuál fue el candidato “independiente” que obtuvo más votos?

Pregunta 10

¿Cuántas personas votaron en la comuna “LAS CONDES”?

Pregunta 9

Genere un objeto que contenga, para cada comuna, el número total de votos que se realizaron en la comuna. Llame a este objeto “DATOS_COMUNALES”

Pregunta 10

Genere una base que contenga el nombre del candidato y el número total de votos a nivel de comuna que recibieron. Llame a este objeto “DATOS_CANDIDATOS”.

Pregunta 11

Utilizando la base “DATOS_CANDIDATOS” genere una variable llamada “mayoria” que tome valor igual a uno si el individuo fue el candidatos con más votos en su comuna. En caso contrario, la variable debe tomar valor igual a cero.

Pregunta 12

Utilice la función “merge” para pegar la información de la base “DATOS_CANDIDATOS” y “DATOS_COMUNALES”. Llame a esta base “DATOS_FINALES”

Pregunta 13

Genere una variable que se llame “porcentaje” que indique la porcentaje de los votos que obtuvo el candidato en relación a los votos de su comuna.