Semana 8: laboratorio de remuneraciones municipales

Construcción de base, tablas y exportación

Dr.(c) César Marcelo Ávila Fuentes

Universidad Católica de Temuco

2026-05-13

Objetivo

Construir una base de remuneraciones municipales a partir de archivos descargados desde Transparencia Activa.

En este laboratorio vamos a:

  1. cargar archivos CSV
  2. agregar variables identificadoras
  3. estandarizar columnas
  4. unir archivos usando bind_rows()
  5. revisar brevemente un ejemplo de left_join()
  6. construir tablas descriptivas
  7. exportar resultados a Word, Excel e imagen.

1. Preparar el proyecto

La carpeta del proyecto debería tener una estructura parecida a esta:

semana8_remuneraciones/
├── datos_raw/
│   ├── planta_marzo_2026.csv
│   ├── contrata_marzo_26.csv
│   ├── cdt_marzo_26.csv
│   └── honorarios_26.csv
├── datos_clean/
├── outputs/
├── scripts/
└── semana8_laboratorio_remuneraciones.qmd

2. Cargar paquetes

library(dplyr)
library(readr)
library(janitor)
library(stringr)
library(flextable)
library(officer)
library(writexl)
library(gt)

Recordar primero instalar en caso de no contar en la biblioteca con los paquetes antes mencionados.

3. Cargar archivos

Los archivos vienen separados por punto y coma, por eso usaremos read_csv2().

planta <- read_csv2("datos_raw/planta_marzo_2026.csv", locale = locale(encoding = "Latin1")) |>
  clean_names()

contrata <- read_csv2("datos_raw/contrata_marzo_26.csv", locale = locale(encoding = "Latin1")) |>
  clean_names()

cdt <- read_csv2("datos_raw/cdt_marzo_26.csv", locale = locale(encoding = "Latin1")) |>
  clean_names()

honorarios <- read_csv2("datos_raw/honorarios_26.csv", locale = locale(encoding = "Latin1")) |>
  clean_names()

4. Revisar nombres de variables

Antes de limpiar, debemos mirar qué columnas trae cada archivo.

names(planta)
names(contrata)
names(cdt)
names(honorarios)

4. Revisar nombres de variables Planta

Antes de limpiar, debemos mirar qué columnas trae cada archivo.

names(planta)
 [1] "ano"                                                                               
 [2] "mes"                                                                               
 [3] "estamento"                                                                         
 [4] "nombre_completo"                                                                   
 [5] "cargo_o_funcion"                                                                   
 [6] "grado_eus_o_jornada"                                                               
 [7] "calificacion_profesional_o_formacion"                                              
 [8] "region"                                                                            
 [9] "asignaciones_especiales_del_mes_inc_en_rem_bruta"                                  
[10] "remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras"
[11] "remuneracion_liquida_del_mes"                                                      
[12] "rem_adicionales_del_mes_no_inc_en_rem_bruta"                                       
[13] "remuneracion_bonos_incentivos_del_mes_inc_en_rem_bruta"                            
[14] "derecho_a_horas_extraordinarias"                                                   
[15] "montos_y_horas_extraordinarias_diurnas_del_mes_inc_en_rem_bruta"                   
[16] "montos_y_horas_extraordinarias_nocturnas_del_mes_inc_en_rem_bruta"                 
[17] "montos_y_horas_extraordinarias_festivas_del_mes_inc_en_rem_bruta"                  
[18] "fecha_de_inicio_dd_mm_aa"                                                          
[19] "fecha_de_termino_dd_mm_aa"                                                         
[20] "observaciones"                                                                     
[21] "viaticos_del_mes_no_inc_en_rem_bruta"                                              
[22] "x22"                                                                               

4. Revisar nombres de variables Contrata

Antes de limpiar, debemos mirar qué columnas trae cada archivo.

names(contrata)
 [1] "ano"                                                                               
 [2] "mes"                                                                               
 [3] "estamento"                                                                         
 [4] "nombre_completo"                                                                   
 [5] "cargo_o_funcion"                                                                   
 [6] "grado_eus_o_jornada"                                                               
 [7] "calificacion_profesional_o_formacion"                                              
 [8] "region"                                                                            
 [9] "asignaciones_especiales_del_mes_inc_en_rem_bruta"                                  
[10] "remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras"
[11] "remuneracion_liquida_del_mes"                                                      
[12] "rem_adicionales_del_mes_no_inc_en_rem_bruta"                                       
[13] "remuneracion_bonos_incentivos_del_mes_inc_en_rem_bruta"                            
[14] "derecho_a_horas_extraordinarias"                                                   
[15] "montos_y_horas_extraordinarias_diurnas_del_mes_inc_en_rem_bruta"                   
[16] "montos_y_horas_extraordinarias_nocturnas_del_mes_inc_en_rem_bruta"                 
[17] "montos_y_horas_extraordinarias_festivas_del_mes_inc_en_rem_bruta"                  
[18] "fecha_de_inicio_dd_mm_aa"                                                          
[19] "fecha_de_termino_dd_mm_aa"                                                         
[20] "viaticos_del_mes_no_inc_en_rem_bruta"                                              
[21] "observaciones"                                                                     
[22] "x22"                                                                               

4. Revisar nombres de variables Código del Trabajo

Antes de limpiar, debemos mirar qué columnas trae cada archivo.

names(cdt)
 [1] "ano"                                                                               
 [2] "mes"                                                                               
 [3] "nombre_completo"                                                                   
 [4] "cargo_o_funcion"                                                                   
 [5] "grado_eus_o_jornada"                                                               
 [6] "calificacion_profesional_o_formacion"                                              
 [7] "region"                                                                            
 [8] "asignaciones_especiales_del_mes_inc_en_rem_bruta"                                  
 [9] "remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras"
[10] "remuneracion_liquida_del_mes"                                                      
[11] "rem_adicionales_del_mes_no_inc_en_rem_bruta"                                       
[12] "remuneracion_bonos_incentivos_del_mes_inc_en_rem_bruta"                            
[13] "monto_de_desvinculacion_no_inc_en_rem_bruta"                                       
[14] "derecho_a_horas_extraordinarias"                                                   
[15] "montos_y_horas_extraordinarias_del_mes_inc_en_rem_bruta"                           
[16] "viaticos_del_mes_no_inc_en_rem_bruta"                                              
[17] "fecha_de_inicio_dd_mm_aaaa"                                                        
[18] "fecha_de_termino_dd_mm_aaaa"                                                       
[19] "observaciones"                                                                     
[20] "x20"                                                                               

4. Revisar nombres de variables Honorarios

Antes de limpiar, debemos mirar qué columnas trae cada archivo.

names(honorarios)
 [1] "ano"                                 
 [2] "mes"                                 
 [3] "nombre_completo"                     
 [4] "grado_eus_si_corresponde"            
 [5] "descripcion_de_la_funcion"           
 [6] "calificacion_profesional_o_formacion"
 [7] "region"                              
 [8] "honorario_total_bruto_del_mes"       
 [9] "honorario_total_liquido_del_mes"     
[10] "tipo_de_pago"                        
[11] "descripcion_pago"                    
[12] "numero_de_cuotas"                    
[13] "fecha_de_inicio"                     
[14] "fecha_de_termino"                    
[15] "observaciones"                       
[16] "enlace_funciones_desarrolladas"      
[17] "viaticos"                            
[18] "x18"                                 

5. Revisar estructura general

glimpse(planta)

5. Revisar estructura general

glimpse(planta)
Rows: 72
Columns: 22
$ ano                                                                                <dbl> …
$ mes                                                                                <chr> …
$ estamento                                                                          <chr> …
$ nombre_completo                                                                    <chr> …
$ cargo_o_funcion                                                                    <chr> …
$ grado_eus_o_jornada                                                                <dbl> …
$ calificacion_profesional_o_formacion                                               <chr> …
$ region                                                                             <chr> …
$ asignaciones_especiales_del_mes_inc_en_rem_bruta                                   <chr> …
$ remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras <chr> …
$ remuneracion_liquida_del_mes                                                       <chr> …
$ rem_adicionales_del_mes_no_inc_en_rem_bruta                                        <chr> …
$ remuneracion_bonos_incentivos_del_mes_inc_en_rem_bruta                             <chr> …
$ derecho_a_horas_extraordinarias                                                    <chr> …
$ montos_y_horas_extraordinarias_diurnas_del_mes_inc_en_rem_bruta                    <chr> …
$ montos_y_horas_extraordinarias_nocturnas_del_mes_inc_en_rem_bruta                  <chr> …
$ montos_y_horas_extraordinarias_festivas_del_mes_inc_en_rem_bruta                   <chr> …
$ fecha_de_inicio_dd_mm_aa                                                           <chr> …
$ fecha_de_termino_dd_mm_aa                                                          <chr> …
$ observaciones                                                                      <chr> …
$ viaticos_del_mes_no_inc_en_rem_bruta                                               <chr> …
$ x22                                                                                <lgl> …
glimpse(contrata)
Rows: 56
Columns: 22
$ ano                                                                                <dbl> …
$ mes                                                                                <chr> …
$ estamento                                                                          <chr> …
$ nombre_completo                                                                    <chr> …
$ cargo_o_funcion                                                                    <chr> …
$ grado_eus_o_jornada                                                                <dbl> …
$ calificacion_profesional_o_formacion                                               <chr> …
$ region                                                                             <chr> …
$ asignaciones_especiales_del_mes_inc_en_rem_bruta                                   <chr> …
$ remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras <chr> …
$ remuneracion_liquida_del_mes                                                       <chr> …
$ rem_adicionales_del_mes_no_inc_en_rem_bruta                                        <chr> …
$ remuneracion_bonos_incentivos_del_mes_inc_en_rem_bruta                             <chr> …
$ derecho_a_horas_extraordinarias                                                    <chr> …
$ montos_y_horas_extraordinarias_diurnas_del_mes_inc_en_rem_bruta                    <chr> …
$ montos_y_horas_extraordinarias_nocturnas_del_mes_inc_en_rem_bruta                  <chr> …
$ montos_y_horas_extraordinarias_festivas_del_mes_inc_en_rem_bruta                   <chr> …
$ fecha_de_inicio_dd_mm_aa                                                           <chr> …
$ fecha_de_termino_dd_mm_aa                                                          <chr> …
$ viaticos_del_mes_no_inc_en_rem_bruta                                               <chr> …
$ observaciones                                                                      <chr> …
$ x22                                                                                <lgl> …
glimpse(cdt)
Rows: 5
Columns: 20
$ ano                                                                                <dbl> …
$ mes                                                                                <chr> …
$ nombre_completo                                                                    <chr> …
$ cargo_o_funcion                                                                    <chr> …
$ grado_eus_o_jornada                                                                <chr> …
$ calificacion_profesional_o_formacion                                               <chr> …
$ region                                                                             <chr> …
$ asignaciones_especiales_del_mes_inc_en_rem_bruta                                   <chr> …
$ remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras <chr> …
$ remuneracion_liquida_del_mes                                                       <chr> …
$ rem_adicionales_del_mes_no_inc_en_rem_bruta                                        <chr> …
$ remuneracion_bonos_incentivos_del_mes_inc_en_rem_bruta                             <chr> …
$ monto_de_desvinculacion_no_inc_en_rem_bruta                                        <chr> …
$ derecho_a_horas_extraordinarias                                                    <chr> …
$ montos_y_horas_extraordinarias_del_mes_inc_en_rem_bruta                            <chr> …
$ viaticos_del_mes_no_inc_en_rem_bruta                                               <chr> …
$ fecha_de_inicio_dd_mm_aaaa                                                         <chr> …
$ fecha_de_termino_dd_mm_aaaa                                                        <chr> …
$ observaciones                                                                      <chr> …
$ x20                                                                                <lgl> …
glimpse(honorarios)
Rows: 204
Columns: 18
$ ano                                  <dbl> 2026, 2026, 2026, 2026, 2026, 202…
$ mes                                  <chr> "Marzo", "Marzo", "Marzo", "Marzo…
$ nombre_completo                      <chr> "Acuña Cerda, Jenifer Haydee", "A…
$ grado_eus_si_corresponde             <chr> "No asimilado a grado", "No asimi…
$ descripcion_de_la_funcion            <chr> "Prestacion de servicios Programa…
$ calificacion_profesional_o_formacion <chr> "Profesora Educación Fisica", "En…
$ region                               <chr> "Región de La Araucanía", "Región…
$ honorario_total_bruto_del_mes        <chr> "$ 1.462.759", "$ 636.008", "$ 22…
$ honorario_total_liquido_del_mes      <chr> "-", "-", "-", "-", "-", "-", "-"…
$ tipo_de_pago                         <chr> "Pago mensual", "Pago mensual", "…
$ descripcion_pago                     <chr> "-", "-", "-", "-", "-", "-", "-"…
$ numero_de_cuotas                     <chr> "-", "-", "-", "-", "-", "-", "-"…
$ fecha_de_inicio                      <chr> "02/01/2026", "01/01/2026", "05/0…
$ fecha_de_termino                     <chr> "31/12/2026", "31/12/2026", "30/0…
$ observaciones                        <chr> "decreto 415; decreto 874 17/02/2…
$ enlace_funciones_desarrolladas       <chr> "No publica", "No publica", "No p…
$ viaticos                             <chr> "No informa", "No informa", "No i…
$ x18                                  <lgl> NA, NA, NA, NA, NA, NA, NA, NA, N…

6. Agregar identificadores

Cada archivo debe conservar información sobre su origen.

Planta

planta <- planta |>
  mutate(
    municipio = "Vilcún",
    unidad = "Municipalidad",
    tipo_personal = "planta",
    anio = 2026,
    mes = "marzo",
    mes_num = 3,
    periodo = "2026-03"
  )

Contrata

contrata <- contrata |>
  mutate(
    municipio = "Vilcún",
    unidad = "Municipalidad",
    tipo_personal = "contrata",
    anio = 2026,
    mes = "marzo",
    mes_num = 3,
    periodo = "2026-03"
  )

Código del Trabajo

cdt <- cdt |>
  mutate(
    municipio = "Vilcún",
    unidad = "Municipalidad",
    tipo_personal = "codigo_trabajo",
    anio = 2026,
    mes = "marzo",
    mes_num = 3,
    periodo = "2026-03"
  )

Honorarios

honorarios <- honorarios |>
  mutate(
    municipio = "Vilcún",
    unidad = "Municipalidad",
    tipo_personal = "honorarios",
    anio = 2026,
    mes = "marzo",
    mes_num = 3,
    periodo = "2026-03"
  )

7. Estandarizar columnas

Los archivos no tienen exactamente las mismas columnas. Por eso construiremos una versión simplificada de cada base.

Planta simplificada

planta_simple <- planta |>
  transmute(
    municipio,
    unidad,
    tipo_personal,
    anio,
    mes,
    mes_num,
    periodo,
    nombre = nombre_completo,
    estamento = estamento,
    funcion = cargo_o_funcion,
    grado_jornada = grado_eus_o_jornada,
    formacion = calificacion_profesional_o_formacion,
    region = region,
    monto_bruto = remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras,
    monto_liquido = remuneracion_liquida_del_mes,
    fecha_inicio = fecha_de_inicio_dd_mm_aa,
    fecha_termino = fecha_de_termino_dd_mm_aa,
    observaciones = observaciones
  )

Contrata simplificada

contrata_simple <- contrata |>
  transmute(
    municipio,
    unidad,
    tipo_personal,
    anio,
    mes,
    mes_num,
    periodo,
    nombre = nombre_completo,
    estamento = estamento,
    funcion = cargo_o_funcion,
    grado_jornada = grado_eus_o_jornada,
    formacion = calificacion_profesional_o_formacion,
    region = region,
    monto_bruto = remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras,
    monto_liquido = remuneracion_liquida_del_mes,
    fecha_inicio = fecha_de_inicio_dd_mm_aa,
    fecha_termino = fecha_de_termino_dd_mm_aa,
    observaciones = observaciones
  )

Código del Trabajo simplificado

cdt_simple <- cdt |>
  transmute(
    municipio,
    unidad,
    tipo_personal,
    anio,
    mes,
    mes_num,
    periodo,
    nombre = nombre_completo,
    estamento = NA_character_,
    funcion = cargo_o_funcion,
    grado_jornada = grado_eus_o_jornada,
    formacion = calificacion_profesional_o_formacion,
    region = region,
    monto_bruto = remuneracion_bruta_del_mes_incluye_bonos_e_incentivos_asig_especiales_horas_extras,
    monto_liquido = remuneracion_liquida_del_mes,
    fecha_inicio = fecha_de_inicio_dd_mm_aaaa,
    fecha_termino = fecha_de_termino_dd_mm_aaaa,
    observaciones = observaciones
  )

Honorarios simplificada

honorarios_simple <- honorarios |>
  transmute(
    municipio,
    unidad,
    tipo_personal,
    anio,
    mes,
    mes_num,
    periodo,
    nombre = nombre_completo,
    estamento = NA_character_,
    funcion = descripcion_de_la_funcion,
    grado_jornada = grado_eus_si_corresponde,
    formacion = calificacion_profesional_o_formacion,
    region = region,
    monto_bruto = honorario_total_bruto_del_mes,
    monto_liquido = honorario_total_liquido_del_mes,
    fecha_inicio = fecha_de_inicio,
    fecha_termino = fecha_de_termino,
    observaciones = observaciones
  )

8. Preparar tipos de columnas antes de unir

Antes de apilar las bases, conviene asegurar que las columnas comunes tengan el mismo tipo. En estos archivos, por ejemplo, grado_jornada puede venir como número en una base y como texto en otra. Eso hace que bind_rows() se detenga.

Primero generaremos un conjunto, con los nombres de las variables que debiesen ser reconocidas como texto

columnas_texto <- c(
  "municipio", "unidad", "tipo_personal", "mes", "periodo",
  "nombre", "estamento", "funcion", "grado_jornada", "formacion",
  "region", "monto_bruto", "monto_liquido", "fecha_inicio",
  "fecha_termino", "observaciones", "archivo_origen"
)

8. Preparar tipos de columnas antes de unir

Luego vamos a aplicar para cada elemento de esa lista de variables, la opción de ser conocida como texto (character)

planta_simple <- planta_simple |>
  mutate(across(any_of(columnas_texto), as.character))

contrata_simple <- contrata_simple |>
  mutate(across(any_of(columnas_texto), as.character))

cdt_simple <- cdt_simple |>
  mutate(across(any_of(columnas_texto), as.character))

honorarios_simple <- honorarios_simple |>
  mutate(across(any_of(columnas_texto), as.character))

9. Unir archivos con bind_rows()

Como queremos apilar registros, usamos bind_rows().

remuneraciones <- bind_rows(
  planta_simple,
  contrata_simple,
  cdt_simple,
  honorarios_simple
)

10. Revisar base unida

glimpse(remuneraciones)
Rows: 337
Columns: 18
$ municipio     <chr> "Vilcún", "Vilcún", "Vilcún", "Vilcún", "Vilcún", "Vilcú…
$ unidad        <chr> "Municipalidad", "Municipalidad", "Municipalidad", "Muni…
$ tipo_personal <chr> "planta", "planta", "planta", "planta", "planta", "plant…
$ anio          <dbl> 2026, 2026, 2026, 2026, 2026, 2026, 2026, 2026, 2026, 20…
$ mes           <chr> "marzo", "marzo", "marzo", "marzo", "marzo", "marzo", "m…
$ mes_num       <dbl> 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3,…
$ periodo       <chr> "2026-03", "2026-03", "2026-03", "2026-03", "2026-03", "…
$ nombre        <chr> "ALFARO PULGAR, PABLO  ESTEBAN", "ALVIAL RIVERA, VIVIANA…
$ estamento     <chr> "Técnico", "Profesional", "Técnico", "Administrativo", "…
$ funcion       <chr> "TÉCNICO ADMINISTRACIÓN MUNICIPAL", "PROFESIONAL OBRAS M…
$ grado_jornada <chr> "14", "11", "16", "17", "7", "9", "15", "17", "17", "7",…
$ formacion     <chr> "Técnico en Amplificación", "Ingeniero Civil", "Técnico …
$ region        <chr> "Región de La Araucanía", "Región de La Araucanía", "Reg…
$ monto_bruto   <chr> "$ 1.737.854", "$ 2.426.876", "$ 1.314.239", "$ 892.019"…
$ monto_liquido <chr> "$", "$", "$", "$", "$", "$", "$", "$", "$", "$", "$", "…
$ fecha_inicio  <chr> "01/06/2015", "03/11/2020", "25/03/2019", "17/11/2025", …
$ fecha_termino <chr> "Indefinido", "Indefinido", "Indefinido", "30/06/2026", …
$ observaciones <chr> "Sin Observaciones", "Sin Observaciones", "Sin Observaci…

10. Revisar base unida

remuneraciones |>
  count(tipo_personal)
# A tibble: 4 × 2
  tipo_personal      n
  <chr>          <int>
1 codigo_trabajo     5
2 contrata          56
3 honorarios       204
4 planta            72

Manejo y modificación de datos

Tabla 1: Tabla: Diferencias entre recodificación, variable derivada y corrección manual
Acción Qué hace Ejemplo
Recodificar Cambia o agrupa valores de una variable existente. 1 = Hombre, 2 = Mujer
Crear variable derivada Construye una nueva variable usando información existente. Obtener sexo desde nombre.
Corrección manual Ajusta casos puntuales luego de revisar errores. Cambiar fila 25 de No clasificado a Mujer.

11. Limpiar montos

summary(remuneraciones$monto_bruto)
   Length     Class      Mode 
      337 character character 
remuneraciones |>
  summarise(
    casos = n(),
    sin_monto_bruto = sum(is.na(monto_bruto)),
    sin_monto_liquido = sum(is.na(monto_liquido))
  )
# A tibble: 1 × 3
  casos sin_monto_bruto sin_monto_liquido
  <int>           <int>             <int>
1   337               0                 0

11. Limpiar montos

Los montos vienen como texto. Necesitamos convertirlos a números.

Como este proceso lo tendremos que repetir, generaremos una función, así podemos replicar este proceso solo escribiendo el nombre de la función posteriormente.

limpiar_monto <- function(x) {
  x |>
    str_remove_all("\\$") |>
    str_remove_all("\\.") |>
    str_trim() |>
    na_if("-") |>
    na_if("") |>
    na_if("No informa") |>
    as.numeric()
}

11. Limpiar montos

remuneraciones <- remuneraciones |>
  mutate(
    monto_bruto = limpiar_monto(monto_bruto),
    monto_liquido = limpiar_monto(monto_liquido)
  )

12. Revisar montos limpios

summary(remuneraciones$monto_bruto)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  47334  500000  885765 1015447 1294552 7008009 
remuneraciones |>
  summarise(
    casos = n(),
    sin_monto_bruto = sum(is.na(monto_bruto)),
    sin_monto_liquido = sum(is.na(monto_liquido))
  )
# A tibble: 1 × 3
  casos sin_monto_bruto sin_monto_liquido
  <int>           <int>             <int>
1   337               0               337

Recodificación derivada

  • Vamos a crear una variable sexo para identificar diferencias entre tipos de funcionarios.

  • Con la información que tenemos… ¿cómo podríamos hacerlo?

  • ¡Exacto! A partir de la variable nombre

Recodificación derivada

  • Para este ejemplo, la base (objeto) se llama remuneraciones. La columna con el nombre completo se llama nombre
remuneraciones <- remuneraciones |>
  mutate(
    nombre_limpio = str_to_lower(nombre),
    nombre_limpio = str_squish(nombre_limpio),
    primer_nombre = word(nombre_limpio, 3)
  )
  • Primero crea una variable nombre_limpio, que tiene todas las letras en minúscula. Esto evita que JUAN, Juan y juan sean tratados como valores distintos.

  • Luego, str_squish elimina los espacios innecesarios que pueen evistir al inicio, al final o entre palabras.

  • Por último, word(nombre_limpio, 3)Extrae la tercer palabra de nombre_limpio. Esto nos permitirá clasificar ese nombre según sexo.

Recodificación derivada

  • Ahora podemos crear un pequeño diccionario manual. Para eso, primero vamos a ver cuáles son los primeros nombres que aparecen en nuestros datos:
tabla_primeros_nombres <- remuneraciones |>
  count(primer_nombre, sort = TRUE)

View(tabla_primeros_nombres)

Recodificación derivada

Construir un diccionario de clasificación

diccionario_sexo <- tibble::tribble(
  ~primer_nombre, ~sexo,
  "maria", "Mujer",
  "juan", "Hombre",
  "mario", "Hombre",
  "belen", "Mujer"
)

Recodificación derivada

  • Construir un diccionario de clasificación
remuneraciones <- remuneraciones |>
  left_join(diccionario_sexo, by = "primer_nombre")

Recodificación derivada

  • Revisar casos sin clasificar
remuneraciones |>
  filter(is.na(sexo)) |>
  count(primer_nombre, sort = TRUE)
# A tibble: 184 × 2
   primer_nombre     n
   <chr>         <int>
 1 jose             10
 2 luis             10
 3 claudio           7
 4 jonathan          7
 5 miguel            7
 6 ana               6
 7 camila            6
 8 carlos            6
 9 viviana           5
10 andrea            4
# ℹ 174 more rows

Recodificación derivada

remuneraciones |>
  count(sexo) |>
  mutate(
    porcentaje = round(n / sum(n) * 100, 1)
  )
# A tibble: 3 × 3
  sexo       n porcentaje
  <chr>  <int>      <dbl>
1 Hombre    14        4.2
2 Mujer      6        1.8
3 <NA>     317       94.1

Situaciones especiales

Supongamos quiero corregir un nombre en particular:

remuneraciones <- remuneraciones |>
  mutate(
    sexo = if_else(
      primer_nombre == "carla",
      "Mujer",
      sexo
    )
  )

#Si necesitas hacerlo para más casos
remuneraciones <- remuneraciones |>
  mutate(
    sexo = case_when(
      primer_nombre == "carlos" ~ "Hombre",
      primer_nombre == "constanza" ~ "Mujer",
      primer_nombre == "alexis" ~ "Hombre",
      TRUE ~ sexo
    )
  )

Situaciones especiales

Podemos también hacerlo a filas especificas. Por ejemplo, si quieres cambiar el sexo de la observación 25:

remuneraciones <- remuneraciones |>
  mutate(
    sexo = if_else(
      row_number() == 25,
      "Mujer",
      sexo
    )
  )

La lógica es: Si la fila es la número 25, cambia sexo a “Mujer”. PAra todas las demás filas, deja el valor original de sexo

remuneraciones <- remuneraciones |>
  mutate(
    formacion_limpia = str_to_lower(formacion),
    formacion_limpia = str_squish(formacion_limpia),
    
    nivel_formacion = case_when(
      str_detect(formacion_limpia, "enseñanza básica|ensenanza basica|estudios básicos|estudios basicos") ~ 
        "Enseñanza básica",
      
      str_detect(formacion_limpia, "enseñanza media|ensenanza media|estudios medios|segundo año enseñanza media|media incompleta") ~ 
        "Enseñanza media",
      
      str_detect(formacion_limpia, "abogad|arquitect|asistente social|trabajador social|trabajadora social|cientista político|cientista politico|comunicador social|constructor civil|contador auditor|contador público|contador publico|educadora|fonoaudiolog|geolog|ingenier|kinesiolog|m[eé]dico|medico|odontolog|periodista|planificador social|profesor|profesora|psicolog|psicopedagog|sociolog|terapeuta ocupacional|veterinario|veterinaria") ~ 
        "Profesional universitario",
      
      str_detect(formacion_limpia, "técnico|tecnico|téc\\.|tec\\.|nivel medio|nivel superior") ~ 
        "Técnico",
      
      str_detect(formacion_limpia, "estudiante|egresad|estudios universitarios|estudios de|estudios pedagogía|estudios pedagogia") ~ 
        "Estudiante / estudios incompletos",
      
      str_detect(formacion_limpia, "auxiliar|maestro|monitor|instructor|mecánico|mecanico|soldador|secretaria") ~ 
        "Oficio / apoyo administrativo",
      
      TRUE ~ "Otro / no clasificado"
    ),
    
    tiene_postgrado_diplomado = case_when(
      str_detect(formacion_limpia, "magister|magíster|diplomado|postitulo|postítulo") ~ "Sí",
      TRUE ~ "No"
    )
  )

13. Tabla de frecuencia por tipo de personal

tabla_tipo <- remuneraciones |>
  count(tipo_personal, name = "registros") |>
  mutate(
    porcentaje = round(registros / sum(registros) * 100, 1)
  )

tabla_tipo
# A tibble: 4 × 3
  tipo_personal  registros porcentaje
  <chr>              <int>      <dbl>
1 codigo_trabajo         5        1.5
2 contrata              56       16.6
3 honorarios           204       60.5
4 planta                72       21.4

14. Tabla descriptiva de remuneraciones

tabla_remuneraciones <- remuneraciones |>
  group_by(tipo_personal) |>
  summarise(
    registros = n(),
    promedio_bruto = round(mean(monto_bruto, na.rm = TRUE), 0),
    mediana_bruto = round(median(monto_bruto, na.rm = TRUE), 0),
    minimo_bruto = min(monto_bruto, na.rm = TRUE),
    maximo_bruto = max(monto_bruto, na.rm = TRUE),
    sin_monto = sum(is.na(monto_bruto)),
    .groups = "drop"
  )

14. Tabla descriptiva de remuneraciones

tabla_remuneraciones
# A tibble: 4 × 7
  tipo_personal registros promedio_bruto mediana_bruto minimo_bruto maximo_bruto
  <chr>             <int>          <dbl>         <dbl>        <dbl>        <dbl>
1 codigo_traba…         5         446342        120448        47334       976221
2 contrata             56        1109228        917666       525133      2540591
3 honorarios          204         662758        636008        53340      1890000
4 planta               72        1981312       1582105        86621      7008009
# ℹ 1 more variable: sin_monto <int>

15. Mejorar tabla para presentación

tabla_presentacion <- tabla_remuneraciones |>
  rename(
    `Tipo de personal` = tipo_personal,
    `Registros` = registros,
    `Promedio bruto` = promedio_bruto,
    `Mediana bruto` = mediana_bruto,
    `Mínimo bruto` = minimo_bruto,
    `Máximo bruto` = maximo_bruto,
    `Sin monto informado` = sin_monto
  )

15. Mejorar tabla para presentación

tabla_presentacion
# A tibble: 4 × 7
  `Tipo de personal` Registros `Promedio bruto` `Mediana bruto` `Mínimo bruto`
  <chr>                  <int>            <dbl>           <dbl>          <dbl>
1 codigo_trabajo             5           446342          120448          47334
2 contrata                  56          1109228          917666         525133
3 honorarios               204           662758          636008          53340
4 planta                    72          1981312         1582105          86621
# ℹ 2 more variables: `Máximo bruto` <dbl>, `Sin monto informado` <int>

16. Convertir a flextable

tabla_flex <- tabla_presentacion |>
  flextable() |>
  set_caption("Tabla 1. Remuneraciones brutas por tipo de personal. Municipalidad de Vilcún, marzo 2026") |>
  autofit()

tabla_flex

Tipo de personal

Registros

Promedio bruto

Mediana bruto

Mínimo bruto

Máximo bruto

Sin monto informado

codigo_trabajo

5

446,342

120,448

47,334

976,221

0

contrata

56

1,109,228

917,666

525,133

2,540,591

0

honorarios

204

662,758

636,008

53,340

1,890,000

0

planta

72

1,981,312

1,582,105

86,621

7,008,009

0

17. Exportar a Word

dir.create("outputs", showWarnings = FALSE)

doc <- read_docx()

doc <- doc |>
  body_add_par("Resultados descriptivos preliminares", style = "heading 1") |>
  body_add_par("Tabla 1. Remuneraciones brutas por tipo de personal", style = "heading 2") |>
  body_add_flextable(tabla_flex) |>
  body_add_par(
    "Fuente: elaboración propia a partir de Transparencia Activa, Municipalidad de Vilcún, marzo 2026.",
    style = "Normal"
  )

print(doc, target = "outputs/tabla_remuneraciones_vilcun.docx")

18. Exportar a Excel

write_xlsx(
  list(
    tabla_tipo_personal = tabla_tipo,
    tabla_remuneraciones = tabla_presentacion
  ),
  path = "outputs/tablas_remuneraciones_vilcun.xlsx"
)

19. Como imagen gt

tabla_gt <- tabla_presentacion |>
  gt() |>
  tab_header(
    title = "Remuneraciones brutas por tipo de personal",
    subtitle = "Municipalidad de Vilcún, marzo 2026"
  ) |>
  tab_source_note(
    source_note = "Fuente: Transparencia Activa."
  )

gtsave(tabla_gt, "outputs/tabla.png")

Otra tabla sobre nivel de formación

tabla_nivel_formacion <- remuneraciones |>
  count(nivel_formacion, sort = TRUE) |>
  mutate(
    porcentaje = round(n / sum(n) * 100, 1)
  )

ft_nivel_formacion <- tabla_nivel_formacion |>
  flextable() |>
  set_header_labels(
    nivel_formacion = "Nivel de formación",
    n = "Frecuencia",
    porcentaje = "Porcentaje"
  ) |>
  colformat_num(
    j = "porcentaje",
    digits = 1,
    suffix = "%"
  ) |>
  theme_booktabs() |>
  autofit()

ft_nivel_formacion

Nivel de formación

Frecuencia

Porcentaje

Profesional universitario

137

40.7%

Técnico

102

30.3%

Enseñanza media

67

19.9%

Oficio / apoyo administrativo

12

3.6%

Otro / no clasificado

9

2.7%

Estudiante / estudios incompletos

6

1.8%

Enseñanza básica

4

1.2%

Tabla cruzada entre formación y tipo de personal

tabla_formacion_personal <- remuneraciones |>
  count(nivel_formacion, tipo_personal) |>
  group_by(nivel_formacion) |>
  mutate(
    porcentaje = round(n / sum(n) * 100, 1)
  ) |>
  ungroup()

ft_formacion_personal <- tabla_formacion_personal |>
  flextable() |>
  set_header_labels(
    nivel_formacion = "Nivel de formación",
    tipo_personal = "Tipo de personal",
    n = "Frecuencia",
    porcentaje = "Porcentaje dentro del nivel"
  ) |>
  colformat_num(
    j = "porcentaje",
    digits = 1,
    suffix = "%"
  ) |>
  theme_vanilla() |>
  autofit()

ft_formacion_personal

Nivel de formación

Tipo de personal

Frecuencia

Porcentaje dentro del nivel

Enseñanza básica

contrata

1

25.0%

Enseñanza básica

honorarios

2

50.0%

Enseñanza básica

planta

1

25.0%

Enseñanza media

codigo_trabajo

1

1.5%

Enseñanza media

contrata

20

29.9%

Enseñanza media

honorarios

27

40.3%

Enseñanza media

planta

19

28.4%

Estudiante / estudios incompletos

contrata

1

16.7%

Estudiante / estudios incompletos

honorarios

5

83.3%

Oficio / apoyo administrativo

honorarios

10

83.3%

Oficio / apoyo administrativo

planta

2

16.7%

Otro / no clasificado

honorarios

8

88.9%

Otro / no clasificado

planta

1

11.1%

Profesional universitario

codigo_trabajo

4

2.9%

Profesional universitario

contrata

11

8.0%

Profesional universitario

honorarios

91

66.4%

Profesional universitario

planta

31

22.6%

Técnico

contrata

23

22.5%

Técnico

honorarios

61

59.8%

Técnico

planta

18

17.6%

20. Guardar base limpia

dir.create("datos_clean", showWarnings = FALSE)

saveRDS(
  remuneraciones,
  file = "datos_clean/remuneraciones_vilcun_marzo_2026.rds"
)

21. Ejemplo breve de left_join()

Ahora imaginemos que queremos agregar información externa del municipio.

datos_municipio <- tibble(
  municipio = "Vilcún",
  provincia = "Cautín",
  region_administrativa = "La Araucanía",
  tipo_comuna = "Municipio de referencia para ejercicio"
)

Usamos left_join() porque queremos agregar columnas, no filas.

remuneraciones_contexto <- remuneraciones |>
  left_join(datos_municipio, by = "municipio")

21. Ejemplo breve de left_join()

Revisamos:

remuneraciones_contexto |>
  select(municipio, provincia, region_administrativa, tipo_comuna, tipo_personal) |>
  head()
# A tibble: 6 × 5
  municipio provincia region_administrativa tipo_comuna            tipo_personal
  <chr>     <chr>     <chr>                 <chr>                  <chr>        
1 Vilcún    Cautín    La Araucanía          Municipio de referenc… planta       
2 Vilcún    Cautín    La Araucanía          Municipio de referenc… planta       
3 Vilcún    Cautín    La Araucanía          Municipio de referenc… planta       
4 Vilcún    Cautín    La Araucanía          Municipio de referenc… planta       
5 Vilcún    Cautín    La Araucanía          Municipio de referenc… planta       
6 Vilcún    Cautín    La Araucanía          Municipio de referenc… planta       

22. Diferencia práctica

nrow(remuneraciones)
[1] 337
nrow(remuneraciones_contexto)
[1] 337

El número de filas no cambia, porque left_join() agregó columnas de contexto.

23. Actividad práctica

Cada grupo debe adaptar el script a su municipio.

Debe entregar una carpeta con:

outputs/
├── tabla_remuneraciones_municipio.docx
├── tablas_remuneraciones_municipio.xlsx
└── tabla_remuneraciones_municipio.png

datos_clean/
└── remuneraciones_municipio_marzo_2026.rds

24. Interpretación breve

Escriba un párrafo de 5 a 7 líneas que responda:

  1. ¿qué muestra la tabla?
  2. ¿qué tipo de personal concentra más registros?
  3. ¿qué diferencias se observan en remuneración bruta?
  4. ¿qué limitación debe considerarse?

Cierre

El objetivo de este laboratorio no es solo producir una tabla.

El objetivo es construir una base trazable, ordenada y reproducible, que luego pueda alimentar el póster descriptivo.