Introducción

R4HR Club de R para RRHH es una comunidad de aprendizaje de programación de R para profesionales y estudiantes que trabajen o quieran trabajar en RRHH.

Somos una comunidad que usa mayormente datos de ejemplo relacionados con RRHH, y que genera contenido en castellano para eliminar las barreras en el aprendizaje y facilitar que más personas adopten las herramientas de análisis de datos en sus trabajos.

Para saber más de nosotros te invitamos a leer este post.

También podés ver todo el contenido que generamos en los siguientes links:

Google Drive

YouTube

Github

También te invitamos a seguirnos en todas nuestras redes sociales.

Pueden acceder a los datos crudos desde este link.

pais_rd <- rh22 %>% 
  group_by(pais) %>% 
  tally() %>% 
  ungroup 

pais_freelo <- freelo22 %>% 
  group_by(pais) %>% 
  tally() %>% 
  ungroup 

paises_kiwi <- full_join(pais_freelo, pais_rd, by = "pais") %>% 
    mutate(n.x = coalesce(n.x, 0),
         n.y = coalesce(n.y, 0),
         n = n.x + n.y)

Motivaciones

Como en RRHH trabajamos con datos sensibles, es complejo conseguir datos para practicar cuando estás aprendiendo sobre People Analytics, especialmente la parte práctica. Por eso, e inspirados en la Encuesta de SysArmy, una comunidad de tecnología, que entre otras cosas, organiza eventos como Nerdearla.

Por esta razón hicimos nuestra propia encuesta, relevando datos de profesionales que trabajan tanto bajo relación de dependencia como de manera freelance. El relevamiento de datos lo hicimos entre el 7 de octubre y el 22 de noviembre de 2021.

En esta edición recibimos 361 respuestas de 12 países diferentes.

paises_kiwi %>%
  arrange(-n, pais) %>% 
  select(pais, n) %>% 
  rename("País" = pais,
         "Respuestas" = n) %>% 
  kbl(caption = "Respuestas por País", ) %>% 
  kable_styling(full_width = F, position = "center",
                bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  footnote(general = fuente)
Respuestas por País
País Respuestas
Argentina 302
Paraguay 14
México 10
Perú 10
Bolivia 7
España 5
Chile 4
Uruguay 4
El Salvador 2
Ecuador 1
Guatemala 1
Otro Europa 1
Note:
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Del total de respuestas recibidas, 321 son de personas que trabajan en relación de dependencia en RRHH, mientras que 40 personas trabajan de manera freelance.

paises_kiwi <- paises_kiwi %>% 
  group_by(pais) %>% 
  summarise(total_freelo = sum(n.x),
            total_rd = sum(n.y)) %>% 
  ungroup() %>% 
  pivot_longer(cols = c("total_freelo", "total_rd"),
               names_to = "trabajo",
               values_to = "rtas")

kiwi %>% 
  select(trabajo) %>% 
  group_by(trabajo) %>% 
  count() %>% 
  ggplot(aes(x = n, y = trabajo)) +
  geom_col(fill = azul) +
  estilov +
  geom_text(aes(label = n), # Indica la cantidad de decimales
            size = 3,       # Cambia el tamaño de la letra
            hjust = 1.2,    # Mueve la etiqueta para la izquierda
            color = "white",
            family = "Roboto") +
  labs(title = "Respuestas por tipo de trabajador", 
       x = "", y = "", 
       caption = fuente)

Como aclaración, cuando nos referimos a la identidad de género de las personas, utilizamos los términos Mujer cis/Mujer trans* y Hombre cis/Hombre trans para poder reflejar con mayor precisión el abánico de identidades y percepciones.

El térmiino “cis” hace referencia a que la persona se identifica con el mismo género con el que nació.

Le agradecemos mucho a Ivana Feldeberg del Observatorio de Datos con Perspectiva de Género por el asesoramiento en este apartado.

Dicho esto, las respuestas según la identidad de género de las personas que participaron es la siguiente:

# Gráfico para relación de dependencia----
rh22 <- rh22 %>% 
  mutate(genero = fct_collapse(genero,  "Hombre cis" = c("Hombre cis", "Varon")))

div <- rh22 %>% 
  select(genero) %>% 
  mutate(genero = factor(genero, 
                         levels = c("Mujer cis", "Hombre cis", "Mujer trans"))) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$genero, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=genero)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c(lila, verde, amarillo)) +
  theme_void() +
  theme(legend.position = "top",
        panel.background = element_blank(),
        plot.title.position = "plot",
        text = element_text(family = "Roboto")) +
  labs(title = "Cantidad de respuestas según identidad de género",
       subtitle = "Relación de Dependencia",
       fill = "Identidad de Género", 
       caption = fuente)

# Gráfico de freelancers ----
freelo22 <- freelo22 %>% 
  mutate(genero = fct_collapse(genero, "Mujer cis" = c("Mujer cis", "Mujer")))

div <- freelo22 %>% 
  select(genero) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$genero, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=genero)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c(verde, lila)) +
  theme_void() +
  theme(legend.position = "top",
        panel.background = element_blank(),
        plot.title.position = "plot",
        text = element_text(family = "Roboto")) +
  labs(title = "Cantidad de respuestas según identidad de género",
       subtitle = "Freelancers",
       fill = "Identidad de Género", 
       caption = fuente)

En resumen, más de dos tercios de las personas que participaron de esta encuesta son mujeres cis. Algo que reflejan los datos es que en las áreas de Recursos Humanos, la diversidad de identidades de género es prácticamente nula.

# Corregir identidad de género
kiwi <- kiwi %>% 
    mutate(genero = fct_collapse(genero, "Mujer cis" = c("Mujer cis", "Mujer"),
                               "Hombre cis" = c("Hombre cis", "Varon")),
         genero = factor(genero, levels = c("Mujer cis", "Hombre cis")))

# Crear tabla
kiwi %>% 
  group_by(genero) %>% 
  tally(sort = T) %>% 
  mutate(Porcentaje = n/sum(n),
         Porcentaje = percent(Porcentaje, accuracy = 0.1)) %>% 
  janitor::adorn_totals() %>% 
  rename("Identidad de Género" = genero, 
         "Cantidad" = n) %>% 
  kbl(caption = "Total de Participantes según\nIdentidad de Género") %>% 
  kable_styling(full_width = F, position = "center",
                bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  footnote(general = fuente, general_title = "")
Total de Participantes según Identidad de Género
Identidad de Género Cantidad Porcentaje
Mujer cis 261 71.7%
Hombre cis 101 27.7%
NA 2 0.5%
Total 364
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Análisis de remuneraciones

Remuneraciones por país

En esta sección nos dedicaremos a comparar los sueldos entre los países. En primer lugar, hay que resaltar que los resultados no son representativos de los mercados de los países, sino que lo son de los datos recolectados.

Por otra parte, la baja cantidad de respuestas recolectadas de otros países fuera de la Argentina, nos hace imposible, hacer un análisis comparado representativo de los puestos. Sin embargo, hay algunos datos intresantes para analizar.

Primero, analicemos los sueldos de los trabajadores en relación de dependencia, de cuyos países hayamos recibido al menos 5 respuestas.

sueldos_dolar <- rh22 %>% 
  select(puesto, sueldo_dolar, pais, tipo_contratacion) %>% 
  filter(puesto != "Pasante", tipo_contratacion != "Pasante")

# Eliminamos los sueldos que están dentro del rango entre los percentiles 5 y 95
numericos <- profiling_num(sueldos_dolar)
poda_p05 <- numericos[1,6]
poda_p95 <- numericos[1,10]

# Dado que los percentiles 5 y 95 están en U$501 y 4656 respectivamente, 
# podamos todo lo que esté fuera de ese rango

media_pais <- sueldos_dolar %>% 
  filter(pais %in% c("Argentina", "Paraguay", "México", "Perú", "Bolivia", "España"),
         between(sueldo_dolar,poda_p05,poda_p95)) %>% 
  group_by(pais) %>% 
  summarise(sueldop = list(mean_se(sueldo_dolar))) %>% 
  unnest(cols = c(sueldop)) 
 
sueldo_dolar_pais <- rh22 %>% 
  select(pais, sueldo_dolar) %>% 
  filter(between(sueldo_dolar, poda_p05, poda_p95),
         pais %in% c("Argentina", "Paraguay", "México", "Perú", "Bolivia", "España"))

# Gráfico
ggplot(media_pais, aes(reorder(pais, -y), y =  y))+
  geom_col(fill = azul, alpha = 0.85) +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47")+
  geom_point(data = sueldo_dolar_pais, aes(x = pais, y = sueldo_dolar), 
             alpha = 0.3, size = 2, color = "#75838F",
             position = position_jitter(width = 0.15))+
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".", 
                              decimal.mark = ","),
                vjust = 1.5, fontface = "bold"), 
            size = 4, color = "white",
            family = "Roboto")+
  eje_y_n +
  labs(title = "Salario promedio por país",
       subtitle = "Sueldos de RRHH en U$S",
       caption = paste0(fuente,"\nPaíses con 5 o más respuestas"),
       x = NULL, y = NULL) + 
  estiloh

En España se encuentran los sueldos más altos de la muestra. Dentro de Latinoamérica, México es el país con mejores sueldos de la región seguido por Argentina. Obtuvimos muy pocas respuestas de Uruguay y Chile, que en las dos ediciones anteriores tenían los sueldos de la región, pero por la baja cantidad de respuestas, fueron excluidos del presente análisis.

Análisis de sueldos por puestos en Latinoamérica

# Crear un data frame sólo con países de Latinoamérica
rh22la <- rh22 %>% 
  filter(pais != "España")

# Gráficos de sueldo promedio por puesto
rh22la %>% 
  select(puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante",
         between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(puesto) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(mediana_salarial, accuracy = 1,prefix = "USS ",
                              decimal.mark = ",", big.mark = ".")),
                color = "#FBFCFC",
                hjust = 1.2,
            fontface = "bold",
            size = 3) +
  estilov +
  labs(title = "Mediana salarial por puesto", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", 
       caption = fuente) +
  eje_x_n

La posición de HRBP presenta una complejidad, que es que dependiendo la empresa el rol es similar al de un Manager, o en otros casos es un Analista Especializado o Senior. Por esa razón tiene una mediana salarial más alta que los Responsables. Es por eso que encontramos entre los HRBP encontramos un suledo mínimo similar al de los analistas y salarios máximos mayores que el de los directores.

gt(rh22la %>% 
     select(puesto, sueldo_dolar) %>% 
     filter(puesto != "Pasante",
            between(sueldo_dolar, poda_p05, poda_p95)) %>% 
     group_by(puesto) %>% 
     summarise(minimo = min(sueldo_dolar),
               mediana_salarial = median(sueldo_dolar),
               maximo = max(sueldo_dolar),
               cant = n())
     ) %>% 
  tab_header(title = "Mediana salarial por puestos", 
             subtitle = "Sueldos en U$D") %>% 
  tab_source_note(source_note = fuente) %>% 
   fmt_currency(columns =  c("mediana_salarial", "minimo", "maximo"), decimals = 0,
               sep_mark = ".", dec_mark = ",") %>% 
  cols_label(puesto = "Posición",
             minimo = "Mínimo",
             mediana_salarial = "Mediana",
             maximo = "Máximo",
             cant = "Respuestas") 
Mediana salarial por puestos
Sueldos en U$D
Posición Mínimo Mediana Máximo Respuestas
Director $1.402 $3.491 $3.782 5
Gerente $1.024 $2.910 $4.422 42
Jefe $1.338 $2.037 $4.655 36
Responsable $512 $1.294 $4.073 53
HRBP $519 $1.750 $4.655 29
Analista $503 $1.216 $3.200 111
Administrativo $550 $616 $1.455 7
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Anállisis por Funciones

Al igual que en ediciones anteriores, las funciones de RH más especializadas como Diseño Organizacional, Cultura y Bienestar y People Analytics cuentan con salarios más altos, mientras que funciones más transaccionales como Administración de Personal están dentro de los más bajos.

# Calcular la mediana salarial 
funcion_rh <- rh22la %>% 
  filter(puesto != "Pasante",
         between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(funcion) %>% 
  summarise(mediana = median(sueldo_dolar),
            cant = n()) %>% 
  arrange(-mediana)

min_funcion <- round(min(funcion_rh$mediana))
max_funcion <- round(max(funcion_rh$mediana))

# Gráfico
ggplot(funcion_rh, aes(x = mediana, y = reorder(funcion, mediana))) +
  geom_point(color = azul, size = 3) +
  geom_segment(aes(x = 0, xend = mediana, 
                   y = funcion, yend = funcion),
               color = azul) +
  labs(title = "Mediana Salarial por Función en LATAM",
       subtitle = "Sueldos de RRHH en U$S",
       x = NULL, y = NULL,
       caption = fuente) +
  geom_text(aes(label = comma(mediana, accuracy = 1,prefix = "USS ",
                              decimal.mark = ",", big.mark = ".")),
                color = azul,
                hjust = -.2,
            fontface = "bold",
            size = 3) +
  estilov +
  eje_x_n +
  scale_x_continuous(limits = c(0, 3000)) 

Nuevamente es necesario aclarar que hay funciones donde no tenemos mucha cantidad de respuestas como Compliance donde sólo tenemos un solo caso, pero la diferencia entre las funciones con mayores sueldos, y con los menores sueldos es muy amplia (U$D 1851).

gt(rh22la %>% 
     filter(puesto != "Pasante",
            between(sueldo_dolar, poda_p05, poda_p95)) %>% 
     select(funcion, sueldo_dolar) %>% 
     group_by(funcion) %>% 
     summarise(minimo = min(sueldo_dolar),
               mediana_salarial = median(sueldo_dolar),
               maximo = max(sueldo_dolar),
               cant = n())
     ) %>% 
  tab_header(title = "Mediana salarial por Función", 
             subtitle = "Sueldos en U$D") %>% 
  tab_source_note(source_note = fuente) %>% 
   fmt_currency(columns =  c("mediana_salarial", "minimo", "maximo"), decimals = 0,
               sep_mark = ".", dec_mark = ",") %>% 
  cols_label(funcion = "Función",
             minimo = "Mínimo",
             mediana_salarial = "Mediana",
             maximo = "Máximo",
             cant = "Respuestas") 
Mediana salarial por Función
Sueldos en U$D
Función Mínimo Mediana Máximo Respuestas
Administración de personal $512 $1.109 $2.502 27
Capacitación y desarrollo $616 $1.696 $3.491 16
Compensaciones y beneficios $763 $1.397 $3.491 13
Compliance $768 $768 $768 1
Comunicación interna $1.216 $1.216 $1.216 1
Payroll / Liquidación de sueldos $943 $1.362 $2.037 19
Cultura y bienestar $815 $2.386 $3.491 3
Diseño organizacional $908 $2.619 $3.592 9
Generalista $512 $1.724 $4.655 116
Gestión de expatriados $1.110 $1.110 $1.110 1
HRIS / Administración de sistemas de RH $832 $1.519 $4.655 6
People analytics $1.145 $1.747 $2.724 15
Reclutamiento y selección $503 $1.235 $4.452 52
Relaciones laborales $1.024 $1.390 $1.978 4
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Sueldos según el origen del capital

Si dividimos los gráficos según el Origen del Capital, podemos apreciar que en líneas generales, la mediana salarial en empresas multinaciones es mayor que en las empresas nacionales. Solamente en las posiciones de HRBP y de Gerente se aprecia una paridad salarial respecto del origen del capital de la organización.

rh22la %>% 
  select(origen_capital, puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante", 
         between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(puesto, origen_capital) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto), fill = origen_capital)) +
  geom_col() +
  geom_text(aes(label = round(x=mediana_salarial, 0), hjust = 1.2, fontface = "bold"),size = 3, color = "white") +
  scale_fill_manual(values = c(verde, azul)) +
  estilov +
  eje_x_n +
  facet_wrap(~origen_capital) +
  labs(title = "Mediana salarial por puesto según origen del capital", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", fill = "", 
       caption = fuente) +
  theme(legend.position = "top")

Veamos este gráfico de otra manera:

slope_df <- rh22la %>% 
  select(puesto, sueldo_dolar, origen_capital) %>% 
  filter(between(sueldo_dolar, poda_p05, poda_p95),
         puesto != "Pasante") %>% 
  group_by(puesto, origen_capital) %>% 
  summarise(mediana_salarial = round(median(sueldo_dolar)))

CGPfunctions::newggslopegraph(dataframe = slope_df,
                Times = origen_capital,
                Measurement = mediana_salarial,
                Grouping = puesto,
                Title = "Diferencias entre sueldos de RRHH en empresas nacionales y multinacionales",
                SubTitle = "Mediana Salarial. Sueldos en U$S",
                Caption = fuente, WiderLabels = T
                
                )

Análisis por rubro y origen del capital

Para el análisis de los rubros de la empresa, vamos a filtrar los 5 rubros que tienen más respuestas. También eliminaremos del análisis el puesto de Director porque no se encuentra presente en todos los rubros.

top_5_rubros <- rh22la %>% 
  select(rubro) %>% 
  group_by(rubro) %>% 
  count(sort = TRUE) %>%
  filter(rubro != "Otros", n > 30) %>% 
  pull(var = rubro)


rh22la %>% 
  select(rubro, origen_capital, puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante", puesto != "Director",
         between(sueldo_dolar, poda_p05, poda_p95),
         rubro %in% top_5_rubros) %>% 
  group_by(rubro, puesto, origen_capital) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto), 
             fill = origen_capital)) +
  geom_col() +
  geom_text(aes(label = round(x=mediana_salarial, 0), 
                hjust = 1.2, 
                fontface = "bold"),
            size = 3, 
            color = "white") +
  scale_fill_manual(values = c(verde, azul)) +
  estilo +
  eje_x_n +
  facet_grid(rubro~origen_capital) +
  labs(title = "Mediana salarial por puesto según origen del capital", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", fill = "", 
       caption = fuente) +
  theme(legend.position = "top")

Para ver las medianas salariales por rubros junto con el desvío estándar, pueden ver la siguiente tabla:

rh22la %>% 
    select(rubro, sueldo_dolar) %>% 
    filter(between(sueldo_dolar, poda_p05, poda_p95)) %>% 
    group_by(rubro) %>% 
    summarise(mediana_salarial = round(median(sueldo_dolar)),
              desvio_salarial = round(sd(sueldo_dolar)),
              Respuestas = n()) %>% 
  ungroup() %>% 
    arrange(-mediana_salarial) %>% 
  kbl(caption = "Mediana salarial por rubro. En U$S", 
      col.names = c("Rubro", "Mediana Salarial","Desvío", "Respuestas")) %>% 
  kable_styling(full_width = F, position = "center",
              bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  scroll_box(height = "500px")
Mediana salarial por rubro. En U$S
Rubro Mediana Salarial Desvío Respuestas
Silvicultura, madera, celulosa, papel 3346 206 2
Industrias químicas 3200 1376 7
Bancos, banca online 2470 1058 6
Agricultura, plantaciones, otros sectores rurales 2409 967 4
Servicios financieros seguros 2124 921 14
Minería 2095 812 3
Petróleo y producción de gas, refinación de petróleo 2095 514 9
Industria siderúrgica 1858 1640 2
Transporte (incluyendo aviación civil, ferrocarriles por carretera) 1804 783 3
Terminales automotrices, fábricas autopartistas, y afines 1705 364 3
Servicios de salud 1680 639 26
Función pública 1678 700 7
Otros 1676 968 32
Servicios profesionales 1571 538 9
Textiles, vestido, cuero, calzado 1549 839 4
Comercio 1501 733 19
Servicios públicos (agua, gas, electricidad) 1484 NA 1
Tecnologías de información 1472 1031 64
Medios de comunicación, cultura, gráficos 1338 234 5
Construcción 1280 569 9
Industria metalúrgica, metalmecánica 1228 884 12
Ingeniería mecánica 1222 NA 1
Alimentación, bebidas 1212 778 18
Servicios de consultoría 1190 1200 18
Educación 1158 656 4
Hotelería, restauración, turismo 1035 NA 1
Transporte marítimo, puertos 512 NA 1

Análisis por países

En esta sección analizaremos la situación salarial de RRHH únicamente de cuatro países: Argentina, Paraguay, México y Perú únicamente, por la cantidad de respuestas. Del resto de los países tenemos menos de 8 respuestas, por lo que es imposible realizar un análisis serio.

Paraguay

Análisis por puesto

# Preproceso -----

# Filtrar los sueldos extremos
rh22la_clean <- rh22la %>% 
  filter(puesto != "Pasante",
         between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  mutate(rubro = str_wrap(rubro, width = 30))

# Limpiar datos 2020
df2020 <-  profiling_num(kiwi20$sueldo_dolar)
p05_20 <- df2020[1,6]
p95_20 <- df2020[1,10]

rh20 <- kiwi20 %>% filter(between(sueldo_dolar, p05_20, p95_20)) %>% 
  mutate(anio = 2020) %>% 
  select(anio, pais, puesto, funcion = funcion_rh, sueldo_bruto) 


# Limpiar datos 2021
df2021 <- profiling_num(kiwi21$sueldo_dolar)
p05_21 <- df2021[1,6]
p95_21 <- df2021[1,10]

rh21 <- kiwi21 %>% filter(between(sueldo_dolar, p05_20, p95_20)) %>% 
  mutate(anio = 2021) %>% 
  select(anio, pais, puesto, funcion, sueldo_bruto) 



# Filtrar por Paraaguay ----
rh_py <- rh22la_clean %>% 
  filter(pais == "Paraguay") %>% 
  mutate(anio = 2022)

rh20py <- rh20 %>% 
  filter(pais == "Paraguay")

rh21py <- rh21 %>% 
  filter(pais == "Paraguay")

rh22py <- rh_py %>% 
    select(anio, pais, puesto, funcion, sueldo_bruto) 

# Para analizar evolución de salarios
# Evolucion
historico <- rbind(rh20py, rh21py, rh22py)

# Salario por puesto 

rh_py %>% 
  group_by(puesto) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(x = fct_rev(puesto), y = mediana)) +
  geom_col(fill = "#0038a8") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            vjust = 1.2,
            size = 3, 
            color = "white") +
  eje_y_n +
  estiloh +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Paraguay - En Gs.",
       x = NULL, y = NULL,
       caption = fuente)

Análisis por función

rh_py %>% 
  group_by(funcion) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(y = reorder(funcion, mediana), x = mediana)) +
  geom_col(fill = "#0038a8") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            hjust = 1.2,
            size = 3, 
            color = "white") +
  eje_x_n +
  estilov +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Paraguay - En Gs.",
       x = NULL, y = NULL,
       caption = fuente)

Análisis por rubro

rh_py %>% 
  group_by(rubro) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(y = reorder(rubro, mediana), x = mediana)) +
  geom_col(fill = "#0038a8") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            hjust = 1.2,
            size = 3, 
            color = "white") +
  eje_x_n +
  estilov +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Paraguay - En Gs.",
       x = NULL, y = NULL,
       caption = fuente)

Evolución

La evolución de los salarios en moneda local puede ser contraintuitiva dada la baja cantidad de respuestas obtenidas por año.

historico %>% 
  group_by(anio) %>% 
  summarise(mediana = median(sueldo_bruto)) %>% 
  ungroup %>% 
  ggplot(aes(x = anio, y = mediana)) +
  geom_col(fill = "#0038a8") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            vjust = 1.2, color = "white") +
  eje_y_n +
  estiloh +
  labs(title = "Mediana Salarial por Año",
       subtitle = "Datos de Paraguay - En Gs.",
       x = NULL, y = NULL,
       caption = fuente)

México

Análisis por puesto

# Filtrar por México ----
rh_mx <- rh22la_clean %>% 
  filter(pais == "México") %>% 
  mutate(anio = 2022)


rh_mx <- rh22la %>% 
  filter(pais == "México") %>% 
  mutate(anio = 2022)

rh20mx <- rh20 %>% 
  filter(pais == "México")

rh21mx <- rh21 %>% 
  filter(pais == "México")

rh22mx <- rh_mx %>% 
    select(anio, pais, puesto, funcion, sueldo_bruto) 

# Para analizar evolución de salarios
# Evolucion
historico <- rbind(rh20mx, rh21mx, rh22mx)

# Salario por puesto 

rh_mx %>% 
  group_by(puesto) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(x = fct_rev(puesto), y = mediana)) +
  geom_col(fill = "#006847") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            vjust = 1.2,
            size = 3, 
            color = "white") +
  eje_y_n +
  estiloh +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de México - En MX$",
       x = NULL, y = NULL,
       caption = fuente)

Análisis por función

rh_mx %>% 
  group_by(funcion) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(y = reorder(funcion, mediana), x = mediana)) +
  geom_col(fill = "#006847") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            hjust = 1.2,
            size = 3, 
            color = "white") +
  eje_x_n +
  estilov +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de México - En MX$",
       x = NULL, y = NULL,
       caption = fuente)

Análisis por rubro

rh_mx %>% 
  group_by(rubro) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(y = reorder(rubro, mediana), x = mediana)) +
  geom_col(fill = "#006847") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            hjust = 1.2,
            size = 3, 
            color = "white") +
  eje_x_n +
  estilov +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de México - En MX$",
       x = NULL, y = NULL,
       caption = fuente)

Evolución

La evolución de los salarios en moneda local puede ser contraintuitiva dada la baja cantidad de respuestas obtenidas por año.

historico %>% 
  group_by(anio) %>% 
  summarise(mediana = median(sueldo_bruto)) %>% 
  ungroup %>% 
  ggplot(aes(x = anio, y = mediana)) +
  geom_col(fill = "#006847") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            vjust = 1.2, 
            color = "white") +
  eje_y_n +
  estiloh +
  labs(title = "Mediana Salarial por Año",
       subtitle = "Datos de México - En MX$",
       x = NULL, y = NULL,
       caption = fuente)

Perú

Análisis por puesto

# Filtrar por México ----
rh_pe <- rh22la_clean %>% 
  filter(pais == "Perú") %>% 
  mutate(anio = 2022)


rh20pe <- rh20 %>% 
  filter(pais == "Perú")

rh21pe <- rh21 %>% 
  filter(pais == "Perú")

rh22pe <- rh_pe %>% 
    select(anio, pais, puesto, funcion, sueldo_bruto) 

# Para analizar evolución de salarios
# Evolucion
historico <- rbind(rh20pe, rh21pe, rh22pe)

# Salario por puesto 

rh_pe %>% 
  group_by(puesto) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(x = fct_rev(puesto), y = mediana)) +
  geom_col(fill = "#D91023") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            vjust = 1.2,
            size = 3, 
            color = "white") +
  eje_y_n +
  estiloh +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Perú - En S/",
       x = NULL, y = NULL,
       caption = fuente)

Análisis por función

rh_pe %>% 
  group_by(funcion) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(y = reorder(funcion, mediana), x = mediana)) +
  geom_col(fill = "#D91023") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            hjust = 1.2,
            size = 3, 
            color = "white") +
  eje_x_n +
  estilov +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Perú - En S/",
       x = NULL, y = NULL,
       caption = fuente)

Análisis por rubro

rh_pe %>% 
  group_by(rubro) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(y = reorder(rubro, mediana), x = mediana)) +
  geom_col(fill = "#D91023") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            hjust = 1.2,
            size = 3, 
            color = "white") +
  eje_x_n +
  estilov +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Perú - En S/",
       x = NULL, y = NULL,
       caption = fuente)

Evolución

La evolución de los salarios en moneda local puede ser contraintuitiva dada la baja cantidad de respuestas obtenidas por año.

historico %>% 
  group_by(anio) %>% 
  summarise(mediana = median(sueldo_bruto)) %>% 
  ungroup %>% 
  ggplot(aes(x = anio, y = mediana)) +
  geom_col(fill = "#D91023") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            vjust = 1.2, 
            color = "white") +
  eje_y_n +
  estiloh +
  labs(title = "Mediana Salarial por Año",
       subtitle = "Datos de Perú - En S/",
       x = NULL, y = NULL,
       caption = fuente)

Argentina

Análisis por puesto

# Filtrar por Argentina ----
rh_ar <- rh22la_clean %>% 
  filter(pais == "Argentina") %>% 
  mutate(anio = 2022)


rh20ar <- rh20 %>% 
  filter(pais == "Argentina")

rh21ar <- rh21 %>% 
  filter(pais == "Argentina")

rh22ar <- rh_ar %>% 
    select(anio, pais, puesto, funcion, sueldo_bruto) 

# Para analizar evolución de salarios
# Evolucion
historico <- rbind(rh20ar, rh21ar, rh22ar)

# Unificar nombres de funciones
historico <- historico %>% 
  mutate(funcion = fct_collapse(funcion, 
                                "Cultura y Clima" = c("Cultura y bienestar","Clima & Cultura"),
                                "Administración de Personal" = c("Administración de personal",
                                                                 "Administración de Personal"),
                                "Capacitación y Desarrollo" = c("Capacitación y desarrollo",
                                                                "Capacitación y desarrollo"),
                                "Compensaciones y Beneficios" = "Compensaciones y beneficios",
                                "Comunicación Interna" = c("Comunicación Interna", 
                                                           "Comunicación interna"),
                                "Diseño Organizacional" = c("Diseño Organizacional",
                                                            "Diseño organizacional"),
                                "Payroll" = c("Payroll",
                                              "Payroll / Liquidación de sueldos"),
                                "People Analytics" = c("People Analytics", 
                                                       "People analytics"),
                                "Reclutamiento" = c("Reclutamiento",
                                                    "Reclutamiento y selección"))) 

# Salario por puesto 

rh_ar %>% 
  group_by(puesto) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(x = fct_rev(puesto), y = mediana)) +
  geom_col(fill = "#75AADB") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            vjust = 1.2,
            size = 3, 
            color = "white") +
  eje_y_n +
  estiloh +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Argentina - En AR$",
       x = NULL, y = NULL,
       caption = fuente)

Dado que el puesto de HRBP en algunas compañías es un analista senior, y en otras es un puesto gerencial, explicaría el por qué la mediana salarial es mayor que el caso de los Responsables, que es una figura que se usa mayormente en empresas con estructuras pequeñas.

Evolución

historico %>% 
  group_by(anio) %>% 
  summarise(mediana = median(sueldo_bruto)) %>% 
  ungroup %>% 
  ggplot(aes(x = anio, y = mediana)) +
  geom_col(fill = "#75AADB") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            vjust = 1.2, 
            color = "white") +
  eje_y_n +
  estiloh +
  labs(title = "Mediana Salarial por Año",
       subtitle = "Datos de Argentina - En AR$",
       x = NULL, y = NULL,
       caption = fuente)

historico_tabla <- historico %>% 
  group_by(anio) %>% 
  summarise(mediana = median(sueldo_bruto)) %>% 
  ungroup 

La mediana salarial del año 2022 en comparación al 2021 creció un 117% mientras que el año anterior el incremento ha sido de un 67%.

Análisis por función

Nuevamente encontramos que los salarios de las funciones más sofisticadas se encuentran dentro de los salarios más altos, mientras que en roles más operativos encontramos salarios más bajos.

rh_ar %>% 
  group_by(funcion) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(y = reorder(funcion, mediana), x = mediana)) +
  geom_col(fill = "#75AADB") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            hjust = 1.2,
            size = 3, 
            color = "white") +
  eje_x_n +
  estilov +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Argentina - En AR$",
       x = NULL, y = NULL,
       caption = fuente)

A continuación podemos apreciar el incremento salarial en comparación con el año anterior de los roles en los cuales tenemos información.

historico %>% 
  filter(anio != 2020,
         !funcion %in% c("HRIS / Administración de sistemas de RH",
                         "Control de Gestión",
                         "Gestión de expatriados")) %>% 
  group_by(funcion, anio) %>%
  summarise(mediana = median(sueldo_bruto)) %>% 
  ungroup %>% 
  ggplot(aes(y = fct_rev(funcion), x = mediana, fill = factor(anio))) +
  geom_col(position = "dodge") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            position = position_dodge(0.9),
            hjust = 1.2,
            size = 2, 
            color = "white") +
  theme(legend.position = "top") +
  guides(fill = guide_legend(reverse=TRUE)) +
  scale_fill_manual(values = c(gris, "#75AADB")) +
  estilov +
  eje_x_n +
  labs(title = "Evolución Salarial por Función",
       subtitle = "En AR$",
       x = NULL, y = NULL,
       caption = fuente,
       fill = "Año")

Análisis por rubro

Veamos cuáles son los rubros mejor pagos en Argentina.

rh_ar %>% 
  group_by(rubro) %>% 
  summarise(mediana = median(sueldo_bruto)) %>%
  ungroup() %>% 
  ggplot(aes(y = reorder(rubro, mediana), x = mediana)) +
  geom_point(color = azul) +
  geom_segment(aes(x = 0, xend = mediana, y = rubro, yend = rubro), 
               color = "#75AADB") +
  geom_text(aes(label = comma(mediana, big.mark = ".", decimal.mark = ",")),
            hjust = -0.2,
            size = 2.8) +
  scale_x_continuous(limits = c(0, 700000), labels = comma_format(big.mark = ".", 
                                                                   decimal.mark = ";")) +
  estilov +
  labs(title = "Mediana Salarial por Puesto",
       subtitle = "Datos de Argentina - En AR$",
       x = NULL, y = NULL,
       caption = fuente)

Ahora comparemos los sueldos por rubros y géneros. Aquí podremos apreciar las diferencias entre los sueldos promedios de los hombres y mujeres en cada rubro.

rubro_ar <- rh_ar %>% 
  select(rubro, sueldo_ft) %>% 
  group_by(rubro) %>% 
  summarise(media_sueldo = mean(sueldo_ft),
            respuestas = n()) %>% 
  arrange(-respuestas)

top_rubros <- rubro_ar %>% 
  filter(rubro != "Otros", respuestas > 10) %>% 
  pull(rubro)

# Divide el largo de 'rubros' en varias líneas
rh_ar$rubro <- str_wrap(rh_ar$rubro, width = 40)


rh_ar %>% 
  filter(rubro %in% top_rubros) %>% 
  select(rubro, sueldo_ft, genero) %>% 
  group_by(rubro, genero) %>% 
  summarise(media_sueldo = mean(sueldo_ft),
            respuestas = n()) %>% 
  arrange(-respuestas) %>% 
  ggplot(aes(x = media_sueldo, y = reorder(rubro, media_sueldo), fill = genero)) +
  geom_col(position = "dodge") +
  geom_text(aes(label = comma(round(media_sueldo, 0),
                              big.mark = ".",
                              decimal.mark = ","),
                hjust = 1.4, vjust = 0.3),
            size = 3, 
            color = "white", 
            position = position_dodge(width = .9)) +
  scale_fill_manual(values = genero) +
  labs(title = "Promedio salarial por rubro y género",
       subtitle = "Datos de Argentina - en AR$",
       x = "", y = "", fill = "Género",
       caption = fuente) +
  eje_x_n +
  estilov +
  theme(axis.text.x = element_blank(),
        axis.ticks.x = element_blank(),
        plot.title.position = "plot") +
  guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

rm(rubro_ar, top_rubros)

Por último, analicemos los sueldos de los 6 rubros con mayor cantidad de respuestas, y visualicemos las distribuciones de los sueldos por puesto y género. En este gráfico podemos ver los cuartiles delimitando las zonas sombreadas, y la mediana con la línea en el centro de la caja. Los puntos violetas y verdes representan a las mujeres y los hombres respectivamente en cada uno de los puestos.

rh_ar %>% 
    filter(genero %in% c("Mujer cis", "Hombre cis"),
         puesto != "Director",
         rubro %in% c("Tecnologías de información",
                      "Servicios de consultoría",
                      "Servicios de salud",
                      "Alimentación, bebidas",
                      "Comercio",
                      "Servicios profesionales")) %>% 
  ggplot(aes(x = fct_rev(puesto), y = sueldo_bruto)) +
  geom_boxplot(width = 0.4, alpha = 0.3, fill = gris) +
  geom_point(aes(y = sueldo_bruto, color = genero), alpha = 0.4,
             position = position_jitter(width = 0.25)) +
  scale_color_manual(values = c(verde, lila)) +
  eje_y_n +
  coord_flip() +
  facet_wrap(~rubro, ncol = 2) +
  estilov +
  labs(title = "Distribución salarial por puesto y rubro",
       subtitle = "Datos de Argentina - en AR$",
       x = "", y = "", color = "Género",
       caption = fuente) +
  theme(plot.title.position = "plot",
        legend.position = "top")

Relaciones entre experiencia y sueldo bruto

En esta sección del análisis buscamos identificar cuáles son los factores que influyen en los ingresos (independientemente de la posición), así que empezamos a explorar los datos.

La primera pregunta que nos hicimos fue si los años de trayectoria influyen en el sueldo. Nuestra hipótesis es que a mayor cantidad de años de experiencia, mayor iba a ser el ingreso.

Lo que vamos a ver en el siguiente gráfico de dispersión, es en el eje horizontal, los años de experiencia, y en el eje vertical, el sueldo bruto expresado en pesos argentinos. Luego, vamos a graficar una recta, que nos va a indicar la fuerza de esa relación.

lm_rh <- lm(sueldo_ft ~ anios_rh, data = rh_ar)

lm_hr_results <- summary(lm_rh)

lm_rh_r2 <- round(lm_hr_results[["r.squared"]],3)

ggplot(rh_ar, aes(x=anios_rh, y = sueldo_ft)) +
  geom_point(color = "#1FC3AA", alpha = 0.4, size = 2) + 
  geom_smooth(method = "lm") +
  theme_minimal() +
  theme(text = element_text(family = "Roboto")) +
  labs(title = "Relación entre sueldo y años de experiencia",
       x = "Años de Experiencia",
       y = "Sueldo bruto (AR$)", 
       caption = fuente) +
  eje_y_n +
  geom_text(aes(x=-Inf, y=Inf, hjust=0, vjust=1, label= paste0("R2 = ", lm_rh_r2))) 

En el gráfico podemos apreciar una recta que va creciendo efectivamente: a medida que nos movemos más hacia la derecha, la recta va subiendo. Pero el \(R^2\) = 0.208 nos indica cuánto explica los años de experiencia sobre el sueldo bruto, o dicho de otra manera, en qué medida influye la variable x (años de experiencia), sobre la variable y (sueldo bruto). Una definición más precisa de este valor conocido como Coeficiente de Determinación es la proporción de la varianza total de la variable explicada por la regresión.

Este valor puede estar entre 0 y 1, mientras más cerca de 0 está menor es la relación, y mientras más cerca de 1 esté el resultado, indica que la regresión explica la variabilidad de la variable de respuesta. Es por eso que este \(R^2\) = 0.208 nos indica que los años de experiencia explican un 20.8% de la variabilidad de los sueldos en RRHH.

Relación entre años de experiencia y sueldo bruto por puesto.

Dado que en el gráfico anterior tenemos mezclados los sueldos de administrativos, analistas, jefes y gerentes, decidimos analizar la relación entre los años de experiencia y el sueldo bruto por cada uno de los puestos por separado.

mi.formula <- y ~ x

ggplot(rh_ar, aes(x=anios_rh, y = sueldo_ft)) +
  geom_point(color = "#1FC3AA", alpha = 0.4, size = 2) + 
  geom_smooth(method = "lm", formula = mi.formula, se = FALSE) +
  theme_minimal() +
  theme(text = element_text(family = "Roboto")) +
  labs(title = "Relación entre sueldo y años de experiencia",
       x = "Años de Experiencia",
       y = "", 
       caption = fuente) +
  eje_y_n +
  stat_poly_eq(formula = mi.formula, 
               aes(label = paste(..rr.label.., sep = "~~~")), 
               parse = TRUE) +
  facet_wrap(~puesto)

Como podemos apreciar en los \(R^2\) de cada gráfico en el único puesto donde encontramos una fuerte relación entre los años de experiencia y el sueldo bruto es en los Administrativos. En el resto de los puestos los años de trayectoria influyen muy poco en los sueldos de cada uno de los puestos. En el caso de los Directores también vemos una relación muy fuerte pero negativa. En ambos casos lo podemos atribuir a la baja cantidad de respuestas que afecta la calidad de este análisis.

Ahora bien, la pregunta es, ¿cuál es la variable que más influye en el sueldo en Recursos Humanos?. Tristemente, la respuesta no sorprende.

rh_ar %>% 
  filter(genero %in% c("Hombre cis", "Mujer cis")) %>% 
ggplot(aes(x = genero, y = sueldo_ft, fill = genero)) +
  geom_boxplot() +
  eje_y_n +
  scale_fill_manual(values = c(verde, lila)) +
  estiloh +
  labs(title = "Distribución salarial por género",
       x = "", y = "",
       fill = "Género", 
       caption = fuente) +
  theme(legend.position = "none")

Si bien hay outliers entre las mujeres con sueldos muy altos, los salarios de los hombres en general suelen ser más altos que el de las mujeres, por eso vemos que la caja de los hombres es más alta que el de las mujeres.

Análisis según género

Cuando analizamos la distribución salarial por puesto, apreciamos desigualdades que se repiten de años anteriores. Antes de profundizar, expliquemos brevemente cómo interpretar el gráfico que vemos a continuación que se llama boxplot.

En primer lugar, la parte inferior de cada caja indica el valor del primer cuartil, es decir el límite donde se encuentra el 25% de los datos. Por otra parte, la parte superior de cada caja indica el tercer cuartil, o sea, el 75% de los datos. Esto implica que dentro de la caja nos encontramos con la mitad de los datos. La cantidad de casos dentro de cada mitad es la misma para cada caja.

Un elemento muy importante dentro del gráfico es la línea que observamos dentro de cada caja que representa a la mediana que es el valor que divide a la mitad a los datos. Este es el valor que habitualmente utilizamos para comparar salarios porque representa el punto medio para cada grupo y además no es sensible a valores extremos como el promedio. La mediana es el valor que vamos a usar para comparar los sueldos entre hombres y mujeres.

Los puntos que observamos en algunos casos indican valores extremos que denominamos outliers. Estos valores son atípicos. Las líneas que salen de las cajas indican los límites a partir de los cuales se determina que un valor es atípico o no.

Por último, el tamaño de la caja también es importante porque nos da una idea de la distribución de los datos. Si la caja es chiquita quiere decir que los sueldos están en un rango de valores cercano. En cambio si la caja, o una de sus mitades, es larga, eso nos indica que los sueldos tienen un rango más amplio, o sea que los sueldos llegan a valores más altos o más bajos dependiendo el caso, y que se alejan más de la mediana.

rh_ar %>% 
  filter(genero %in% c("Hombre cis", "Mujer cis"),
         !puesto %in% c("Director", "Administrativo")) %>% 
ggplot(aes(x = fct_rev(puesto), y = sueldo_bruto, fill = genero)) +
  geom_boxplot() +
  estiloh +
  scale_fill_manual(values = c(verde, lila)) +
  eje_y_n +
  labs(title = "Distribución Salarial según Identidad de Género",
       subtitle = "En AR$",
       fill = "Identidad de Género",
       x = NULL, y = NULL,
       caption = fuente) +
  theme(legend.position = "top")

En el gráfico anterior podemos apreciar que las medianas de los sueldos es más alta para los hombres en los roles de Analista, Responsables, y Jefes. En cambio en las mujeres podemos apreciar que las HBRP y Gerentes tienen medianas salariales más altas.

Analizando el rol de Analista podemos ver que en el caso de los hombres, además de observar una mediana salarial más amplia que en el caso de las mujeres, el tamaño de la caja es más amplia, lo que nos indica que los sueldos de los analistas varones tienen un rango más amplio llegando a sueldos más altos que sus pares mujeres. Podemos apreciar varios outliers por encima de los AR$ 400.000 tanto para hombres y mujeres.

En el rol de Jefe apreciamos que las medianas están algo alejadas y el tamaño de la caja nos indica que los rangos de los sueldos de los hombres alcanza valores más altos que en el caso de las mujeres, mientras que la mitad superior de las mujeres está concentrado en un rango de valores muy cercanos. También podemos observar que hay algunos casos de mujeres con sueldos muy altos indicados como outliers (puntos) alrededor de los AR$ 600.000.

Esta es otra opción para visualizar los gaps salariales.

brecha <- rh_ar %>% 
  filter(genero %in% c("Mujer cis", "Hombre cis"), 
         puesto %in% c("Gerente","Jefe", "HRBP","Responsable", "Analista")) %>% 
  mutate(puesto = factor(puesto, levels = c("Analista",  
                                            "HRBP", "Responsable", "Jefe",
                                            "Gerente","Director"))) %>% 
  group_by(genero, puesto) %>% 
  summarise(media_salarial = median(sueldo_bruto, na.rm = TRUE)) %>% 
  ungroup()


brecha_graf <- brecha %>% 
  pivot_wider(., names_from = genero, values_from = media_salarial) %>% 
  mutate(brecha = percent((`Hombre cis`-`Mujer cis`)/`Hombre cis`, 1),
         x = (`Hombre cis` + `Mujer cis`)/2)

ggplot(brecha_graf, 
       aes(x = `Mujer cis`, xend = `Hombre cis`, y = puesto, 
           group = puesto, label = brecha)) +
  geom_dumbbell(color = "#808080",
                size_x = 3, size_xend = 3,
                colour_x = colores[1],
                colour_xend = colores[2]) +
  geom_text(data = brecha_graf, 
            aes(x, puesto, label = brecha), size = 3,
            nudge_y = .2) +
  labs(title = "Brecha salarial por puestos de RRHH",
       subtitle = "Mediana en Argentina",
       x = "",
       y = NULL, 
       caption = fuente) +
  scale_x_continuous(labels = comma_format(big.mark = ".", decimal.mark = ",")) +
  scale_color_manual(values = colores)

Si observamos la mediana salarial para cada puesto vemos que de acuerdo a las respuestas recolectadas las mujeres en puesto de Gerente tienen un sueldo un 10% mayor que los hombres en el mismo rol. No hay diferencia salarial en el puesto de HRBP.

Finalmente vemos que la brecha salarial en favor de los hombres es de un 16% en el rol de Jefe, un 14% para Responsables y de un 13% para los Analistas.

En la tabla a continuación veremos algunos datos que resumen estos hallazgos. Excluimos a los directores y administrativos porque tenemos muy pocas respuestas.

gt(rh_ar %>% 
  filter(genero %in% c("Hombre cis", "Mujer cis"), 
         !puesto %in% c("Director", "Administrativo")) %>% 
  group_by(puesto, genero) %>% 
  summarise(Rtas = n(),
            Min = min(sueldo_bruto),
            Mediana = median(sueldo_bruto),
            Promedio = mean(sueldo_bruto),
            Max = max(sueldo_bruto)
            ) %>% 
  ungroup() %>% 
  pivot_longer(cols = c("Rtas", "Min", "Mediana", "Promedio", "Max"),
               names_to = "Metrica",
               values_to = "Valor") %>% 
  pivot_wider(id_cols = c(puesto,genero),
              names_from = Metrica,
              values_from = Valor),
  groupname_col = "puesto") %>% 
  fmt_currency(columns = c(Min, Mediana, Promedio, Max),
               currency = "ARS",
               decimals = 0,
               sep_mark = ".",
               dec_mark = ",") %>% 
  tab_header(title = "Resumen Salarial por Puesto y Género",
             subtitle = "En AR$") %>% 
  tab_spanner(label = "Métricas Salariales",
              columns = c(Min, Mediana, Promedio, Max)) %>% 
  tab_source_note(source_note = fuente) %>% 
  cols_label(puesto = "Puesto",
             genero = "Género") %>% 
  tab_options(row_group.background.color = "#A3E4D7",)
Resumen Salarial por Puesto y Género
En AR$
Género Rtas Métricas Salariales
Min Mediana Promedio Max
Gerente
Hombre cis 13 $176.000 $500.000 $494.077 $736.000
Mujer cis 23 $235.000 $550.000 $497.863 $760.000
Jefe
Hombre cis 9 $250.000 $400.000 $426.668 $800.000
Mujer cis 20 $230.000 $337.425 $377.125 $623.000
Responsable
Hombre cis 15 $157.300 $255.000 $290.911 $700.000
Mujer cis 31 $88.000 $220.000 $231.612 $504.630
HRBP
Hombre cis 1 $300.000 $300.000 $300.000 $300.000
Mujer cis 24 $143.000 $301.500 $334.785 $800.000
Analista
Hombre cis 21 $90.000 $230.000 $251.676 $550.000
Mujer cis 75 $99.000 $200.000 $225.132 $500.000
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Educación

En esta sección queremos indagar si hay relación entre la formación y la remuneración, y si impacta también el tipo de universidad, pública o privada, en la remuneración y posición. Primero veamos entre los distintos países como se distribuye la muestra entre profesionales provenientes de universidades públicas y privadas.

Dado que tenemos relativamente pocas respuestas de otros países que no sean Argentina, no podemos sacar ninguna conclusión seria, sólo mencionar que en Argentina, hay una virtual paridad entre los estudiantes y graduados de universidades públicas y privadas. Posteriormente analizaremos la situación por regiones dentro del país.

Las proporciones de respuestas según al tipo de universidad que asistieron los participantes de la encuesta es la siguiente:

kiwi %>% 
  select(pais, tipo_universidad) %>% 
  group_by(pais, tipo_universidad) %>% 
  summarise(cant = n()) %>% 
  transmute(tipo_universidad, porcentaje = cant/sum(cant)) %>% 
  ungroup() %>% 
  ggplot(aes(y = fct_rev(pais),
             x = porcentaje,
             fill = tipo_universidad)) +
           geom_col(position = "fill") + 
  scale_fill_manual(values = c(gris, verde, azul)) +
  geom_text(aes(label = percent(porcentaje, accuracy = 1)), 
            position = position_fill(0.5),
            color = "white",
            fontface = "bold",
            size = 3) +
  labs(title = "Distribución de respuestas por tipo de universidad por país",
       caption = fuente,
       x = "", y = "") +
  estilo +
  theme(legend.position = "none") +
  eje_x_p


educ <- kiwi %>% 
  select(tipo_universidad) %>%  
  group_by(tipo_universidad) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
educ$ymax <- cumsum(educ$freq)

# Compute the bottom of each rectangle
educ$ymin <- c(0, head(educ$ymax, n=-1))

# Compute label position
educ$labelPosition <- (educ$ymax + educ$ymin) / 2

# Compute a good label
educ$label <- paste0(educ$tipo_universidad, "\n Cant: ", educ$n)

# Make the plot
ggplot(educ, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=tipo_universidad)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c(gris, verde, azul)) +
  theme_void() +
  theme(legend.position = "right",
        panel.background = element_blank(),
        text = element_text(family = "Roboto")) +
  labs(title = "Tipo de Universidad",
       fill = "Tipo de Universidad", 
       caption = fuente) +
  theme(legend.position = "left")

Las principales carreras de las personas que respondieron son:

carreras <- kiwi %>% 
  select(nivel_formacion, carrera_grado, tipo_universidad, trabajo, 
         sueldo_bruto, puesto, funcion, pais, genero) %>% 
  filter(trabajo == "Relación de Dependencia") %>% 
  mutate(carrera_grado = factor(carrera_grado))


carreras <- carreras %>% 
  mutate(carrera_grado = fct_collapse(carrera_grado, 
                                      "Comunicación Social" = c("Comunicación", "Comunicación social", "Comunicación Social", "comunicacion social", "Comunicación Institucional", "Comunicación Social Institucional"),
         "Ingenierías" = c("Ingeniería Comercial","Ingenieria Electronica", "Ingeniería Industrial"),
         "Sistemas" = c("Análisis Sistemas", "Sistemas"),
         "Administración de Empresas" = c("Administración de Empresas",
                                          "Administración Industrial",
                                          "Administración y Recursos Humanos"),
         "Abogacía" = c("Abogacía", "Derecho, HR y Escribania"),
         "RRHH / RRLL / RRTT" = c("Relaciones Laborales y Abogacia",
                                  "RRHH / RRLL / RRTT",
                                  "RRTT + Abogado UBA")),
         carrera_grado = fct_lump(carrera_grado, 
                                  prop = 0.02, 
                                  other_level = "Otras"),
         carrera_grado = factor(carrera_grado,
                               levels = c("RRHH / RRLL / RRTT", 
                                          "Psicología", 
                                          "Administración de Empresas",
                                          "Ingenierías",
                                          "Otras")))



carreras %>% 
  group_by(carrera_grado) %>% 
  summarise(cant = n()) %>%
  ungroup() %>% 
ggplot(aes(x = cant, y = fct_rev(carrera_grado))) + 
  geom_col(position = "dodge", fill = azul) +
  geom_text(aes(label = cant),
            size = 3,
            color = "white",
            facefont = "bold",
            hjust = 1.2) +
  labs(x="",y="") +
  estilov +
  labs(title = "Principales carreras estudiadas",
       subtitle = "Trabajadores en relación de dependencia",
       caption = fuente)

Dada la cantidad de respuestas por país, el análisis que haremos desde aquí en adelante sólo será para Argentina.

Análisis de educación y puestos para Argentina

Luego, podemos analizar en qué tipo de universidad estudiaron las personas que respondieron la encuesta, según el puesto actual que ocupan.

recorte_educacion <- rh22la %>%
  filter(pais == "Argentina") %>% 
  select(nivel_formacion, carrera_grado,
         tipo_universidad, trabajo, sueldo_bruto, puesto, funcion, pais, genero)

ggplot(recorte_educacion, (aes(x = puesto, fill = tipo_universidad))) + #Tipo de universidad y cargo
  geom_bar(position = "dodge") +
  theme(plot.title.position = "plot") + 
  labs(x="",y="") +
    estilov +
  scale_fill_manual(values = c(gris, verde, azul)) +
  coord_flip() +
  labs(title = "Cantidad de respuestas según puesto y universidad",
       subtitle = "Sólo respuestas de Argentina",
       x = "", fill = "Tipo de Universidad",
       caption = fuente) +
    guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

Reiteremos el análisis pero únicamente para las carreras relacionadas con Recursos Humanos y Relaciones del Trabajo.

recorte_educacion %>%
  filter(carrera_grado == "RRHH / RRLL / RRTT") %>% 
  ggplot(aes(x = puesto, fill = tipo_universidad)) + #Tipo de universidad y cargo
  geom_bar(position = "dodge") +
  theme(plot.title.position = "plot") + 
  labs(x="",y="") +
    estilov +
  scale_fill_manual(values = c(gris, verde, azul)) +
  coord_flip() +
  labs(title = "Cantidad de respuestas según puesto y universidad",
       subtitle = "Sólo respuestas de Argentina - Carreras de RH",
       x = "", fill = "Tipo de Universidad",
       caption = fuente) +
    guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

Podemos apreciar que a partir de los puestos de jefatura, hay mayor presencia de graduados provenientes de universidades privadas.

En Argentina, podemos ver la siguiente distribución por género y nivel educativo.

ne_salario <- recorte_educacion 


# Agrupa categorías de educación
ne_salario <- ne_salario %>% 
    mutate(nivel_formacion = 
             fct_collapse(nivel_formacion,
                          "Secundario completo" = c("Secundario completo",
                                                    "Terciario en curso", 
                                                    "Terciario abandonado",
                                                    "Universitario abandonado"),
                          "Universitario completo" = c("Universitario completo",
                                                       "Maestría abandonada",
                                                       "Maestría o superior abandonada",
                                                       "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, 
                                      "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso",
                                      "Maestría en curso" = "Maestría o superior en curso",
                                      "Maestría completa" = "Maestría o superior completa")) 

ne_salario %>% 
  select(pais, nivel_formacion, genero, puesto) %>%
  filter(genero %in% c("Mujer cis", "Hombre cis"),
         !is.na(nivel_formacion)) %>%
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion, genero) %>%
  summarise(cant = n()) %>% 
  transmute(genero, porcentaje = cant/sum(cant)) %>% 
  ungroup() %>% 
  ggplot(aes (y= nivel_formacion, x = porcentaje, fill = genero)) + 
  geom_col(position = "fill") +
  geom_text(aes(label = percent(porcentaje, accuracy = 1)),
            position = position_fill(0.5),
            color = "white",
            size = 3,
            fontface = "bold")+
  scale_fill_manual(values = c(verde, lila)) +
  estilov +
  theme(legend.position = "top",
        plot.title.position = "plot") +
  labs(title = "Máximo nivel educativo alcanzado por género",
       subtitle = "Distribución por frecuencias absolutas",
       caption = fuente, 
       x = NULL, y = NULL,
       fill = "Género") +
  eje_x_p +
      guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

En términos absolutos, las mujeres graduadas representan más del 75% de la muestra. Analicemos estos datos en términos relativos. Prácticamente el patrón de nivel educativo entre hombres y mujeres es idéntico.

De acuerdo a la muestra recolectada, las mujeres se forman en mayor proporción que los hombres cis.

ne_fem <- ne_salario %>% 
  filter(genero == "Mujer cis") %>% 
  group_by(genero, nivel_formacion) %>% 
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(n = n()) %>% 
  mutate(frecuencia = round(n/sum(n),2),
         genero = "Mujer cis") 

ne_mas <- ne_salario %>% 
  filter(genero == "Hombre cis") %>% 
  group_by(genero, nivel_formacion) %>% 
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(n = n()) %>% 
  mutate(frecuencia = round(n/sum(n),2),
         genero = "Hombre cis") 

ne_total <- rbind(ne_fem, ne_mas)

ggplot(ne_total, aes(x = nivel_formacion, y = frecuencia, fill = genero)) +
  geom_col() +
  theme(axis.text.x = element_text(angle = 90), 
        legend.position = "none") + 
  scale_fill_manual(values = colores) +
  facet_wrap(~genero, ncol = 2) +
  estiloh +
  eje_y_p +
  labs(title = "Proporción de nivel educativo máximo por género",
       x = "", y = "Proporción", 
       caption = fuente)

Ahora veamos como se distribuyen los puestos según el género y el nivel educativo.

ne_salario %>% 
  select(pais, nivel_formacion, genero, puesto) %>%
  filter(genero %in% c("Mujer cis", "Hombre cis"),
         puesto != "Pasante", puesto != "Director") %>%
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo", 
                                             "Maestría en curso","Maestría completa")),
         puesto = factor(puesto, 
                         levels = c("Director", "Gerente", "Jefe", "Responsable", "HRBP",
                                    "Analista", "Administrativo"))) %>% 
  group_by(nivel_formacion) %>% 
  ggplot(aes (y= nivel_formacion, fill = genero)) + 
  geom_bar(position = "fill") +
  labs(x="",y="") +
  scale_fill_manual(values = c(verde, lila)) +
  estilo +
  theme(legend.position = "top",
        plot.title.position = "plot") +
  labs(title = "Nivel educativo por puesto y género",
       subtitle = "Distribución por frecuencias absolutas",
       caption = fuente, 
       fill = "Género") +
  eje_x_p +
  facet_wrap(~puesto, ncol = 3) + 
      guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

Análisis de sueldos y educación en Argentina

En esta sección analizaremos los sueldos en comparación con los distintos niveles educativos.

A diferencia de otras secciones, en este caso compararemos la media salarial para poder observar los desvíos estándar en los análisis. En primer lugar analicemos cuál es el sueldo promedio de acuerdo a los distintos niveles educativos.

Primero veamos cuál es el sueldo promedio en pesos argentinos, según el nivel educativo.

estudios <- rh22la %>% 
  filter(pais == "Argentina") %>% 
  select(genero, nivel_formacion, sueldo_bruto)
    
  
est_ar  <- profiling_num(estudios)
es_p05 <- est_ar[1,6]
es_p95 <- est_ar[1,10]

rm(est_ar)

rh22la %>% 
  filter(pais == "Argentina", 
         between(sueldo_bruto, es_p05, es_p95)) %>% 
      mutate(nivel_formacion = fct_collapse(nivel_formacion,
                                        "Secundario completo" = c("Secundario completo", "Terciario en curso",
                                                                  "Terciario abandonado", "Universitario abandonado"),
                                        "Universitario completo" = c("Universitario completo", "Maestría abandonada", 
                                                                     "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso",
                                      "Maestría en curso" = "Maestría o superior en curso",
                                      "Maestría completa" = "Maestría o superior completa")) %>% 
    mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso", "Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, y = nivel_formacion))+
  geom_col(fill = azul)+
geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ",",
                            prefix = "AR$ "),
            hjust = 1.2, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  estilov +
  eje_x_n +
  labs(title = "Sueldo promedio por nivel de formación",
       subtitle = "En AR$",
       x="", y="", caption = fuente)

Ahora veamos qué pasa si incluimos en el análisis el género para analizar los sueldos promedios y sus desvíos estándar.

rh22la %>% 
  filter(pais == "Argentina", 
         between(sueldo_bruto, es_p05, es_p95)) %>% 
      mutate(nivel_formacion = 
               fct_collapse(nivel_formacion,
                            "Secundario completo" = c("Secundario completo", 
                                                      "Terciario en curso",
                                                      "Terciario abandonado", 
                                                      "Universitario abandonado"),
                            "Universitario completo" = c("Universitario completo", 
                                                         "Maestría o superior abandonada", 
                                                         "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, 
                                      "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso",
                                      "Maestría en curso" = "Maestría o superior en curso",
                                      "Maestría completa" = "Maestría o superior completa")) %>% 
    mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso", "Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion, genero) %>% 
  summarise(salarios = list(mean_se(sueldo_bruto))) %>% 
  unnest(salarios) %>% 
  ungroup() %>% 
  ggplot(aes(x = nivel_formacion, y = y, fill = genero)) +
  geom_col(position = "dodge")+
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge")+
  coord_flip()+
  eje_y_n +
  estilov +
  scale_fill_manual(values = c(verde, lila, amarillo)) +
  labs(title = "Sueldo promedio y desvío estándard por nivel de formación y género",
       subtitle = "En AR$", 
       x = "", y = "", 
       caption = fuente, 
       fill = "Género") +      
  guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

Diversidad en RRHH

Liderazgo y género en RRHH

Analicemos las proporciones de hombres y de mujeres en puesto de liderazgo.

div <- rh22la %>%
  filter(pais == "Argentina") %>% 
select(genero) %>% 
  mutate(genero = factor(genero, 
                         levels = c("Mujer cis", "Hombre cis"))) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

lideres <- rh22la %>% 
  filter(pais == "Argentina") %>% 
 select(genero, puesto) 

# Propoción de líderes hombres y mujeres
lideres_genero <- lideres %>% 
  filter(genero %in% c("Mujer cis", "Hombre cis")) %>% 
  group_by(genero) %>%
  mutate(gente_a_cargo = if_else(puesto %in% c("Responsable", "Jefe", "Gerente", 
                                               "Supervisor", "Director"),1,0)) %>%
  summarise(lider = sum(gente_a_cargo)) %>% 
  left_join(div) %>% 
  select(genero, lider, n) %>% 
  mutate(proporcion = percent(lider/n))

# Test de hipótesis para validar diferencias de resultados
# Hay que verificar si la proporción de líderes hombres es mayor que la proporción de líderes mujeres
# Creo un dataframe para analizar proporciones de hombres y de mujeres en puestos de liderazgo y de no-liderazgo
test_lider <- lideres_genero %>% 
  mutate(no_lider = n - lider) %>%        # Columna de no líderes
  select(genero, lider, no_lider) %>%     # selecciono columnas de interés
  pivot_longer(cols = c(lider, no_lider), # Hago un dataset largo para analizar después
               names_to = "es_lider", values_to = "conteo")

# Del total de respuestas me interesa sólo ver cuáles son los hombres con puesto de liderazgo
test_lider$cat <- c(0,0,1,0)

# Extraigo el mu para decidir si la diferencia es significativa y pasarlo a la fórmula del test.
prop_mujer_lid <- pull(lideres_genero[1,2]/lideres_genero[1,3])

# Realizo el test de hipótesis.
# H0 = Las proporciones de líderes hombres y mujeres son iguales
# H1 = La proporción de hombres líderes es mayor que la proporción de mujeres líderes.
resultados_test <- broom::tidy(t.test(test_lider$cat, mu = prop_mujer_lid, alternative = "greater"))

valor_test <- if(resultados_test[1,3] > 0.05) {
  print("la diferencia es estadísticamente significativa, y la proporción de hombres en puestos de liderazgo es mayor que el de las mujeres")
  } else {
    print("la diferencia no es estadísticamente significativa, y la proporción de hombres no es estadísticamente mayor que el de las mujeres en puestos de liderazgo")
  }
# Gráfico
lideres_genero %>% 
  mutate(porc_lider = lider/n, 
         porc_no_lider = 1 - porc_lider) %>% 
  pivot_longer(cols = c(porc_lider, porc_no_lider),
               names_to = "es_lider", 
               values_to = "valores") %>% 
  mutate(es_lider = factor(es_lider, 
                           levels = c("porc_no_lider", "porc_lider"), 
                           labels = c("No Líder", "Líder"))) %>% 
  ggplot(aes(x= genero, y = valores, fill = es_lider))+
  geom_col(position = "fill")+
  estilo +
  scale_fill_manual(values = c("#75838F", "#344D7E")) +
  labs(title = "Proporción de Líderes según género",
       x = "", y = "", fill = "", 
       caption = fuente)

De acuerdo a las respuestas recolectadas 2 de cada 3 participantes son mujeres.

Para los puestos de liderazgo consideramos las personas en los puestos de Director, Gerente, Jefe, y Responsable.

Del total de mujeres, 69 respuestas, 43 ocupan un puesto de liderazgo (62%).

Del total de hombres, 195 respuestas, 87 ocupan un puesto de liderazgo (45%).

Con un p-value igual a 0.884 podemos afirmar que la diferencia es estadísticamente significativa, y la proporción de hombres en puestos de liderazgo es mayor que el de las mujeres.

A pesar de que en Recursos Humanos en Argentina, las mujeres cis representan la mayor cantidad de empleados bajo relación de dependencia, y además se forman en mayor proporción que los varones en posgrados, proporcionalmente en comparación con los hombres cis, acceden a menos posiciones de liderazgo.

Diversidad en RRHH

En esta sección analizaremos qué tan diversa e inclusiva es la función de RRHH en general desde una perspectiva de identidad de género, orientación sexual y discapacidad.

# Cargar los datos 2020 y 2021
k20 <- googlesheets4::read_sheet("1833xEeRIy1DLke4eHKfEThjjgx01YGX9yQaU6vv15K0", 
                     skip = 5) %>% 
  janitor::clean_names()

k21 <- googlesheets4::read_sheet("1LDdXlIwrcsyuywbcS4gdc-1p6wBXfEfL2Y6sNBj-4GM",
                    skip = 5) %>% 
  janitor::clean_names()

# Seleccionar las columnas de ambos data frames.
k20 <- k20 %>% 
  select(identidad_genero = genero, 
         diversidad_sexual = te_identificas_como_lgbt_lesbiana_gay_bisexual_transexual_otra_minoria_sexual,
         rubro = rubro_de_la_empresa,
         origen_del_capital,
         puesto = en_que_puesto_trabajas,
         nivel_formacion = maximo_nivel_de_formacion,
         idioma = te_exigieron_saber_un_idioma_extranjero_ingles_portugues_etc_para_entrar_a_trabajar_en_tu_empresa,
         idioma_porcentaje = que_porcentaje_del_tiempo_usas_el_idioma_extranjero_en_tu_puesto_actual,
         discapacidad,
         trabajo) %>% 
  mutate(libertad_ser = 99, 
         sufrio_acoso = 99,
         management_femenino = 99,
         linea_segura = 99,
         machismo = 99,
         edicion = 2020) # Añado una columna con un valor = 1 porque esta pregunta no existía en la edición 2020 de la Encuesta

k21 <- k21 %>% 
  select(identidad_genero = identidad_de_genero,
         diversidad_sexual = te_identificas_como_lgbtiq_lesbiana_gay_bisexual_transexual_otra_minoria_sexual,
         rubro = rubro_de_la_empresa,
         origen_del_capital,
         puesto = en_que_puesto_trabajas,
         nivel_formacion = maximo_nivel_de_formacion,
         idioma = te_exigieron_saber_un_idioma_extranjero_ingles_portugues_etc_para_entrar_a_trabajar_en_tu_empresa,
         idioma_porcentaje = que_porcentaje_del_tiempo_usas_el_idioma_extranjero_en_tu_puesto_actual,
         discapacidad = tenes_alguna_discapacidad,
         trabajo,
         libertad_ser = en_tu_empresa_puedes_ser_como_realmente_eres_por_ej_expresar_abiertamente_tu_personalidad_tu_identidad_de_genero_orientacion_sexual_etc, 
         sufrio_acoso = sufriste_alguna_situacion_de_acoso_abuso_o_de_discriminacion_en_algun_trabajo,
         management_femenino = que_porcentaje_aproximado_del_management_de_tu_empresa_son_mujeres_entiendase_posiciones_de_jefatura_de_gerencia_o_de_direccion, 
         linea_segura = en_tu_organizacion_existe_una_linea_segura_o_politicas_definidas_para_actuar_frente_a_situaciones_de_acoso_o_discriminacion) %>% 
  mutate(machismo = 99,
         edicion = 2021)

k22 <- kiwi %>% 
  select(identidad_genero = genero,
         diversidad_sexual,
         rubro,
         origen_del_capital = origen_capital,
         puesto,
         nivel_formacion,
         idioma = idioma_exigencia,
         idioma_porcentaje,
         discapacidad,
         trabajo,
         libertad_ser, 
         sufrio_acoso,
         management_femenino = diversidad_management,
         linea_segura,
         machismo) %>% 
  mutate(edicion = 2022)

# Unir los datasets
div_rh <- rbind(k20, k21, k22)

# Como ya tengo unificados ambos datasets puedo borrar las versiones individuales para ahorrar memoria
rm(k20, k21, k22)

En la edición 2020, nos referíamos a la identidad de género de una manera diferente a la que lo hicimos en la edición del 2021, así que la siguiente parte consiste en consolidar los datos de ambas ediciones.

# Verificar las distintas formas de referirse al género
unique(div_rh$identidad_genero)
##  [1] "Masculino"                                                      
##  [2] "Femenino"                                                       
##  [3] "Prefiero no responder"                                          
##  [4] "Género diverso (género diverso / género fluido /otras minorías)"
##  [5] "No binario"                                                     
##  [6] "Mujer cis"                                                      
##  [7] "Hombre cis"                                                     
##  [8] "Hombre"                                                         
##  [9] "Hombre hetero. Que es cis?"                                     
## [10] "mujer"                                                          
## [11] "Mujer heterosexual"                                             
## [12] "Gay"                                                            
## [13] "Mujer"                                                          
## [14] "Hombre heterosexual"                                            
## [15] NA

En los datos encontramos 5 formas diferentes de referirse a los hombres cis, y 5 formas diferentes de referirse a las mujeres cis, así que el siguiente paso es unificar estos valores para simplificar el análisis y la interpretación de los resultados.

El sufijo cis hace referencia a las personas que se identifican con el mismo género asignado al nacer.

div_rh <- div_rh %>% 
    mutate(identidad_genero = 
             fct_collapse(identidad_genero,
                          "Hombre cis" = c("Masculino",
                                           "Hombre cis",
                                           "Hombre",
                                           "Hombre hetero. Que es cis?",
                                           "Hombre heterosexual",
                                           "Varon"),
                          "Mujer cis" = c("Femenino",
                                          "Mujer cis",
                                          "mujer",
                                          "Mujer heterosexual",
                                          "Mujer"),
                          "Género diverso" = c("Género diverso (género diverso / género fluido /otras minorías)",
                                               "No binario",
                                               "Gay")))

# Ver resultados del proceso anterior
unique(div_rh$identidad_genero)
## [1] Hombre cis            Mujer cis             Prefiero no responder
## [4] Género diverso        <NA>                 
## Levels: Mujer cis Género diverso Hombre cis Prefiero no responder
div_rh <- div_rh %>% 
  mutate(rubro = fct_collapse(rubro, "Agro" = c("Agricultura, plantaciones, otros sectores rurales", "Agricultura; plantaciones,otros sectores rurales"),
                              "Alimentos" = c("Alimentación, bebidas", "Alimentación; bebidas; tabaco"),
                              "Bancos y Finanzas" = c("Bancos, banca online", "Bancos; banca online;", "Servicios financieros seguros", "Servicios financieros; seguros"),
                              "Autopartista" = c("Fabricación de material de transporte", "Terminales automotrices, fábricas autopartistas, y afines"), 
                              "Hotelería" = "Hotelería, restauración, turismo",
                              "Metalurgia" = c("Industria metalúrgica, metalmecánica", "Producción de metales básicos"), 
                              "Medios" = c("Medios de comunicación, cultura, gráficos", "Medios de comunicación; cultura; gráficos"),
                              "Minería" = c("Minería", "Minería (carbón, otra minería)"),
                              "Oil & Gas" = c("Petróleo y producción de gas, refinación de petróleo", "Petróleo y producción de gas; refinación de petróleo"), 
                              "Consultoría" = "Servicios de consultoría",
                              "Correos" = c("Servicios de correos y de telecomunicaciones", "Medios de comunicación; cultura; gráficos"),
                              "Correos" = c("Servicios de correos y de telecomunicaciones", "Servicios de correos, y de telecomunicaciones"),
                              "Servicios Públicos" = c("Servicios públicos (agua, gas, electricidad)", "Servicios públicos (agua;gas; electricidad)"),
                              "Silvicultura" = "Silvicultura; madera; celulosa; papel",
                              "Tecnología" = c("Tecnologías de información", "Tecnologías de Información, Sistemas, y afines"), 
                              "Textil" = c("Textiles, vestido, cuero, calzado", "Textiles; vestido; cuero; calzado"),
                              "Transporte" = c("Transporte (incluyendo aviación civil, ferrocarriles por carretera)", "Transporte (incluyendo aviación civil; ferrocarriles por carretera)", "Transporte marítimo, puertos", "Transporte marítimo; puertos;"
                                               )))

# Añadimos a los freelancers como servicios de consultoría dentro de la columna Rubro
div_rh <- div_rh %>% 
  mutate(rubro = if_else(trabajo == "Freelance", "Consultoría Freelance", as.character(rubro)))

# Limpieza Puesto
# Descartamos posiciones no relacionadas con RRHH
div_rh <- div_rh %>% 
  filter(!puesto %in% c("Juzgado Civil y Comercial", "Programador",
                        "Cuidado", "Asesor", "Jefe de Proyecto",
                        "Desarrollador", "Programador", 
                        "-", "Inspección de calidad", "Jefe de Proyecto",
                        "Representante", "Técnico", "Asesoramiento", "-")) %>% 
  mutate(puesto = str_trim(puesto, side = "both")) # Elimina espacios vacíos antes y después de cada palabra

# Reemplazar los valores NA por Consultor Freelance
div_rh <- div_rh %>% 
  mutate(puesto = if_else(is.na(puesto), "Consultor Freelance", puesto))


# Unificación de Puestos
div_rh <- div_rh %>% 
  mutate(puesto = fct_collapse(puesto, "Gerente" = c("Gerente",
                                                     "Superintendente", 
                                                     "Director",
                                                     "Director ( escalafón municipal)"),
                         "HRBP" = c("HRBP",
                                    "Senior Consultoría", "specialist",
                                    "especialista",
                                    "Specialist",
                                    "Especialista de selección por un lado (única persona en estas tareas) y HRBP de 2 equipos por otro",
                                    "Especialista en selección IT", 
                                    "Recruiter"),
                        "Responsable" = c("Responsable",
                                          "Coordinación",
                                          "coordinación",
                                          "Coordinador de Payroll",
                                          "Encargado",
                                          "Coordinadora",
                                          "Supervisor",
                                          "Líder Ágil",
                                          "Líder de selección"),
                        "Administrativo" = c("Administrativo",
                                             "Asistente",
                                             "Asistente RRHH",
                                             "Aux", "Auxiliar",
                                             "consultor jr",
                                             "El cargo es Asistente de CH, pero leo adelante Comunicación Interna, RSE, Capacitacion",
                                             "Payroll Assistant"),
                        "Analista" = c("Analista", 
                                       "Analista semi senior",
                                       "Asesoramiento", 
                                       "Consultor", 
                                       "Capacitador", 
                                       "Consultor Ejecutivo",
                                       "consultor jr",
                                       "Generalista",
                                       "Profesional RRHH",
                                       "Reclutador",
                                       "Recruiter",
                                       "Recruiter IT",
                                       "Reclutadora", 
                                       "Selectora",
                                       "Senior",
                                       "Senior Recruiter",
                                       "Senior Consultoría",
                                       "Sourcer (Recruiter)",
                                       "Sourcer Specialist",
                                       "talent",
                                       "Talent Acquisition",
                                       "IT RECRUITER",
                                       "Auditor",
                                       "Tech Recruiter",
                                       "Analista de People Operations",
                                       "Specialist")))

Cuanta diversidad de identidades de género y orientaciones sexuales hay en RRHH

En este punto creo que es importante aclarar que entre una edición y otra de la Encuesta KIWI hicimos cambios en el diseño del formulario, y por ejemplo, las preguntas sobre orientación sexual sólo se las hicimos a las personas que trabajan en relación de dependencia, con lo cual no tenemos una continuidad en los datos sobre el total de las personas que participaron, especialmente de quienes trabajan de manera freelance.

En primer lugar, veamos cuántas personas trabajan en RRHH según su identidad de género:

gt(
div_rh %>% 
  group_by(edicion, identidad_genero) %>% 
  count(sort = TRUE) %>% 
  ungroup() %>% 
  pivot_wider(names_from = edicion, values_from = n) %>% 
  mutate(`2020` = coalesce(`2020`, 0),
         `2021` = coalesce(`2021`, 0),
         `2022` = coalesce(`2022`, 0),
         Total = `2020` + `2021` + `2022`,
         Porcentaje = round(Total/sum(Total),3))
) %>% 
  fmt_percent(columns = Porcentaje,
              decimals = 1) %>% 
  tab_header(title = "Identidad de Género por Edición") %>% 
  tab_source_note(source_note = fuente) %>% 
  cols_label(identidad_genero = "Identidad de Género")
Identidad de Género por Edición
Identidad de Género 2020 2021 2022 Total Porcentaje
Mujer cis 518 403 261 1182 69.5%
Hombre cis 232 170 101 503 29.6%
Prefiero no responder 2 6 0 8 0.5%
Género diverso 4 2 0 6 0.4%
NA 0 0 2 2 0.1%
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Según la muestra que obtuvimos, menos del 1% de las personas que trabajan en RRHH son personas no binarias. Como para quede más claro veamóslo con un gráfico.

div_rh %>% 
  group_by(identidad_genero) %>% 
  count(sort = TRUE) %>% 
  ungroup() %>% 
  ggplot(aes(y = reorder(identidad_genero, n), x = n, 
             fill = identidad_genero)) +
  geom_col() +
  estilov +
  geom_text(aes(label = n, hjust = -0.2),
            size = 3.5,
            color = c(gris, gris, gris, "black", "black"))+
  scale_fill_manual(values = c(gris, verde, gris, verde, gris)) +
  scale_x_continuous(limits = c(0, 1300)) +
  labs(title = "Cantidad de respuestas según Identidad de Género",
       x = "", y = "",
       caption = fuente) +
  theme(legend.position = "none")

Por decirlo amablemente: Hay muchas oportunidades de mejora acá.

Y ahora veamos la cantidad de respuestas según la orientación sexual de las personas que participaron de la encuesta. Dado que en la edición 2021 esta era una sección voluntaria, la cantidad de respuestas va a ser distinta que en la tabla anterior. Además, fue algo que no le preguntamos a las personas que trabajan de manera independiente.

La pregunta que hicimos fue ¿Te identificás como LGBTIQ+ (lesbiana, gay, bisexual, transexual, otra minoría sexual)?. He aquí las respuestas:

gt(div_rh %>% 
  filter(!is.na(diversidad_sexual)) %>% 
  group_by(edicion, diversidad_sexual) %>% 
  count(sort = TRUE) %>% 
  ungroup() %>% 
  pivot_wider(names_from = edicion, 
              values_from = n) %>% 
  mutate(Total = `2020` + `2021`,
         Porcentaje = Total/sum(Total))
) %>% 
  fmt_percent(columns = Porcentaje,
              decimals = 1) %>% 
  tab_header(title = "Diversidad Sexual por Edición") %>% 
  tab_source_note(source_note = fuente) %>% 
  cols_label(diversidad_sexual = "Eres de algún\nColectivo LBGTQ+")
Diversidad Sexual por Edición
Eres de algún Colectivo LBGTQ+ 2020 2021 2022 Total Porcentaje
No 701 335 198 1036 91.4%
Si 41 33 16 74 6.5%
Prefiero no responder 14 9 3 23 2.0%
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Al menos respecto de esta pregunta, tenemos una mayor representación de diversidades sexuales. Nuevamente, esta muestra no es representativa de todas las personas que trabajan en RRHH, pero esperamos que permita discutir el tema.

div_rh %>% 
  filter(!is.na(diversidad_sexual)) %>%
  group_by(identidad_genero, diversidad_sexual) %>% 
  tally() %>% 
  ungroup() %>% 
  ggplot(aes(y = identidad_genero, x = n, fill = diversidad_sexual )) +
  geom_col(position = "fill") +
  geom_text(aes(label = n), position = position_fill(vjust = 0.5), size = 2.5) +
  estilov +
  theme(legend.position = "top") +
  guides(fill = guide_legend(reverse = T)) +
  scale_x_continuous(labels = scales::percent_format(accuracy = 1))+
  labs(title = "Diversidad Sexual según Identidad de Género",
       subtitle = "Pregunta: ¿Te identificás como LGBTIQ+?", 
       fill = "Eres de algún Colectivo LGBTIQ+",
       x = NULL, y = NULL, caption = fuente) +
  scale_fill_manual(values = c(azul, gris, verde))

El tamaño de las barras reflejan la proporción de cada respuesta según la identidad de género de cada participante. Por ejemplo, en el caso de las personas que se identifican como Hombres cis, 46 personas se identifican como parte de la comunidad LGBTIQ+ (un 11.6%). 41 Mujeres cis (4.3%) pertenecen a este colectivo.

En qué rubros se da la mayor tasa de diversidad

Ahora analicemos los rubros. Dado que no tenemos muchas personas con diversas identidades de género, listaremos todos los rubros.

gt(div_rh %>% 
  filter(identidad_genero == "Género diverso") %>% 
  select(Rubro = rubro) %>% 
  group_by(Rubro) %>% 
  tally(sort = T, name = "Respuestas") %>% 
    janitor::adorn_totals()
)
Rubro Respuestas
Consultoría Freelance 3
Construcción 1
Correos 1
Servicios profesionales 1
Total 6

Ahora, repliquemos el análisis con la pregunta ¿Te identificás como LGBTIQ+ (lesbiana, gay, bisexual, transexual, otra minoría sexual)?.

gt(
div_rh %>% 
  filter(diversidad_sexual == "Si") %>% 
  select(Rubro = rubro) %>% 
  group_by(Rubro) %>% 
  tally(sort = T, name = "Respuestas")
)
Rubro Respuestas
Tecnología 14
Consultoría 11
Otros 10
Bancos y Finanzas 8
Consultoría Freelance 5
Servicios de salud 5
Alimentos 4
Construcción 4
Hotelería 4
Agro 3
Comercio 3
Metalurgia 3
Transporte 3
Correos 2
Oil & Gas 2
Servicios profesionales 2
Servicios Públicos 2
Autopartista 1
Educación 1
Función pública 1
Industrias químicas 1
Minería 1

Entre los primeros rubros (fuera de Otros) nos encontramos con actividades relacionadas con servicios. Recién en el 6° puesto nos encontramos con el primer rubro relacionado con la industria manufacturera (Alimentos).

Qué roles ejercen las personas diversas

Por último, veamos en qué roles se desempeñan las personas que pertenecen a algún colectivo de diversidad dentro de RRHH.

# Crear un flag para posiciones de manager (Gerente, Jefe o Responsable)
div_rh <- div_rh %>% 
  mutate(manager = if_else(puesto %in% c("Gerente", "Jefe", "Responsable"),
                           1, 0))

# Si el valor de la columna identidad_genero es igual a Género diverso o el valor de la columna diversidad_sexual es igual a Si, entonces el valor en la nueva columna llamada diversa es 1, de lo contrario poner 0.
div_rh <- div_rh %>% 
  mutate(diversa = if_else(identidad_genero == "Género diverso" | diversidad_sexual == "Si",
                           1, 0))

managers_porcentaje <- div_rh %>% 
  filter(diversa == 1) %>% 
  group_by(manager) %>% 
  count() %>% 
  ungroup() %>% 
  mutate(porcentaje = n/sum(n))

puestos_porcentaje <- div_rh %>% 
  filter(diversa == 1) %>% 
  group_by(puesto) %>% 
  count(sort = T) %>% 
  ungroup() %>% 
  mutate(porcentaje = n/sum(n))

# Visualización
ggplot(puestos_porcentaje, aes(x = n, y = reorder(puesto, n))) +
  geom_col(fill = verde) +
  geom_text(aes(label = n), 
            hjust = 1.3,
            size = 4) +
  estilov +
  labs(title = "Roles que ocupan las personas diversas",
       x = NULL, y = NULL,
       caption = fuente)

Algo interesante de este gráfico es que un 39% ocupan algún puesto jerárquico (definidos como Gerente, Jefe, o Responsable) lo cual nos parece algo positivo.

Sólo 6 personas, un 6%, trabajan por su cuenta como Consultor Freelance, el cual es un dato alentador mirándolo desde el punto de vista de la formalidad laboral y la estabilidad.

Estos son datos que están sesgados por la muestra de datos, pero la hipótesis inicial que teníamos era que el porcentaje de freelancers sería mayor en este caso.

Libertad en el trabajo

En las últimas ediciones de la Encuesta KIWI incluimos dos preguntas, una fue si En tu empresa puedes ser como realmente eres, por ej. expresar abiertamente tu personalizada, tu identidad de género, orientación sexual, etc.. y la otra fue ¿Sufriste alguna situación de acoso, abuso o de discriminación en algún trabajo?, con las cuales apuntábamos a analizar qué tan abiertos son los lugares de trabajo, y qué tan seguras y libres se sienten las personas con su lugar de trabajo.

En esta sección vamos a comparar los resultados de estas preguntas de acuerdo a si las personas pertenecen a algún colectivo de diversidad o no.

Estas eran preguntas voluntarias en las ediciones del 2021 y del 2022 así que no todas las personas la respondieron, y no estaban incluidas en la edición del 2020.

# Limpiar campos
libertad <- div_rh %>% 
  filter(libertad_ser %in% c("De acuerdo", "En desacuerdo", "Ni de acuerdo ni en desacuerdo", 
                             "Totalmente de acuerdo", "Totalmente en desacuerdo"),
         !is.na(diversa))

# Ordenar la jerarquía de las respuestas sobre libertad en el trabajo.
libertad <- libertad %>% 
  mutate(libertad_ser = factor(libertad_ser, levels = c("Totalmente de acuerdo", "De acuerdo", 
                                                        "Ni de acuerdo ni en desacuerdo",
                                                        "En desacuerdo", "Totalmente en desacuerdo"))) 

Comparemos las respuestas según si las personas pertenecen a algún colectivo de diversidad o no.

libertad_scores <- libertad %>%
  mutate(diversa = factor(diversa)) %>% 
  group_by(diversa, libertad_ser) %>% 
  summarise(respuestas = n()) %>% 
  mutate(porcentaje = respuestas/sum(respuestas)) 

ggplot(libertad_scores, aes(y = diversa, x = respuestas, fill = libertad_ser)) +
  geom_col(position = "fill") +
  scale_fill_manual(values = c(azul, lila, gris, rosa2, rosa1)) +
  geom_text(aes(label = scales::percent(porcentaje, accuracy = 1)), position = position_fill(vjust = 0.5), size = 3) +
  estilo +
  scale_x_continuous(labels = scales::percent_format(accuracy = 1)) +
  theme(legend.position = "top",
        legend.text = element_text(size = 5),
        legend.background = element_rect(colour = "#FCFCFC")) +
  guides(fill = guide_legend(reverse = TRUE)) +
  labs(title = "Niveles de libertad en el trabajo",
       subtitle = "0: Personas no diversas - 1: Personas diversas",
       x = NULL, y = NULL, caption = fuente,
       fill = "Libertad para\nser uno mismo")

No hay grandes diferencias entre los resultados de ambos grupos. En la opción Totalmente de acuerdo es donde encontramos la mayor diferencia (6%). Si agrupamos las respuestas Totalmente en desacuerdo y En desacuerdo, la diferencia total es de 9%.

Me parece muy positivo que 2 de cada 3 personas (el 65%) de colectivos de diversidad sientan que pueden ser como son en sus respectivos trabajos.

Ahora comparemos las respuestas a la pregunta ¿Sufriste alguna situación de acoso, abuso o de discriminación en algún trabajo?. Primero, analicemos los resultados según si la persona pertenece a algún colectivo de diversidad o no.

div_rh %>% 
  mutate(sufrio_acoso = 
           fct_collapse(sufrio_acoso,
                        "Si" = c("Si", 
                                 "agresión verbal.", 
                                 "Mobbing",
                                 "no en el actual",
                                 "Sí. Son sutiles pero están.",
                                  "No. Pero si muchos comentarios marchistas durante mi carrera. No ahora.",
                                 "Sí claro, abuso de autoridad",
                                 "Alguna vez sufrí maltrato psicológico",
                                 "Lo máximo fue \"sos lesbiana porque no te maquillas\""
                                              ))) %>% 
  filter(sufrio_acoso %in% c("Si", "No"), 
         !is.na(diversa)) %>% 
  group_by(diversa, sufrio_acoso) %>% 
  summarise(cantidad = n()) %>%
  mutate(porcentaje = cantidad/sum(cantidad)) %>% 
  ggplot(aes(x = factor(diversa), y = cantidad, fill = sufrio_acoso)) +
  geom_col(position = "dodge") +
  geom_text(aes(label = paste0(cantidad, " (", scales::percent(porcentaje, accuracy = 1), ")")),
            position = position_dodge(0.9), vjust = -0.3, size = 3) +
  estiloh +
  labs(title = "Personas que sufrieron acoso, abuso o discriminación\nsegún colectivo de diversidad",  subtitle = "0: Personas no diversas - 1: Personas diversas",
       x = NULL, y = NULL, caption = fuente,
       fill = "Sufrió acoso, abuso o discriminación") +
  theme(legend.position = "top") +
  scale_fill_manual(values = c(naranja, gris)) +
  scale_y_continuous(limits = c(0,450))

El 34% de las personas diversas, ya sea por su identidad de género o por su orientación sexual sufrieron alguna situación de acoso, abuso, o discriminación, frente a un 28% de las personas cis y heterosexuales.

Ahora desagreguemos el gráfico anterior según la identidad de género de las personas:

div_rh %>% 
  mutate(sufrio_acoso = fct_collapse(sufrio_acoso,
                                     "Si" = c("Si", "agresión verbal.", "Mobbing",
                                              "no en el actual"))) %>% 
  filter(sufrio_acoso %in% c("Si", "No")) %>% 
  group_by(identidad_genero, sufrio_acoso) %>% 
  summarise(cantidad = n()) %>%
  mutate(porcentaje = cantidad/sum(cantidad)) %>% 
  ggplot(aes(x = identidad_genero, y = cantidad, fill = sufrio_acoso)) +
  geom_col(position = "dodge") +
  geom_text(aes(label = paste0(cantidad, " (", scales::percent(porcentaje, accuracy = 1), ")")),
            position = position_dodge(0.9), vjust = -0.3, size = 3) +
  estiloh +
  labs(title = "Personas que sufrieron acoso, abuso o discriminación\nsegún su identidad de género",  subtitle = "0: Personas no diversas - 1: Personas diversas",
       x = NULL, y = NULL, caption = fuente,
       fill = "Sufrió acoso, abuso o discriminación") +
  theme(legend.position = "top") +
  scale_fill_manual(values = c(naranja, gris)) +
  scale_y_continuous(limits = c(0,320))

En este último gráfico podemos apreciar las distintas realidades de las personas. Un tercio de las mujeres cis sufrió al menos una vez alguna situación de acoso, abuso o discriminación versus un 15% de los hombres cis. Más allá de la cantidad de respuestas recibidas, las tendencias son claras.

Machismo

La siguiente pregunta, ¿Sentís que tu entorno laboral es machista?, la realizamos por primera vez en 2022, así que en primer lugar comparemos los resultados en función de si las personas son diversas o no.

# Creamos un dataframe específico para este análisis.
machismo <- div_rh %>% 
  filter(!is.na(diversa),
         machismo %in% c("No es un entorno machista",
                         "Si pero no es tanto",
                         "Si, es muy machista")) %>% 
  mutate(machismo = factor(machismo, 
                           levels = c("No es un entorno machista",
                                      "Si pero no es tanto",
                                      "Si, es muy machista")))

machismo_score <- machismo %>%
  mutate(diversa = factor(diversa)) %>% 
  group_by(diversa, machismo) %>% 
  summarise(respuestas = n()) %>% 
  mutate(porcentaje = respuestas/sum(respuestas)) 

ggplot(machismo_score, aes(y = diversa, x = respuestas, fill = machismo)) +
  geom_col(position = "fill") +
  scale_fill_manual(values = c(azul, rosa1, rosa2)) +
  geom_text(aes(label = scales::percent(porcentaje, accuracy = 1)), position = position_fill(vjust = 0.5), size = 3) +
  estilo +
  scale_x_continuous(labels = scales::percent_format(accuracy = 1)) +
  theme(legend.position = "top",
        legend.text = element_text(size = 5),
        legend.background = element_rect(colour = "#FCFCFC")) +
  guides(fill = guide_legend(reverse = TRUE)) +
  labs(title = "¿Sentís que tu entorno laboral es machista?",
       subtitle = "0: Personas no diversas - 1: Personas diversas",
       x = NULL, y = NULL, caption = fuente,
       fill = "Respuesta:")

Entre las personas diversas encontramos respuestas con mayor cantidad de respuestas en los extremos, 44% no sienten que su entorno sea machista, y un 25% sienten que es muy machista.

Entre las personas heteronormativas un 42% que su entorno no es tan machista.

Analizando las respuestas según la identidad de género, no sorprende que las mujeres tengan una percepción mayor que los hombres sobre si el entorno laboral es machista.

machismo_genero <- machismo %>%
  filter(identidad_genero != "Mujer trans") %>% 
  group_by(identidad_genero, machismo) %>% 
  summarise(respuestas = n()) %>% 
  mutate(porcentaje = respuestas/sum(respuestas)) 

ggplot(machismo_genero, aes(y = identidad_genero, x = respuestas, fill = machismo)) +
  geom_col(position = "fill") +
  scale_fill_manual(values = c(azul, rosa1, rosa2)) +
  geom_text(aes(label = scales::percent(porcentaje, accuracy = 1)), position = position_fill(vjust = 0.5), size = 3) +
  estilo +
  scale_x_continuous(labels = scales::percent_format(accuracy = 1)) +
  theme(legend.position = "top",
        legend.text = element_text(size = 5),
        legend.background = element_rect(colour = "#FCFCFC")) +
  guides(fill = guide_legend(reverse = TRUE)) +
  labs(title = "¿Sentís que tu entorno laboral es machista?",
       x = NULL, y = NULL, caption = fuente,
       fill = "Respuesta:")

Analicemos la situación por rubros:

machismo_rubro <- machismo %>%
  mutate(diversa = factor(diversa)) %>% 
  group_by(rubro, machismo) %>% 
  summarise(respuestas = n()) %>% 
  mutate(porcentaje = respuestas/sum(respuestas)) 

ggplot(machismo_rubro, aes(y = fct_rev(rubro), x = respuestas, fill = machismo)) +
  geom_col(position = "fill") +
  scale_fill_manual(values = c(azul, rosa1, rosa2)) +
  geom_text(aes(label = scales::percent(porcentaje, accuracy = 1)), position = position_fill(vjust = 0.5), size = 3) +
  estilo +
  scale_x_continuous(labels = scales::percent_format(accuracy = 1)) +
  theme(legend.position = "top",
        legend.text = element_text(size = 5),
        legend.background = element_rect(colour = "#FCFCFC")) +
  guides(fill = guide_legend(reverse = TRUE)) +
  labs(title = "¿Sentís que tu entorno laboral es machista?",
       x = NULL, y = NULL, caption = fuente,
       fill = "Respuesta:")

En la visualización anterior podemos ver que los rubros que hay menor percepción de machismo, son en Servicios profesionales, Medios, y Consultoría. En el otro extremo, por cantidad de respuestas, nos encontramos que los rubros Alimentos, Tecnología, y Servicios de Salud.

machismo_rubro %>% 
  select(-porcentaje) %>% 
  pivot_wider(names_from = machismo, values_from = respuestas) %>% 
  mutate(`No es un entorno machista` = coalesce(`No es un entorno machista`, 0),
         `Si pero no es tanto` = coalesce(`Si pero no es tanto`, 0),
         `Si, es muy machista` = coalesce(`Si, es muy machista`, 0),
         Total = `No es un entorno machista` + `Si pero no es tanto` + `Si, es muy machista`) %>% 
  rename(Rubro = rubro) %>% 
      arrange(-Total) %>% 
  kbl(caption = "Percepción de Machismo por Rubro") %>% 
  kable_styling(full_width = F, position = "center",
              bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  scroll_box(height = "500px")
Percepción de Machismo por Rubro
Rubro No es un entorno machista Si pero no es tanto Si, es muy machista Total
Tecnología 21 10 10 41
Otros 13 12 3 28
Servicios de salud 6 9 4 19
Comercio 7 7 3 17
Bancos y Finanzas 3 10 1 14
Alimentos 4 2 7 13
Consultoría 6 4 1 11
Metalurgia 3 4 3 10
Oil & Gas 1 7 2 10
Servicios profesionales 7 2 0 9
Construcción 1 3 3 7
Industrias químicas 2 4 1 7
Función pública 1 2 2 5
Agro 2 1 1 4
Minería 1 2 1 4
Textil 2 2 0 4
Medios 2 1 0 3
Transporte 0 2 1 3
Autopartista 0 1 1 2
Educación 0 1 0 1
Hotelería 0 1 0 1
Industria siderúrgica 0 1 0 1
Ingeniería mecánica 0 1 0 1
Silvicultura, madera, celulosa, papel 0 0 1 1

Discapacidad

disc_rh <- div_rh %>%
  filter(!is.na(discapacidad)) %>% 
  mutate(discapacidad = 
           fct_collapse(discapacidad, 
                        "Sin discapacidad" = 
                          c("No tengo ninguna discapacidad",
                            "creo no tener jajaja", 
                            "Visual???")),
    tiene_discapacidad = if_else(discapacidad %in% c("Sin discapacidad", "Prefiero no responder"), 0, 1))

Veamos cuántas personas con alguna discapacidad participaron de la edición actual:

kiwi <- kiwi %>% 
  mutate(discapacidad = 
           fct_collapse(discapacidad,
                        "Sin discapacidad" = 
                          c("No tengo ninguna discapacidad",
                            "creo no tener jajaja",
                            "Visual???")),
         tiene_discapacidad = factor(if_else(discapacidad == "Sin discapacidad", 0, 1)))

div <- kiwi %>% 
  filter(!is.na(discapacidad)) %>% 
  select(tiene_discapacidad) %>% 
  group_by(tiene_discapacidad) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$genero, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=tiene_discapacidad)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c(gris, naranja)) +
  theme_void() +
  theme(legend.position = "top",
        panel.background = element_blank(),
        plot.title.position = "plot",
        text = element_text(family = "Roboto")) +
  labs(title = "Respuestas según discapacidad",
       subtitle = "1: Tiene alguna discapacidad - 0: Sin discapacidad",
       fill = "Discapacidad", 
       caption = fuente)

gt(kiwi %>% 
  filter(!is.na(discapacidad)) %>% 
  group_by(tiene_discapacidad) %>% 
  tally(name = "Respuestas") %>% 
  ungroup() %>% 
  mutate(Porcentaje = Respuestas/sum(Respuestas),
         tiene_discapacidad = factor(tiene_discapacidad,
                                      levels = c(0, 1),
                                      labels = c("No", "Si")))) %>% 
  cols_label(tiene_discapacidad = "Con Discapacidad") %>% 
  summary_rows(columns = c(Respuestas, Porcentaje),
    fns = list(Total = "sum")) %>% 
  fmt_percent(columns = Porcentaje,
              decimals = 1) %>% 
  tab_header(title = "Respuestas según discapacidad",
             subtitle = "Relación de Dependencia") %>% 
  tab_source_note(source_note = fuente)
Respuestas según discapacidad
Relación de Dependencia
Con Discapacidad Respuestas Porcentaje
No 210 97.2%
Si 6 2.8%
Total 216.00 1.00
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

En la actual edición contamos sólo con un 2.8% de colegas con alguna discapacidad trabajando en RRHH, las cuales son las siguientes:

kiwi %>% 
  filter(!is.na(discapacidad),
         tiene_discapacidad == 1) %>% 
  group_by(discapacidad) %>% 
  summarise(cant = n()) %>% 
  ungroup() %>% 
  ggplot(aes(x = cant, y = reorder(discapacidad, cant))) +
  geom_col(fill = naranja) +
  estilov +
  labs(title = "Tipos de Discapacidad",
       subtitle = "Relación de Dependencia",
       x = NULL, y = NULL,
       caption = fuente)

Veamos cómo fue la evolución de esta respuesta a lo largo de las ediciones de esta encuesta.

disc_rh %>% 
  filter(tiene_discapacidad == 1) %>% 
  group_by(edicion) %>% 
  summarise(cant = n()) %>% 
  ungroup() %>% 
  ggplot(aes(x = factor(edicion), y = cant)) +
  geom_col(fill = naranja) +
  geom_text(aes(label = cant),
            vjust = 1.2,
            size = 3) +
  estiloh +
  labs(title = "Respuestas de Personas con Discapacidad",
       subtitle = "Relación de Dependencia",
       x = NULL, y = NULL,
       caption = fuente)

Puestos

Si bien la mayor cantidad de personas con discapacidad históricamente se desempeñan en roles de Analista, es interesante apreciar que en total tenemos prácticamente la misma cantidad (18) en roles de liderazgo (Gerente, Jefe o Resposable).

Esto nos parece positivo porque es una muestra no sólo de diversidad, sino también de inclusión. Consideramos que no sólo es importante contratar personas con discapacidad, sino también darles las oportunidades de desarrollo que le daríamos a cualquier persona de la compañía.

gt(disc_rh %>% 
  filter(!is.na(discapacidad),
         !is.na(puesto),
         tiene_discapacidad == 1) %>% 
  group_by(edicion, puesto) %>% 
  summarise(cant = n()) %>% 
  ungroup() %>% 
    pivot_wider(names_from = edicion,
                values_from = cant) %>% 
  mutate(`2020` = coalesce(`2020`, 0),
         `2021` = coalesce(`2021`, 0),
         `2022` = coalesce(`2022`, 0),
         Total = `2020`+`2021`+`2022`)) %>% 
  cols_label(puesto = "Puesto") %>% 
  tab_header(title = "Puestos de Personas con Discapacidad") %>% 
  tab_source_note(source_note = fuente)
Puestos de Personas con Discapacidad
Puesto 2020 2021 2022 Total
Administrativo 3 0 0 3
Analista 9 8 3 20
Consultor Freelance 6 0 0 6
Responsable 4 3 1 8
Gerente 3 2 1 6
Jefe 2 2 0 4
HRBP 0 2 1 3
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Contratación de personas con discapacidad

En esta edición incluimos la pregunta En lo que va del año, ¿han contratado en tu empresa a personas con discapacidad? para analizar si las empresas están activamente tomando acciones de inclusión.

kiwi %>% 
  filter(!is.na(contrata_discapacidad)) %>% 
  group_by(contrata_discapacidad) %>% 
  summarise(cant = n()) %>% 
  ungroup() %>% 
  ggplot(aes(x = contrata_discapacidad, y = cant, fill = contrata_discapacidad)) +
  geom_col() +
  geom_text(aes(label = cant),
            vjust = 1.2, 
            color = "white",
            size = 3) +
  scale_fill_manual(values = c(gris, gris, naranja)) +
  estiloh +
  labs(title = "Contrataron personas con discapacidad",
       x = NULL, y = NULL,
       caption = fuente) +
  theme(legend.position = "none")

contrata_disc <- kiwi %>% 
  filter(!is.na(contrata_discapacidad)) %>% 
  group_by(contrata_discapacidad) %>% 
  summarise(cant = n()) %>% 
  ungroup() %>% 
  mutate(porcentaje = cant/sum(cant))

En esta edición, 44 (un 20%) afirmaron que en sus empresas han contratado personas con discapacidad en sus organizaciones. Esto nos lleva a la siguientes preguntas: estas compañías, ¿son nacionales o multinacionales?, ¿Qué tamaño tienen las empresas?

kiwi %>% 
  filter(contrata_discapacidad == "Si") %>% 
  group_by(origen_capital) %>% 
  tally() %>% 
  ungroup() %>% 
  ggplot(aes(x = origen_capital, y = n)) +
  geom_col(fill = naranja) +
  geom_text(aes(label = n),
            vjust = 1.2,
            size = 3) +
  estiloh +
  labs(title = "Origen del Capital de Empresas\nque Contrataron Personas con Discapacidad",
       x = NULL, y = NULL,
       caption = fuente)

En base a las respuestas recibidas, las empresas nacionales han contratado más personas con discapacidad que las multinacionales.

kiwi %>% 
  filter(contrata_discapacidad == "Si") %>%
  mutate(dotacion = factor(dotacion,
                           levels = c("1 - 50",
                                      "51 - 100",
                                      "101 - 250",
                                      "251 - 500",
                                      "501 - 1.000",
                                      "1.001 - 2.500",
                                      "2.501 - 5.000",
                                      "5.001 - 10.000",
                                      "10.001 o más"))) %>% 
  group_by(dotacion) %>% 
  tally() %>% 
  ungroup() %>% 
  ggplot(aes(x = dotacion, y = n)) +
  geom_col(fill = naranja) +
  geom_text(aes(label = n),
            vjust = 1.1,
            size = 3) +
  scale_x_discrete(guide = guide_axis(n.dodge = 2)) +
  labs(title = "Empresas que Contrataron Personas con Discapacidad\nsegún Tamaño de la Empresa",
       x = "Dotación de la Empresa", y = NULL,
       caption = fuente) +
  estiloh

Si bien en total vemos que las empresas con más de 1.000 empleados son las que contratan más personas con discapacidad, no vemos un patrón claro en función de la dotación de la organización porque por ejemplo las empresas que tienen entre 101 y 250 empleados han contratado personas con discapacidad en la misma medidad que las organizaciones con 5.001 - 10.000 empleados.

Edad

La discriminación por edad, también conocida como edadismo es un problema que afecta a la empleabilidad de las personas de mayor edad. Es habitual encontrar avisos de empleo donde el límite de edad es de 40 años.

En la presente edición de la encuesta incluimos la pregunta “En lo que va del año, ¿han contratado en tu empresa a personas mayores de 50 años?” para analizar cuál es la tendencia en contratación de personas senior.

kiwi %>% 
  filter(!is.na(contrata_senior)) %>% 
  group_by(contrata_senior) %>% 
  tally() %>% 
  ungroup() %>% 
  ggplot(aes(x = contrata_senior, y = n, fill = contrata_senior)) +
  geom_col() +
  geom_text(aes(label = n),
            vjust = 1.2,
            size = 3, 
            color = "white") +
  estiloh +
  labs(title = "Empresas que han Contratado \nPersonas de Más de 50 Años",
       x = NULL, y = NULL,
       caption = fuente) +
  scale_fill_manual(values = c(gris, gris, rosa1)) +
  theme(legend.position = "none")

contrata_sr <- kiwi %>% 
  filter(!is.na(contrata_senior)) %>% 
  group_by(contrata_senior) %>% 
  summarise(cant = n()) %>% 
  ungroup() %>% 
  mutate(porcentaje = cant/sum(cant))

En esta edición, 88 (un 41%) afirmaron que en sus empresas han contratado personas de más de 50 años.

A continuación reiteraremos los análisis en función del origen del capital y del tamaño de las empresas.

kiwi %>% 
  filter(contrata_senior == "Si") %>% 
  group_by(origen_capital) %>% 
  tally() %>% 
  ungroup() %>% 
  ggplot(aes(x = origen_capital, y = n)) +
  geom_col(fill = rosa1) +
  geom_text(aes(label = n),
            vjust = 1.2,
            size = 3,
            color = "white") +
  estiloh +
  labs(title = "Origen del Capital de Empresas\nque Contrataron Personas de Más de 50 Años",
       x = NULL, y = NULL,
       caption = fuente)

En base a las respuestas recibidas, nuevamente apreciamos que las empresas nacionales han contratado más personas de más de 50 años que las multinacionales.

kiwi %>% 
  filter(contrata_senior == "Si") %>%
  mutate(dotacion = factor(dotacion,
                           levels = c("1 - 50",
                                      "51 - 100",
                                      "101 - 250",
                                      "251 - 500",
                                      "501 - 1.000",
                                      "1.001 - 2.500",
                                      "2.501 - 5.000",
                                      "5.001 - 10.000",
                                      "10.001 o más"))) %>% 
  group_by(dotacion) %>% 
  tally() %>% 
  ungroup() %>% 
  ggplot(aes(x = dotacion, y = n)) +
  geom_col(fill = rosa1) +
  geom_text(aes(label = n),
            vjust = 1.2,
            size = 3,
            color = "white") +
  scale_x_discrete(guide = guide_axis(n.dodge = 2)) +
  labs(title = "Empresas que Personas de Más de 50 Años\nsegún Tamaño de la Empresa",
       x = "Dotación de la Empresa", y = NULL,
       caption = fuente) +
  estiloh

A contrario de los que vimos en el análisis de discapacidad, las empresas más chicas tienden a contratar personas de más de 50 años que las empresas más grandes.

Lo que podemos apreciar en todos estos análisis es que la diversidad e inclusión depende más de la visión de una organización y su compromiso genuino, que el tamaño de la compañía, o el origen de su capital.

Nuevos Empleados

Otra forma de analizar la empleabilidad de las personas, podría ser comparando cuántas personas tienen menos de 2 años en su empresa actual por rango de edad.

# Respuestas por Edad
resp_edad <- rh22 %>% 
  group_by(edad) %>% 
  tally() %>% 
  ungroup()

# Nuevos Empleados
resp_ne <- rh22 %>% 
  filter(anios_empresa < 2) %>% 
  group_by(edad) %>% 
  tally(name = "nuevos") %>% 
  ungroup()

resp_edad <- left_join(resp_edad, resp_ne, by = "edad") %>% 
  mutate(nuevos = coalesce(nuevos, 0))


ggplot(resp_ne, aes(x = edad, y = nuevos)) +
  geom_col(fill = rosa1) +
  geom_text(aes(label = nuevos), 
            vjust = -0.5,
            size = 3) +
  scale_y_continuous(limits = c(0,65)) +
  estiloh +
  labs(title = "Personas con menos de 2 años de antigüedad\nen su actual empresa",
       x = NULL, y = NULL,
       caption = fuente)

En el gráfico anterior podemos apreciar que las personas con menos de dos años de antigüedad en sus empresas empieza a decrecer luego de los 30 años.

gt(
  resp_edad %>% 
    select(edad, nuevos, n) %>% 
    mutate(porcentaje = nuevos/n) 
) %>% 
  fmt_percent(columns = porcentaje,
              decimals = 1) %>% 
  tab_header(title = "Porcentaje de Nuevos Empleados según Edad",
             subtitle = "Nuevo Empleado = Antigüedad < 2 años") %>% 
  tab_source_note(source_note = fuente) %>% 
  cols_label(edad = "Edad",
             n = "Total",
             nuevos = "Empleados Nuevos",
             porcentaje = "Porcentaje") 
Porcentaje de Nuevos Empleados según Edad
Nuevo Empleado = Antigüedad < 2 años
Edad Empleados Nuevos Total Porcentaje
18 - 25 11 17 64.7%
25 - 30 58 93 62.4%
31 - 35 41 91 45.1%
36 - 40 28 59 47.5%
41 - 45 17 37 45.9%
46 - 50 5 17 29.4%
51 - 55 1 6 16.7%
55 - 60 0 1 0.0%
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

De la tabla anterior podemos ver que:

  • Casi dos tercios de las personas menores de 30 años está en sus empresas hace menos de dos años.
  • Casi la mitad de las personas mayores de 30 años y menores de 45 años que respondieron la encuesta tienen menos de dos años de experiencia en su empleo actual.
  • A partir de los 46 años el porcentaje de empleados nuevos decrece.

Hay una parte de esta movilidad en función de la edad que la podemos explicar por el afán de buscar mejores oportunidades laborales (o las primeras oportunidades en los más jóvenes) mientras uno tiene menores responsabilidades, y a medida que las personas crecemos nos interesa más la estabilidad o el retiro.

Algo interesante para analizar sería la tasa de desempleo por rangos de edad de profesionales de RRHH y cuánto tiempo estuvieron buscando trabajo o si las personas estuvieron desempleadas antes de su actual empleo o no, pero son datos con los que no contamos y que exceden este trabajo.

Finalmente veamos en qué puestos se desarrollan las personas con menos de dos años de antigüedad según su rango de edad

rh22 %>% 
  filter(anios_empresa < 2) %>% 
  group_by(edad, puesto) %>% 
  tally() %>% 
  ungroup %>% 
  ggplot(aes(x = fct_rev(puesto), y = n)) +
  geom_col(fill = rosa1) +
  facet_wrap(~edad, ncol = 2,scales = "free_y") +
  theme(axis.text.x = element_text(angle = 90)) +
  estiloh +
  labs(title = "Puestos de Trabajadores Nuevos por Edad",
       x = NULL, y = NULL,
       caption = fuente)

Freelancers

En este relevamiento participan colegas que trabajan en relación de dependencia y también de manera freelance. Este es el análisis desarrollado en base a las respuestas de las personas que trabajan de manera independiente o en sus propias empresas.

Respuestas por país

En el caso de las personas freelance, la mayoría de las respuestas obtenidas fueron de Argentina. Por eso reiteramos, que los resultados no son representativos de los países.

Cantidad de respuestas por país
Freelance
País Cuenta
Argentina 36
Chile 1
Otro Europa 1
Paraguay 1
Perú 1
Total 40
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2022

Respuestas por Género

La participación según el género de las personas freelance, es la siguiente:

Podemos observar que la mayoría de las respuestas fueron de Mujeres cis, manteniendo la misma tendencia que las personas en relación de dependencia.

Género Cuenta
Mujer cis 34
Hombre cis 6
Total 40

Respuestas por Educación

En esta sección queremos indagar si hay relación entre la formación y la exportacion de los servicios, y si impacta también el tipo de universidad, pública o privada, en dichas prestaciónes. Primero veamos como se distribuye la muestra entre profesionales provenientes de universidades públicas y privadas de los diferentes paises:

Limitandonos al país con mayor cantidad de respuestas, Argentina, en los siguientes graficos podemos observar que la distribución por tipo de Universidad es muy pareja , quedando un valor minimo y poco representativo para quienen no fueron a la Universidad:

Nos interesaba indagar cuál era el nivel de formación de los encuestados.

En la siguiente tabla podemos ver que la mayoría tiene estudios Universitarios completos:

Nivel de Formación Cuenta
Universitario completo 15
Maestría o superior completa 9
Diplomado de posgrado completo 7
Diplomado de posgrado en curso 2
Terciario completo 2
Universitario abandonado 2
Maestría o superior en curso 1
Terciario en curso 1
Universitario en curso 1

Cuando analizamos educación, nos resultó interesante analizar la distribución por género y nivel educativo.

En el siguiente gráfico podemos observar que las mujeres tienen mayor nivel de formación que los hombres:

Veamos los mismos resultados, en terminos relativos:

Respecto a las carreras, vemos que la tendencia de las mismas se corresponden con los resultados obtenidos en las personas en relación de dependencia:

Respuestas por Condición fiscal

La condidición fiscal de los encuestados la podemos observar en la siguiente tabla:

Registro Fiscal Cuenta
Monotributista 33
Contractor 4
Responsable inscripto 2
Asociado a cooperativa de trabajo 1

Respuestas por Exportación de Servicio

Como vemos a continuación, la mayoría no exporta sus servicios:

Focalizandonos entre quienes exportan, podemos ver cuál es el servicio prestado:

En relación a los medios de pago utilizados por quienes exportan, sus respuestas fueron las siguientes:

Medios de Pago Exterior Cuenta
Payoneer 9
Transferencia 3
criptos estables 1
Cuenta en el exterior 1
Deel 1
dinero en mano 1
PayPal 1
Wise 1

Respuestas por Antigüedad

Respecto a los años de experiencia como freelance, podemos observar que la mayoría tiene menos de dos años.

Un interrogante que nos surge en si la inserción en esta modalidad fue una decisión de carrera voluntaria o impulsada por las consecuencias de la pandemia. Carecemos de elementos para responder esa pregunta, por eso nos limitamos a presentar las respuestas obtenidas:

Años de Experiencia Cuenta
Menos de 2 años 16
Entre 2 y 5 años 14
Entre 5 y 10 años 1
Más de 10 años 9

Respuestas por Búsquedas

Nos interesa saber cuantos se dedican a realizar trabajos de selección de talentos.

Podemos observar que un 66% de las personas encuestadas en esta categoria se dedican a la tarea de búsqueda.

Serv. Búsqueda n freq
Si 24 0.6
No 16 0.4

Sabiendo el crecimiento y auge de las búsquedas en el sector de IT, veamos cuál es la participación de las mismas entre las personas que hacen recruiting.

Como se observa en el siguiente gráfico, la mayoría de las búsquedas se concentran que en el sector IT.

Respuesta por garantía de trabajo

Las garantías de reposición de vacantes se refieren a la protección que se brinda a cada cliente en el caso de que la persona contratada se marche de la empresa.

Veamos entre los que prestan el servicio de recruiting, quienes ofrecen garantía de permanencia del candidato.

En la siguiente tabla podemos observar que los plazos de garantía suelen ir desde un mes hasta los tres meses. Pero un número importante, no ofrece garantia por el servicio contratado.

Respuestas por Base de Coeficiente

Otro punto para destacar es el precio del servicio de quienes hacen recruiting.

Podemos ver que la gran mayoría cobra por dicho servicio, un porcentaje de remuneración mensual del ingresante, dejando para muy pocos casos el ingreso anual del mismo.

Una pregunta abierta que nos queda, es cuáles son las posiciones mejores pagas para los recruiters. Sin embargo, dicho análisis escapa de los objetivos de la presente encuesta.

Remuneración del Ingresante Cuenta
Mensual 22
Anual 2

La mayoría cobra un porcentaje que va del 20% al 30% de las remuneraciones mensuales de los ingresantes, como podemos ver en el siguiente cuadro:

Porcentaje Cuenta
20% 1
30% 2
40% 3
50% 2

Otros análisis

Relación entre satisfacción y sueldos

Para este análisis nos preguntamos si hay relación entre el nivel salarial y la satisfacción.

Para responder a esta pregunta, cruzamos los sueldos brutos de Argentina, contra los niveles de satisfacción con la actual empresa donde trabajan las personas que respondieron la encuesta.

Los pasos que seguimos fueron los siguientes:

A los sueldos brutos los segmentamos en 4 partes con igual cantidad de registros (cuartiles). Es decir, en el 1° cuartil tenemos el 25% de los datos, en el segundo cuartil tenemos el 50% de los datos, y en el 3° cuartil tenemos el 75% de los datos. En el primer cuartil están los sueldos más bajos, y el 4° los más altos. Los niveles de satisfacción van del 1 (Totalmente Insatisfecho), al 5, (Totalmente Satisfecho).

library(ggalluvial)

satisf <- rh22la %>% 
  filter(!is.na(satisfaccion),
         pais == "Argentina") %>% 
  select(sueldo_bruto, satisfaccion)


p25 <- profiling_num(satisf)[1,7]
p50 <- profiling_num(satisf)[1,8]
p75 <- profiling_num(satisf)[1,9]

satisf <- satisf %>% 
  mutate(cuartil = factor(case_when(
    sueldo_bruto  <   p25  ~ "1Q",
    sueldo_bruto > p25 & sueldo_bruto < p50 ~ "2Q",
    sueldo_bruto > p50 & sueldo_bruto < p75 ~ "3Q",
    TRUE   ~ "4Q")),
    satisfaccion = factor(satisfaccion, 
                             levels = c("1","2","3","4","5")), 
    cuenta = 1)


satisf <- satisf %>% 
  group_by(satisfaccion, cuartil) %>% 
  summarise(cant = n())



ggplot(as.data.frame(satisf), aes(y = cant, axis1 = cuartil, axis2 = satisfaccion)) +
  geom_alluvium(aes(fill = cuartil), width = 1/12,  alpha = 0.4) +
  geom_stratum(width = 1/12, fill = "#8882F7") +
  geom_label(stat = "stratum", aes(label = after_stat(stratum))) +
  scale_x_discrete(limits = c("Sueldo Bruto por Cuartil", "Nivel de Satisfacción"), expand = c(.05, .05)) +
  scale_fill_manual(values = c(verde, lila, rosa1, azul)) +
  theme_void() +
  labs(title = "Relación entre nivel salarial y satisfacción con la empresa",
       y = "", caption = fuente, fill = "Cuartil")

Burn out en RRHH

En esta edición de la Encuesta KIWI de Sueldos de RH Latam incluimos unas preguntas nuevas sobre burn out debido a cómo el tema de la salud mental ha cobrado relevancia desde el inicio de la pandemia y las compañías han desarrollado muchas actividades (con mayor o menor efectividad) desde entonces.

Es por eso que en esta edición incluimos 3 preguntas:

  • Del 1 al 10, ¿qué tan estresado o estresada te sentís?
  • En comparación con el año pasado, ¿cómo te sentís?
  • Motivo principal por el cual sentís estrés en el trabajo.

Esta sección fue publicada previamente en este link

burn <- kiwi %>%
  filter(!is.na(estres)) %>% 
  select(genero, puesto, rubro, estres,
         comparacion, motivo)

# Transformar en categórica la variable estrés
burn <- burn %>% 
  mutate(estres_cat = case_when(
    estres <= 2 ~ "Sin Estrés",
    estres <= 4 ~ "Estrés Bajo",
    estres <= 6 ~ "Estrés Moderado",
    estres <= 8 ~ "Estrés Alto",
    estres <= 10 ~ "Estrés Muy Alto"
  ),
  estres_cat = factor(estres_cat, 
                      levels = c("Sin Estrés", "Estrés Bajo", 
                                 "Estrés Moderado",
                                 "Estrés Alto", "Estrés Muy Alto")))

# Ordenar variable 'comparacion'
burn <- burn %>% 
  mutate(comparacion = 
           factor(comparacion,
                  levels = c("No me siento estresada o estresado",
                             "Con menos estrés",
                             "Mismo nivel de estrés",
                             "Con más estrés")))

# Calcular porcentajes de los resultados.
niveles <- burn %>% 
  group_by(estres_cat) %>% 
  summarise(cant = n()) %>% 
  ungroup() %>%
  mutate(Porcentaje = cant/sum(cant))

Para construir las categorías de los niveles de estrés asumimos que resultados:

  • 1 o 2 = Sin Estrés
  • 3 o 4 = Estrés Bajo
  • 5 o 6 = Estrés Moderado
  • 7 u 8 = Estrés Alto
  • 9 o 10 = Estrés Muy Alto

En base a 210 recibidas, el 60% sienten que su nivel de estrés es Alto o Muy Alto.

ggplot(niveles, aes(x = estres_cat, y = cant, fill = estres_cat)) +
  geom_col() +
  geom_text(aes(label = percent(Porcentaje, accuracy = 1)),
            vjust = 1.2,
            color = "white", 
            face = "bold",
            size = 4) +
  scale_fill_viridis_d(direction = -1)+
  estiloh +
  labs(title = "Niveles de estrés en RRHH",
       subtitle = paste0("En base a ", sum(niveles$cant), " respuestas recibidas"),
       caption = fuente,
       x = NULL, y = NULL, 
       fill = NULL) +
  theme(legend.position = "none")

Comparación de Estres

comparacion <- burn %>% 
  group_by(comparacion) %>% 
  summarise(cant = n()) %>% 
  ungroup() %>% 
  mutate(porcentaje = cant/sum(cant),
         comparacion = str_wrap(comparacion, width = 20))

La siguiente pregunta que realizamos es si la sensación de estrés es mayor, igual o menor al año pasado.

En base a las respuestas obtenidas, un 35% siente que su nivel de estrés es mayor en relación al año anterior, mientras que un 35% afirma que sus niveles de estrés son más bajos en relación al 2021.

ggplot(comparacion, aes(x = comparacion, 
                        y = cant, 
                        fill = comparacion)) +
  geom_col() +
    geom_text(aes(label = percent(porcentaje, accuracy = 1)),
            vjust = 1.2,
            color = "white", 
            face = "bold",
            size = 4) +
  scale_fill_viridis_d(direction = -1)+
  estiloh +
  labs(title = "Comparación de Niveles de Estrés vs. Año Anterior",
       subtitle = paste0("En base a ", sum(niveles$cant), " respuestas recibidas"),
       caption = fuente,
       x = NULL, y = NULL, 
       fill = NULL) +
  theme(legend.position = "none")

Causas de la sensación de estrés

En la siguiente nube de palabras podremos ver las causas mencionadas en la pregunta abierta sobre las causas de la sensación de estrés de las personas que trabajan en RRHH.

# Separar las palabras en filas individuales
causa <- burn %>% 
  filter(!is.na(motivo)) %>% 
  select(motivo) %>% 
  unnest_tokens(palabra, motivo)

# Lexicon de palabras vacías
vacias <- read_csv("https://raw.githubusercontent.com/7PartidasDigital/AnaText/master/datos/diccionarios/vacias.txt",
                               locale = default_locale())

# Eliminar palabras vacías
causa <- causa %>% 
  anti_join(vacias, by = "palabra")

# Contar la cantidad de veces que aparece cada palabra
 causa <- causa %>%
   count(palabra, sort = T, name = "freq")

# Crear la nube de palabras
nube <- wordcloud2(data = causa,
           size = 0.8,
           rotateRatio = 1,
           color = rep_len(c("#D4499C", "#3500B3", "#02D9C5", "#5463A8", "#DEF241"),                          nrow(causa)))
nube

Podemos apreciar que las 5 principales palabras son:

  1. trabajo: con 27 apariciones
  2. falta: con 20 apariciones
  3. carga: con 15 apariciones
  4. tareas: con 15 apariciones
  5. tiempo: con 11 apariciones

Esto nos daría a entender que una de las principales causas de estrés es la alta carga de trabajo con la que contamos y la falta de recursos que tenemos.

A continuación intentaremos analizar las relaciones de estos conceptos, para lo cual lo que haremos en primer lugar es agrupar las palabras de a pares, llamados bigramas en la jerga, y luego realizaremos un análisis de grafos para ver cómo se relacionan entre sí. Para saber más sobre análisis de grafos te invitamos a ver este video de un meetup de R4HR

# Creamos duplas de tokens
causa2 <- burn %>% 
  filter(!is.na(motivo)) %>% 
  select(motivo) %>% 
  unnest_tokens(bigrama, motivo,
                token = "ngrams",
                n = 2)

# Separamos los bigramas en dos columnas
causa2 <- causa2 %>% 
    separate(bigrama,
           c("palabra1", "palabra2"),
           sep = " ")

# Eliminamos palabras vacías
causa2 <- causa2 %>% 
   filter(!palabra1 %in% vacias$palabra,
         !palabra2 %in% vacias$palabra)

# Eliminamos filas con datos nulos
causa2 <- causa2 %>% 
  filter(!is.na(palabra1))

Si tienen curiosidad por ver cuáles son los bigramas más frecuentes les dejo este gráfico:

causa2 %>% 
  unite(bigrama, palabra1, palabra2, sep = " ") %>% 
  group_by(bigrama) %>% 
  tally(sort = TRUE) %>% 
  ungroup() %>% 
  filter(n > 1) %>% 
  ggplot(aes(x = n, y = reorder(bigrama, n))) +
  geom_col(fill = rosa2) +
  geom_text(aes(label = n), 
            hjust = 1.2, 
            size = 3) +
  estilov +
  labs(title = "Motivos de Estrés en RRHH",
    subtitle = "Bigramas más frecuentes",
       x = NULL, y = "Bigramas",
       caption = fuente)

Las cantidades de repeticiones son bajas porque sólo tenemos 160 comentarios para analizar. Sin embargo hay tópicos que podemos entender que la carga de trabajo (carga laboral, mucho trabajo, muchos temas, muchas cosas) es la principal causa de estrés dentro de RRHH.

Ahora analicemos las relaciones entre estos conceptos:

# Creamos un objeto grafo
grafo_causa2 <-  causa2 %>% 
  count(palabra1, palabra2, sort = T) 

grafo_causa2 <- grafo_causa2 %>% 
  graph_from_data_frame()

# Seleccionar 100 filas nada más 
ggraph(grafo_causa2, layout = "nicely") +
  geom_edge_link(aes(edge_alpha = n),
                 show.legend = FALSE,
                 arrow = arrow(type = "closed",
                               length = unit(3, "mm"))) +
  geom_node_point(color = rosa2, size = 3) +
  geom_node_text(aes(label = name), vjust = 1, hjust = 1) +
  theme_void()

Este gráfico inicial es un poco confuso dado que tenemos muchas relaciones con bigramas que se repiten una sola vez. Pero prestemos atención a las zonas donde hay mucha concentración de conceptos, y eso nos va a dar una idea de cómo se relacionan las palabras entre sí.

Busquen el término carga. Las palabras mucha y demasiada apuntan a carga (esto se llama un grafo dirigido) y luego carga apunta a laboral que tiene a su vez relaciones con agenda, presión y entorno, por ejemplo.

Si filtramos los bigramas que tienen más de una aparición nos encontramos con algo así

# Creamos un objeto grafo
grafo_causa2 <-  causa2 %>% 
  count(palabra1, palabra2, sort = T) %>% 
  filter(n > 1)

grafo_causa2 <- grafo_causa2 %>% 
  graph_from_data_frame()

# Seleccionar 100 filas nada más 
ggraph(grafo_causa2, layout = "nicely") +
  geom_edge_link(aes(edge_alpha = n),
                 show.legend = FALSE,
                 arrow = arrow(type = "closed",
                               length = unit(3, "mm"))) +
  geom_node_point(color = rosa2, size = 3) +
  geom_node_text(aes(label = name), vjust = 1, hjust = 1) +
  theme_void()

Vemos que los términos mucho, muchos, muchas, mucha si bien se refieren a lo mismo, a un exceso, al estar escrito de diferentes maneras genera 4 términos diferentes, así que intentaremos repetir el primer grafo con todos los conceptos, pero eliminando las palabras en plural y su género (en la medida de lo posible) para intentar generar mayor claridad.

Este proceso de limpieza nos permitió detectar que el término tiempo también tiene mucha relación con varios conceptos que contribuyen añ burn out en RRHH.

# Comenzamos limpieza de datos
burn2 <- burn %>% 
  mutate(motivo = str_replace(motivo, "alas", "a las"),
         motivo = str_replace(motivo, "años", "año"),
         motivo = str_replace(motivo, "[aá]reas", "área"),
         motivo = str_replace(motivo, "asignadas", "asignados"),
         motivo = str_replace(motivo, "aspectos", "aspecto"),
         motivo = str_replace(motivo, "beneficios", "beneficio"),
         motivo = str_replace(motivo, "buen[ao]s|buena", "bueno"),
         motivo = str_replace(motivo, "claras|claros", "claro"),
         motivo = str_replace(motivo, "clientes", "cliente"),
         motivo = str_replace(motivo, "deberían", "deben"),
         motivo = str_replace(motivo, "demasiadas", "demasiada"),
         motivo = str_replace(motivo, "decisiones", "decisión"),
         motivo = str_replace(motivo, "días", "día"),
         motivo = str_replace(motivo, "económica|economica", "económico"),
         motivo = str_replace(motivo, "exigencias", "exigencia"),
         motivo = str_replace(motivo, "externos", "externo"),
         motivo = str_replace(motivo, "extras", "extra"),
         motivo = str_replace(motivo, "estres", "estrés"),
         motivo = str_replace(motivo, "expectativas", "expectativa"),
         motivo = str_replace(motivo, "excesivas", "excesiva"),
         motivo = str_replace(motivo, "extern[ao]s", "externo"),
         motivo = str_replace(motivo, "globales", "global"),
         motivo = str_replace(motivo, "ha[bc]er[lm]e|hago|hace", "hacer"),
         motivo = str_replace(motivo, "horas", "hora"),
         motivo = str_replace(motivo, "intern[ao]s", "interno"),
         motivo = str_replace(motivo, "jef[ae]", "jefe"),
         motivo = str_replace(motivo, "jornadas", "jornada"),
         motivo = str_replace(motivo, "lasrg[ao]s|larga", "largo"),
         motivo = str_replace(motivo, "l[ií]deres", "lider"),
         motivo = str_replace(motivo, "laborales", "laboral"),
         motivo = str_replace(motivo, "locales", "local"),
         motivo = str_replace(motivo, "malos", "mal"),
         motivo = str_replace(motivo, "much[ao]", "mucho"),
         motivo = str_replace(motivo, "necesari[ao]|necesari[ao]s", "necesario"),
         motivo = str_replace(motivo, "nuev[ao]|nuev[ao]s", "nuevo"),
         motivo = str_replace(motivo, "poca|poc[ao]s", "poco"),
         motivo = str_replace(motivo, "presion|presiones", "presión"),
         motivo = str_replace(motivo, "problemas", "problema"),
         motivo = str_replace(motivo, "propia|propi[ao]s", "propio"),
         motivo = str_replace(motivo, "proyectos", "proyecto"),
         motivo = str_replace(motivo, "realizo|realizadas|realizada", "realizar"),
         motivo = str_replace(motivo, "reglas", "regla"),
         motivo = str_replace(motivo, "relaciones|relacion", "relación"),
         motivo = str_replace(motivo, "responsabilidades", "responsabilidad"),
         motivo = str_replace(motivo, "respuestas", "respuesta"),
         motivo = str_replace(motivo, "responsabilidades", "responsabilidad"),
         motivo = str_replace(motivo, "resultados", "resultado"),                motivo = str_replace(motivo, "situacion|situaciones", "situación"),
         motivo = str_replace(motivo, "soluciones", "solución"),
         motivo = str_replace(motivo, "tareas", "tarea"),
         motivo = str_replace(motivo, "temas", "tema"),
         motivo = str_replace(motivo, "tenemos|tengo", "tener"),
         motivo = str_replace(motivo, "tiempos", "tiempo"),
         motivo = str_replace(motivo, "tomado", "tomar"),
         motivo = str_replace(motivo, "toxico|tóxic[ao]|tóxic[ao]s", "tóxico"),
         motivo = str_replace(motivo, "trabajando", "trabajar"))

burn2 <- burn2 %>% 
  mutate(motivo = str_replace(motivo, "much[ao]s", "mucho"))

# Creamos duplas de tokens
causa3 <- burn2 %>% 
  filter(!is.na(motivo)) %>% 
  select(motivo) %>% 
  unnest_tokens(bigrama, motivo,
                token = "ngrams",
                n = 2)

# Separamos los bigramas en dos columnas
causa3 <- causa3 %>% 
    separate(bigrama,
           c("palabra1", "palabra2"),
           sep = " ")

# Eliminamos palabras vacías
causa3 <- causa3 %>% 
   filter(!palabra1 %in% vacias$palabra,
         !palabra2 %in% vacias$palabra)

# Eliminamos filas con datos nulos
causa3 <- causa3 %>% 
  filter(!is.na(palabra1))

# Creamos un objeto grafo
grafo_causa3 <-  causa3 %>% 
  count(palabra1, palabra2, sort = T) 

grafo_causa3 <- grafo_causa3 %>% 
  graph_from_data_frame()

# Seleccionar 100 filas nada más 
ggraph(grafo_causa3, layout = "nicely") +
  geom_edge_link(aes(edge_alpha = n),
                 show.legend = FALSE,
                 arrow = arrow(type = "closed",
                               length = unit(3, "mm"))) +
  geom_node_point(color = rosa2, size = 3) +
  geom_node_text(aes(label = name), vjust = 1, hjust = 1) +
  theme_void()

Resultados por género

Comparemos los scores promedios según el género.

burn %>% 
  filter(genero %in% c("Mujer cis", "Hombre cis")) %>% 
  group_by(genero) %>% 
  summarise(estres_prom = mean(estres)) %>% 
  ggplot(aes(x = genero, y = estres_prom, fill = genero)) +
  geom_col() +
  geom_text(aes(label = round(estres_prom,1)),
            vjust = 1.2, 
            color = "white") +
  estiloh +
  labs(title = "Promedio de Puntajes de Estrés por Género",
       x = NULL, y = NULL, 
       caption = fuente,
       fill = "Identidad de Género") +
  scale_fill_manual(values = colores) +
  theme(legend.position = "top")

estres_genero <- burn %>% 
  filter(genero %in% c("Mujer cis", "Hombre cis")) %>% 
  group_by(genero) %>% 
  summarise(estres_prom = mean(estres)) %>%
  ungroup()
burn %>% 
  filter(genero %in% c("Mujer cis", "Hombre cis")) %>% 
  ggplot(aes(x = genero, y = estres, color = genero)) +
  geom_violin()+
  geom_point(position = position_jitter(width = 0.15), alpha = 0.4, size = 4) +
  estiloh +
  labs(title = "Distribución de Puntajes de Estrés por Género",
       x = NULL, y = NULL, 
       caption = fuente,
       color = "Identidad de Género") +
  scale_color_manual(values = colores) +
  theme(legend.position = "top")

En promedio, el puntaje de estrés de las mujeres es -0.7 puntos más alto que en el caso de los varones. La mayor concentración de respuestas las tenemos entre los 5 y 7.5 puntos.

Comparación por rubros

Por último, veremos los resultados promedios por industria.

burn %>% 
  filter(rubro %in% c("Tecnologías de información", "Servicios de salud",
                      "Comercio", "Otros", "Alimentación, bebidas",
                      "Industria metalúrgica, metalmecánica",
                      "Petróleo y producción de gas, refinación de petróleo",
                      "Servicios de consultoría", "Servicios profesionales",
                      "Construcción", "Servicios financieros seguros")) %>% 
  mutate(rubro = str_wrap(rubro, width = 30)) %>% 
  group_by(rubro) %>% 
  summarise(estres_prom = mean(estres)) %>% 
  ungroup() %>% 
  ggplot(aes(x = estres_prom, y = reorder(rubro, estres_prom))) +
  geom_point(size = 4, color = azul) +
  geom_segment(aes(x = 0, xend = estres_prom, 
                   y = rubro, yend = rubro),
               color = azul) +
  estilov +
  labs(title = "Nivel Promedio de Estrés por Industria",
       caption = fuente, 
       x = NULL, y =NULL)

Conclusión

En líneas generales apreciamos que los niveles de estrés de las personas que trabajan en RRHH es alto, y que las principales razones se deben a la sobrecarga de trabajo y la cantidad de tareas que debemos atender desde el sector (y en ocasiones con menos recursos de los que deberíamos tener).

Un aspecto positivo es que en comparación con el 2021, mayormente los niveles de estrés son más bajos. Probablemente podamos atribuir ese resultado a la salida de las cuarentenas estrictas y al regreso a una vida más o menos similar a la que teníamos antes de la pandemia.

De todas maneras este es un tema que merece un estudio más a fondo hecho por personas más idóneas que nosotros. Si te sentís abrumada o abrumado, animate a pedir ayuda y a hablar con alguien de confianza. Lo peor del estrés es la sensación de soledad.

Comunidades

R4HR es una comunidad abierta y gratuita. ¿Qué quiere decir esto? Que es es un espacio donde cualquier persona puede participar de la comunidad, sepa de R o no sepa nada, y además no hay que pagar nada por formar parte. También es un espacio seguro en el que cuidamos que haya acoso, insultos o abusos.

Las comunidades son una gran forma de construir conocimiento, de aprender, de generar relaciones, para resolver consultas, y también, por qué no, de hacer buenos amigos. Así que en esta sección nos proponemos ver cuáles son las comunidades más frecuentadas por las personas que participaron de la Encuesta.

comunidad <- rh22 %>% 
  select(pais, provincia, comunidad, comunidades)

div <- comunidad %>% 
  select(comunidad) %>% 
  filter(!is.na(comunidad)) %>% 
  group_by(comunidad) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$comunidad, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=comunidad)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c(gris, azul)) +
  theme_void() +
  theme(legend.position = "top",
        panel.background = element_blank(),
        plot.title.position = "plot",
        text = element_text(family = "Roboto")) +
  labs(title = "Participás de Alguna Comunidad",
       fill = "Respuesta", 
       caption = fuente)

Del total de respuestas, 49% (131) participan de alguna comunidad. Estas son las comunidades mencionadas.

En la tabla a continuación ponemos todas las comunidades que nos nombraron. No ponemos la cantidad de respuestas que obtuvo cada una porque no es una competencia.

Tené en cuenta lo siguiente: Para crear una comunidad sólo hace falta tener ganas de hacerlo. Lo mejor de las comunidades es que hay mucha gente dispuesta a compartir.

comunidad <- comunidad %>% 
  filter(!is.na(comunidades), 
         comunidad == "Si") %>% 
  select(pais, comunidades)

comunidad <- comunidad %>% 
  mutate(comunidades = str_replace(comunidades, "whats app|Whatsapp|Wsapp|wsp|whatsapp", "WhatsApp"),
         comunidades = str_replace(comunidades, "Adrha|Adhra|ADHRA", "ADRHA"),
         comunidades = str_replace(comunidades, "Data 4 hr|Data4hr|DATA4HR", "Data 4HR"),
         comunidades = str_replace(comunidades, "Bench.Club|Benchclub|Bench", "Bench Club"),
         comunidades = str_replace(comunidades, "Aprhnoa", "APRHNOA"),
         comunidades = str_replace(comunidades, "Bench ClubClub", "Bench Club"),
         comunidades = str_replace(comunidades, "Aparh", "APARH"),
         comunidades = str_replace(comunidades, "slack tech recruiters arg|tech.recruiters.arg|Tech Recruiter", "Tech Recruiters Arg"),
         comunidades = str_replace(comunidades, "LinkdIn|Linkedin", "LinkedIn"),
         comunidades = str_replace(comunidades, "Uba", "UBA"),
         comunidades = str_replace(comunidades, "Interempresa Cordoba|Recursos Humanos Inter Empresas CBA", "RRHH Interempresas"),
         comunidades = str_replace(comunidades, "grupo", "Grupo"),
         comunidades = str_replace(comunidades, "Capital humano Talento femenino", "Capital Humano Talento Femenino"),
         comunidades = str_replace(comunidades, "Tendencia de Recursos Humanos Bolivia", "Tendencias en Recursos Humanos Bolivia"),
         comunidades = str_replace(comunidades, "PAS", "People Analytics Spain"),
         comunidades = str_replace(comunidades, "Grupos de Whatsapp", "Grupos de WhatsApp"),
         comunidades = str_replace(comunidades, "Grupos Whatsapp", "Grupos de WhatsApp")) 

# Reemplazo manual de comunidades
comunidad[2,2] <- "Grupos de WhatsApp, ADRHA"
comunidad[6,2] <- "Bench Club, ADRHA"
comunidad[7,2] <- "Grupos de WhatsApp"
comunidad[9,2] <- "Grupos en LinkedIn, Grupos de WhatsApp"
comunidad[12,2] <- "Grupos de WhatsApp"
comunidad[13,2] <- "Grupo de WhatsApp Córdoba"
comunidad[14,2] <- "Club de R para RH, Grupo de WhatsApp Córdoba"
comunidad[17,2] <- "Club de R para RH"
comunidad[21,2] <- "Grupos de WhatsApp, Grupo Local, LinkedIn"
comunidad[22,2] <- "Grupos de LinkedIn"
comunidad[25,2] <- "Grupos de WhatsApp, LinkedIn"
comunidad[28,2] <- "Instagram, Grupos de WhatsApp"
comunidad[29,2] <- "ADRHA, Comunidad HR"
comunidad[42,2] <- "ADRHA, LinkedIn"
comunidad[48,2] <- "Tendencias en Recursos Humanos Bolivia, ASOBOGH"
comunidad[53,2] <- "Comunidad HR, Grupos de diferentes Universidades"
comunidad[59,2] <- "Grupos de Whatsapp, LinkedIn"
comunidad[64,2] <- "Red de RRHH, Grupo de WhatsApp Mar del Plata"
comunidad[69,2] <- "Grupo de Colegas RRHH (Consultora MJG) Buenos Aires y Latinoamerica"
comunidad[70,2] <- "ADRHA, Grupos Regionales"
comunidad[73,2] <- "Club de R para RH, Data 4HR, RRHH Interempresas, Reclutadores CBA"
comunidad[80,2] <- "Compensaciones, Bench Club"
comunidad[83,2] <- "Total Rewards Compensaciones"

# Separamos las comunidades en columnas y luego pivoteamos para agruparlas
comunidad %>% 
  separate(col = comunidades, into = c("c1", "c2", "c3", "c4"), 
           sep = ",", fill = "right", remove = TRUE) %>% 
  mutate(across(c("c1", "c2", "c3", "c4"), str_trim)) %>% 
  pivot_longer(cols = c(c1:c4),
    names_to = "columna",
    values_to = "comunidad") %>% 
  filter(!is.na(comunidad)) %>% 
  filter(comunidad != "etc") %>% 
  group_by(pais, comunidad) %>% 
  tally() %>% 
  ungroup() %>% 
  select(-n) %>% 
  rename("País" = pais,
         "Comunidad" = comunidad) %>% 
  kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, 
                bootstrap_options = 
                  c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)
País Comunidad
Argentina ADRHA
Argentina AIHR
Argentina APRHNOA
Argentina Asociación de Recursos Humanos Misiones
Argentina Asociación de RRHH de Misiones
Argentina Asociación Misionera de RRHH
Argentina Bench Club
Argentina Capital Humano Talento Femenino
Argentina Chats
Argentina Club de Profesionales de Recursos Humanos RRHH
Argentina Club de R para RH
Argentina Club IFREI - IAE
Argentina Compañeros de posgrado
Argentina Compensaciones
Argentina Comunidad HR
Argentina Comunidad RH
Argentina Data 4HR
Argentina En red
Argentina En un Grupo de la carrera de RT de la UBA
Argentina Grupo de Colegas RRHH (Consultora MJG) Buenos Aires y Latinoamerica
Argentina Grupo de Gerentes de RRHH de Mundos E
Argentina Grupo de profesionales de RRHH de la UES21
Argentina Grupo de WhatsApp
Argentina Grupo de WhatsApp Córdoba
Argentina Grupo de WhatsApp de Compensaciones
Argentina Grupo de WhatsApp Mar del Plata
Argentina Grupo Local
Argentina Grupos de diferentes Universidades
Argentina Grupos de la facultad.
Argentina Grupos de LinkedIn
Argentina Grupos de Whatsapp
Argentina Grupos de WhatsApp
Argentina Grupos en LinkedIn
Argentina Grupos Regionales
Argentina Grupos WhatsApp
Argentina IDEA
Argentina Instagram
Argentina Invounf recruiting
Argentina ITBA People Analytics
Argentina LinkedIn
Argentina Profesionales de RRHH
Argentina Profesionales de RT
Argentina Reclutadores CBA
Argentina Red de profesionales RT
Argentina Red de RRHH
Argentina Rewards
Argentina RH Talent
Argentina RR.HH. ARGENTINA
Argentina RRHH Interempresas
Argentina Talento de Cessi
Argentina Tech Recruiters Arg
Argentina Total Rewards Compensaciones
Argentina UBA
Argentina Varias
Argentina Varias en Facebook
Bolivia ASOBOGH
Bolivia Tendencias en Recursos Humanos Bolivia
Chile Comunidades de People Analytics
Chile Red de RRHH
Ecuador People Analytics Ecuador
El Salvador ASOBOGH
España People Analytics Spain
México Grupos de redes sociales
México People Analytics en su mayoría
Paraguay APARH
Paraguay Asociación Paraguaya de Recursos Humanos
Paraguay Comunidad RH
Paraguay Mas de tres
Perú Local
