library(tidyverse)
library(gargle)
library(googlesheets4)
library(funModeling)
library(gt)
library(scales)

# Estilo de los gráficos
estilo <- theme(panel.grid = element_blank(),
                plot.background = element_rect(fill = "#FBFCFC"),
                panel.background = element_blank())

# Este es un objeto que vamos a utilizar para no tener que tipear siempre lo mismo
fuente <- "Fuente: Encuesta KIWI de Sueldos de RRHH"

# Colores predefinidos de los gráficos
col_genero <- c("#8624F5", "#1FC3AA")
col_graf <- "#943126"

# Carga de los sueldos
sueldos <- sheets_read("1f3MCA81NnjI48C03GxxGu69i2hKZLrpxf4tHzKkXL_k")

# Filtramos los sueldos entre los percentiles 5 y 95
resumen_numerico <- profiling_num(sueldos)
percentil_05 <- resumen_numerico[6,6]
percentil_95 <- resumen_numerico[6,10]

# Limpiamos un poco más el dataset
sueldos <- sueldos %>% 
  filter(between(sueldo_bruto, percentil_05, percentil_95), 
         aumento < 100,
         anios_rh < 40,
         puesto != "Director") 

Introducción

Este es un ejercicio de práctica, realizado durante la sesión abierta de Noviembre del Club de R para RRHH. Si quieren saber más, pueden contactarme en mi perfil en LinkedIn. 🥝

Los datos utilizados son una muestra de la Encuesta KIWI de Sueldos de RRHH de Latam realizado por el Club de R para RRHH.

Este es un ejemplo de reporte que se puede hacer utilizando R, con el paquete RMarkdown.

Análisis de sueldos de RRHH por puesto

sueldos <- sueldos %>% 
  mutate(puesto = factor(puesto, 
                         levels = c("Administrativo", "Analista", "HRBP", 
                                    "Responsable", "Jefe", "Gerente"))) 
puestos <- sueldos %>% 
  group_by(puesto) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto))

# Hacemos el gráfico
ggplot(puestos, aes(x = sueldo_promedio, 
                    y = reorder(puesto, sueldo_promedio))) +
  geom_col(fill = col_graf) +
  labs(title = "Sueldo promedio por puesto",
       subtitle = "En AR$",
       caption = fuente) +
  scale_x_continuous(labels = comma_format(big.mark = ".", decimal.mark = ";")) +
  theme(panel.grid.major.x = element_line(colour = "#CACFD2")) +
  estilo

Para realizar este gráfico filtramos los sueldos por encima de AR$ 30.000 (percentil 5), y por debajo de AR$ 220.000 (percentil 95).

Tabla de Sueldos

salarios <- sueldos %>% 
  mutate(puesto = factor(puesto, 
                         levels = c("Gerente", "Jefe", "Responsable",
                                     "HRBP", "Analista", "Administrativo"))) 
puestos2 <- salarios %>% 
  group_by(puesto) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto))
gt(puestos2) %>% 
  tab_header(title = "Sueldo promedio por puesto") %>% 
  cols_label(puesto = "Puesto", 
             sueldo_promedio = "Sueldo Promedio") %>% 
  fmt_currency(columns = c("sueldo_promedio"),
               currency = "ARS",
               decimals = 0)
Sueldo promedio por puesto
Puesto Sueldo Promedio
Gerente $150,777
Jefe $107,026
Responsable $76,715
HRBP $97,824
Analista $66,883
Administrativo $49,781

Dispersión de sueldos por puesto y género

En este boxplot podemos apreciar las amplitudes en los sueldos de cada puesto por género. Mientras más larga sea la caja, más amplia es la variación de los sueldos, y al contrario, mientras más chica sea la caja, hay una mayor concentración de los sueldos.

A los puntos que aparecen por encima de cada uno de los gráficos, se los denomina outlier, y son valores extremos.

ggplot(salarios, aes(x = puesto, y = sueldo_bruto, fill = genero)) +
  geom_boxplot() +
  labs(title = "Dispersión de sueldos por puesto y género",
       x = "", y = "",
       caption = fuente, 
       fill = "Género") +
  scale_y_continuous(labels = comma_format(big.mark = ".", decimal.mark = ","))  +
  scale_fill_manual(values = col_genero) +
  theme(panel.grid.major.y = element_line(colour = "#CACFD2")) +
  estilo

Este tipo de gráficos, los boxplots, proveen de mucha información estadística.

  • El límite inferior de la caja es el 1° cuartil (1Q).
  • La línea dentro de la caja, es la mediana.
  • El límite superior de la caja es el 3° cuartil (3Q).
  • Las líneas que salen de la caja son los límites para indicar los valores outliers y se calculan 1,5 por el Rango Intercuartil (3Q - 1Q).
  • Los puntos que vemos más allá de las líneas son outliers.

Por ejemplo, este gráfico nos permite ver que en el caso de los gerentes, no hay una diferencia muy amplia en la mediana de los sueldos de hombres y mujeres. En cambio vemos que la caja del gráfico de las mujeres es más amplia que la de los varones. Esto quiere decir que hay una porción de mujeres como Gerente de RRHH que cobran menos que sus pares hombres, y que también hay una porción de mujeres que cobran más que los varones.

Relación entre años de experiencia y sueldo

Con el siguiente gráfico queremos ver cuál es la relación entre los años de experiencia y el sueldo bruto.

modelo_lineal <- broom::tidy(lm(data = sueldos, 
                                sueldo_bruto ~ anios_rh))
modelo_lineal$estimate <- dollar(modelo_lineal$estimate,
                                 prefix = "AR$ ",    # Podemos controlar el símbolo utilizado
                                 big.mark = ".",     # Cambia el separador de miles
                                 decimal.mark = ",") # Cambia el separador decimal
ggplot(sueldos, aes(x = anios_rh, y = sueldo_bruto)) +
  geom_point(alpha = .7, size = 1.5, color = col_graf) +
  geom_smooth(method = "lm") +
  labs(title = "Relación entre años de experiencia y sueldos de RRHH",
       subtitle = "En pesos argentinos",
       x = "Años de Experiencia",
       y = "Sueldo Bruto",
       caption = fuente) +
  scale_y_continuous(labels = comma_format(big.mark = ".", decimal.mark = ","))+
  estilo

Podemos ver una relación positiva entre los años de experiencia y el sueldo, es decir que a medida que aumentan los años de experiencia (nos movemos hacia la derecha en el eje horizontal), sube el sueldo bruto (en el eje vertical).

En promedio, una persona con cero años de experiencia en RRHH cobra un sueldo bruto de AR$ 58.393,91. Y con cada año de experiencia, el sueldo aumenta en AR$ 2.860,21.

Ratio de Empleados de RRHH por Dotación

Con este indicador queremos analizar la cantidad de empleados que hay en el área de RRHH en relación a la dotación de la empresa.

 ratio <- sueldos %>% 
  select(rubro, empleados, empleados_rh) %>% 
  mutate(ratio_rh_dotacion = empleados/empleados_rh) %>% 
  group_by(rubro) %>% 
  summarise(ratio_promedio = round(mean(ratio_rh_dotacion))) %>% 
  filter(ratio_promedio != Inf) 
ggplot(ratio, aes(x=ratio_promedio, 
                         y = reorder(rubro, ratio_promedio)))+
  geom_point(color = col_graf, size = 4)+
  geom_segment(aes(y = rubro, yend= rubro, x=0, xend=ratio_promedio),
               color="#5D6D7E") +
  estilo +
  labs(title="Ratio de Empleados de RH \n por Dotación",
       subtitle = "Detallado por rubro de la empresa", 
       caption = fuente, 
       x="", y= "") +
  theme(panel.grid.major.x = element_line(colour = "#CACFD2"))

Agradecimientos

Agradezco a todos los participantes del curso “Introducción a R para RRHH” que dictamos en Data 4HR. Para conocer nuestras próximas fechas, y todas nuestras actividades de formación podés entrar en este link o por mail a sergio@d4hr.com.

Este es un curso en castellano, que utiliza datos de RRHH, para facilitar el aprendizaje del uso de este lenguaje de análisis de datos.

Y si ya sabés algo de R y te interesa ser parte de una comunidad de R enfocada en RRHH, te invitamos a seguirnos en el Club de R para RRHH.




# The Wall

Disco 1

Lado 1

  1. In the Flesh?

  2. The Thin Ice

  3. Another Brick in the Wall (Part I)

  4. The Happiest Days of Our Lives

  5. Another Brick in the Wall (Part II)

  6. Mother

adicion <- 26 + 144

El resultado de la suma es 170

library(tidyverse)
