Introducción

R4HR Club de R para RRHH es una comunidad de aprendizaje de programación de R para profesionales y estudiantes que trabajen o quieran trabajar en RRHH.

Somos una comunidad que usa mayormente datos de ejemplo relacionados con RRHH, y que genera contenido en castellano para eliminar las barreras en el aprendizaje y facilitar que más personas adopten las herramientas de análisis de datos en sus trabajos.

Para saber más de nosotros te invitamos a leer este post.

También podés ver todo el contenido que generamos en los siguientes links:

Google Drive

YouTube

Github

También te invitamos a seguirnos en todas nuestras redes sociales.

Pueden acceder a los datos crudos desde este link.

# Carga de librerías 
# Instalar pacman install.packages("pacman")

pacman::p_load(tidyverse, funModeling, gt, googlesheets4,gt, CGPfunctions,
               extrafont, scales, ggalt, kableExtra, wordcloud, networkD3,
               data.table, ggeconodist, ggpmisc)



# Carga de Datos ----
# Datos --------

## 2021 ----

# Encuesta
kiwi21 <- read.csv("https://raw.githubusercontent.com/r4hr/kiwi2021/main/data/rh_2021.csv",
                   sep = ";",
                   encoding = "UTF-8") 

kiwi20 <- read.csv("https://raw.githubusercontent.com/r4hr/kiwi2021/main/data/rh_2020.csv", 
                   sep = ";",
                   encoding = "UTF-8")

freelo21 <- read.csv("https://raw.githubusercontent.com/r4hr/kiwi2021/main/data/freelancers_2021.csv",
                     sep = ";",
                     encoding = "UTF-8")

kiwi21_original <- read_sheet("1nhpqDWuJoWhiVj0rIaV51-SdfnSxTpbV3Vcd3iYmyTw")

# Configuraciones generales ----

options(scipen = 999)   # Modifica la visualización de los ejes numérico a valores nominales

loadfonts(quiet = TRUE) # Permite cargar en R otros tipos de fuentes.

# Estilo limpio sin líneas de fondo
estilo <- theme(panel.grid = element_blank(),
                plot.background = element_rect(fill = "#FBFCFC"),
                panel.background = element_blank(),
                text = element_text(family = "Roboto"))

# Estilo limpio con líneas de referencia verticales en gris claro
estilov <- theme(panel.grid = element_blank(),
                 plot.background = element_rect(fill = "#FBFCFC"),
                 panel.background = element_blank(),
                 panel.grid.major.x = element_line(color = "#AEB6BF"),
                 text = element_text(family = "Roboto"))

# Estilo limpio con líneas de referencia horizontales en gris claro
estiloh <- theme(panel.grid = element_blank(),
                 plot.background = element_rect(fill = "#FBFCFC"),
                 panel.background = element_blank(),
                 panel.grid.major.y = element_line(color = "#AEB6BF"),
                 text = element_text(family = "Roboto"))

genero <- c("#1FC3AA", "#8624F5", "#FFD129", "#75838F") # Verde - Violeta - Amarillo - Gris
genero3 <- c("#8624F5","#FFD129", "#1FC3AA")

colores <-  c("#8624F5", "#1FC3AA")

azul <- "#344D7E"
verde <-  "#1FC3AA"
rosa1 <- "#B95192"
rosa2 <- "#EE5777"
naranja <- "#FF764C"
amarillo <- "#FFA600"
gris <- "#75838F"
lila <- "#8624F5"
rojo <- "#943126"

col4 <- c(azul, lila, rosa1, rosa2)
col5 <- c(azul, lila, rosa1, rosa2, naranja)
col6 <- c(azul, lila, rosa1, rosa2, naranja, amarillo)

# Creo un objeto con un texto que se va a repetir mucho a lo largo del análisis
fuente <- "Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2021"

# Creo objetos para formatear las etiquetas numéricas de los ejes x e y
eje_x_n <- scale_x_continuous(labels = comma_format(big.mark = ".", decimal.mark = ","))

eje_y_n <- scale_y_continuous(labels = comma_format(big.mark = ".", decimal.mark = ","))


# Cantidad de respuestas 

rtas21 <- nrow(kiwi21_original)

rtas21_perc <- percent(1- (rtas21 / 762))

rtas_pais <- kiwi21_original %>% 
  select(pais = `País en el que trabajas`) %>% 
  distinct(pais) %>% 
  count() %>% 
  pull()


# Reorganizar puestos jerárquicamente
kiwi21 <- kiwi21 %>% 
  mutate(puesto = factor(puesto, 
                         levels = c("Director", "Gerente", "Jefe", 
                                    "Responsable", "HRBP", "Analista",
                                    "Administrativo", "Pasante")))

Motivaciones

Como en RRHH trabajamos con datos sensibles, es complejo conseguir datos para practicar cuando estás aprendiendo sobre People Analytics, especialmente la parte práctica. Por eso, e inspirados en la Encuesta de SysArmy, una comunidad de tecnología, que entre otras cosas, organiza eventos como Nerdearla.

Por esta razón hicimos nuestra propia encuesta, relevando datos de profesionales que trabajan tanto bajo relación de dependencia como de manera freelance. El relevamiento de datos lo hicimos entre el 22 de octubre y el 22 de noviembre de 2021.

En esta edición recibimos en total 586 respuestas (un 23% menos que en 2020), de 16 países diferentes.

kiwi21 %>% 
  group_by(pais) %>% 
  tally(sort = T) %>% 
  rename("País" = pais,
         "Respuestas" = n) %>% 
  kbl(caption = "Respuestas por País", ) %>% 
  kable_styling(full_width = F, position = "center",
                bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  footnote(general = fuente)
Respuestas por País
País Respuestas
Argentina 426
Perú 19
Bolivia 16
Costa Rica 15
Uruguay 14
Chile 10
México 7
Paraguay 6
Ecuador 5
Colombia 3
España 2
Guatemala 2
El Salvador 1
Estados Unidos 1
Panamá 1
Venezuela 1
Note:
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2021

Del total de respuestas recibidas, 536 son de personas que trabajan en relación de dependencia en RRHH, mientras que 50 personas trabajan de manera freelance.

kiwi21_original %>% 
  select(Trabajo) %>% 
  group_by(Trabajo) %>% 
  count() %>% 
  ggplot(aes(x = n, y = Trabajo)) +
  geom_col(fill = azul) +
  estilov +
  geom_text(aes(label = n), # Indica la cantidad de decimales
            size = 3,       # Cambia el tamaño de la letra
            hjust = 1.2,    # Mueve la etiqueta para la izquierda
            color = "white",
            family = "Roboto") +
  labs(title = "Respuestas por tipo de trabajador", 
       x = "", y = "", 
       caption = fuente)

En esta edición decidimos realizar los análisis de género en términos de Identidad de Género para intentar abarcar con nuestro análisis la diversidad en términos de identidad de género. Es por esta razón que, a diferencia de la primera edición donde los análisis los hicimos en términos de Mujer/Hombre este año lo hicimos en términos de Mujer cis/Mujer trans y Hombre cis/Hombre trans para poder reflejar con mayor precisión el abánico de identidades y percepciones.

El térmiino “cis” hace referencia a que la persona se identifica con el mismo género con el que nació.

Le agradecemos mucho a Ivana Feldeberg del Observatorio de Datos con Perspectiva de Género por el asesoramiento en este apartado.

Dicho esto, las respuestas según la identidad de género de las personas que participaron es la siguiente:

# Gráfico para relación de dependencia----
div <- kiwi21 %>% 
  select(genero) %>% 
  mutate(genero = factor(genero, 
                         levels = c("Mujer cis", "Hombre cis", 
                                    "Prefiero no responder", "Gay"))) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$genero, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=genero)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c("#8624F5",  "#1FC3AA", "#FFD129","#75838F")) +
  theme_void() +
  theme(legend.position = "top",
        panel.background = element_blank(),
        plot.title.position = "plot",
        text = element_text(family = "Roboto")) +
  labs(title = "Cantidad de respuestas según género",
       subtitle = "Relación de Dependencia",
       fill = "Género", 
       caption = fuente)

# Gráfico de freelancers ----
freelo21 <- freelo21 %>% 
  mutate(genero = fct_collapse(genero, "Mujer cis" = c("Mujer cis", "Mujer"),
                               "Hombre cis" = c("Hombre cis")),
         genero = factor(genero, levels = c("Mujer cis", "Hombre cis",
                                             "Prefiero no responder", "No binario")))

div <- freelo21 %>% 
  select(genero) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$genero, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=genero)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c("#8624F5",  "#1FC3AA", "#FFD129","#75838F")) +
  theme_void() +
  theme(legend.position = "top",
        panel.background = element_blank(),
        plot.title.position = "plot",
        text = element_text(family = "Roboto")) +
  labs(title = "Cantidad de respuestas según género",
       subtitle = "Freelancers",
       fill = "Género", 
       caption = fuente)

En resumen, más de dos tercios de las personas que participaron de esta encuesta son mujeres cis. Algo que reflejan los datos es que en las áreas de Recursos Humanos, la diversidad de identidades de género es prácticamente nula.

kiwi21_original %>% 
    mutate(genero = fct_collapse(`Identidad de Género`, "Mujer cis" = c("Mujer cis", "Mujer", "mujer",
                                                       "Mujer heterosexual"),
                               "Hombre cis" = c("Hombre cis", "Hombre", 
                                                "Hombre hetero. Que es cis?",
                                                "Hombre heterosexual")),
         genero = factor(genero, levels = c("Mujer cis", "Hombre cis",
                                            "Gay", "Prefiero no responder", "No binario"))) %>% 
  group_by(genero) %>% 
  tally(sort = T) %>% 
  mutate(Porcentaje = n/sum(n),
         Porcentaje = percent(Porcentaje, accuracy = 0.1)) %>% 
  rename("Género" = genero, 
         "Cantidad" = n) %>% 
  kbl(caption = "Total de Participantes según\nIdentidad de Género") %>% 
  kable_styling(full_width = F, position = "center",
                bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  footnote(general = fuente, general_title = "")
Total de Participantes según Identidad de Género
Género Cantidad Porcentaje
Mujer cis 407 69.5%
Hombre cis 171 29.2%
Prefiero no responder 6 1.0%
Gay 1 0.2%
No binario 1 0.2%
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2021

Análisis de remuneraciones

Remuneraciones por país

En esta sección nos dedicaremos a comparar los sueldos entre los países. En primer lugar, hay que resaltar que los resultados no son representativos de los mercados de los países, sino que lo son de los datos recolectados.

Por otra parte, la baja cantidad de respuestas recolectadas de otros países fuera de la Argentina, nos hace imposible, hacer un análisis comparado representativo de los puestos. Sin embargo, hay algunos datos intresantes para analizar.

Primero, analicemos los sueldos de los trabajadores en relación de dependencia, de cuyos países hayamos recibido al menos 5 respuestas.

sueldos_dolar <- kiwi21 %>% 
  select(puesto, sueldo_dolar, pais, tipo_contratacion) %>% 
  filter(puesto != "Pasante", tipo_contratacion != "Pasante")

# Eliminamos los sueldos que están dentro del rango entre los percentiles 5 y 95
numericos <- profiling_num(sueldos_dolar)
poda_p05 <- numericos[1,6]
poda_p95 <- numericos[1,10]

# Dado que los percentiles 5 y 95 están en U$422 y 3300 respectivamente, 
# podamos todo lo que esté fuera de ese rango

media_pais <- sueldos_dolar %>% 
  filter(pais %in% c("Argentina", "Perú", "Bolivia", "Costa Rica", "Uruguay", 
                     "Chile", "México", "Paraguay", "Ecuador"),
         between(sueldo_dolar,poda_p05,poda_p95)) %>% 
  group_by(pais) %>% 
  summarise(sueldop = list(mean_se(sueldo_dolar))) %>% 
  unnest(cols = c(sueldop)) 
 
sueldo_dolar_pais <- kiwi21 %>% 
  select(pais, sueldo_dolar) %>% 
  filter(between(sueldo_dolar, poda_p05, poda_p95),
         pais %in% c("Argentina", "Perú", "Bolivia", "Costa Rica", "Uruguay", 
                     "Chile", "México", "Paraguay", "Ecuador"))

# Gráfico
ggplot(media_pais, aes(reorder(pais, -y), y =  y))+
  geom_col(fill = azul, alpha = 0.85) +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47")+
  geom_point(data = sueldo_dolar_pais, aes(x = pais, y = sueldo_dolar), 
             alpha = 0.3, size = 2, color = "#75838F",
             position = position_jitter(width = 0.15))+
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".", 
                              decimal.mark = ","),
                vjust = 1.5, fontface = "bold"), 
            size = 4, color = "white",
            family = "Roboto")+
  eje_y_n +
  labs(title = "Salario promedio por país",
       subtitle = "Sueldos de RRHH en U$S",
       caption = paste0(fuente,"\nPaíses con más de 5 respuestas"),
       x = "", y = "") + 
  estiloh

A pesar de la baja cantidad de respuestas, se repite la tendencia del 2020 en donde Uruguay y Chile tienen en promedio los sueldos más altos de la región.

Análisis de sueldos por puestos en Latinoamérica

kiwi21 %>% 
  select(puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante",
         between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(puesto) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto))) +
  geom_col(fill = azul) +
  estilov +
  labs(title = "Mediana salarial por puesto", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", 
       caption = fuente) +
  eje_x_n

La razón por la cual la mediana salarial de las personas en puesto de Dirección es menor a la de las personas en puestos de Gerente se explica por el tamaño de la muestra y las respuestas recibidas. En la tabla a continuación incorpora la cantidad de respuestas recibidas para cada uno de estas posiciones.

gt(kiwi21 %>% 
     select(puesto, sueldo_dolar) %>% 
     filter(puesto != "Pasante") %>% 
     group_by(puesto) %>% 
     summarise(mediana_salarial = median(sueldo_dolar), 
               cant = n())
     ) %>% 
  tab_header(title = "Mediana salarial por puestos", 
             subtitle = "Sueldos en U$D") %>% 
  tab_source_note(source_note = fuente) %>% 
   fmt_currency(columns =  "mediana_salarial", decimals = 0,
               sep_mark = ".", dec_mark = ",") %>% 
  cols_label(puesto = "Posición",
             mediana_salarial = "Mediana Sueldo",
             cant = "Respuestas") 
Mediana salarial por puestos
Sueldos en U$D
Posición Mediana Sueldo Respuestas
Director $1.591 6
Gerente $2.773 46
Jefe $1.879 54
Responsable $1.359 96
HRBP $1.221 56
Analista $977 236
Administrativo $658 25
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2021

Sueldos según el origen del capital

Si dividimos los gráficos según el Origen del Capital, podemos apreciar que en líneas generales, la mediana salarial en empresas multinaciones es mayor que en las empresas nacionales. Solamente en las posiciones de HRBP y de Gerente se aprecia una paridad salarial respecto del origen del capital de la organización.

kiwi21 %>% 
  select(origen_capital, puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante", 
         between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(puesto, origen_capital) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto), fill = origen_capital)) +
  geom_col() +
  geom_text(aes(label = round(x=mediana_salarial, 0), hjust = 1.2, fontface = "bold"),size = 3, color = "white") +
  scale_fill_manual(values = c(verde, azul)) +
  estilov +
  eje_x_n +
  facet_wrap(~origen_capital) +
  labs(title = "Mediana salarial por puesto según origen del capital", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", fill = "", 
       caption = fuente) +
  theme(legend.position = "top")

Veamos este gráfico de otra manera:

slope_df <- kiwi21 %>% 
  select(puesto, sueldo_dolar, origen_capital) %>% 
  filter(between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(puesto, origen_capital) %>% 
  summarise(mediana_salarial = round(median(sueldo_dolar)))

newggslopegraph(dataframe = slope_df,
                Times = origen_capital,
                Measurement = mediana_salarial,
                Grouping = puesto,
                Title = "Diferencias entre sueldos de RRHH en empresas nacionales y multinacionales",
                SubTitle = "Mediana Salarial. Sueldos en U$S",
                Caption = fuente, WiderLabels = T
                
                )

Análisis por rubro y origen del capital

Para el análisis de los rubros de la empresa, vamos a filtrar los 5 rubros que tienen más respuestas. También eliminaremos del análisis el puesto de Director porque no se encuentra presente en todos los rubros.

top_5_rubros <- kiwi21 %>% 
  select(rubro) %>% 
  group_by(rubro) %>% 
  count(sort = TRUE) %>%
  filter(rubro != "Otros", n > 30) %>% 
  pull(var = rubro)


kiwi21 %>% 
  select(rubro, origen_capital, puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante", puesto != "Director",
         between(sueldo_dolar, poda_p05, poda_p95),
         rubro %in% top_5_rubros) %>% 
  group_by(rubro, puesto, origen_capital) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto), 
             fill = origen_capital)) +
  geom_col() +
  geom_text(aes(label = round(x=mediana_salarial, 0), 
                hjust = 1.2, 
                fontface = "bold"),
            size = 3, 
            color = "white") +
  scale_fill_manual(values = c(verde, azul)) +
  estilo +
  eje_x_n +
  facet_grid(rubro~origen_capital) +
  labs(title = "Mediana salarial por puesto según origen del capital", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", fill = "", 
       caption = fuente) +
  theme(legend.position = "top")

Para ver las medianas salariales por rubros junto con el desvío estándar, pueden ver la siguiente tabla:

  kiwi21 %>% 
    select(rubro, sueldo_dolar) %>% 
    filter(between(sueldo_dolar, poda_p05, poda_p95)) %>% 
    group_by(rubro) %>% 
    summarise(mediana_salarial = round(median(sueldo_dolar)),
              desvio_salarial = round(sd(sueldo_dolar)),
              Respuestas = n()) %>% 
    arrange(-mediana_salarial) %>% 
  kbl(caption = "Mediana salarial por rubro. En U$S", 
      col.names = c("Rubro", "Mediana Salarial","Desvío", "Respuestas")) %>% 
  kable_styling(full_width = F, position = "center",
              bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  scroll_box(height = "500px")
Mediana salarial por rubro. En U$S
Rubro Mediana Salarial Desvío Respuestas
Servicios financieros seguros 1785 784 15
Transporte marítimo, puertos 1706 831 2
Petróleo y producción de gas, refinación de petróleo 1691 646 15
Tabaco 1597 266 2
Bancos, banca online 1578 242 6
Servicios de correos y de telecomunicaciones 1498 673 11
Servicios públicos (agua, gas, electricidad) 1494 345 4
Hotelería, restauración, turismo 1409 664 5
Agricultura, plantaciones, otros sectores rurales 1376 636 8
Transporte (incluyendo aviación civil, ferrocarriles por carretera) 1371 748 14
Terminales automotrices, fábricas autopartistas, y afines 1334 409 6
Medios de comunicación, cultura, gráficos 1221 391 5
Industrias químicas 1174 307 6
Servicios de salud 1165 542 32
Tecnologías de información 1163 639 93
Minería 1146 826 7
Alimentación, bebidas 1118 535 34
Servicios de consultoría 1092 618 39
Construcción 1091 905 11
Otros 1071 557 67
Servicios profesionales 1057 481 18
Función pública 1005 448 13
Comercio 939 695 31
Producción de metales básicos 905 NA 1
Industria metalúrgica, metalmecánica 890 872 12
Educación 874 697 9
Textiles, vestido, cuero, calzado 798 306 3

Sueldos por países

Si bien la mayor cantidad de respuestas la recibimos de personas trabajando en Argentina, en esta edición decidimos incluir a todos los países de los que obtuvimos al menos 10 respuestas (Argentina, Perú, Bolivia, Costa Rica, Uruguay y Chile). Si bien la cantidad de respuestas no nos permiten realizar análisis muy profundos queremos agradecer a las personas que respondieron realizando aunque más no sea un breve análisis.

Como primeros pasos, vamos a filtrar los datos correspondientes a cada país, y luego filtramos los sueldos que estén entre los percentiles 5 y 95, para eliminar valores espurios o extremos que ensucien el análisis.

También eliminamos el puesto de Director del análisis y las respuestas con Género diverso por la baja cantidad de respuestas.

Otra conversión que hicimos fue pasar los sueldos de las personas que trabajan part-time a una equivalencia full-time multiplicando por 1.5 el sueldo completado en la encuesta.

En esta instancia, también simplificamos los nombres de algunos rubros para mejorar las visualizaciones de los resultados.

Perú

kiwi21 <- kiwi21 %>% 
  filter(between(sueldo_dolar, poda_p05, poda_p95),
         puesto != "Director", puesto != "Pasante",
         genero %in% c("Mujer cis", "Hombre cis"),
         anios_experiencia < 50) %>% 
  mutate(rubro = fct_recode(rubro, "Servicios financieros" = "Servicios financieros; seguros",
                             "Transporte" = "Transporte (incluyendo aviación civil; ferrocarriles por carretera)",
                            "Ind. Automotriz y Autopartistas" = "Terminales automotrices, fábricas autopartistas, y afines",
                            "Tecnología" = "Tecnologías de Información, Sistemas, y afines",
                            "Ind. Petrolera" = "Petróleo y producción de gas; refinación de petróleo"),
         multiplicador = if_else(tipo_contratacion == "Part time", 1.5, 1),
         sueldo_ft = sueldo_bruto * multiplicador)

# Análisis Perú
rh_pe <- kiwi21 %>% 
  filter(pais == "Perú")

Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

  • Primer cuartil: La parte inferior de la caja.
  • Mediana: La línea gruesa dentro de cada rectángulo.
  • Tercer cuartil: La parte superior de la caja
  • Outliers: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

ggplot(rh_pe, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Perú - En S/",
       x = "", y = "Soles S/",
       fill = "Género",
       caption = fuente)

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

rh_pe %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Perú en S/",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Soles S/") + 
  estiloh

Análisis por funciones

rh_pe %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Perú en S/",
       x = "Soles S/",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Perú

rh_pe %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Perú en S/",
       x = "Soles S/",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Bolivia

# Análisis Bolivia
rh_bo <- kiwi21 %>% 
  filter(pais == "Bolivia")

Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

  • Primer cuartil: La parte inferior de la caja.
  • Mediana: La línea gruesa dentro de cada rectángulo.
  • Tercer cuartil: La parte superior de la caja
  • Outliers: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

ggplot(rh_bo, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Bolivia - En Bs.",
       x = "", y = "Boliviano Bs",
       fill = "Género",
       caption = fuente)

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

rh_bo %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Bolivia Bs.",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Bolivianos Bs") + 
  estiloh

Análisis por funciones

rh_bo %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Bolivia en Bs.",
       x = "Bolivia Bs.",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Bolivia.

rh_bo %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Bolivia en Bs.",
       x = "Bolivianos Bs",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Costa Rica

# Análisis Costa Rica
rh_cr <- kiwi21 %>% 
  filter(pais == "Costa Rica")

Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

  • Primer cuartil: La parte inferior de la caja.
  • Mediana: La línea gruesa dentro de cada rectángulo.
  • Tercer cuartil: La parte superior de la caja
  • Outliers: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

ggplot(rh_cr, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Costa Rica - en CRC",
       x = "", y = "Colones ¢",
       fill = "Género",
       caption = fuente)

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

rh_cr %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Costa Rica en CRC",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Colones ¢") + 
  estiloh

Análisis por funciones

rh_cr %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Costa Rica en CRC",
       x = "Colones ¢",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Costa Rica.

rh_cr %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Costa Rica en CRC",
       x = "Colones ¢",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Uruguay

# Análisis Uruguay
rh_uy <- kiwi21 %>% 
  filter(pais == "Uruguay")

Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

  • Primer cuartil: La parte inferior de la caja.
  • Mediana: La línea gruesa dentro de cada rectángulo.
  • Tercer cuartil: La parte superior de la caja
  • Outliers: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

ggplot(rh_uy, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Uruguay - en UYU",
       x = "", y = "Pesos $",
       fill = "Género",
       caption = fuente)

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

rh_uy %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Uruguay en UYU",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Pesos $") + 
  estiloh

Análisis por funciones

rh_uy %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Uruguay en UYU",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Uruguay.

rh_uy %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Uruguay en UYU",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Chile

# Análisis Chile
rh_cl <- kiwi21 %>% 
  filter(pais == "Chile")

Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

  • Primer cuartil: La parte inferior de la caja.
  • Mediana: La línea gruesa dentro de cada rectángulo.
  • Tercer cuartil: La parte superior de la caja
  • Outliers: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

ggplot(rh_cl, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Chile - en CLP",
       x = "", y = "Pesos $",
       fill = "Género",
       caption = fuente)

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

rh_cl %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Chile en CLP",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Pesos $") + 
  estiloh

Análisis por funciones

rh_cl %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Chile en CLP",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Chile.

rh_cl %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 2, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Chile en CLP",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Argentina

En el caso de Argentina, como contamos con un caudal de respuestas mucho más amplio, vamos a realizar un análisis más detallado.

# Análisis Argentina
rh_ar <- kiwi21 %>% 
  filter(pais == "Argentina")

Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

  • Primer cuartil: La parte inferior de la caja.
  • Mediana: La línea gruesa dentro de cada rectángulo.
  • Tercer cuartil: La parte superior de la caja
  • Outliers: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

ggplot(rh_ar, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.7) +
  geom_point(position = position_jitter(width = 0.08), size = 2, alpha = 0.35) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Argentina - en ARS",
       x = "", y = "Pesos $",
       fill = "Género",
       caption = fuente)

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género.

rh_ar %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 2, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Argentina en ARS",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Pesos $") + 
  estiloh

Es interesante, de alguna manera combinar la información de los gráficos anteriores para analizar la distribución de los sueldos para cada posición:

ggplot(rh_ar, aes(x = fct_rev(puesto), y = sueldo_ft, fill = genero)) +
  geom_boxplot() +
  scale_fill_manual(values = genero) +
  eje_y_n +
  estiloh +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Argentina - en ARS",
       x = "", y = "", fill = "Género",
       caption = fuente) +
  theme(panel.grid.minor.y = element_line(color = "#AEB6BF"),
        plot.title.position = "plot")

Con estos datos podemos realizar una visualización de los gaps salariales entre hombres y mujeres.

gap_salarial <- rh_ar %>% 
  select(genero, puesto, sueldo_ft)

brecha <- gap_salarial %>% 
  group_by(genero, puesto) %>% 
  summarise(media_salarial = mean(sueldo_ft))


brecha_graf <- brecha %>% 
  pivot_wider(., names_from = genero, values_from = media_salarial) %>% 
  mutate(brecha = percent((`Hombre cis`-`Mujer cis`)/`Hombre cis`, 1),
         x = (`Hombre cis` + `Mujer cis`)/2)

ggplot(brecha_graf, 
       aes(x = `Mujer cis`, xend = `Hombre cis`, y = fct_rev(puesto), 
           group = puesto, label = brecha)) +
  geom_dumbbell(color = "#808080",
                size_x = 3, size_xend = 3,
                colour_x = colores[1],
                colour_xend = colores[2]) +
  geom_text(data = brecha_graf, 
            aes(x, puesto, label = brecha), nudge_y = .2) +
  labs(title = "Brecha salarial por puestos de RRHH",
       subtitle = "Sueldos promedios en Argentina en ARS",
       x = "",
       y = NULL, 
       caption = fuente) +
  eje_x_n +
  scale_color_manual(values = colores) +
  theme_minimal()+
  theme(plot.background = element_rect(fill = "#fbfcfc"),
        text = element_text(family = "Roboto"),
        plot.title.position = "plot")

rm(brecha, gap_salarial)

Si comparamos los resultados con la edición del 2020 (sección Sueldos Argentina -> Distribución de sueldos por puesto) podemos apreciar las siguientes diferencias.

En 2020, la mayoría de las medianas tenían valores similares en la mayoría de las posiciones de mayor jerarquía y había una paridad casi absoluta en el caso de los HRBP. En esta edición, salvo para el caso de los responsables, la mediana salarial aumentó para los hombres cis, y en el caso de las mujeres cis, la única posición jerárquica que tiene una mediana salarial más alta, es en el puesto de Responsable.

El puesto de Analista es el único caso donde la mediana salarial es más alta para las mujeres que para los varones, el gap salarial es un 5% más alto para las mujeres que para los hombres, y la distribución salarial es equitativa (aunque hay varias mujeres cis con valores altos).

Respecto al gráfico de gaps salariales, en esta edición comparada con la de 2020 podemos apreciar que:

  • Para el puesto de Gerente, la brecha salarial se mantiene igual.
  • Para el puesto de Jefe, la brecha salarial aumentó 4% (de un 12% en 2020 a un 16% en 2021).
  • Para el puesto de Responsable la brecha se redujo de un 17% en 2020, a un 6% en la edición 2021.
  • El mayor cambio en el análisis de gaps se apreció en la posición de HRBP donde el gap pasó de un 3% en 2020 a un 29% en 2021.
  • El puesto de Analista es el único en donde el gap salarial es favorable para las mujeres cis, pasando de un gap de 17% en 2020, a un 5% a favor de las mujeres.
  • Para el puesto de Administrativo el gap salarial pasó de un 8% en 2020 a un 19% en 2021.

Dado que la encuesta es anónima, es imposible trackear los cambios, promociones y aumentos en las mismas personas y empresas. Sería interesante buscar otros análisis de mercado para ver si esta tendencia se replica en otras investigaciones. Es sabido que la pandemia tuvo un impacto mayor en la carga cognitiva de las mujeres, dado que sumado a sus responsabilidades laborales, las mujeres típicamente se hacen cargo de las tareas domésticas y de la educación de los hijos e hijas, lo cual también implica un mayor acompañamiento también en las clases que fueron virtuales y de las tareas para el hogar. Para determinar el impacto de la carga cognitiva y de trabajo de las tareas domésticas sería importante hacer un análisis ad-hoc.

A continuación, y a modo de resumen, dejamos una comparación del gap salarial del 2020 vs. 2021.

Puesto <- c("Gerente", "Jefe", "Responsable", "HRBP", "Analista", "Administrativo")
`Gap 2020` <- c(0.13, 0.12, 0.17, 0.03, 0.17, 0.08)
`Gap 2021` <- c(0.13, 0.16, 0.06, 0.29, -0.05, 0.19)

gaps <- data.frame(Puesto, `Gap 2020`, `Gap 2021`)

gaps <- gaps %>% 
  mutate(Diferencia = Gap.2021 - Gap.2020)

gt(
  gaps
) %>% 
  tab_header(
    title = "Gap Salarial por puesto en RRHH en Argentina por año",
    subtitle = "Comparación Hombres cis vs Mujeres cis"
  ) %>% 
  fmt_percent(columns = c("Gap.2020", "Gap.2021", "Diferencia"),
              decimals = 0) %>% 
  cols_label(
    Gap.2020 = "Gap 2020",
    Gap.2021 = "Gap 2021"
  ) %>% 
  tab_source_note(source_note = paste0(fuente, " y 2020"))
Gap Salarial por puesto en RRHH en Argentina por año
Comparación Hombres cis vs Mujeres cis
Puesto Gap 2020 Gap 2021 Diferencia
Gerente 13% 13% 0%
Jefe 12% 16% 4%
Responsable 17% 6% −11%
HRBP 3% 29% 26%
Analista 17% −5% −22%
Administrativo 8% 19% 11%
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2021 y 2020

Análisis por funciones

rh_ar %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Argentina en ARS",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Argentina.

rh_ar %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 2, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Argentina en ARS",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")

Ahora comparemos los sueldos por rubros y géneros. Aquí podremos apreciar las diferencias entre los sueldos promedios de los hombres y mujeres en cada rubro.

rubro_ar <- rh_ar %>% 
  select(rubro, sueldo_ft) %>% 
  group_by(rubro) %>% 
  summarise(media_sueldo = mean(sueldo_ft),
            respuestas = n()) %>% 
  arrange(-respuestas)

top_rubros <- rubro_ar %>% 
  filter(rubro != "Otros", respuestas > 10) %>% 
  pull(rubro)

# Divide el largo de 'rubros' en varias líneas
rh_ar$rubro <- str_wrap(rh_ar$rubro, width = 30)


rh_ar %>% 
  filter(rubro %in% top_rubros) %>% 
  select(rubro, sueldo_ft, genero) %>% 
  group_by(rubro, genero) %>% 
  summarise(media_sueldo = mean(sueldo_ft),
            respuestas = n()) %>% 
  arrange(-respuestas) %>% 
  ggplot(aes(x = media_sueldo, y = reorder(rubro, media_sueldo), fill = genero)) +
  geom_col(position = "dodge") +
  geom_text(aes(label = comma(round(media_sueldo, 0),
                              big.mark = ".",
                              decimal.mark = ","),
                hjust = 1.4, vjust = 0.3),
            size = 3, 
            color = "white", 
            position = position_dodge(width = .9)) +
  scale_fill_manual(values = genero) +
  labs(title = "Promedio salarial por rubro y género",
       subtitle = "Datos de Argentina - en AR$",
       x = "", y = "", fill = "Género",
       caption = fuente) +
  eje_x_n +
  estilov +
  theme(axis.text.x = element_blank(),
        axis.ticks.x = element_blank(),
        plot.title.position = "plot") +
  guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

rm(rubro_ar, top_rubros)

Por último, analicemos los sueldos de los 6 rubros con mayor cantidad de respuestas, y visualicemos las distribuciones de los sueldos por puesto y género. En este gráfico podemos ver los cuartiles delimitando las zonas sombreadas, y la mediana con el punto gris. Los puntos violetas y verdes representan a las mujeres y los hombres respectivamente en cada uno de los puestos.

rh_ar %>% 
  filter(genero != "Género Diverso",
         puesto != "Director",
         rubro %in% c("Tecnologías de información", "Servicios de consultoría", 
                      "Alimentación, bebidas", "Comercio",
                      "Servicios de salud", "Servicios profesionales"))  %>% 
  ggplot(aes(x = fct_rev(puesto), y = sueldo_bruto)) +
  geom_econodist(width = 0.5) +
  geom_point(aes(y = sueldo_bruto, color = genero), alpha = 0.3,
             position = position_jitter(width = 0.25)) +
  scale_color_manual(values = c(verde, lila)) +
  eje_y_n +
  coord_flip() +
  facet_wrap(~rubro, ncol = 2) +
  estilov +
  labs(title = "Distribución salarial por puesto y rubro",
       subtitle = "Datos de Argentina - en AR$",
       x = "", y = "", color = "Género",
       caption = fuente) +
  theme(plot.title.position = "plot")

Relaciones entre experiencia y sueldo bruto

En esta sección del análisis buscamos identificar cuáles son los factores que influyen en los ingresos (independientemente de la posición), así que empezamos a explorar los datos.

La primera pregunta que nos hicimos fue si los años de trayectoria influyen en el sueldo. Nuestra hipótesis es que a mayor cantidad de años de experiencia, mayor iba a ser el ingreso.

Lo que vamos a ver en el siguiente gráfico de dispersión, es en el eje horizontal, los años de experiencia, y en el eje vertical, el sueldo bruto expresado en pesos argentinos. Luego, vamos a graficar una recta, que nos va a indicar la fuerza de esa relación.

lm_rh <- lm(sueldo_ft ~ anios_experiencia, data = rh_ar)

lm_hr_results <- summary(lm_rh)

lm_rh_r2 <- round(lm_hr_results[["r.squared"]],3)

ggplot(rh_ar, aes(x=anios_experiencia, y = sueldo_ft)) +
  geom_point(color = "#1FC3AA", alpha = 0.4, size = 2) + 
  geom_smooth(method = "lm") +
  theme_minimal() +
  theme(text = element_text(family = "Roboto")) +
  labs(title = "Relación entre sueldo y años de experiencia",
       x = "Años de Experiencia",
       y = "Sueldo bruto (AR$)", 
       caption = fuente) +
  eje_y_n +
  geom_text(aes(x=-Inf, y=Inf, hjust=0, vjust=1, label= paste0("R2 = ", lm_rh_r2))) 

En el gráfico podemos apreciar una recta que va creciendo efectivamente: a medida que nos movemos más hacia la derecha, la recta va subiendo. Pero el \(R^2\) = 0.318 nos indica cuánto explica los años de experiencia sobre el sueldo bruto, o dicho de otra manera, en qué medida influye la variable x (años de experiencia), sobre la variable y (sueldo bruto). Una definición más precisa de este valor conocido como Coeficiente de Determinación es la proporción de la varianza total de la variable explicada por la regresión.

Este valor puede estar entre 0 y 1, mientras más cerca de 0 está menor es la relación, y mientras más cerca de 1 esté el resultado, indica que la regresión explica la variabilidad de la variable de respuesta. Es por eso que este \(R^2\) = 0.318 nos indica que los años de experiencia explican un 31.8% de la variabilidad de los sueldos en RRHH.

Relación entre años de experiencia y sueldo bruto por puesto.

Dado que en el gráfico anterior tenemos mezclados los sueldos de administrativos, analistas, jefes y gerentes, decidimos analizar la relación entre los años de experiencia y el sueldo bruto por cada uno de los puestos por separado.

mi.formula <- y ~ x

ggplot(rh_ar, aes(x=anios_experiencia, y = sueldo_ft)) +
  geom_point(color = "#1FC3AA", alpha = 0.4, size = 2) + 
  geom_smooth(method = "lm", formula = mi.formula, se = FALSE) +
  theme_minimal() +
  theme(text = element_text(family = "Roboto")) +
  labs(title = "Relación entre sueldo y años de experiencia",
       x = "Años de Experiencia",
       y = "", 
       caption = fuente) +
  eje_y_n +
  stat_poly_eq(formula = mi.formula, 
               aes(label = paste(..rr.label.., sep = "~~~")), 
               parse = TRUE) +
  facet_wrap(~puesto)

Como podemos apreciar en los \(R^2\) de cada gráfico en el único puesto donde encontramos una fuerte relación entre los años de experiencia y el sueldo bruto es en los HRBP. En el resto de los puestos los años de trayectoria influyen muy poco en los sueldos de cada uno de los puestos.

Ahora bien, la pregunta es, ¿cuál es la variable que más influye en el sueldo en Recursos Humanos?. Tristemente, la respuesta no sorprende.

ggplot(rh_ar, aes(x = genero, y = sueldo_ft, fill = genero)) +
  geom_boxplot() +
  eje_y_n +
  scale_fill_manual(values = c(verde, lila)) +
  estiloh +
  labs(title = "Distribución salarial por género",
       x = "", y = "",
       fill = "Género", 
       caption = fuente)

Educación

En esta sección queremos indagar si hay relación entre la formación y la remuneración, y si impacta también el tipo de universidad, pública o privada, en la remuneración y posición. Primero veamos entre los distintos países como se distribuye la muestra entre profesionales provenientes de universidades públicas y privadas.

Dado que tenemos relativamente pocas respuestas de otros países que no sean Argentina, no podemos sacar ninguna conclusión seria, sólo mencionar que en Argentina, hay una virtual paridad entre los estudiantes y graduados de universidades públicas y privadas. Posteriormente analizaremos la situación por regiones dentro del país.

Las proporciones de respuestas según al tipo de universidad que asistieron los participantes de la encuesta es la siguiente:

kiwi21 %>% 
  select(pais, tipo_universidad) %>% 
  ggplot(aes(y = fct_rev(pais), 
             fill = tipo_universidad)) +
           geom_bar(position = "fill") + 
  scale_fill_manual(values = c(gris, verde, azul)) +
  labs(title = "Distribución de respuestas por tipo de universidad por país",
       caption = fuente, 
       x = "", y = "") +
  estilo +
  theme(legend.position = "none")


educ <- kiwi21 %>% 
  select(tipo_universidad) %>%  
  group_by(tipo_universidad) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
educ$ymax <- cumsum(educ$freq)

# Compute the bottom of each rectangle
educ$ymin <- c(0, head(educ$ymax, n=-1))

# Compute label position
educ$labelPosition <- (educ$ymax + educ$ymin) / 2

# Compute a good label
educ$label <- paste0(educ$tipo_universidad, "\n Cant: ", educ$n)

# Make the plot
ggplot(educ, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=tipo_universidad)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c(gris, verde, azul)) +
  theme_void() +
  theme(legend.position = "right",
        panel.background = element_blank(),
        text = element_text(family = "Roboto")) +
  labs(title = "Tipo de Universidad",
       fill = "Tipo de Universidad", 
       caption = fuente) +
  theme(legend.position = "left")

Las principales carreras de las personas que respondieron son:

carreras <- kiwi21 %>% 
  select(nivel_formacion, carrera_grado, tipo_universidad, trabajo, 
         sueldo_bruto, puesto, funcion, pais, genero) %>% 
  mutate(carrera_grado = factor(carrera_grado))


carreras <- carreras %>% 
  mutate(carrera_grado = fct_collapse(carrera_grado, 
                                      "Comunicación Social" = c("Ciencias de la Comunicación", "Comunicación", "Comunicación social",
                                                                "Comunicación Social",
                                                                "Soy Licenciada en Ciencias Comunicación y Diplomada en RRHH")), 
         carrera_grado = fct_collapse(carrera_grado, "Ingenierías" = c("Ingeniera Comercial", "INGENIERA COMERCIAL",
                                                                       "Ing. Gestión Empresarial", "Ingeniería",
                                                                       "Ingenieria comercial", "Ingeniería Comercial",
                                                                       "Ingeniería de Sistemas", "Ingeniería Industrial")),
         carrera_grado = fct_collapse(carrera_grado, "Relaciones Públicas" = c("Lic. en Relacione Publicas",
                                                                               "Lic. en Relaciones Públicas",
                                                                               "Relaciones Públicas e Institucionales")),
         carrera_grado = fct_collapse(carrera_grado, 
                                      "Psicología" = c("Psicología", "Psicología Social")),
         carrera_grado = fct_lump(carrera_grado, 
                                  prop = 0.02, 
                                  other_level = "Otras"),
         carrera_grado = factor(carrera_grado,
                               levels = c("RRHH / RRLL / RRTT", "Psicología", "Administración de Empresas", 
                                         "Contador Público", "Ingenierías","Comunicación Social", "Otras")))



ggplot(carreras, aes(y = fct_rev(carrera_grado))) + 
  geom_bar(position = "dodge", fill = azul) +
  theme(plot.title.position = "plot") + 
  labs(x="",y="") +
  estilov +
  labs(title = "Principales carreras estudiadas",
       subtitle = "Trabajadores en relación de dependencia",
       caption = fuente)

Dada la cantidad de respuestas por país, el análisis que haremos desde aquí en adelante sólo será para Argentina.

Análisis de educación y puestos para Argentina

Luego, podemos analizar en qué tipo de universidad estudiaron las personas que respondieron la encuesta, según el puesto actual que ocupan.

recorte_educacion <- rh_ar %>%
  filter(pais == "Argentina") %>% 
  select(nivel_formacion, carrera_grado,
         tipo_universidad, trabajo, sueldo_bruto, puesto, funcion, pais, genero)

ggplot(recorte_educacion, (aes(x = puesto, fill = tipo_universidad))) + #Tipo de universidad y cargo
  geom_bar(position = "dodge") +
  theme(plot.title.position = "plot") + 
  labs(x="",y="") +
    estilov +
  scale_fill_manual(values = c(gris, verde, azul)) +
  coord_flip() +
  labs(title = "Cantidad de respuestas según puesto y universidad",
       subtitle = "Sólo respuestas de Argentina",
       x = "", fill = "Tipo de Universidad",
       caption = fuente) +
    guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

Reiteremos el análisis pero únicamente para las carreras relacionadas con Recursos Humanos y Relaciones del Trabajo.

recorte_educacion %>%
  filter(carrera_grado == "RRHH / RRLL / RRTT") %>% 
  ggplot(aes(x = puesto, fill = tipo_universidad)) + #Tipo de universidad y cargo
  geom_bar(position = "dodge") +
  theme(plot.title.position = "plot") + 
  labs(x="",y="") +
    estilov +
  scale_fill_manual(values = c(gris, verde, azul)) +
  coord_flip() +
  labs(title = "Cantidad de respuestas según puesto y universidad",
       subtitle = "Sólo respuestas de Argentina - Carreras de RH",
       x = "", fill = "Tipo de Universidad",
       caption = fuente) +
    guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

Podemos apreciar que a partir de los puestos de jefatura, hay mayor presencia de graduados provenientes de universidades privadas.

En Argentina, podemos ver la siguiente distribución por género y nivel educativo.

ne_salario <- recorte_educacion 

# Elimina recorte_educacion
rm(recorte_educacion)

# Agrupa categorías de educación
ne_salario <- ne_salario %>% 
    mutate(nivel_formacion = fct_collapse(nivel_formacion,
                                        "Secundario completo" = c("Secundario completo", "Terciario en curso",
                                                                  "Terciario abandonado", "Universitario abandonado"),
                                        "Universitario completo" = c("Universitario completo", "Maestría abandonada", 
                                                                     "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso")) 

ne_salario %>% 
  select(pais, nivel_formacion, genero, puesto) %>%
  filter(genero %in% c("Mujer cis", "Hombre cis")) %>%
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  ggplot(aes (y= nivel_formacion, fill = genero)) + 
  geom_bar(position = "fill") +
  labs(x="",y="") +
  scale_fill_manual(values = c(verde, lila)) +
  estilo +
  theme(legend.position = "top",
        plot.title.position = "plot") +
  labs(title = "Máximo nivel educativo alcanzado por género",
       subtitle = "Distribución por frecuencias absolutas",
       caption = fuente, 
       fill = "Género")

En términos absolutos, las mujeres graduadas representan cerca del 75% de la muestra. Analicemos estos datos en términos relativos. Prácticamente el patrón de nivel educativo entre hombres y mujeres es idéntico.

De acuerdo a la muestra recolectada, las mujeres se forman en mayor proporción que los hombres cis.

ne_fem <- ne_salario %>% 
  filter(genero == "Mujer cis") %>% 
  group_by(genero, nivel_formacion) %>% 
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(n = n()) %>% 
  mutate(frecuencia = round(n/sum(n),2),
         genero = "Mujer cis") 

ne_mas <- ne_salario %>% 
  filter(genero == "Hombre cis") %>% 
  group_by(genero, nivel_formacion) %>% 
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(n = n()) %>% 
  mutate(frecuencia = round(n/sum(n),2),
         genero = "Hombre cis") 

ne_total <- rbind(ne_fem, ne_mas)

ggplot(ne_total, aes(x = nivel_formacion, y = frecuencia, fill = genero)) +
  geom_col() +
  theme(axis.text.x = element_text(angle = 90), 
        legend.position = "none") + 
  labs(x="",y="") +
  scale_fill_manual(values = colores) +
  facet_wrap(~genero, ncol = 2) +
  estiloh +
  labs(title = "Proporción de nivel educativo máximo por género",
       x = "", y = "Proporción", 
       caption = fuente)

Ahora veamos como se distribuyen los puestos según el género y el nivel educativo.

ne_salario %>% 
  select(pais, nivel_formacion, genero, puesto) %>%
  filter(genero %in% c("Mujer cis", "Hombre cis"),
         puesto != "Pasante", puesto != "Director") %>%
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo", 
                                             "Maestría en curso","Maestría completa")),
         puesto = factor(puesto, 
                         levels = c("Director", "Gerente", "Jefe", "Responsable", "HRBP",
                                    "Analista", "Administrativo"))) %>% 
  group_by(nivel_formacion) %>% 
  ggplot(aes (y= nivel_formacion, fill = genero)) + 
  geom_bar(position = "fill") +
  labs(x="",y="") +
  scale_fill_manual(values = c(verde, lila)) +
  estilo +
  theme(legend.position = "top",
        plot.title.position = "plot") +
  labs(title = "Nivel educativo por puesto y género",
       subtitle = "Distribución por frecuencias absolutas",
       caption = fuente, 
       fill = "Género") +
  facet_wrap(~puesto, ncol = 3)

Algunas datos llamativos del gráfico anterior:

  • En las posiciones de Gerente y de Jefe hay paridad entre los géneros respecto de la formación en posgrados completos.
  • En posiciones de menor jerarquía se observan mujeres cis con posgrados completos o en curso en mayor proporción que hombres cis.
  • En el caso del puesto de Analista encontramos mujeres con posgrados completos, incluso con maestrías y diplomados completos. Hay pocas observaciones de varones cis con Diplomado completo en esta posición. Lo cual nos da la pauta que contar con un título de posgrado en el caso de los hombres ayuda a posicionarse en posiciones de mayor jerarquía en mayor proporción que las mujeres.

Analicemos las proporciones de hombres y de mujeres en puesto de liderazgo.

div <- rh_ar %>%
  filter(pais == "Argentina") %>% 
select(genero) %>% 
  mutate(genero = factor(genero, 
                         levels = c("Mujer cis", "Hombre cis"))) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

lideres <- rh_ar %>% 
  filter(pais == "Argentina") %>% 
 select(genero, puesto) 

# Propoción de líderes hombres y mujeres
lideres_genero <- lideres %>% 
  filter(genero %in% c("Mujer cis", "Hombre cis")) %>% 
  group_by(genero) %>%
  mutate(gente_a_cargo = if_else(puesto %in% c("Responsable", "Jefe", "Gerente", 
                                               "Supervisor", "Director"),1,0)) %>%
  summarise(lider = sum(gente_a_cargo)) %>% 
  left_join(div) %>% 
  select(genero, lider, n) %>% 
  mutate(proporcion = percent(lider/n))

# Test de hipótesis para validar diferencias de resultados
# Hay que verificar si la proporción de líderes hombres es mayor que la proporción de líderes mujeres
# Creo un dataframe para analizar proporciones de hombres y de mujeres en puestos de liderazgo y de no-liderazgo
test_lider <- lideres_genero %>% 
  mutate(no_lider = n - lider) %>%        # Columna de no líderes
  select(genero, lider, no_lider) %>%     # selecciono columnas de interés
  pivot_longer(cols = c(lider, no_lider), # Hago un dataset largo para analizar después
               names_to = "es_lider", values_to = "conteo")

# Del total de respuestas me interesa sólo ver cuáles son los hombres con puesto de liderazgo
test_lider$cat <- c(0,0,1,0)

# Extraigo el mu para decidir si la diferencia es significativa y pasarlo a la fórmula del test.
prop_mujer_lid <- pull(lideres_genero[1,2]/lideres_genero[1,3])

# Realizo el test de hipótesis.
# H0 = Las proporciones de líderes hombres y mujeres son iguales
# H1 = La proporción de hombres líderes es mayor que la proporción de mujeres líderes.
resultados_test <- broom::tidy(t.test(test_lider$cat, mu = prop_mujer_lid, alternative = "greater"))

valor_test <- if(resultados_test[1,3] > 0.05) {
  print("la diferencia es estadísticamente significativa, y la proporción de hombres en puestos de liderazgo es mayor que el de las mujeres")
  } else {
    print("la diferencia no es estadísticamente significativa, y la proporción de hombres no es estadísticamente mayor que el de las mujeres en puestos de liderazgo")
  }
# Gráfico
lideres_genero %>% 
  mutate(porc_lider = lider/n, 
         porc_no_lider = 1 - porc_lider) %>% 
  pivot_longer(cols = c(porc_lider, porc_no_lider),
               names_to = "es_lider", 
               values_to = "valores") %>% 
  mutate(es_lider = factor(es_lider, 
                           levels = c("porc_no_lider", "porc_lider"), 
                           labels = c("No Líder", "Líder"))) %>% 
  ggplot(aes(x= genero, y = valores, fill = es_lider))+
  geom_col(position = "fill")+
  estilo +
  scale_fill_manual(values = c("#75838F", "#344D7E")) +
  labs(title = "Proporción de Líderes según género",
       x = "", y = "", fill = "", 
       caption = fuente)

De acuerdo a las respuestas recolectadas 2 de cada 3 participantes son mujeres.

Para los puestos de liderazgo consideramos las personas en los puestos de Director, Gerente, Jefe, y Responsable.

Del total de mujeres, 109 respuestas, 52 ocupan un puesto de liderazgo (48%).

Del total de hombres, 274 respuestas, 88 ocupan un puesto de liderazgo (32%).

Con un p-value igual a 0.785 podemos afirmar que la diferencia es estadísticamente significativa, y la proporción de hombres en puestos de liderazgo es mayor que el de las mujeres.

A pesar de que en Recursos Humanos en Argentina, las mujeres cis representan la mayor cantidad de empleados bajo relación de dependencia, y además se forman en mayor proporción que los varones en posgrados, proporcionalmente en comparación con los hombres cis, acceden a menos posiciones de liderazgo.

Análisis de sueldos y educación en Argentina

En esta sección analizaremos los sueldos en comparación con los distintos niveles educativos.

A diferencia de otras secciones, en este caso compararemos la media salarial para poder observar los desvíos estándar en los análisis. En primer lugar analicemos cuál es el sueldo promedio de acuerdo a los distintos niveles educativos.

Primero veamos cuál es el sueldo promedio en pesos argentinos, según el nivel educativo.

estudios <- rh_ar %>% 
  filter(pais == "Argentina") %>% 
  select(genero, nivel_formacion, sueldo_bruto)
    
  
est_ar  <- profiling_num(estudios)
es_p05 <- est_ar[1,6]
es_p95 <- est_ar[1,10]

rm(est_ar)

rh_ar %>% 
  filter(pais == "Argentina", 
         between(sueldo_bruto, es_p05, es_p95)) %>% 
      mutate(nivel_formacion = fct_collapse(nivel_formacion,
                                        "Secundario completo" = c("Secundario completo", "Terciario en curso",
                                                                  "Terciario abandonado", "Universitario abandonado"),
                                        "Universitario completo" = c("Universitario completo", "Maestría abandonada", 
                                                                     "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso")) %>% 
    mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso", "Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, y = nivel_formacion))+
  geom_col(fill = azul)+
geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1., fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  estilov +
  eje_x_n +
  labs(title = "Sueldo promedio por nivel de formación",
       subtitle = "En AR$",
       x="", y="", caption = fuente)

Ahora veamos qué pasa si incluimos en el análisis el género para analizar los sueldos promedios y sus desvíos estándar.

rh_ar %>% 
  filter(pais == "Argentina", 
         between(sueldo_bruto, es_p05, es_p95)) %>% 
      mutate(nivel_formacion = fct_collapse(nivel_formacion,
                                        "Secundario completo" = c("Secundario completo", "Terciario en curso",
                                                                  "Terciario abandonado", "Universitario abandonado"),
                                        "Universitario completo" = c("Universitario completo", "Maestría abandonada", 
                                                                     "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso")) %>% 
    mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso", "Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion, genero) %>% 
  summarise(salarios = list(mean_se(sueldo_bruto))) %>% 
  unnest(salarios) %>% 
  ggplot(aes(x = nivel_formacion, y = y, fill = genero)) +
  geom_col(position = "dodge")+
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge")+
  coord_flip()+
  theme(legend.position = "top",
        plot.title.position = "plot") +
  eje_y_n +
  estilov +
  scale_fill_manual(values = c(verde, lila)) +
  labs(title = "Sueldo promedio y desvío estándard por nivel de formación y género",
       subtitle = "En AR$", 
       x = "", y = "", 
       caption = fuente, 
       fill = "Género")

Freelancers

En este relevamiento participan colegas que trabajan en relación de dependencia y también de manera freelance. Este es el análisis desarrollado en base a las respuestas de las personas que trabajan de manera independiente o en sus propias empresas.

Respuestas por país

En el caso de las personas freelance, la mayoría de las respuestas obtenidas fueron de Argentina. Por eso reiteramos, que los resultados no son representativos de los países.

Cantidad de respuestas por país
Freelance
País Cuenta
Argentina 40
Perú 3
Bolivia 2
Chile 1
Colombia 1
Estados Unidos 1
México 1
Uruguay 1
Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2021

Respuestas por Género

La participación según el género de las personas freelance, es la siguiente:

Podemos observar que la mayoría de las respuestas fueron de Mujeres cis, manteniendo la misma tendencia que las personas en relación de dependencia.

Género Cuenta
Mujer cis 34
Hombre cis 14

Respuestas por Educación

En esta sección queremos indagar si hay relación entre la formación y la exportacion de los servicios, y si impacta también el tipo de universidad, pública o privada, en dichas prestaciónes. Primero veamos como se distribuye la muestra entre profesionales provenientes de universidades públicas y privadas de los diferentes paises:

Limitandonos al país con mayor cantidad de respuestas, Argentina, en los siguientes graficos podemos observar que la distribución por tipo de Universidad es muy pareja , quedando un valor minimo y poco representativo para quienen no fueron a la Universidad:

Nos interesaba indagar cuál era el nivel de formación de los encuestados.

En la siguiente tabla podemos ver que la mayoría tiene estudios Universitarios completos:

Nivel de Formación Cuenta
Universitario completo 16
Diplomado de posgrado completo 9
Maestría completa 8
Universitario en curso 8
Diplomado de posgrado en curso 4
Terciario completo 4
Terciario abandonado 1

Cuando analizamos educación, nos resultó interesante analizar la distribución por género y nivel educativo.

En el siguiente gráfico podemos observar que las mujeres tienen mayor nivel de formación que los hombres:

Veamos los mismos resultados, en terminos relativos:

Respecto a las carreras, vemos que la tendencia de las mismas se corresponden con los resultados obtenidos en las personas en relación de dependencia:

Respuestas por Condición fiscal

La condidición fiscal de los encuestados la podemos observar en la siguiente tabla:

Registro Fiscal Cuenta
Monotributista 36
Contractor 7
Otros 3
Responsable inscripto 3
SA 1

Respuestas por Exportación de Servicio

como vemos a continuación, la mayoría no exporta sus servicios:

Focalizandonos entre quienes exportan, podemos ver cuál es el servicio prestado:

En relación a los medios de pago utilizados por quienes exportan, sus respuestas fueron las siguientes:

Medios de Pago Exterior Cuenta
Payoneer 12
Transferencia 12
PayPal 7
Bitcoin 1
Prex 1
Western Union 1

Respuestas por Antigüedad

Respecto a los años de experiencia como freelance, podemos observar que la mayoría tiene menos de dos años.

Un interrogante que nos surge en si la inserción en esta modalidad fue una decisión de carrera voluntaria o impulsada por las consecuencias de la pandemia. Carecemos de elementos para responder esa pregunta, por eso nos limitamos a presentar las respuestas obtenidas:

Años de Experiencia Cuenta
Menos de 2 años 26
Entre 2 y 5 años 18
Entre 5 y 10 años 4
Más de 10 años 2

Respuestas por Búsquedas

Nos interesa saber cuantos se dedican a realizar trabajos de selección de talentos.

Podemos observar que un 66% de las personas encuestadas en esta categoria se dedican a la tarea de búsqueda.

Serv. Búsqueda n freq
Si 33 0.66
No 17 0.34

Sabiendo el crecimiento y auge de las búsquedas en el sector de IT, veamos cuál es la participación de las mismas entre las personas que hacen recruiting.

Como se observa en el siguiente gráfico, la mayoría de las búsquedas se concentran que en el sector IT.

Respuesta por garantía de trabajo

Las garantías de reposición de vacantes se refieren a la protección que se brinda a cada cliente en el caso de que la persona contratada se marche de la empresa.

Veamos entre los que prestan el servicio de recruiting, quienes ofrecen garantía de permanencia del candidato.

En la siguiente tabla podemos observar que los plazos de garantía suelen ir desde un mes hasta los tres meses. Pero un número importante, no ofrece garantia por el servicio contratado.

Respuestas por Base de Coeficiente

Otro punto para destacar es el precio del servicio de quienes hacen recruiting.

Podemos ver que la gran mayoría cobra por dicho servicio, un porcentaje de remuneración mensual del ingresante, dejando para muy pocos casos el ingreso anual del mismo.

Una pregunta abierta que nos queda, es cuáles son las posiciones mejores pagas para los recruiters. Sin embargo, dicho análisis escapa de los objetivos de la presente encuesta.

Remuneración del Ingresante Cuenta
Mensual 30
Anual 3

La mayoría cobra un porcentaje que va del 20% al 30% de las remuneraciones mensuales de los ingresantes, como podemos ver en el siguiente cuadro:

Porcentaje Cuenta
20% 5
30% 4
40% 2
50% 2
70% 1
80% 1
100% 2
---
title: "2° Encuesta KIWI de Sueldos de RRHH para Latam 2021"
author: "R4HR Club de R para RRHH"
date: "29/11/2021"
output: 
  html_document:
    theme: cosmo
    highlight: haddock
    toc: true
    toc_float: true
    code_folding: hide
    code_download: true
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE, message = FALSE, warning = FALSE, fig.retina = 3, out.width = "80%", fig.align = "center")
```

# Introducción

[R4HR Club de R para RRHH](https://r4hr.club) es una comunidad de aprendizaje de programación de R para profesionales y estudiantes que trabajen o quieran trabajar en RRHH.

Somos una comunidad que usa mayormente datos de ejemplo relacionados con RRHH, y que genera contenido en castellano para eliminar las barreras en el aprendizaje y facilitar que más personas adopten las herramientas de análisis de datos en sus trabajos.

Para saber más de nosotros te invitamos a leer [este post](https://r4hr.club/2020/09/23/el-club-de-r-para-rrhh/).

También podés ver todo el contenido que generamos en los siguientes links:

`r icons::fontawesome("google-drive")` [Google Drive](https://drive.google.com/drive/folders/1Qck3z_t6XLRXb2vbN-00931DgdJZ0yse?usp=sharing)

`r icons::fontawesome("youtube")` [YouTube](https://youtube.com/playlist?list=PLZuVytUJrxQlcqu6l-P3ou4vV2mRJU2Ka)

`r icons::fontawesome("github")` [Github](https://github.com/r4hr/)

`r icons::fontawesome("link")` También te invitamos a seguirnos en todas [nuestras redes sociales](https://linktr.ee/r4hrclub).

Pueden acceder a los datos crudos desde [este link](https://docs.google.com/spreadsheets/d/1LDdXlIwrcsyuywbcS4gdc-1p6wBXfEfL2Y6sNBj-4GM/edit?usp=sharing).

```{r preproceso}
# Carga de librerías 
# Instalar pacman install.packages("pacman")

pacman::p_load(tidyverse, funModeling, gt, googlesheets4,gt, CGPfunctions,
               extrafont, scales, ggalt, kableExtra, wordcloud, networkD3,
               data.table, ggeconodist, ggpmisc)



# Carga de Datos ----
# Datos --------

## 2021 ----

# Encuesta
kiwi21 <- read.csv("https://raw.githubusercontent.com/r4hr/kiwi2021/main/data/rh_2021.csv",
                   sep = ";",
                   encoding = "UTF-8") 

kiwi20 <- read.csv("https://raw.githubusercontent.com/r4hr/kiwi2021/main/data/rh_2020.csv", 
                   sep = ";",
                   encoding = "UTF-8")

freelo21 <- read.csv("https://raw.githubusercontent.com/r4hr/kiwi2021/main/data/freelancers_2021.csv",
                     sep = ";",
                     encoding = "UTF-8")

kiwi21_original <- read_sheet("1nhpqDWuJoWhiVj0rIaV51-SdfnSxTpbV3Vcd3iYmyTw")

# Configuraciones generales ----

options(scipen = 999)   # Modifica la visualización de los ejes numérico a valores nominales

loadfonts(quiet = TRUE) # Permite cargar en R otros tipos de fuentes.

# Estilo limpio sin líneas de fondo
estilo <- theme(panel.grid = element_blank(),
                plot.background = element_rect(fill = "#FBFCFC"),
                panel.background = element_blank(),
                text = element_text(family = "Roboto"))

# Estilo limpio con líneas de referencia verticales en gris claro
estilov <- theme(panel.grid = element_blank(),
                 plot.background = element_rect(fill = "#FBFCFC"),
                 panel.background = element_blank(),
                 panel.grid.major.x = element_line(color = "#AEB6BF"),
                 text = element_text(family = "Roboto"))

# Estilo limpio con líneas de referencia horizontales en gris claro
estiloh <- theme(panel.grid = element_blank(),
                 plot.background = element_rect(fill = "#FBFCFC"),
                 panel.background = element_blank(),
                 panel.grid.major.y = element_line(color = "#AEB6BF"),
                 text = element_text(family = "Roboto"))

genero <- c("#1FC3AA", "#8624F5", "#FFD129", "#75838F") # Verde - Violeta - Amarillo - Gris
genero3 <- c("#8624F5","#FFD129", "#1FC3AA")

colores <-  c("#8624F5", "#1FC3AA")

azul <- "#344D7E"
verde <-  "#1FC3AA"
rosa1 <- "#B95192"
rosa2 <- "#EE5777"
naranja <- "#FF764C"
amarillo <- "#FFA600"
gris <- "#75838F"
lila <- "#8624F5"
rojo <- "#943126"

col4 <- c(azul, lila, rosa1, rosa2)
col5 <- c(azul, lila, rosa1, rosa2, naranja)
col6 <- c(azul, lila, rosa1, rosa2, naranja, amarillo)

# Creo un objeto con un texto que se va a repetir mucho a lo largo del análisis
fuente <- "Fuente: Encuesta KIWI de Sueldos de RRHH para Latam 2021"

# Creo objetos para formatear las etiquetas numéricas de los ejes x e y
eje_x_n <- scale_x_continuous(labels = comma_format(big.mark = ".", decimal.mark = ","))

eje_y_n <- scale_y_continuous(labels = comma_format(big.mark = ".", decimal.mark = ","))


# Cantidad de respuestas 

rtas21 <- nrow(kiwi21_original)

rtas21_perc <- percent(1- (rtas21 / 762))

rtas_pais <- kiwi21_original %>% 
  select(pais = `País en el que trabajas`) %>% 
  distinct(pais) %>% 
  count() %>% 
  pull()


# Reorganizar puestos jerárquicamente
kiwi21 <- kiwi21 %>% 
  mutate(puesto = factor(puesto, 
                         levels = c("Director", "Gerente", "Jefe", 
                                    "Responsable", "HRBP", "Analista",
                                    "Administrativo", "Pasante")))
```

# Motivaciones

Como en RRHH trabajamos con datos sensibles, es complejo conseguir datos para practicar cuando estás aprendiendo sobre People Analytics, especialmente la parte práctica. Por eso, e inspirados en la Encuesta de [SysArmy](https://sysarmy.com/blog/posts/resultados-de-la-encuesta-de-sueldos-2020-2/), una comunidad de tecnología, que entre otras cosas, organiza eventos como **Nerdearla**.

Por esta razón hicimos nuestra propia encuesta, relevando datos de profesionales que trabajan tanto bajo relación de dependencia como de manera freelance. El relevamiento de datos lo hicimos entre el 22 de octubre y el 22 de noviembre de 2021.

En esta edición recibimos en total `r rtas21` respuestas (un `r rtas21_perc` menos que en 2020), de `r rtas_pais` países diferentes.

```{r rtas_pais_tabla}
kiwi21 %>% 
  group_by(pais) %>% 
  tally(sort = T) %>% 
  rename("País" = pais,
         "Respuestas" = n) %>% 
  kbl(caption = "Respuestas por País", ) %>% 
  kable_styling(full_width = F, position = "center",
                bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  footnote(general = fuente)
```

Del total de respuestas recibidas, `r nrow(kiwi21_original) - nrow(freelo21)` son de personas que trabajan en relación de dependencia en RRHH, mientras que `r nrow(freelo21)` personas trabajan de manera freelance.

```{r}
kiwi21_original %>% 
  select(Trabajo) %>% 
  group_by(Trabajo) %>% 
  count() %>% 
  ggplot(aes(x = n, y = Trabajo)) +
  geom_col(fill = azul) +
  estilov +
  geom_text(aes(label = n), # Indica la cantidad de decimales
            size = 3,       # Cambia el tamaño de la letra
            hjust = 1.2,    # Mueve la etiqueta para la izquierda
            color = "white",
            family = "Roboto") +
  labs(title = "Respuestas por tipo de trabajador", 
       x = "", y = "", 
       caption = fuente)
```

En esta edición decidimos realizar los análisis de género en términos de **Identidad de Género** para intentar abarcar con nuestro análisis la diversidad en términos de identidad de género. Es por esta razón que, a diferencia de la primera edición donde los análisis los hicimos en términos de *Mujer/Hombre* este año lo hicimos en términos de *Mujer cis/Mujer trans* y *Hombre cis/Hombre trans* para poder reflejar con mayor precisión el abánico de identidades y percepciones.

> El térmiino *"cis"* hace referencia a que la persona se identifica con el mismo género con el que nació.

Le agradecemos mucho a [Ivana Feldeberg](https://www.linkedin.com/in/ivana-feldfeber/) del [Observatorio de Datos con Perspectiva de Género](https://www.datagenero.org/) por el asesoramiento en este apartado.

Dicho esto, las respuestas según la identidad de género de las personas que participaron es la siguiente:

```{r fig.show='hold', out.width="50%", fig.align='default'}

# Gráfico para relación de dependencia----
div <- kiwi21 %>% 
  select(genero) %>% 
  mutate(genero = factor(genero, 
                         levels = c("Mujer cis", "Hombre cis", 
                                    "Prefiero no responder", "Gay"))) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$genero, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=genero)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c("#8624F5",  "#1FC3AA", "#FFD129","#75838F")) +
  theme_void() +
  theme(legend.position = "top",
        panel.background = element_blank(),
        plot.title.position = "plot",
        text = element_text(family = "Roboto")) +
  labs(title = "Cantidad de respuestas según género",
       subtitle = "Relación de Dependencia",
       fill = "Género", 
       caption = fuente)

# Gráfico de freelancers ----
freelo21 <- freelo21 %>% 
  mutate(genero = fct_collapse(genero, "Mujer cis" = c("Mujer cis", "Mujer"),
                               "Hombre cis" = c("Hombre cis")),
         genero = factor(genero, levels = c("Mujer cis", "Hombre cis",
                                             "Prefiero no responder", "No binario")))

div <- freelo21 %>% 
  select(genero) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$genero, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=genero)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c("#8624F5",  "#1FC3AA", "#FFD129","#75838F")) +
  theme_void() +
  theme(legend.position = "top",
        panel.background = element_blank(),
        plot.title.position = "plot",
        text = element_text(family = "Roboto")) +
  labs(title = "Cantidad de respuestas según género",
       subtitle = "Freelancers",
       fill = "Género", 
       caption = fuente)

```

En resumen, más de dos tercios de las personas que participaron de esta encuesta son mujeres cis. Algo que reflejan los datos es que en las áreas de Recursos Humanos, la diversidad de identidades de género es prácticamente nula.

```{r genero_participantes}
kiwi21_original %>% 
    mutate(genero = fct_collapse(`Identidad de Género`, "Mujer cis" = c("Mujer cis", "Mujer", "mujer",
                                                       "Mujer heterosexual"),
                               "Hombre cis" = c("Hombre cis", "Hombre", 
                                                "Hombre hetero. Que es cis?",
                                                "Hombre heterosexual")),
         genero = factor(genero, levels = c("Mujer cis", "Hombre cis",
                                            "Gay", "Prefiero no responder", "No binario"))) %>% 
  group_by(genero) %>% 
  tally(sort = T) %>% 
  mutate(Porcentaje = n/sum(n),
         Porcentaje = percent(Porcentaje, accuracy = 0.1)) %>% 
  rename("Género" = genero, 
         "Cantidad" = n) %>% 
  kbl(caption = "Total de Participantes según\nIdentidad de Género") %>% 
  kable_styling(full_width = F, position = "center",
                bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  footnote(general = fuente, general_title = "")
  


```


# Análisis de remuneraciones
## Remuneraciones por país

En esta sección nos dedicaremos a comparar los sueldos entre los países. En primer lugar, hay que resaltar que los resultados no son representativos de los mercados de los países, sino que lo son de los datos recolectados.

Por otra parte, la baja cantidad de respuestas recolectadas de otros países fuera de la Argentina, nos hace imposible, hacer un análisis comparado representativo de los puestos. Sin embargo, hay algunos datos intresantes para analizar.

Primero, analicemos los sueldos de los trabajadores en relación de dependencia, de cuyos países hayamos recibido al menos 5 respuestas.

```{r sueldo_pais1}
sueldos_dolar <- kiwi21 %>% 
  select(puesto, sueldo_dolar, pais, tipo_contratacion) %>% 
  filter(puesto != "Pasante", tipo_contratacion != "Pasante")

# Eliminamos los sueldos que están dentro del rango entre los percentiles 5 y 95
numericos <- profiling_num(sueldos_dolar)
poda_p05 <- numericos[1,6]
poda_p95 <- numericos[1,10]

# Dado que los percentiles 5 y 95 están en U$422 y 3300 respectivamente, 
# podamos todo lo que esté fuera de ese rango

media_pais <- sueldos_dolar %>% 
  filter(pais %in% c("Argentina", "Perú", "Bolivia", "Costa Rica", "Uruguay", 
                     "Chile", "México", "Paraguay", "Ecuador"),
         between(sueldo_dolar,poda_p05,poda_p95)) %>% 
  group_by(pais) %>% 
  summarise(sueldop = list(mean_se(sueldo_dolar))) %>% 
  unnest(cols = c(sueldop)) 
 
sueldo_dolar_pais <- kiwi21 %>% 
  select(pais, sueldo_dolar) %>% 
  filter(between(sueldo_dolar, poda_p05, poda_p95),
         pais %in% c("Argentina", "Perú", "Bolivia", "Costa Rica", "Uruguay", 
                     "Chile", "México", "Paraguay", "Ecuador"))

# Gráfico
ggplot(media_pais, aes(reorder(pais, -y), y =  y))+
  geom_col(fill = azul, alpha = 0.85) +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47")+
  geom_point(data = sueldo_dolar_pais, aes(x = pais, y = sueldo_dolar), 
             alpha = 0.3, size = 2, color = "#75838F",
             position = position_jitter(width = 0.15))+
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".", 
                              decimal.mark = ","),
                vjust = 1.5, fontface = "bold"), 
            size = 4, color = "white",
            family = "Roboto")+
  eje_y_n +
  labs(title = "Salario promedio por país",
       subtitle = "Sueldos de RRHH en U$S",
       caption = paste0(fuente,"\nPaíses con más de 5 respuestas"),
       x = "", y = "") + 
  estiloh
```

A pesar de la baja cantidad de respuestas, se repite la tendencia del 2020 en donde **Uruguay** y **Chile** tienen en promedio los sueldos más altos de la región.

## Análisis de sueldos por puestos en Latinoamérica

```{r sueldo_puesto}
kiwi21 %>% 
  select(puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante",
         between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(puesto) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto))) +
  geom_col(fill = azul) +
  estilov +
  labs(title = "Mediana salarial por puesto", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", 
       caption = fuente) +
  eje_x_n
```

La razón por la cual la mediana salarial de las personas en puesto de **Dirección** es menor a la de las personas en puestos de **Gerente** se explica por el tamaño de la muestra y las respuestas recibidas. En la tabla a continuación incorpora la cantidad de respuestas recibidas para cada uno de estas posiciones.

```{r sueldo_puesto_tabla}
gt(kiwi21 %>% 
     select(puesto, sueldo_dolar) %>% 
     filter(puesto != "Pasante") %>% 
     group_by(puesto) %>% 
     summarise(mediana_salarial = median(sueldo_dolar), 
               cant = n())
     ) %>% 
  tab_header(title = "Mediana salarial por puestos", 
             subtitle = "Sueldos en U$D") %>% 
  tab_source_note(source_note = fuente) %>% 
   fmt_currency(columns =  "mediana_salarial", decimals = 0,
               sep_mark = ".", dec_mark = ",") %>% 
  cols_label(puesto = "Posición",
             mediana_salarial = "Mediana Sueldo",
             cant = "Respuestas") 
```

## Sueldos según el origen del capital

Si dividimos los gráficos según el *Origen del Capital*, podemos apreciar que en líneas generales, la mediana salarial en empresas multinaciones es mayor que en las empresas nacionales. Solamente en las posiciones de **HRBP** y de **Gerente** se aprecia una paridad salarial respecto del origen del capital de la organización.

```{r origen_capital}
kiwi21 %>% 
  select(origen_capital, puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante", 
         between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(puesto, origen_capital) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto), fill = origen_capital)) +
  geom_col() +
  geom_text(aes(label = round(x=mediana_salarial, 0), hjust = 1.2, fontface = "bold"),size = 3, color = "white") +
  scale_fill_manual(values = c(verde, azul)) +
  estilov +
  eje_x_n +
  facet_wrap(~origen_capital) +
  labs(title = "Mediana salarial por puesto según origen del capital", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", fill = "", 
       caption = fuente) +
  theme(legend.position = "top")
```

Veamos este gráfico de otra manera:

```{r origen_capital_slope}

slope_df <- kiwi21 %>% 
  select(puesto, sueldo_dolar, origen_capital) %>% 
  filter(between(sueldo_dolar, poda_p05, poda_p95)) %>% 
  group_by(puesto, origen_capital) %>% 
  summarise(mediana_salarial = round(median(sueldo_dolar)))

newggslopegraph(dataframe = slope_df,
                Times = origen_capital,
                Measurement = mediana_salarial,
                Grouping = puesto,
                Title = "Diferencias entre sueldos de RRHH en empresas nacionales y multinacionales",
                SubTitle = "Mediana Salarial. Sueldos en U$S",
                Caption = fuente, WiderLabels = T
                
                )
```

## Análisis por rubro y origen del capital

Para el análisis de los rubros de la empresa, vamos a filtrar los 5 rubros que tienen más respuestas. También eliminaremos del análisis el puesto de Director porque no se encuentra presente en todos los rubros.

```{r rubros, fig.height=15}
top_5_rubros <- kiwi21 %>% 
  select(rubro) %>% 
  group_by(rubro) %>% 
  count(sort = TRUE) %>%
  filter(rubro != "Otros", n > 30) %>% 
  pull(var = rubro)


kiwi21 %>% 
  select(rubro, origen_capital, puesto, sueldo_dolar) %>% 
  filter(puesto != "Pasante", puesto != "Director",
         between(sueldo_dolar, poda_p05, poda_p95),
         rubro %in% top_5_rubros) %>% 
  group_by(rubro, puesto, origen_capital) %>% 
  summarise(mediana_salarial = median(sueldo_dolar)) %>% 
  ggplot(aes(x = mediana_salarial, y = fct_rev(puesto), 
             fill = origen_capital)) +
  geom_col() +
  geom_text(aes(label = round(x=mediana_salarial, 0), 
                hjust = 1.2, 
                fontface = "bold"),
            size = 3, 
            color = "white") +
  scale_fill_manual(values = c(verde, azul)) +
  estilo +
  eje_x_n +
  facet_grid(rubro~origen_capital) +
  labs(title = "Mediana salarial por puesto según origen del capital", 
       subtitle = "Sueldos de RRHH en U$S", 
       x = "", y = "", fill = "", 
       caption = fuente) +
  theme(legend.position = "top")
```

Para ver las medianas salariales por rubros junto con el desvío estándar, pueden ver la siguiente tabla:

```{r rubros2}
  kiwi21 %>% 
    select(rubro, sueldo_dolar) %>% 
    filter(between(sueldo_dolar, poda_p05, poda_p95)) %>% 
    group_by(rubro) %>% 
    summarise(mediana_salarial = round(median(sueldo_dolar)),
              desvio_salarial = round(sd(sueldo_dolar)),
              Respuestas = n()) %>% 
    arrange(-mediana_salarial) %>% 
  kbl(caption = "Mediana salarial por rubro. En U$S", 
      col.names = c("Rubro", "Mediana Salarial","Desvío", "Respuestas")) %>% 
  kable_styling(full_width = F, position = "center",
              bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% 
  scroll_box(height = "500px")
  

```

# Sueldos por países

Si bien la mayor cantidad de respuestas la recibimos de personas trabajando en Argentina, en esta edición decidimos incluir a todos los países de los que obtuvimos al menos 10 respuestas (Argentina, Perú, Bolivia, Costa Rica, Uruguay y Chile). Si bien la cantidad de respuestas no  nos permiten realizar análisis muy profundos queremos agradecer a las personas que respondieron realizando aunque más no sea un breve análisis.

Como primeros pasos, vamos a filtrar los datos correspondientes a cada país, y luego filtramos los sueldos que estén entre los percentiles 5 y 95, para eliminar valores espurios o extremos que ensucien el análisis.

También eliminamos el puesto de Director del análisis y las respuestas con Género diverso por la baja cantidad de respuestas.

Otra conversión que hicimos fue pasar los sueldos de las personas que trabajan part-time a una equivalencia full-time multiplicando por 1.5 el sueldo completado en la encuesta.

En esta instancia, también simplificamos los nombres de algunos rubros para mejorar las visualizaciones de los resultados.

## Perú

```{r peru1}
kiwi21 <- kiwi21 %>% 
  filter(between(sueldo_dolar, poda_p05, poda_p95),
         puesto != "Director", puesto != "Pasante",
         genero %in% c("Mujer cis", "Hombre cis"),
         anios_experiencia < 50) %>% 
  mutate(rubro = fct_recode(rubro, "Servicios financieros" = "Servicios financieros; seguros",
                             "Transporte" = "Transporte (incluyendo aviación civil; ferrocarriles por carretera)",
                            "Ind. Automotriz y Autopartistas" = "Terminales automotrices, fábricas autopartistas, y afines",
                            "Tecnología" = "Tecnologías de Información, Sistemas, y afines",
                            "Ind. Petrolera" = "Petróleo y producción de gas; refinación de petróleo"),
         multiplicador = if_else(tipo_contratacion == "Part time", 1.5, 1),
         sueldo_ft = sueldo_bruto * multiplicador)

# Análisis Perú
rh_pe <- kiwi21 %>% 
  filter(pais == "Perú")



```

### Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

* **Primer cuartil**: La parte inferior de la caja.
* **Mediana**: La línea gruesa dentro de cada rectángulo.
* **Tercer cuartil**: La parte superior de la caja
* **Outliers**: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

```{r peru2}
ggplot(rh_pe, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Perú - En S/",
       x = "", y = "Soles S/",
       fill = "Género",
       caption = fuente)

```

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

```{r peru3}

rh_pe %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Perú en S/",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Soles S/") + 
  estiloh
```

### Análisis por funciones

```{r peru_rol}
rh_pe %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Perú en S/",
       x = "Soles S/",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


### Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Perú

```{r peru_rubro}
rh_pe %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Perú en S/",
       x = "Soles S/",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```

## Bolivia

```{r bol1}

# Análisis Bolivia
rh_bo <- kiwi21 %>% 
  filter(pais == "Bolivia")

```

### Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

* **Primer cuartil**: La parte inferior de la caja.
* **Mediana**: La línea gruesa dentro de cada rectángulo.
* **Tercer cuartil**: La parte superior de la caja
* **Outliers**: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

```{r bol2}
ggplot(rh_bo, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Bolivia - En Bs.",
       x = "", y = "Boliviano Bs",
       fill = "Género",
       caption = fuente)

```

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

```{r bol3}

rh_bo %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Bolivia Bs.",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Bolivianos Bs") + 
  estiloh
```

### Análisis por funciones

```{r bol_rol}
rh_bo %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Bolivia en Bs.",
       x = "Bolivia Bs.",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


### Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Bolivia.

```{r bol_rubro}
rh_bo %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Bolivia en Bs.",
       x = "Bolivianos Bs",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


## Costa Rica

```{r cr1}
# Análisis Costa Rica
rh_cr <- kiwi21 %>% 
  filter(pais == "Costa Rica")

```

### Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

* **Primer cuartil**: La parte inferior de la caja.
* **Mediana**: La línea gruesa dentro de cada rectángulo.
* **Tercer cuartil**: La parte superior de la caja
* **Outliers**: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

```{r cr2}
ggplot(rh_cr, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Costa Rica - en CRC",
       x = "", y = "Colones ¢",
       fill = "Género",
       caption = fuente)

```

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

```{r cr3}
rh_cr %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Costa Rica en CRC",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Colones ¢") + 
  estiloh
```

### Análisis por funciones

```{r cr_rol}
rh_cr %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Costa Rica en CRC",
       x = "Colones ¢",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


### Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Costa Rica.

```{r cr_rubro}
rh_cr %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Costa Rica en CRC",
       x = "Colones ¢",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


## Uruguay

```{r uy1}
# Análisis Uruguay
rh_uy <- kiwi21 %>% 
  filter(pais == "Uruguay")



```

### Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

* **Primer cuartil**: La parte inferior de la caja.
* **Mediana**: La línea gruesa dentro de cada rectángulo.
* **Tercer cuartil**: La parte superior de la caja
* **Outliers**: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

```{r uy2}
ggplot(rh_uy, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Uruguay - en UYU",
       x = "", y = "Pesos $",
       fill = "Género",
       caption = fuente)

```

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

```{r uy3}
rh_uy %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Uruguay en UYU",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Pesos $") + 
  estiloh
```

### Análisis por funciones

```{r uy_rol}
rh_uy %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Uruguay en UYU",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


### Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Uruguay.

```{r uy_rubro}
rh_uy %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Uruguay en UYU",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


## Chile

```{r cl1}
# Análisis Chile
rh_cl <- kiwi21 %>% 
  filter(pais == "Chile")



```

### Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

* **Primer cuartil**: La parte inferior de la caja.
* **Mediana**: La línea gruesa dentro de cada rectángulo.
* **Tercer cuartil**: La parte superior de la caja
* **Outliers**: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

```{r cl2}
ggplot(rh_cl, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.6) +
  geom_point(position = position_jitter(width = 0.08), size = 2) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Chile - en CLP",
       x = "", y = "Pesos $",
       fill = "Género",
       caption = fuente)

```

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. En algunas posiciones y género sólo tenemos una sola respuesta, por eso las barras de error no aparecen.

```{r cl3}
rh_cl %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 4, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Chile en CLP",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Pesos $") + 
  estiloh
```

### Análisis por funciones

```{r cl_rol}
rh_cl %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Chile en CLP",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


### Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Chile.

```{r cl_rubro}
rh_cl %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 2, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Chile en CLP",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```



## Argentina

En el caso de Argentina, como contamos con un caudal de respuestas mucho más amplio, vamos a realizar un análisis más detallado.


```{r ar1}
# Análisis Argentina
rh_ar <- kiwi21 %>% 
  filter(pais == "Argentina")

```

### Análisis salarial por género y puestos

En el siguiente gráfico podemos ver la distribución de los sueldos por género. En este tipo de gráficos, llamados boxplots podemos ver:

* **Primer cuartil**: La parte inferior de la caja.
* **Mediana**: La línea gruesa dentro de cada rectángulo.
* **Tercer cuartil**: La parte superior de la caja
* **Outliers**: son los valores extremos identificados con puntos.

A este gráfico lo combinamos con un scatterplot para poder ver la cantidad de registros.

```{r ar2}
ggplot(rh_ar, aes(x = genero, y = sueldo_bruto, fill = genero)) +
  geom_boxplot(alpha = 0.7) +
  geom_point(position = position_jitter(width = 0.08), size = 2, alpha = 0.35) +
  scale_fill_manual(values = genero) +
  estiloh + 
  eje_y_n +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Argentina - en ARS",
       x = "", y = "Pesos $",
       fill = "Género",
       caption = fuente)

```

En el siguiente gráfico podemos ver los sueldos promedios para cada posición y género. 

```{r ar3}
rh_ar %>% 
  group_by(puesto, genero) %>% 
  summarise(sueldop = list(mean_se(sueldo_bruto))) %>% 
  unnest(cols = c(sueldop)) %>% 
  ggplot(aes(x = fct_rev(puesto), y = y, fill = genero)) +
  geom_col(position = "dodge") +
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge", color = "#333e47") +
  geom_text(aes(label = comma(round(x=y, 0), big.mark = ".",
                             decimal.mark = ","),
               vjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
           size = 2, color = "white",
           family = "Roboto") +
  eje_y_n +
  scale_fill_manual(values = genero) +
  labs(title = "Salario promedio por puesto y género",
       subtitle = "Datos de Argentina en ARS",
       caption = paste0(fuente),
       fill = "Género",
       x = "", y = "Pesos $") + 
  estiloh
```


Es interesante, de alguna manera combinar la información de los gráficos anteriores para analizar la distribución de los sueldos para cada posición:

```{r ar4}
ggplot(rh_ar, aes(x = fct_rev(puesto), y = sueldo_ft, fill = genero)) +
  geom_boxplot() +
  scale_fill_manual(values = genero) +
  eje_y_n +
  estiloh +
  labs(title = "Distribución de sueldos por género",
       subtitle = "Datos de Argentina - en ARS",
       x = "", y = "", fill = "Género",
       caption = fuente) +
  theme(panel.grid.minor.y = element_line(color = "#AEB6BF"),
        plot.title.position = "plot")
```


Con estos datos podemos realizar una visualización de los gaps salariales entre hombres y mujeres.

```{r brecha_21}
gap_salarial <- rh_ar %>% 
  select(genero, puesto, sueldo_ft)

brecha <- gap_salarial %>% 
  group_by(genero, puesto) %>% 
  summarise(media_salarial = mean(sueldo_ft))


brecha_graf <- brecha %>% 
  pivot_wider(., names_from = genero, values_from = media_salarial) %>% 
  mutate(brecha = percent((`Hombre cis`-`Mujer cis`)/`Hombre cis`, 1),
         x = (`Hombre cis` + `Mujer cis`)/2)

ggplot(brecha_graf, 
       aes(x = `Mujer cis`, xend = `Hombre cis`, y = fct_rev(puesto), 
           group = puesto, label = brecha)) +
  geom_dumbbell(color = "#808080",
                size_x = 3, size_xend = 3,
                colour_x = colores[1],
                colour_xend = colores[2]) +
  geom_text(data = brecha_graf, 
            aes(x, puesto, label = brecha), nudge_y = .2) +
  labs(title = "Brecha salarial por puestos de RRHH",
       subtitle = "Sueldos promedios en Argentina en ARS",
       x = "",
       y = NULL, 
       caption = fuente) +
  eje_x_n +
  scale_color_manual(values = colores) +
  theme_minimal()+
  theme(plot.background = element_rect(fill = "#fbfcfc"),
        text = element_text(family = "Roboto"),
        plot.title.position = "plot")

rm(brecha, gap_salarial)

```

Si comparamos los resultados con la [edición del 2020](https://rpubs.com/Data4HR/encuesta-kiwi-2020) (sección *Sueldos Argentina -> Distribución de sueldos por puesto*) podemos apreciar las siguientes diferencias. 

En 2020, la mayoría de las medianas tenían valores similares en la mayoría de las posiciones de mayor jerarquía y había una paridad casi absoluta en el caso de los **HRBP**. En esta edición, salvo para el caso de los responsables, la mediana salarial aumentó para los hombres cis, y en el caso de las mujeres cis, la única posición jerárquica que tiene una mediana salarial más alta, es en el puesto de **Responsable**.

El puesto de **Analista** es el único caso donde la mediana salarial es más alta para las mujeres que para los varones, el gap salarial es un 5% más alto para las mujeres que para los hombres, y la distribución salarial es equitativa (aunque hay varias mujeres cis con valores altos).

Respecto al gráfico de gaps salariales, en esta edición comparada con la de 2020 podemos apreciar que:

* Para el puesto de **Gerente**, la brecha salarial se mantiene igual.
* Para el puesto de **Jefe**, la brecha salarial aumentó 4% (de un 12% en 2020 a un 16% en 2021).
* Para el puesto de **Responsable** la brecha se redujo de un 17% en 2020, a un 6% en la edición 2021.
* El mayor cambio en el análisis de gaps se apreció en la posición de **HRBP** donde el gap pasó de un 3% en 2020 a un 29% en 2021.
* El puesto de **Analista** es el único en donde el gap salarial es favorable para las mujeres cis, pasando de un gap de 17% en 2020, a un 5% a favor de las mujeres.
* Para el puesto de **Administrativo** el gap salarial pasó de un 8% en 2020 a un 19% en 2021.

Dado que la encuesta es anónima, es imposible trackear los cambios, promociones y aumentos en las mismas personas y empresas. Sería interesante buscar otros análisis de mercado para ver si esta tendencia se replica en otras investigaciones. Es sabido que la pandemia tuvo un impacto mayor en la carga cognitiva de las mujeres, dado que sumado a sus responsabilidades laborales, las mujeres típicamente se hacen cargo de las tareas domésticas y de la educación de los hijos e hijas, lo cual también implica un mayor acompañamiento también en las clases que fueron virtuales y de las tareas para el hogar. Para determinar el impacto de la carga cognitiva y de trabajo de las tareas domésticas sería importante hacer un análisis ad-hoc.

A continuación, y a modo de resumen, dejamos una comparación del gap salarial del 2020 vs. 2021.

```{r}
Puesto <- c("Gerente", "Jefe", "Responsable", "HRBP", "Analista", "Administrativo")
`Gap 2020` <- c(0.13, 0.12, 0.17, 0.03, 0.17, 0.08)
`Gap 2021` <- c(0.13, 0.16, 0.06, 0.29, -0.05, 0.19)

gaps <- data.frame(Puesto, `Gap 2020`, `Gap 2021`)

gaps <- gaps %>% 
  mutate(Diferencia = Gap.2021 - Gap.2020)

gt(
  gaps
) %>% 
  tab_header(
    title = "Gap Salarial por puesto en RRHH en Argentina por año",
    subtitle = "Comparación Hombres cis vs Mujeres cis"
  ) %>% 
  fmt_percent(columns = c("Gap.2020", "Gap.2021", "Diferencia"),
              decimals = 0) %>% 
  cols_label(
    Gap.2020 = "Gap 2020",
    Gap.2021 = "Gap 2021"
  ) %>% 
  tab_source_note(source_note = paste0(fuente, " y 2020"))
```


### Análisis por funciones

```{r ar_rol}
rh_ar %>% 
  group_by(funcion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(funcion, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por función",
       subtitle = "Datos de Argentina en ARS",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


### Análisis por rubros

Veamos cuáles son los rubros mejor pagos en Argentina.

```{r ar_rubro}
rh_ar %>% 
  group_by(rubro) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, 
             y = reorder(rubro, sueldo_promedio))) +
  geom_col(fill = azul) +
  geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1.5, fontface = "bold"),
            position = position_dodge(0.9),
            size = 2, color = "white",
            family = "Roboto") +
  eje_x_n +
  estilov +
  labs(title = "Sueldo promedio por rubro",
       subtitle = "Datos de Argentina en ARS",
       x = "Pesos $",
       y = "",
       caption = fuente) +
  theme(plot.title.position = "plot")
```


Ahora comparemos los sueldos por rubros y géneros. Aquí podremos apreciar las diferencias entre los sueldos promedios de los hombres y mujeres en cada rubro.

```{r ar_rubro2}
rubro_ar <- rh_ar %>% 
  select(rubro, sueldo_ft) %>% 
  group_by(rubro) %>% 
  summarise(media_sueldo = mean(sueldo_ft),
            respuestas = n()) %>% 
  arrange(-respuestas)

top_rubros <- rubro_ar %>% 
  filter(rubro != "Otros", respuestas > 10) %>% 
  pull(rubro)

# Divide el largo de 'rubros' en varias líneas
rh_ar$rubro <- str_wrap(rh_ar$rubro, width = 30)


rh_ar %>% 
  filter(rubro %in% top_rubros) %>% 
  select(rubro, sueldo_ft, genero) %>% 
  group_by(rubro, genero) %>% 
  summarise(media_sueldo = mean(sueldo_ft),
            respuestas = n()) %>% 
  arrange(-respuestas) %>% 
  ggplot(aes(x = media_sueldo, y = reorder(rubro, media_sueldo), fill = genero)) +
  geom_col(position = "dodge") +
  geom_text(aes(label = comma(round(media_sueldo, 0),
                              big.mark = ".",
                              decimal.mark = ","),
                hjust = 1.4, vjust = 0.3),
            size = 3, 
            color = "white", 
            position = position_dodge(width = .9)) +
  scale_fill_manual(values = genero) +
  labs(title = "Promedio salarial por rubro y género",
       subtitle = "Datos de Argentina - en AR$",
       x = "", y = "", fill = "Género",
       caption = fuente) +
  eje_x_n +
  estilov +
  theme(axis.text.x = element_blank(),
        axis.ticks.x = element_blank(),
        plot.title.position = "plot") +
  guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda


rm(rubro_ar, top_rubros)
```

Por último, analicemos los sueldos de los 6 rubros con mayor cantidad de respuestas, y visualicemos las distribuciones de los sueldos por puesto y género. En este gráfico podemos ver los cuartiles delimitando las zonas sombreadas, y la mediana con el punto gris. Los puntos violetas y verdes representan a las mujeres y los hombres respectivamente en cada uno de los puestos.

```{r ar_rubros3}
#| out.width = "90%",
#| fig.height = 7

rh_ar %>% 
  filter(genero != "Género Diverso",
         puesto != "Director",
         rubro %in% c("Tecnologías de información", "Servicios de consultoría", 
                      "Alimentación, bebidas", "Comercio",
                      "Servicios de salud", "Servicios profesionales"))  %>% 
  ggplot(aes(x = fct_rev(puesto), y = sueldo_bruto)) +
  geom_econodist(width = 0.5) +
  geom_point(aes(y = sueldo_bruto, color = genero), alpha = 0.3,
             position = position_jitter(width = 0.25)) +
  scale_color_manual(values = c(verde, lila)) +
  eje_y_n +
  coord_flip() +
  facet_wrap(~rubro, ncol = 2) +
  estilov +
  labs(title = "Distribución salarial por puesto y rubro",
       subtitle = "Datos de Argentina - en AR$",
       x = "", y = "", color = "Género",
       caption = fuente) +
  theme(plot.title.position = "plot")
```

### Relaciones entre experiencia y sueldo bruto

En esta sección del análisis buscamos identificar cuáles son los factores que influyen en los ingresos (independientemente de la posición), así que empezamos a explorar los datos.

La primera pregunta que nos hicimos fue si los años de trayectoria influyen en el sueldo. Nuestra hipótesis es que a mayor cantidad de años de experiencia, mayor iba a ser el ingreso.

Lo que vamos a ver en el siguiente gráfico de dispersión, es en el eje horizontal, los años de experiencia, y en el eje vertical, el sueldo bruto expresado en pesos argentinos. Luego, vamos a graficar una recta, que nos va a indicar la *fuerza* de esa relación.


```{r reg_lineal_1}
lm_rh <- lm(sueldo_ft ~ anios_experiencia, data = rh_ar)

lm_hr_results <- summary(lm_rh)

lm_rh_r2 <- round(lm_hr_results[["r.squared"]],3)

ggplot(rh_ar, aes(x=anios_experiencia, y = sueldo_ft)) +
  geom_point(color = "#1FC3AA", alpha = 0.4, size = 2) + 
  geom_smooth(method = "lm") +
  theme_minimal() +
  theme(text = element_text(family = "Roboto")) +
  labs(title = "Relación entre sueldo y años de experiencia",
       x = "Años de Experiencia",
       y = "Sueldo bruto (AR$)", 
       caption = fuente) +
  eje_y_n +
  geom_text(aes(x=-Inf, y=Inf, hjust=0, vjust=1, label= paste0("R2 = ", lm_rh_r2))) 

```

En el gráfico podemos apreciar una recta que va creciendo efectivamente: a medida que nos movemos más hacia la derecha, la recta va subiendo. Pero el $R^2$ = `r lm_rh_r2` nos indica cuánto explica los años de experiencia sobre el sueldo bruto, o dicho de otra manera, en qué medida influye la variable x (años de experiencia), sobre la variable y (sueldo bruto). Una definición más precisa de este valor conocido como **Coeficiente de Determinación** es la proporción de la varianza total de la variable explicada por la regresión.

Este valor puede estar entre 0 y 1, mientras más cerca de 0 está menor es la relación, y mientras más cerca de 1 esté el resultado, indica que la regresión explica la variabilidad de la variable de respuesta. Es por eso que este $R^2$ = `r lm_rh_r2` nos indica que los años de experiencia explican un 31.8% de la variabilidad de los sueldos en RRHH.

#### Relación entre años de experiencia y sueldo bruto por puesto.

Dado que en el gráfico anterior tenemos mezclados los sueldos de administrativos, analistas, jefes y gerentes, decidimos analizar la relación entre los años de experiencia y el sueldo bruto por cada uno de los puestos por separado.

```{r reg_lineal_2, out.width="90%"}

mi.formula <- y ~ x

ggplot(rh_ar, aes(x=anios_experiencia, y = sueldo_ft)) +
  geom_point(color = "#1FC3AA", alpha = 0.4, size = 2) + 
  geom_smooth(method = "lm", formula = mi.formula, se = FALSE) +
  theme_minimal() +
  theme(text = element_text(family = "Roboto")) +
  labs(title = "Relación entre sueldo y años de experiencia",
       x = "Años de Experiencia",
       y = "", 
       caption = fuente) +
  eje_y_n +
  stat_poly_eq(formula = mi.formula, 
               aes(label = paste(..rr.label.., sep = "~~~")), 
               parse = TRUE) +
  facet_wrap(~puesto)

```

Como podemos apreciar en los $R^2$ de cada gráfico en el único puesto donde encontramos una fuerte relación entre los años de experiencia y el sueldo bruto es en los **HRBP**. En el resto de los puestos los años de trayectoria influyen muy poco en los sueldos de cada uno de los puestos.

Ahora bien, la pregunta es, *¿cuál es la variable que más influye en el sueldo en Recursos Humanos?.* Tristemente, la respuesta no sorprende.

```{r}
ggplot(rh_ar, aes(x = genero, y = sueldo_ft, fill = genero)) +
  geom_boxplot() +
  eje_y_n +
  scale_fill_manual(values = c(verde, lila)) +
  estiloh +
  labs(title = "Distribución salarial por género",
       x = "", y = "",
       fill = "Género", 
       caption = fuente)
```

# Educación

En esta sección queremos indagar si hay relación entre la formación y la remuneración, y si impacta también el tipo de universidad, pública o privada, en la remuneración y posición. Primero veamos entre los distintos países como se distribuye la muestra entre profesionales provenientes de universidades públicas y privadas.

Dado que tenemos relativamente pocas respuestas de otros países que no sean Argentina, no podemos sacar ninguna conclusión seria, sólo mencionar que en Argentina, hay una virtual paridad entre los estudiantes y graduados de universidades públicas y privadas. Posteriormente analizaremos la situación por regiones dentro del país.

Las proporciones de respuestas según al tipo de universidad que asistieron los participantes de la encuesta es la siguiente:

```{r tipo_universidad, fig.show="hold", out.width="50%", fig.align = "default"}
kiwi21 %>% 
  select(pais, tipo_universidad) %>% 
  ggplot(aes(y = fct_rev(pais), 
             fill = tipo_universidad)) +
           geom_bar(position = "fill") + 
  scale_fill_manual(values = c(gris, verde, azul)) +
  labs(title = "Distribución de respuestas por tipo de universidad por país",
       caption = fuente, 
       x = "", y = "") +
  estilo +
  theme(legend.position = "none")


educ <- kiwi21 %>% 
  select(tipo_universidad) %>%  
  group_by(tipo_universidad) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
educ$ymax <- cumsum(educ$freq)

# Compute the bottom of each rectangle
educ$ymin <- c(0, head(educ$ymax, n=-1))

# Compute label position
educ$labelPosition <- (educ$ymax + educ$ymin) / 2

# Compute a good label
educ$label <- paste0(educ$tipo_universidad, "\n Cant: ", educ$n)

# Make the plot
ggplot(educ, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=tipo_universidad)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c(gris, verde, azul)) +
  theme_void() +
  theme(legend.position = "right",
        panel.background = element_blank(),
        text = element_text(family = "Roboto")) +
  labs(title = "Tipo de Universidad",
       fill = "Tipo de Universidad", 
       caption = fuente) +
  theme(legend.position = "left")
```

Las principales carreras de las personas que respondieron son:

```{r carreras}
carreras <- kiwi21 %>% 
  select(nivel_formacion, carrera_grado, tipo_universidad, trabajo, 
         sueldo_bruto, puesto, funcion, pais, genero) %>% 
  mutate(carrera_grado = factor(carrera_grado))


carreras <- carreras %>% 
  mutate(carrera_grado = fct_collapse(carrera_grado, 
                                      "Comunicación Social" = c("Ciencias de la Comunicación", "Comunicación", "Comunicación social",
                                                                "Comunicación Social",
                                                                "Soy Licenciada en Ciencias Comunicación y Diplomada en RRHH")), 
         carrera_grado = fct_collapse(carrera_grado, "Ingenierías" = c("Ingeniera Comercial", "INGENIERA COMERCIAL",
                                                                       "Ing. Gestión Empresarial", "Ingeniería",
                                                                       "Ingenieria comercial", "Ingeniería Comercial",
                                                                       "Ingeniería de Sistemas", "Ingeniería Industrial")),
         carrera_grado = fct_collapse(carrera_grado, "Relaciones Públicas" = c("Lic. en Relacione Publicas",
                                                                               "Lic. en Relaciones Públicas",
                                                                               "Relaciones Públicas e Institucionales")),
         carrera_grado = fct_collapse(carrera_grado, 
                                      "Psicología" = c("Psicología", "Psicología Social")),
         carrera_grado = fct_lump(carrera_grado, 
                                  prop = 0.02, 
                                  other_level = "Otras"),
         carrera_grado = factor(carrera_grado,
                               levels = c("RRHH / RRLL / RRTT", "Psicología", "Administración de Empresas", 
                                         "Contador Público", "Ingenierías","Comunicación Social", "Otras")))



ggplot(carreras, aes(y = fct_rev(carrera_grado))) + 
  geom_bar(position = "dodge", fill = azul) +
  theme(plot.title.position = "plot") + 
  labs(x="",y="") +
  estilov +
  labs(title = "Principales carreras estudiadas",
       subtitle = "Trabajadores en relación de dependencia",
       caption = fuente)

```

Dada la cantidad de respuestas por país, el análisis que haremos desde aquí en adelante sólo será para **Argentina**.

## Análisis de educación y puestos para Argentina

Luego, podemos analizar en qué tipo de universidad estudiaron las personas que respondieron la encuesta, según el puesto actual que ocupan.

```{r puesto-universidad}
recorte_educacion <- rh_ar %>%
  filter(pais == "Argentina") %>% 
  select(nivel_formacion, carrera_grado,
         tipo_universidad, trabajo, sueldo_bruto, puesto, funcion, pais, genero)

ggplot(recorte_educacion, (aes(x = puesto, fill = tipo_universidad))) + #Tipo de universidad y cargo
  geom_bar(position = "dodge") +
  theme(plot.title.position = "plot") + 
  labs(x="",y="") +
    estilov +
  scale_fill_manual(values = c(gris, verde, azul)) +
  coord_flip() +
  labs(title = "Cantidad de respuestas según puesto y universidad",
       subtitle = "Sólo respuestas de Argentina",
       x = "", fill = "Tipo de Universidad",
       caption = fuente) +
    guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

```

Reiteremos el análisis pero únicamente para las carreras relacionadas con Recursos Humanos y Relaciones del Trabajo.

```{r rh-psico}
recorte_educacion %>%
  filter(carrera_grado == "RRHH / RRLL / RRTT") %>% 
  ggplot(aes(x = puesto, fill = tipo_universidad)) + #Tipo de universidad y cargo
  geom_bar(position = "dodge") +
  theme(plot.title.position = "plot") + 
  labs(x="",y="") +
    estilov +
  scale_fill_manual(values = c(gris, verde, azul)) +
  coord_flip() +
  labs(title = "Cantidad de respuestas según puesto y universidad",
       subtitle = "Sólo respuestas de Argentina - Carreras de RH",
       x = "", fill = "Tipo de Universidad",
       caption = fuente) +
    guides(fill = guide_legend(reverse=TRUE))  # Invierte el orden de los colores en la leyenda

  

```

Podemos apreciar que a partir de los puestos de jefatura, hay mayor presencia de graduados provenientes de universidades privadas.

En Argentina, podemos ver la siguiente distribución por género y nivel educativo.

```{r nivel-ed-genero}

ne_salario <- recorte_educacion 

# Elimina recorte_educacion
rm(recorte_educacion)

# Agrupa categorías de educación
ne_salario <- ne_salario %>% 
    mutate(nivel_formacion = fct_collapse(nivel_formacion,
                                        "Secundario completo" = c("Secundario completo", "Terciario en curso",
                                                                  "Terciario abandonado", "Universitario abandonado"),
                                        "Universitario completo" = c("Universitario completo", "Maestría abandonada", 
                                                                     "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso")) 

ne_salario %>% 
  select(pais, nivel_formacion, genero, puesto) %>%
  filter(genero %in% c("Mujer cis", "Hombre cis")) %>%
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  ggplot(aes (y= nivel_formacion, fill = genero)) + 
  geom_bar(position = "fill") +
  labs(x="",y="") +
  scale_fill_manual(values = c(verde, lila)) +
  estilo +
  theme(legend.position = "top",
        plot.title.position = "plot") +
  labs(title = "Máximo nivel educativo alcanzado por género",
       subtitle = "Distribución por frecuencias absolutas",
       caption = fuente, 
       fill = "Género")

```

En términos absolutos, las mujeres graduadas representan cerca del 75% de la muestra. Analicemos estos datos en términos relativos. Prácticamente el patrón de nivel educativo entre hombres y mujeres es idéntico.

De acuerdo a la muestra recolectada, las mujeres se forman en mayor proporción que los hombres cis.

```{r nivel-ed-genero-rel}
ne_fem <- ne_salario %>% 
  filter(genero == "Mujer cis") %>% 
  group_by(genero, nivel_formacion) %>% 
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(n = n()) %>% 
  mutate(frecuencia = round(n/sum(n),2),
         genero = "Mujer cis") 

ne_mas <- ne_salario %>% 
  filter(genero == "Hombre cis") %>% 
  group_by(genero, nivel_formacion) %>% 
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(n = n()) %>% 
  mutate(frecuencia = round(n/sum(n),2),
         genero = "Hombre cis") 

ne_total <- rbind(ne_fem, ne_mas)

ggplot(ne_total, aes(x = nivel_formacion, y = frecuencia, fill = genero)) +
  geom_col() +
  theme(axis.text.x = element_text(angle = 90), 
        legend.position = "none") + 
  labs(x="",y="") +
  scale_fill_manual(values = colores) +
  facet_wrap(~genero, ncol = 2) +
  estiloh +
  labs(title = "Proporción de nivel educativo máximo por género",
       x = "", y = "Proporción", 
       caption = fuente)

```

Ahora veamos como se distribuyen los puestos según el género y el nivel educativo.

```{r puestos-nivel-ed, fig.height=8}
ne_salario %>% 
  select(pais, nivel_formacion, genero, puesto) %>%
  filter(genero %in% c("Mujer cis", "Hombre cis"),
         puesto != "Pasante", puesto != "Director") %>%
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso","Diplomado completo", 
                                             "Maestría en curso","Maestría completa")),
         puesto = factor(puesto, 
                         levels = c("Director", "Gerente", "Jefe", "Responsable", "HRBP",
                                    "Analista", "Administrativo"))) %>% 
  group_by(nivel_formacion) %>% 
  ggplot(aes (y= nivel_formacion, fill = genero)) + 
  geom_bar(position = "fill") +
  labs(x="",y="") +
  scale_fill_manual(values = c(verde, lila)) +
  estilo +
  theme(legend.position = "top",
        plot.title.position = "plot") +
  labs(title = "Nivel educativo por puesto y género",
       subtitle = "Distribución por frecuencias absolutas",
       caption = fuente, 
       fill = "Género") +
  facet_wrap(~puesto, ncol = 3)

```

Algunas datos llamativos del gráfico anterior:

- En las posiciones de **Gerente** y de **Jefe** hay paridad entre los géneros respecto de la formación en posgrados completos.
- En posiciones de menor jerarquía se observan mujeres cis con posgrados completos o en curso en mayor proporción que hombres cis.
- En el caso del puesto de **Analista** encontramos mujeres con posgrados completos, incluso con maestrías y diplomados completos. Hay pocas observaciones de varones cis con Diplomado completo en esta posición. Lo cual nos da la pauta que contar con un título de posgrado en el caso de los hombres ayuda a posicionarse en posiciones de mayor jerarquía en mayor proporción que las mujeres.

Analicemos las proporciones de hombres y de mujeres en puesto de liderazgo.

```{r liderazgo-genero, results='hide'}

div <- rh_ar %>%
  filter(pais == "Argentina") %>% 
select(genero) %>% 
  mutate(genero = factor(genero, 
                         levels = c("Mujer cis", "Hombre cis"))) %>% 
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

lideres <- rh_ar %>% 
  filter(pais == "Argentina") %>% 
 select(genero, puesto) 

# Propoción de líderes hombres y mujeres
lideres_genero <- lideres %>% 
  filter(genero %in% c("Mujer cis", "Hombre cis")) %>% 
  group_by(genero) %>%
  mutate(gente_a_cargo = if_else(puesto %in% c("Responsable", "Jefe", "Gerente", 
                                               "Supervisor", "Director"),1,0)) %>%
  summarise(lider = sum(gente_a_cargo)) %>% 
  left_join(div) %>% 
  select(genero, lider, n) %>% 
  mutate(proporcion = percent(lider/n))

# Test de hipótesis para validar diferencias de resultados
# Hay que verificar si la proporción de líderes hombres es mayor que la proporción de líderes mujeres
# Creo un dataframe para analizar proporciones de hombres y de mujeres en puestos de liderazgo y de no-liderazgo
test_lider <- lideres_genero %>% 
  mutate(no_lider = n - lider) %>%        # Columna de no líderes
  select(genero, lider, no_lider) %>%     # selecciono columnas de interés
  pivot_longer(cols = c(lider, no_lider), # Hago un dataset largo para analizar después
               names_to = "es_lider", values_to = "conteo")

# Del total de respuestas me interesa sólo ver cuáles son los hombres con puesto de liderazgo
test_lider$cat <- c(0,0,1,0)

# Extraigo el mu para decidir si la diferencia es significativa y pasarlo a la fórmula del test.
prop_mujer_lid <- pull(lideres_genero[1,2]/lideres_genero[1,3])

# Realizo el test de hipótesis.
# H0 = Las proporciones de líderes hombres y mujeres son iguales
# H1 = La proporción de hombres líderes es mayor que la proporción de mujeres líderes.
resultados_test <- broom::tidy(t.test(test_lider$cat, mu = prop_mujer_lid, alternative = "greater"))

valor_test <- if(resultados_test[1,3] > 0.05) {
  print("la diferencia es estadísticamente significativa, y la proporción de hombres en puestos de liderazgo es mayor que el de las mujeres")
  } else {
    print("la diferencia no es estadísticamente significativa, y la proporción de hombres no es estadísticamente mayor que el de las mujeres en puestos de liderazgo")
  }
```

```{r grafico-prop-lid-genero}
# Gráfico
lideres_genero %>% 
  mutate(porc_lider = lider/n, 
         porc_no_lider = 1 - porc_lider) %>% 
  pivot_longer(cols = c(porc_lider, porc_no_lider),
               names_to = "es_lider", 
               values_to = "valores") %>% 
  mutate(es_lider = factor(es_lider, 
                           levels = c("porc_no_lider", "porc_lider"), 
                           labels = c("No Líder", "Líder"))) %>% 
  ggplot(aes(x= genero, y = valores, fill = es_lider))+
  geom_col(position = "fill")+
  estilo +
  scale_fill_manual(values = c("#75838F", "#344D7E")) +
  labs(title = "Proporción de Líderes según género",
       x = "", y = "", fill = "", 
       caption = fuente)

```

De acuerdo a las respuestas recolectadas **2 de cada 3** participantes son mujeres.

Para los puestos de liderazgo consideramos las personas en los puestos de *Director, Gerente, Jefe, y Responsable.*

Del total de **mujeres**, `r lideres_genero[1,3]` respuestas, `r lideres_genero[1,2]` ocupan un puesto de liderazgo (`r lideres_genero[1, 4]`).

Del total de **hombres**, `r lideres_genero[2, 3]` respuestas, `r lideres_genero[2,2]` ocupan un puesto de liderazgo (`r lideres_genero[2, 4]`).

Con un *p-value* igual a `r round(resultados_test[1,3],3)` podemos afirmar que **`r valor_test`**.


A pesar de que en Recursos Humanos en Argentina, las mujeres cis representan la mayor cantidad de empleados bajo relación de dependencia, y además se forman en mayor proporción que los varones en posgrados, proporcionalmente en comparación con los hombres cis, acceden a menos posiciones de liderazgo.



## Análisis de sueldos y educación en Argentina

En esta sección analizaremos los sueldos en comparación con los distintos niveles educativos.

A diferencia de otras secciones, en este caso compararemos la *media salarial* para poder observar los desvíos estándar en los análisis. En primer lugar analicemos cuál es el sueldo promedio de acuerdo a los distintos niveles educativos.

Primero veamos cuál es el sueldo promedio en pesos argentinos, según el nivel educativo.

```{r sueldo-educ}
estudios <- rh_ar %>% 
  filter(pais == "Argentina") %>% 
  select(genero, nivel_formacion, sueldo_bruto)
    
  
est_ar  <- profiling_num(estudios)
es_p05 <- est_ar[1,6]
es_p95 <- est_ar[1,10]

rm(est_ar)

rh_ar %>% 
  filter(pais == "Argentina", 
         between(sueldo_bruto, es_p05, es_p95)) %>% 
      mutate(nivel_formacion = fct_collapse(nivel_formacion,
                                        "Secundario completo" = c("Secundario completo", "Terciario en curso",
                                                                  "Terciario abandonado", "Universitario abandonado"),
                                        "Universitario completo" = c("Universitario completo", "Maestría abandonada", 
                                                                     "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso")) %>% 
    mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso", "Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(sueldo_promedio = mean(sueldo_bruto)) %>% 
  ggplot(aes(x = sueldo_promedio, y = nivel_formacion))+
  geom_col(fill = azul)+
geom_text(aes(label = comma(round(sueldo_promedio, 0), 
                              big.mark = ".",
                             decimal.mark = ","),
            hjust = 1., fontface = "bold"),
            position = position_dodge(0.9),
            size = 3, color = "white",
            family = "Roboto") +
  estilov +
  eje_x_n +
  labs(title = "Sueldo promedio por nivel de formación",
       subtitle = "En AR$",
       x="", y="", caption = fuente)

  

```

Ahora veamos qué pasa si incluimos en el análisis el género para analizar los sueldos promedios y sus desvíos estándar.

```{r sueldo-educ-genero}
rh_ar %>% 
  filter(pais == "Argentina", 
         between(sueldo_bruto, es_p05, es_p95)) %>% 
      mutate(nivel_formacion = fct_collapse(nivel_formacion,
                                        "Secundario completo" = c("Secundario completo", "Terciario en curso",
                                                                  "Terciario abandonado", "Universitario abandonado"),
                                        "Universitario completo" = c("Universitario completo", "Maestría abandonada", 
                                                                     "Diplomado de posgrado abandonado")),
         nivel_formacion = fct_recode(nivel_formacion, "Diplomado completo" = "Diplomado de posgrado completo",
                                      "Diplomado en curso" = "Diplomado de posgrado en curso")) %>% 
    mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Secundario completo", "Terciario completo",
                                             "Universitario en curso", "Universitario completo",
                                             "Diplomado en curso", "Diplomado completo",
                                             "Maestría en curso","Maestría completa"))) %>% 
  group_by(nivel_formacion, genero) %>% 
  summarise(salarios = list(mean_se(sueldo_bruto))) %>% 
  unnest(salarios) %>% 
  ggplot(aes(x = nivel_formacion, y = y, fill = genero)) +
  geom_col(position = "dodge")+
  geom_errorbar(aes(ymin = ymin,ymax = ymax), position = "dodge")+
  coord_flip()+
  theme(legend.position = "top",
        plot.title.position = "plot") +
  eje_y_n +
  estilov +
  scale_fill_manual(values = c(verde, lila)) +
  labs(title = "Sueldo promedio y desvío estándard por nivel de formación y género",
       subtitle = "En AR$", 
       x = "", y = "", 
       caption = fuente, 
       fill = "Género")
```


# Freelancers

En este relevamiento participan colegas que trabajan en relación de dependencia y también de manera freelance. Este es el análisis desarrollado en base a las respuestas de las personas que trabajan de manera independiente o en sus propias empresas.

## Respuestas  por país

En el caso de las personas freelance, la mayoría de las respuestas obtenidas fueron de Argentina.
Por eso reiteramos, que los resultados no son representativos de los países. 


```{r  echo=FALSE  }


paises <- freelo21 %>% 
  select(pais) %>% 
  mutate(cuenta = 1) %>% 
  group_by(pais) %>% 
  summarise(Cuenta = sum(cuenta)) %>% 
  arrange(-Cuenta)

gt(paises) %>% 
  tab_header(title = "Cantidad de respuestas por país",
             subtitle = "Freelance") %>% 
  tab_source_note(source_note = fuente) %>% 
  cols_label(pais = "País")

```

## Respuestas por Género 

La participación según el género de las personas freelance,  es la siguiente:


```{r  echo=FALSE , message= FALSE,  warning = FALSE }


## Limpieza variable genero ----
freelo21 <- freelo21 %>% 
  mutate(genero = fct_collapse(genero, "Mujer cis" = c("Mujer cis", "Mujer"),
                               "Hombre cis" = "Hombre cis"),
         genero = factor(genero, levels = c("Mujer cis", "Hombre cis",
                                             "Prefiero no responder")))


div <- freelo21 %>% 
  select(genero) %>% 
  filter(genero!="NA")%>%  # se saca, porque no es representativo
  filter(genero!="Prefiero no responder")%>%  # se saca, porque no es representativo
  group_by(genero) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
div$ymax <- cumsum(div$freq)

# Compute the bottom of each rectangle
div$ymin <- c(0, head(div$ymax, n=-1))

# Compute label position
div$labelPosition <- (div$ymax + div$ymin) / 2

# Compute a good label
div$label <- paste0(div$genero, "\n Cant: ", div$n)

# Make the plot
ggplot(div, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=genero)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c("#8624F5",  "#1FC3AA", "#FFD129","#75838F")) +
  theme_void() +
  theme(legend.position = "right",
        panel.background = element_blank(),
        text = element_text(family = "Roboto")) +
  labs(title = "Cantidad de respuestas según género",
       subtitle = "Freelance",
       fill = "Género", 
       caption = fuente)

```

Podemos observar que la mayoría de las respuestas fueron de  Mujeres cis, manteniendo la misma tendencia que las personas en relación de dependencia. 

```{r echo=FALSE, message=FALSE}

freelo21 %>% 
  select(genero) %>%
  mutate(cuenta = 1) %>% 
  group_by(genero) %>%
  summarise(Cuenta = sum(cuenta)) %>%
  filter(Cuenta>2)%>%
  arrange(-Cuenta)%>%
  rename("Género"=genero) %>% 
  kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, bootstrap_options = c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)
```

## Respuestas por Educación 

En esta sección queremos indagar si hay relación entre la formación y la exportacion de los servicios, y si impacta también el tipo de universidad, pública o privada, en dichas prestaciónes. 
Primero veamos  como se distribuye la muestra entre profesionales provenientes de universidades públicas y privadas de los diferentes paises:


```{r  echo=FALSE , message= FALSE,  warning = FALSE}

# Nota: Ver como agregar la tabla de referencias al grafico-

freelo21 %>% 
  select(pais, tipo_universidad) %>% 
  ggplot(aes(y = pais, fill = tipo_universidad)) +
  geom_bar(position = "fill") + 
  scale_fill_manual(values = c(gris, verde, azul)) +
  labs(title = "Distribución de respuestas por tipo de universidad por país",
       caption = fuente, 
       x = "", y = "") +
  estilo +
  theme(legend.position = "none")

```


Limitandonos al país con mayor cantidad de respuestas, Argentina, en los  siguientes graficos podemos observar  que  la distribución   por tipo de Universidad es  muy pareja , quedando un valor  minimo y poco representativo  para quienen no fueron a la Universidad: 


```{r  echo=FALSE , message= FALSE,  warning = FALSE}

freelo21 %>% 
  select(pais, tipo_universidad) %>%
  filter (pais=="Argentina")%>% 
  ggplot(aes(x = tipo_universidad)) + 
  geom_bar(position = "dodge", fill = azul) +
  theme(axis.text.x = element_text(angle = 360)) + 
  labs(x="",y="") +
  estiloh +
  labs(title = "Distribución de respuestas por tipo de universidad",
       subtitle = "Solo Argentina",
       caption = fuente)


```

```{r  echo=FALSE , message= FALSE,  warning = FALSE}



## Tipo de Universidad  

educ <- freelo21 %>% 
  select(tipo_universidad) %>%  
  group_by(tipo_universidad) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
educ$ymax <- cumsum(educ$freq)

# Compute the bottom of each rectangle
educ$ymin <- c(0, head(educ$ymax, n=-1))

# Compute label position
educ$labelPosition <- (educ$ymax + educ$ymin) / 2

# Compute a good label
educ$label <- paste0(educ$tipo_universidad, "\n Cant: ", educ$n)

# Make the plot
ggplot(educ, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=tipo_universidad)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c(gris, verde, azul)) +
  theme_void() +
  theme(legend.position = "right",
        panel.background = element_blank(),
        text = element_text(family = "Roboto")) +
  labs(title = "Tipo de Universidad",
       fill = "Tipo de Universidad", 
       caption = fuente) +
  theme(legend.position = "left")
```



Nos interesaba indagar cuál era el nivel de formación  de los encuestados.

En la siguiente tabla podemos ver que la mayoría tiene estudios  Universitarios completos: 

```{r  echo=FALSE , message= FALSE,  warning = FALSE}

freelo21 %>% 
  select(nivel_formacion) %>%
  mutate(cuenta = 1) %>% 
  group_by(nivel_formacion) %>%
  summarise(Cuenta = sum(cuenta)) %>% 
  arrange(-Cuenta)%>% 
  select(nivel_formacion,Cuenta) %>% 
  rename("Nivel de Formación"=nivel_formacion) %>% 
  kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, bootstrap_options = c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)
```

Cuando  analizamos educación, nos resultó  interesante analizar la distribución por género y nivel educativo.

En el siguiente gráfico podemos observar que las mujeres tienen mayor nivel de formación que los hombres:

```{r  echo=FALSE , message= FALSE,  warning = FALSE}
freelo21 %>% 
  select(pais, nivel_formacion, genero) %>%
  filter(genero != "Prefiero no responder") %>% # sacar porque no es representativo
  filter(nivel_formacion != "NA") %>%           # sacar porque no es representativo
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Terciario completo","Terciario abandonado", "Diplomado de posgrado en curso","Diplomado de posgrado completo","Universitario en curso", "Universitario completo", "Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  ggplot(aes (y= nivel_formacion, fill = genero)) + 
  geom_bar(position = "fill") +
  theme(axis.text.x = element_text(angle = 90)) + 
  labs(x="",y="") +
  scale_fill_manual(values = colores) +
  estilo +
  theme(legend.position = "top") +
  labs(title = "Máximo nivel educativo alcanzado por género",
       subtitle = "Distribución por frecuencias absolutas",
       caption = fuente, 
       fill = "Género")

```


Veamos los mismos resultados, en terminos relativos: 

```{r  echo=FALSE , message= FALSE,  warning = FALSE}

#Esta bien la proporcion?? ver!! 



fr_fem <- freelo21 %>% 
  filter(genero == "Mujer cis") %>% 
  group_by(genero, nivel_formacion) %>% 
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Terciario completo","Terciario abandonado", "Diplomado de posgrado en curso","Diplomado de posgrado completo","Universitario en curso", "Universitario completo", "Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(n = n()) %>% 
  mutate(frecuencia = round(n/sum(n),2),
         genero = "Mujer cis") 


fr_mas <- freelo21 %>% 
  filter(genero == "Hombre cis") %>% 
  group_by(genero, nivel_formacion) %>% 
  mutate(nivel_formacion = factor(nivel_formacion,
                                  levels = c("Terciario completo","Terciario abandonado", "Diplomado de posgrado en curso","Diplomado de posgrado completo","Universitario en curso", "Universitario completo", "Maestría completa"))) %>% 
  group_by(nivel_formacion) %>% 
  summarise(n = n()) %>% 
  mutate(frecuencia = round(n/sum(n),2),
         genero = "Hombre cis") 

fr_total <- rbind(fr_fem, fr_mas )

ggplot(fr_total, aes(x = nivel_formacion, y = frecuencia, fill = genero)) +
  geom_col() +
  theme(axis.text.x = element_text(angle = 90), 
        legend.position = "none") + 
  labs(x="",y="") +
  scale_fill_manual(values = colores) +
  facet_wrap(~genero, ncol = 2) +
  estiloh +
  labs(title = "Proporción de nivel educativo máximo por género",
       subtitle = "Freelance",
       x = "", y = "Proporción", 
       caption = fuente)


```


Respecto a las  carreras, vemos que la tendencia de las mismas se corresponden con los resultados obtenidos en las personas en relación de dependencia: 

```{r  echo=FALSE , message= FALSE,  warning = FALSE}

carrerasfr <- freelo21 %>% 
  select(nivel_formacion, carrera_grado, tipo_universidad, pais, genero) %>% 
  mutate(carrera_grado = factor(carrera_grado))

carrerasfr <- carrerasfr %>% 
  mutate(carrera_grado = fct_collapse(carrera_grado, 
                                    "RRHH / RRLL / RRTT" = c("RRHH / RRLL / RRTT", "Y ahora Relaciones Laborales")),
         carrera_grado = fct_collapse(carrera_grado, 
                                      "Psicología" = c("Psicología")),
         carrera_grado = fct_collapse(carrera_grado, 
                                      "Administración de Empresas" = c("Administración de Empresas")),
  
         carrera_grado = fct_lump(carrera_grado, 
                                  prop = 0.02, 
                                  other_level = "Otros"),
           carrera_grado = factor(carrera_grado, levels = c("RRHH / RRLL / RRTT", "Psicología", "Administración de Empresas", "Otros")))


ggplot(carrerasfr, aes(x = carrera_grado)) +
  geom_bar(position = "dodge", fill = azul) +
  theme(axis.text.x = element_text(angle = 360)) + 
  labs(x="",y="") +
  estiloh +
  labs(title = "Principales carreras estudiadas",
       subtitle = "Freelance",
       caption = fuente)
```

## Respuestas por Condición fiscal

La condidición fiscal de  los encuestados la podemos observar en la siguiente tabla:

```{r  echo=FALSE , message= FALSE,  warning = FALSE}


fiscofr <- freelo21 %>% 
  select(trabajo, registro_fiscal, medio_pago_exterior) %>% 
  mutate(registro_fiscal = factor(registro_fiscal))%>%
  mutate(registro_fiscal = fct_collapse(registro_fiscal, 
                                      "Monotributista" = "Monotributista"),
         registro_fiscal = fct_collapse(registro_fiscal, 
                                        "Contractor" = "Contractor"),
         registro_fiscal = fct_collapse(registro_fiscal, 
                                        "Responsable inscripto" = "Responsable inscripto"),
          registro_fiscal = fct_collapse(registro_fiscal, 
                                        "SA" = "SA"),
         registro_fiscal = fct_collapse(registro_fiscal, 
                                        "Otros" = c("No estoy registrada por el momento","Spa","tengo un contrato mixto rel dependencia y  freelance")),
         carrera_grado = factor(registro_fiscal,
                                levels = c("Monotributista", "Contractor", "Responsable inscripto","SA", "Otros")))


fiscofr %>% 
  select(registro_fiscal) %>%
  mutate(cuenta = 1) %>% 
  group_by(registro_fiscal) %>%
  summarise(Cuenta = sum(cuenta)) %>% 
  arrange(-Cuenta)%>% 
  rename("Registro Fiscal"=registro_fiscal) %>% 
  kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, bootstrap_options = c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)

```

##  Respuestas por Exportación de  Servicio

como vemos a continuación,  la mayoría no exporta sus servicios: 
```{r  echo=FALSE , message= FALSE,  warning = FALSE}

exp <- freelo21 %>% 
  select(exporta) %>% 
 filter(exporta!="NA") %>% 
  group_by(exporta) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
exp$ymax <- cumsum(exp$freq)

# Compute the bottom of each rectangle
exp$ymin <- c(0, head(exp$ymax, n=-1))

# Compute label position
exp$labelPosition <- (exp$ymax + div$ymin) / 2

# Compute a good label
exp$label <- paste0(exp$exporta, "\n Cant: ", div$n)

# Make the plot
ggplot(exp, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=exporta)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c("#8624F5",  "#1FC3AA", "#FFD129","#75838F")) +
  theme_void() +
  theme(legend.position = "right",
        panel.background = element_blank(),
        text = element_text(family = "Roboto")) +
  labs(title = "Exporta Servicios",
       fill = "", 
       caption = fuente)
```


Focalizandonos entre quienes exportan, podemos ver cuál es el servicio prestado: 


```{r  echo=FALSE , message= FALSE,  warning = FALSE}


sv_fr <- freelo21 %>% 
  filter(servicio_principal != "NA")%>% 
  filter(servicio_principal != "Start up del area de HR inpmentacion de politicas y procesos, busqueda y seleccion, asesoramiento en general del area")%>% 
  select(servicio_principal, exporta) %>%
  filter(exporta=="Si")%>%
mutate(servicio_principal = factor(servicio_principal,
                              levels = c("Payroll / Liquidación de sueldos", "Diseño organizacional", "Capacitación", "Comunicación interna","People Analytics","HR Generalista")))

ggplot(sv_fr, (aes(x = servicio_principal, fill = exporta))) + 
  geom_bar(position = "dodge") +
  theme(axis.text.x = element_text(angle = 90)) + 
  labs(x="",y="") +
  estilov +
  scale_fill_manual(values = c(verde)) +
  coord_flip() +
  labs(title = "Respuestas según Servicio Exportado",
       subtitle = "Freelance",
       x = "", fill = "Exporta",
       caption = fuente)
```


En relación a los medios de pago utilizados por quienes exportan, sus respuestas fueron las siguientes: 


```{r  echo=FALSE , message= FALSE,  warning = FALSE}


mp_fr <-freelo21%>%
  mutate(medio_pago_exterior = fct_collapse(medio_pago_exterior, 
                                        "Payoneer" = c("Payoneer")),
         medio_pago_exterior = fct_collapse(medio_pago_exterior, 
                                        "Transferencia" = c("Transferencia a tu cuenta")),
         medio_pago_exterior = fct_collapse(medio_pago_exterior, 
                                        "PayPal" = c("PayPal")),
         medio_pago_exterior = fct_collapse(medio_pago_exterior, 
                                            "Bitcoin" = c("Bitcoin")),
         medio_pago_exterior = fct_collapse(medio_pago_exterior, 
                                            "Western Union" = c("Western Union")),
         medio_pago_exterior = fct_collapse(medio_pago_exterior, 
                                            "Prex" = c("Prex")),
         medio_pago_exterior = fct_collapse(medio_pago_exterior, 
                                            "NO" = c("-","0","N/A","no","No","No aplica","No exporti por ahora","no exporto","No exporto" ,"No exporto servicios","No exporto.","No trabajo para afuera aún","Xxxx")),
         carrera_grado = factor(medio_pago_exterior,
                                levels = c("Payoneer", "Transferencia", "PayPal", "Bitcoin","Western Union","Prex","NO")))



mp_fr %>% 
  filter(medio_pago_exterior!="NO")%>% 
  mutate(cuenta = 1) %>% 
  group_by(medio_pago_exterior) %>%
  summarise(Cuenta = sum(cuenta)) %>% 
  arrange(-Cuenta)%>% 
  select(medio_pago_exterior,Cuenta) %>% 
  rename("Medios de Pago Exterior"=medio_pago_exterior) %>% 
  kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, bootstrap_options = c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)

```

## Respuestas por  Antigüedad

Respecto a los años de experiencia como freelance, podemos observar que la mayoría tiene menos de dos años.

Un interrogante que nos surge en si la inserción en esta modalidad fue una decisión de carrera voluntaria o impulsada por las consecuencias de la pandemia. Carecemos de elementos para responder esa pregunta, por eso nos limitamos a  presentar las respuestas obtenidas: 


```{r  echo=FALSE , message= FALSE,  warning = FALSE}

ant_fr<- freelo21 %>% 
  mutate(rango_ant =case_when(
    anios_freelance < 2 ~ "Menos de 2 años",
    anios_freelance < 6 ~ "Entre 2 y 5 años",
    anios_freelance < 11 ~ "Entre 5 y 10 años",
    anios_freelance = T ~ "Más de 10 años"),
    rango_ant = fct_relevel(rango_ant, c("Menos de 2 años", "Entre 2 y 5 años",
                                                       "Entre 5 y 10 años", "Más de 10 años")))
 ant_fr %>%
  select(rango_ant) %>%
  mutate(cuenta = 1) %>% 
  group_by(rango_ant) %>%
  summarise(Cuenta = sum(cuenta)) %>% 
  arrange(-Cuenta)%>% 
  rename("Años de Experiencia"=rango_ant) %>% 
 # rename("Exporta"=exporta) %>% 
  kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, bootstrap_options = c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)

```

## Respuestas por  Búsquedas

Nos interesa saber cuantos se dedican a realizar trabajos de selección de talentos. 

Podemos observar que un 66% de las personas encuestadas en esta categoria se dedican a la tarea de búsqueda. 


```{r  echo=FALSE , message= FALSE,  warning = FALSE}

freelo21 %>% 
  select(servicio_busqueda) %>%
  mutate(cuenta = 1) %>% 
  group_by(servicio_busqueda) %>%
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)%>% 
rename("Serv. Búsqueda"=servicio_busqueda) %>%
   kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, bootstrap_options = c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)

```

Sabiendo el crecimiento y auge de las búsquedas en el sector de IT, veamos cuál es la participación de las mismas entre las personas que hacen recruiting. 

Como se observa en el siguiente gráfico, la mayoría de las búsquedas se concentran que en el sector IT. 


```{r  echo=FALSE , message= FALSE,  warning = FALSE}


it_fr<- freelo21 %>% 
  select(busqueda_it, servicio_busqueda) %>% 
  filter(servicio_busqueda=="Si") 


ggplot(it_fr, (aes(x = busqueda_it, fill = servicio_busqueda))) + 
  geom_bar(position = "dodge") +
  theme(axis.text.x = element_text(angle = 90)) + 
  labs(x="",y="") +
  estilov +
  scale_fill_manual(values = c(verde)) +
  coord_flip() +
  labs(title = "Servicio de Búsqueda",
       subtitle = "Freelance",
       x = "", fill = "IT",
       caption = fuente)
```


## Respuesta por garantía de trabajo

Las garantías de reposición de vacantes se refieren a la protección que se brinda a cada cliente en el caso de que la persona contratada   se marche de la empresa.

Veamos entre los que  prestan  el servicio de recruiting, quienes ofrecen garantía de permanencia del candidato. 



```{r  echo=FALSE , message= FALSE,  warning = FALSE}


gtia <- freelo21 %>% 
#  select(garantia,servicio_busqueda) %>% 
  filter(servicio_busqueda=="Si") %>% 
  mutate(garantia=fct_collapse(garantia, "Si" = c("1 mes","2 meses", "3 meses")),
         garantia=fct_collapse(garantia, "No" = c("No ofrezco garantía")),
          garantia = factor(garantia, levels =c("Si","No" )))


gtia2 <- gtia %>% 
  select(garantia) %>% 
  group_by(garantia) %>% 
  summarise (n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  arrange(-n)

# Compute the cumulative percentages (top of each rectangle)
gtia2$ymax <- cumsum(gtia2$freq)

# Compute the bottom of each rectangle
gtia2$ymin <- c(0, head(gtia2$ymax, n=-1))

# Compute label position
gtia2$labelPosition <- (gtia2$ymax + gtia2$ymin) / 2

# Compute a good label
gtia2$label <- paste0(gtia2$garantia, "\n Cant: ", gtia2$n)

# Make the plot
ggplot(gtia2, aes(ymax=ymax, ymin=ymin, xmax=4, xmin=3, fill=garantia)) +
  geom_rect() +
  coord_polar(theta="y") + # Try to remove that to understand how the chart is built initially
  xlim(c(2, 4)) +# Try to remove that to see how to make a pie chart
  scale_fill_manual(values = c( verde, azul)) +
  theme_void() +
  theme(legend.position = "right",
        panel.background = element_blank(),
        text = element_text(family = "Roboto")) +
  labs(title = "Garantía de Permanencia",
       fill = "", 
       caption = fuente) +
  theme(legend.position = "left")




```



En la siguiente tabla podemos observar que los plazos de garantía suelen ir desde un mes hasta los tres meses. Pero un número importante, no ofrece garantia por el  servicio contratado.

```{r  echo=FALSE , message= FALSE,  warning = FALSE}

gtia2 <- freelo21 %>% 
#  select(garantia,servicio_busqueda) %>% 
  filter(servicio_busqueda=="Si") %>% 
  mutate( garantia=fct_collapse(garantia, "No" = c("No ofrezco garantía")),
          garantia = factor(garantia, levels =c("Si","No" )))

                                                      


```

## Respuestas por Base de Coeficiente


Otro punto para destacar es el precio del servicio de quienes hacen recruiting.

Podemos ver que la gran mayoría  cobra   por dicho servicio, un porcentaje de  remuneración mensual del ingresante, dejando para muy pocos casos el ingreso anual del mismo.


Una pregunta abierta que nos queda, es cuáles son las posiciones mejores pagas para los recruiters. Sin embargo, dicho análisis escapa de los objetivos de la presente encuesta.  

```{r  echo=FALSE , message= FALSE,  warning = FALSE}

coef_fr<- freelo21 %>% 
  mutate(base_coeficiente=fct_collapse(base_coeficiente, "Mensual" = "Remuneración mensual del ingresante"),
         base_coeficiente=fct_collapse(base_coeficiente, "Anual" = "Remuneración anual del ingresante"),
          base_coeficiente = factor(base_coeficiente, levels =c("Mensual","Anual" )))


 coef_fr %>%
  select(servicio_busqueda,base_coeficiente) %>%
  filter(servicio_busqueda=="Si") %>% 
  mutate(cuenta = 1) %>% 
  group_by(base_coeficiente) %>%
  summarise(Cuenta = sum(cuenta)) %>% 
  arrange(-Cuenta)%>% 
  rename("Remuneración del Ingresante"=base_coeficiente) %>% 
  kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, bootstrap_options = c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)


```

La mayoría cobra un porcentaje  que va del  20% al 30% de  las remuneraciones mensuales de los ingresantes, como podemos ver en el siguiente cuadro:


```{r echo=FALSE , message= FALSE,  warning = FALSE}

## armo las categorias

#freelo21$coeficiente #consulto categorias

n_coef<- freelo21 %>% 
  select(servicio_busqueda,coeficiente,base_coeficiente) %>% 
  filter(servicio_busqueda=="Si") %>% 
  filter(base_coeficiente=="Remuneración mensual del ingresante") %>% 
  filter(coeficiente>10)%>%  #Filtro entre 0-100 (decido eliminar 1.2,1.5,2.0 y otros, porque no es clara su categorizacion)
  filter(coeficiente<101) %>% 
  mutate(coeficiente =case_when(
      coeficiente < 11 ~ "10%",
    coeficiente < 21 ~ "20%",
    coeficiente < 31 ~ "30%",
        coeficiente < 41 ~ "40%",
    coeficiente < 51 ~ "50%",
    coeficiente < 61 ~ "60%",
    coeficiente < 71 ~ "70%",
    coeficiente < 81 ~ "80%",
    coeficiente < 91 ~ "90%",
    coeficiente <101 ~ "100%",
    coeficiente = T ~ "Otros"),
    coeficiente = fct_relevel(coeficiente, c("10%","20%","30%","40%","50%","60%","70%","80%","90%","100%","Otros")))
  
# agrupo las categorias en una tabla.

 n_coef<- n_coef %>%
  select(coeficiente) %>%
  mutate(cuenta = 1) %>% 
  group_by(coeficiente) %>%
  summarise(Cuenta = sum(cuenta)) %>% 
  #arrange(-Cuenta)%>% 
  rename("Porcentaje"=coeficiente)
 
 n_coef$TIP <- c("% Sobre la Remuneración Mensual") # al pasar el cursor se ve
 
 #Tabla

n_coef %>% 
  mutate(Cuenta=text_spec(Cuenta, "html", tooltip=TIP)) %>% 
    select(Porcentaje,Cuenta) %>% 
  kable("html", escape=F) %>% 
  kable_styling(full_width = TRUE, bootstrap_options = c("striped","hover","condensed" )) %>% 
  row_spec(0, bold=T, color="white", background = azul)


```



