Introducción

Descripción del fenómeno de estudio

El objetivo del siguiente trabajo es indagar brevemente sobre algunas de las características del mercado de trabajo (salario promedio, desigualdad de ingresos laborales, proporción de empleo estatal/privado, calidad del empleo, nivel educativo y rango etario de la población económicamente activa), y compararlas para las distintas regiones que releva el INDEC. También intentaremos probar si existen diferencias, de esos mismos indicadores, entre varones y mujeres en cada región y comparar sus resultados entre sí.

Para el trabajo utilizaremos la base EPH-INDEC del 1°trimestre 2020, ya que consideramos a los períodos posteriores como anómalos producto de la pandemia, evento del cual todavía no conocemos cuáles son los impactos finales sobre la estructura del mercado de trabajo. Sí, finalizando, haremos un bereve análisis del impacto sobre el empleo del primer período completo bajo pandemia y medidas de aislamiento (2°trimestre 2020).

library(tidyverse)
library(eph)
library(readxl)
library(kableExtra)
library(scales)
options(rpubs.upload.method = "internal")

Desarrollo

Salario promedio por región

Metodología

Analizamos el salario promedio por región para probar si existen diferencias significativas entre los salarios que pagan las regiones, y discriminando por sexo, para conocer si existe una brecha salarial significativa. Para el análisis del salario promedio que pagan los empleadores, nos centramos únicamente en las variables de la EPH que responden a la condición de trabajadoras o trabajadores asalariados: ESTADO=1, para personas ocupadas; CAT_OCUP=3 para personas en relación de dependencia; y P21>0, para concentrarnos en las personas que no trabajan ad honorem y que reciben un salario.

Resultados

Si analizamos el salario promedio de los varones, encontramos que la región que mayores salarios promedio paga es la región pampeana, seguida con bastante diferencia entre sí por el Gran Buenos Aires. Las mujeres ganan en todos los casos un salario promedio menor que los varones, observando una mayor brecha salarial en las regiones que mayor salario promedio pagan.

Regiones <- diccionario_regiones %>% 
  rename(REGION = codigo, Region=region)

Aglomerados <- diccionario_aglomerados %>% 
  rename(AGLOMERADO = codigo, Aglomerado=aglo)

base <- get_microdata(year = 2020, trimester = 1, type = "individual") %>%
  left_join(.,Aglomerados, by="AGLOMERADO") %>% 
  left_join(.,Regiones, by="REGION") %>% 
  mutate(Sexo=factor(CH04, levels=c(1,2),
                     labels=c("Varones","Mujeres")))


Salario_promedio_region <- base %>%
  filter(ESTADO ==1, CAT_OCUP==3, P21>0) %>% 
  group_by(Region, Sexo) %>% 
  summarise(salario_promedio= round(weighted.mean(P21, PONDIIO, na.rm = FALSE)))  


Salario_promedio_region%>% 
  pivot_wider(names_from ="Sexo", values_from="salario_promedio") %>% 
  mutate("Brecha" = sprintf("%1.1f%%",-(1-Mujeres/Varones)*100)) %>% 
  arrange(desc(Brecha)) %>% 
  kbl(caption = "<b> Salario promedio y brecha salarial por región<b>", align = "c", format = "html", format.args = list(big.mark = ",")) %>% 
  kable_minimal("striped", full_width = T, font_size = 15, position = "right") %>% 
  add_footnote("Fuente: EPH-INDEC - 1°trimestre 2020", notation="alphabet")
Salario promedio y brecha salarial por región
Region Varones Mujeres Brecha
Patagonia 50,270 34,784 -30.8%
Pampeana 32,685 24,234 -25.9%
Noreste 26,048 19,624 -24.7%
Cuyo 28,698 22,559 -21.4%
GBA 35,216 27,831 -21.0%
Noroeste 24,881 20,778 -16.5%
a Fuente: EPH-INDEC - 1°trimestre 2020

Al mismo tiempo, observamos que si ordenamos las regiones a partir de las que pagan menos a las que pagan más, el orden se mantiene tanto para varones como para mujeres.

ggplot(data = Salario_promedio_region) +
  aes(x = reorder(Region, salario_promedio), y = salario_promedio, width=.7, fill = Sexo) +
  geom_bar(stat = "identity",
           position = position_dodge(),
           color = "white") +
  theme_update() +
  scale_fill_manual("Sexo", values = c("Varones" = "lightgoldenrod3", "Mujeres" = "brown3")) +
  labs(title = "Salario promedio por región",
       x = "Región",
       y = "Salario promedio",
       caption = "Fuente: EPH - INDEC. 1° trimestre 2020") +
  geom_text(aes(label=format(round(salario_promedio), big.mark = ",")), position=position_dodge(width=0.9), vjust=-0.25) +
  theme(axis.title.x = element_text(vjust = -1, size = rel(1.1), face = "bold"), 
        axis.title.y.left = element_text(size = rel(1.1), face = "bold", vjust = 2), 
        plot.title = element_text(size = rel(1.5), face = "bold"), 
        legend.title = element_text(face = "bold"),
        plot.background = element_rect(fill = "lemonchiffon2", colour = "black", size = 2))

Desigualdad salarial

Metodología

Con el objetivo de indagar sobre la desigualdad salarial entre las y los asalariados de cada región, hicimos una comparación entre el salario promedio del 50% de las y los asalariados que cobran menores salarios, y el 10% de las personas que cobran los mayores salarios. Para definir a las y los asalariados, usamos las mismas variables de la EPH que usamos en el análisis previo, para predefinir a las personas que cumplen la categoría de asalariados ocupados y que cobran un ingreso ( ESTADO=1, CAT_OCUP=3, P21>0). En este análisis lo que incorporamos es la variable RDECOCUR, que representa el n° de decil de ingreso de la ocupación principal en cada región. Como la EPH separa en deciles, agrupamos a las personas que se encuentran en los deciles 1 a 5 (Las observaciones que tienen RDCECOUR entre 1 a 5), para representar al 50% del total de personas de cada región que cobran un menor salario promedio; y por otro lado, a las personas que cobran el mayor salario promedio en cada región y que se encuentran en el decil 10 de la variable ( RDECOCUR=10). Las ponderaciones en este caso se realizan con la variable de la EPH PONDIIO, que es el ponderador de la ocupación principal.

Resultados

Observamos que en todas las regiones la diferencia entre los primeros 5 deciles y el decil 10 supera el 500%. Cuyo y GBA son las dos regiones que tienen mayores niveles de desigualdad salarial, superando el 600%.

Salario_deciles_bajos <- base %>%
  filter(P21>0 , RDECOCUR %in% c(1:5), ESTADO ==1, CAT_OCUP ==3) %>% 
  group_by(Region) %>% 
  summarise(salarios_bajos=weighted.mean(P21,PONDIIO))


Salario_deciles_altos <- base %>%
  filter(P21>0, RDECOCUR == 10, ESTADO ==1, CAT_OCUP ==3) %>% 
  group_by(Region) %>% 
  summarise(salarios_altos=weighted.mean(P21,PONDIIO)) %>%
  ungroup() %>% 
  select(2)


Desigualdad_region <- bind_cols(Salario_deciles_bajos, Salario_deciles_altos) %>% 
  mutate("Diferencia porcentual"=sprintf("%1.1f%%",salarios_altos*100/salarios_bajos)) %>% 
  select(1,4) %>% 
  arrange(desc(`Diferencia porcentual`))



Desigualdad_region %>%
  kbl(caption = "<b>Diferencia del salario promedio entre el 50% de menores salarios y el 10% de mayores salarios<b>", align = "c", format = "html") %>% 
  kable_minimal("striped", full_width = T, font_size = 15, position = "right") %>% 
  add_footnote("Fuente: EPH-INDEC - 1°trimestre 2020", notation="alphabet")
Diferencia del salario promedio entre el 50% de menores salarios y el 10% de mayores salarios
Region Diferencia porcentual
Cuyo 638.8%
GBA 600.2%
Noroeste 569.5%
Noreste 546.4%
Patagonia 539.1%
Pampeana 510.1%
a Fuente: EPH-INDEC - 1°trimestre 2020

Desempleo

Metodología

Con el fin de conocer las distintas tasas de desempleo presentes en cada una de las regiones en el período 1°trimestre 2020, se calcularon: la población cubierta por la EPH, la cantidad de ocupados ( ESTADO=1), la cantidad de desocupados ( ESTADO=2) y la cantidad de personas económicamente activas ( ocupados + desocupados), para obtener las tasas de desocupación ( Desocupados/PEA) correspondientes a cada región y discriminando por sexo. En todos los casos, como estamos trabajando con cantidades de personas, se utiliza la variable PONDERA de la EPH como ponderador.

Resultados

Observamos que para el 1°trimestre de 2020 Gran Buenos Aires es la región que posee una mayor tasa de desempleo, seguida por el Noroeste. Cuando analizamos la situación de las mujeres, observamos que en todas las regiones, excepto en la Patagonia, las tasas de desempleo son mayores, evidenciando mayores dificultades para las mujeres en todas las regiones para obtener trabajo asalariado. A diferencia de la situación de los varones, la región con mayor desempleo femenino es la región pampeana y no la del Gran Buenos Aires (aunque la diferencia es mínima). La región pampeana evidencia la mayor diferencia en el acceso al trabajo entre varones y mujeres. De todas maneras, al igual que en el caso de los varones, tanto en el Gran Buenos Aires como en el Noreste, los valores de desempleo continúan siendo los más altos del país (si exceptuamos la región pampeana).

base2 <- get_microdata(year = c(2017:2020), trimester = c(1:4), type = "individual") %>% 
  select(microdata) %>% 
  unnest(microdata) %>% 
  left_join(.,Aglomerados, by="AGLOMERADO") %>% 
  left_join(.,Regiones, by="REGION") %>% 
  mutate(Sexo = factor(CH04, levels=c(1,2),
                     labels=c("Varones","Mujeres")),
         Período = paste(TRIMESTRE, ANO4, sep = "."))



base_desempleo <- base2 %>% 
  filter(Período=="1.2020") %>% 
  group_by(Region, Sexo) %>%
  summarise(Población = sum(PONDERA),
            Ocupados  = sum(PONDERA[ESTADO == 1], na.rm = TRUE),
            Desocupados = sum(PONDERA[ESTADO == 2], na.rm = TRUE),
            PEA = Ocupados + Desocupados,
            'Tasa Desocupación (%)' = Desocupados/PEA) %>%
  select(1,2,7)

base_desempleo_tabla <- base_desempleo %>% 
  pivot_wider(names_from = Sexo, values_from = `Tasa Desocupación (%)`) %>% 
  arrange(-Varones, -Mujeres)
base_desempleo_tabla$Varones <- scales::percent(base_desempleo_tabla$Varones, accuracy = 0.1)
base_desempleo_tabla$Mujeres <- scales::percent(base_desempleo_tabla$Mujeres, accuracy = 0.1) 
  

 base_desempleo_tabla %>% 
  kbl(caption = "<b>Tasa de desempleo<b>", align = "c", format = "html") %>% 
  kable_minimal("striped", full_width = T, font_size = 15, position = "right") %>% 
  add_footnote("Fuente: EPH-INDEC - 1°trimestre 2020", notation="alphabet")
Tasa de desempleo
Region Varones Mujeres
GBA 11.2% 11.9%
Noroeste 9.1% 10.9%
Pampeana 8.6% 12.0%
Patagonia 8.1% 6.4%
Cuyo 5.9% 8.8%
Noreste 5.0% 6.0%
a Fuente: EPH-INDEC - 1°trimestre 2020

Como explicábamos anteriormente, si graficamos y ordenamos de menor a mayor las tasas de desempleo regionales, vemos que difiere el orden de las regiones al comparar varones y mujeres. Tanto la región pampeana como la región cuyana son las que poseen una mayor diferencia entre el desemeplo femenino y masculino, lo que podría evidenciar una mayor dificultad de las mujeres para acceder a puestos de trabajo en estas regiones en particular, en comparación con los varones.

ggplot(data = base_desempleo) +
  aes(x = reorder(Region, `Tasa Desocupación (%)`), y = `Tasa Desocupación (%)`*100, width=.7, fill = Sexo) +
  geom_bar(stat = "identity",
           position = position_dodge(),
           color = "white") +
  theme_update() +
  scale_fill_manual("Sexo", values = c("Mujeres" = "brown3","Varones" = "lightgoldenrod3")) +
  labs(title = "Tasas de desempleo por región y sexo",
       subtitle = "1° trimestre 2020",
       x = "Región",
       y = "Desempleo (%)",
       caption = "Fuente: EPH - INDEC. 1° trimestre 2020") +
  geom_text(
    aes(label = sprintf("%1.1f%%",
                        `Tasa Desocupación (%)`*100)), 
    position=position_dodge(width=0.9), vjust=-0.25) +
  theme(axis.title.x = element_text(vjust = -1, size = rel(1.1), face = "bold"), 
        axis.title.y.left = element_text(size = rel(1.1), 
                                         face = "bold"), 
        plot.title = element_text(size = rel(1.5), 
                                  face = "bold"), 
        legend.title = element_text(face = "bold"),
        plot.background = element_rect(fill = "lemonchiffon2", colour = "black", size = 2))

Empleo estatal

Metodología

Recurrimos a analizar la proporción de empleo estatal sobre el empleo total presente en cada región y discriminado por sexo, para analizar si existe alguna dificultad del sector privado para absorber trabajadores y trabajadoras y generar puestos de trabajo.

Incoporamos las mismas variables de la EPH que hemos utilizado en elanálisis salarial para trabajadoras y trabajadores asalariados ( P21>0, ESTADO=1, CAT_OCUP=3 ), incorporando aquella que refiera al tipo de establecimiento donde trabaja la persona: PP04A igual a 1 ó 2, para un establecimiento estatal o privado, respectivamente.

Resultados

Encontramos que las regiones del Noreste, Patagonia y Noroeste son las que mayor porcentaje de empleo estatal tienen, lo que podría mostrar un sector privado más pequeños o con mayores dificultades para brindar oportunidades de trabajo que absorban a la mano de obra.

Si nos centramos en la condición de las mujeres, encontramos que el procentaje de empleo estatal es mucho más alto en todos los casos, resaltando particularmente las regiones del Noreste y la Patagonia, donde casi la mitad de las mujeres asalariadas trabajan para el estado, lo que podría evidenciar, en todas las regiones pero, sobretodo en estas últimas, una discriminación marcada a la hora de ofrecer oportunidades de trabajo en el sector privado para las mujeres. Particularmente es llamativo que estas dos regiones (Patagonia y Noreste), también son las que poseen menores tasas de desempleo femenino, lo que podría reflejar que esta menor desigualdad en el acceso al trabajo asalariado se debe al Estado y no al sector privado. El caso de la Patagonia es más marcado, porque la tasa de desempleo femenina es menor que la tasa de desempleo masculina, y la diferencia de participación en el sector estatal entre ambos, es la más grandes de la muestra. Otra región donde la diferencia entre varones y mujeres es importante es en Cuyo.

base_establecimiento <- base %>% 
  filter(ESTADO ==1, CAT_OCUP==3, PP04A==1 | 2, na.rm = TRUE) %>%
select(PP04A, PONDERA, Region, Aglomerado, Sexo) %>% 
  mutate(establecimiento= case_when(PP04A==1 ~ "Estatal",
                                    PP04A==2 ~ "Privado")) %>% 
  group_by(Region, Sexo) %>% 
  summarise(Empleo_estatal = sum(PONDERA[establecimiento=="Estatal"],na.rm = TRUE)/
              sum(PONDERA, na.rm =TRUE)) %>% 
  mutate("Empleo estatal"=sprintf("%1.1f%%",Empleo_estatal*100))
   

base_establecimiento %>%
  select(1:2,4) %>% 
pivot_wider(names_from = Sexo, values_from = `Empleo estatal`) %>% 
  arrange(desc(Varones)) %>%
  arrange(desc(Mujeres)) %>% 
  kbl(caption = "<b>Empleo estatal como porcentaje del empleo total<b>", align = "c", format = "html") %>% 
  kable_minimal("striped", full_width = T, font_size = 15, position = "right") %>% 
  add_footnote("Fuente: EPH-INDEC - 1°trimestre 2020", notation="alphabet")
Empleo estatal como porcentaje del empleo total
Region Varones Mujeres
Patagonia 29.6% 45.9%
Noreste 36.7% 44.2%
Noroeste 29.4% 37.1%
Cuyo 22.5% 37.0%
Pampeana 20.4% 27.8%
GBA 16.3% 23.6%
a Fuente: EPH-INDEC - 1°trimestre 2020

Si graficamos los resultados, encontramos que si ordenamos a las regiones de las que tienen menor empleo estatal a las que tienen proporcionalmente más, encontramos que el ordenamiento se respeta tanto para varones como para mujeres, resaltando la diferencia entre sexos que antes mencionábamos.

ggplot(data = base_establecimiento) +
  aes(x = reorder(Region, Empleo_estatal*100), y = Empleo_estatal*100, width=.7, fill= Sexo) +
  geom_bar(stat = "identity",
           position = position_dodge(),
           color = "white", ) +
  theme_update() +
  scale_fill_manual("Sexo", values = c("Varones" = "lightgoldenrod3", "Mujeres" = "brown3")) +
  labs(title = "Empleo estatal como porcentaje del empleo total",
       x = "Región",
       y = "Empleo estatal (%)",
       caption = "Fuente: EPH - INDEC. 1° trimestre 2020") +
  geom_text(aes(label=sprintf("%1.1f%%",Empleo_estatal*100)), position=position_dodge(width=0.9), vjust=-0.25) +
  theme(axis.title.x = element_text(vjust = -1, size = rel(1.1), face = "bold"), 
        axis.title.y.left = element_text(size = rel(1.1), face = "bold", vjust = 2), 
        plot.title = element_text(size = rel(1.5), face = "bold"), 
        legend.title = element_text(face = "bold"),
        plot.background = element_rect(fill = "lemonchiffon2", colour = "black", size = 2))

Calidad de empleo

Metodología

Para conocer las características del mercado de trabajo asalariado de cada región, en cuanto a precariedad laboral e informalidad, discriminando por sexo, trabajamos con las mismas variables de la EPH utilizadas previamente, para quedarnos con los empleados asalariados ( ESTADO=1, CAT_OCUP=3, P21>0), añadiendo al análisis la variable PP07H que brinda información acerca de si la o el trabjador posee descuentos jubilatorios en sus ingresos: PP07H=1 si posee; PP07H=2 si no posee. Utilizamos esta variable como una proxy de la calidad del empleo.

Resultados

Exceptuando la región Patagónica que posee los menores valores de precariedad, entendida como ausencia de descuentos jubilatorios, y relativamente muy distintos al resto de las regiones; encontramos que todas las regiones tienen un nivel de precariedad por encima del 30%, alcanzando valores superiores al 40% tanto para varones como para mujeres en el Noroeste (la región con los valores más altos de precariedad), y para mujeres en Cuyo y el Noreste.

Calidad_empleo <- base %>% 
  filter(ESTADO==1, CAT_OCUP==3, P21>0) %>% 
  group_by(Region, Sexo) %>% 
  summarise(trabajo_informal = (sum(PONDERA[PP07H==2])/(sum(PONDERA[PP07H==1])+sum(PONDERA[PP07H==2]))))

Calidad_empleo_tabla <- Calidad_empleo %>% 
  pivot_wider(names_from = Sexo, values_from = trabajo_informal) %>% 
  arrange(desc(Varones)) %>% 
  arrange(desc(Mujeres))


Calidad_empleo_tabla$Varones <- scales::percent(Calidad_empleo_tabla$Varones, accuracy = 0.1)
Calidad_empleo_tabla$Mujeres <- scales::percent(Calidad_empleo_tabla$Mujeres, accuracy = 0.1) 
  

Calidad_empleo_tabla %>%  
  kbl(caption = "<b>Proporción de empleo sin aportes sobre el empleo total<b>", align = "c", format = "html") %>% 
  kable_minimal("striped", full_width = T, font_size = 15, position = "right") %>% 
  add_footnote("Fuente: EPH-INDEC - 1°trimestre 2020", notation="alphabet")
Proporción de empleo sin aportes sobre el empleo total
Region Varones Mujeres
Noroeste 40.7% 43.3%
Noreste 36.2% 43.1%
Cuyo 39.1% 40.0%
Pampeana 32.0% 38.5%
GBA 32.6% 35.3%
Patagonia 16.6% 22.4%
a Fuente: EPH-INDEC - 1°trimestre 2020

Si nos circunscribimos a la situación de las mujeres, encontramos que la prcariedad es siempre mayor en todas las regiones, incluso en la patagónica. Encontramos entonces, que también hay desigualdad por el sexo en el acceso a puestos de trabajo no precarios, aunque las diferencias no parecen ser demasiado significativas.

Podemos resaltar como llamativo los casos del Noroeste y la Patagonia, que siendo las dos regiones con más proporción de empleo estatal, tienen resultados muy distintos en la proporción de empleos sin aportes, lo que refleja condiciones diferentes de contratación en el Estado según la región.

ggplot(data = Calidad_empleo) +
  aes(x = reorder(Region, trabajo_informal), y = trabajo_informal, width=.7, fill = Sexo) +
  geom_bar(stat = "identity",
           position = position_dodge(),
           color = "white") +
  theme_get() +
  scale_fill_manual("Sexo", values = c("Mujeres" = "brown3","Varones" = "lightgoldenrod3")) +
  labs(title = "Proporción del empleo sin aportes sobre el empleo total",
       x = "Región",
       y = "Trabajdores (%)",
       caption = "Fuente: EPH - INDEC. 1° trimestre 2020") +
  geom_text(aes(label=sprintf("%1.1f%%", trabajo_informal*100)), position=position_dodge(width=0.9), vjust=-0.25) +
  theme(axis.title.x = element_text(vjust = -1, size = rel(1.1), face = "bold"), 
        axis.title.y.left = element_text(size = rel(1.1), face = "bold", vjust = 2), 
        plot.title = element_text(size = rel(1.5), face = "bold"), 
        legend.title = element_text(face = "bold"),
        plot.background = element_rect(fill = "lemonchiffon2", colour = "black", size = 2))

Calificación y edad poblacional

Metodología

Con el fin de intentar encontrar alguna posible explicación de los resultados obtenidos previamente, indagamos en algunas características de las sociedades de cada región, analizando si la calificación o la edad promedio en cada región, pueden explicar las diferencias entre los mercados de trabajo asalariado.

En cuanto a las variables que utilizamos en esta sección, nos basamos en las personas económicamente activas ( ESTADO=1 y ESTADO=2), de manera de centrarnos en el mercado de trabajo realmente existente y en condiciones de asumir un empleo de manera inmediata, y ver si tanto el máximo nivel educativo alcanzado o la edad poblacional tienen algún impacto en los distintos resultados entre regiones. Además utilizamos NIVEL_ED para recolectar el máximo nivel educativo alcanzado; y CH06, desde los 17 años (el mínimo para no ser considerado trabajo infantil) y agrupando a las personas en grupos de 10 años para facilitar la visualización. En todos los casos utilizamos PONDERA para ponderar la cantidad de personas.

Calificación de la población económicamente activa

Calificación <- base %>% 
  filter(ESTADO==1 | ESTADO==2) %>% 
  group_by(Region, Sexo) %>% 
  summarise("Sin instrucción o primaria incompleta"=sum(PONDERA[NIVEL_ED==1], 
                                                        PONDERA[NIVEL_ED==7])/sum(PONDERA)*100,
            "Primaria completa"=sum(PONDERA[NIVEL_ED==2])/sum(PONDERA)*100,
            "Secundaria incompleta"=sum(PONDERA[NIVEL_ED==3])/sum(PONDERA)*100,
            "Secundaria completa"=sum(PONDERA[NIVEL_ED==4])/sum(PONDERA)*100,
            "Universitaria incompleta"=sum(PONDERA[NIVEL_ED==5])/sum(PONDERA)*100,
            "Universitaria completa"=sum(PONDERA[NIVEL_ED==6])/sum(PONDERA)*100) %>% 
  pivot_longer(cols = c(3:8), names_to = "Educación", values_to = "Proporción")




ggplot(data = Calificación, aes(x = Region, y = Proporción, 
                                fill = factor(Educación, levels=c("Universitaria completa",
                                                                  "Universitaria incompleta",
                                                                  "Secundaria completa",
                                                                  "Secundaria incompleta",
                                                                  "Primaria completa",
                                                                  "Primaria incompleta",
                                                                  "Sin instrucción o primaria incompleta")),
                                        label = sprintf("%1.1f%%", Proporción))) + 
  geom_bar(stat="identity") +
  scale_fill_manual("Máximo nivel educativo alcanzado", values=c("coral3", 
                                                                 "khaki3", 
                                                                 "lightblue3", 
                                                                 "rosybrown3",
                                                                 "darkseagreen3",
                                                                 "slateblue3")) +
  labs(title = "Comparación entre regiones de la calificación de la PEA",
       x = "Región",
       y = "Población económicamente activa (%)",
       caption = "Fuente: EPH - INDEC. 1° trimestre 2020") +
  theme_bw() +
  geom_text(position = position_stack(vjust = 0.5), size=2, fontface = "bold") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7),
        axis.title.x = element_text(vjust = 1.7, size = rel(1.1), face = "bold"), 
        axis.title.y.left = element_text(size = rel(1.1), face = "bold", vjust = 2), 
        plot.title = element_text(size = rel(1.5), face = "bold"), 
        legend.title = element_text(face = "bold"),
        plot.background = element_rect(fill = "lemonchiffon2", colour = "black", size = 2),
        strip.text = element_text(size = rel(1.1), colour = "white"),
        strip.background = element_rect(fill = "grey30")) +
  facet_wrap(~Sexo)

A simple vista no parecería haber diferencias significativas en la calificación de la PEA entre las regiones, que expliquen los diferenciales en el mercado laboral que encontramos en las secciones anteriores. Por ejemplo, habíamos encontrado que las dos regiones que pagan mayores salarios promedio son la Patagonia y GBA. Sin embargo, ni la región patagónica ni el Gran Buenos Aires son las que tienen mayor porcentaje propio de universitarios (el máximo nivel de calificación de la EPH), y es más, GBA es la que acusa las mayores tasas de desempleo, junto con la región pampeana, que en este gráfico, llamativamente, es que la que mayor proporción de universitarios sobre el total de su PEA tiene, tanto en varones como en mujeres.

Sin embargo, lo más destacable, a contramano de lo que podríamos esperar, siguiendo los resultados previos, es que en todas las regiones, la proporción de mujeres con universitario completo sobre el total de mujeres económicamente activas, es mayor que la proporción de hombres con universitario completo, indicando que si nos limitamos a la población de la las mujeres económicamente activas, éstas son, en gran medida, de alta calificación, y aun así, perciben menores salarios promedio y tienen mayores dificultades para conseguir trabajo, resultados bastante distintos a lo que encontramos en varones de la PEA. Los resultados se vuelven aún más relevantes si expandimos el análisis a los y las que no terminaron la universidad, lo que implica personas que tuvieron algún contacto con el sistema universitario después de finalizar la secundaria. Casi el 50% de las mujeres en todas las regiones se encuentra en esta situación; números muy superiores a los que se ven en la población de varones.

Rango etario

Rango_etario <- base %>% 
  filter(ESTADO==1 | ESTADO==2) %>% 
  group_by(Region) %>% 
  summarise("Entre 17 y 30 años"=sum(PONDERA[CH06>16 & CH06<30])/sum(PONDERA)*100,
            "Entre 30 y 40 años"=sum(PONDERA[CH06>=30 & CH06<40])/sum(PONDERA)*100,
            "Entre 40 y 50 años"=sum(PONDERA[CH06>=40 & CH06<50])/sum(PONDERA)*100,
            "Entre 50 y 60 años"=sum(PONDERA[CH06>=50 & CH06<60])/sum(PONDERA)*100,
            "Mayores de 60 años"=sum(PONDERA[CH06>60])/sum(PONDERA)*100) %>% 
  pivot_longer(cols = c(2:6), names_to = "Edad", values_to = "Proporción")


ggplot(data = Rango_etario, aes(x = Region, y = Proporción, fill = factor(Edad, levels=c("Entre 17 y 30 años",
                                                                                              "Entre 30 y 40 años",
                                                                                              "Entre 40 y 50 años",
                                                                                              "Entre 50 y 60 años",
                                                                                              "Mayores de 60 años")),
                                label = sprintf("%1.1f%%", Proporción))) + 
  geom_bar(stat="identity") +
  scale_fill_manual("Rango etario", values=c("coral3", "khaki3", "lightblue3", "darkseagreen3", "rosybrown3")) +
  labs(title = "Comparación entre regiones del rango etario de la PEA",
       x = "Región",
       y = "Población económicamente activa (%)",
       caption = "Fuente: EPH - INDEC. 1° trimestre 2020") +
  theme_bw() +
  geom_text(position = position_stack(vjust = 0.5), size=3, fontface = "bold") +
  theme(axis.title.x = element_text(vjust = 1.1, size = rel(1.1), face = "bold"), 
        axis.title.y.left = element_text(size = rel(1.1), face = "bold", vjust = 2), 
        plot.title = element_text(size = rel(1.5), face = "bold"), 
        legend.title = element_text(face = "bold"),
        plot.background = element_rect(fill = "lemonchiffon2", colour = "black", size = 2))

Mirando la edad poblacional de cada región, no se evidencian a simple vista diferencias significativas en la proporción etaria de la PEA que puedan explicar los resultados obtenidos previamente.

Serie de tiempo y variación interanual de indicadores laborales (impactos del 1° trimestre bajo la pandemia)

Por último hicimos un análisis de la evolución de los indicadores laborales y el impacto del primer trimestre completo bajo la pandemia y las medidas de aislamiento.

Podemos observar que hay un abrupto aumento, en el último trimestre ( 2.2020), de la tasa de desocupación pero que no refleja en plenitud lo que sucede en el mercado de trabajo ya que, debido al freno de la activdad económica y las medidas de aislamiento, muchas de las personas se vieron desincentivadas o imposibilitadas de buscar empleo, lo que se refleja en la fuerte caída de la tasa de actividad. Es necesario mirar ambas variables en conjunto para comprender el impacto en su totalidad.

base_empleo <- base2 %>% 
  group_by(Período, Region) %>%
  summarise(población = sum(PONDERA),
            ocupados  = sum(PONDERA[ESTADO == 1]),
            desocupados = sum(PONDERA[ESTADO == 2]),
            PEA = ocupados + desocupados,
            'Ocupación' = ocupados/población,
            'Desocupación' = desocupados/PEA,
            'Actividad' = PEA/población) %>% 
  ungroup()

base_empleo$Período <- factor(base_empleo$Período, levels=c("1.2017","2.2017","3.2017","4.2017",
                                                          "1.2018","2.2018","3.2018","4.2018",
                                                          "1.2019","2.2019","3.2019","4.2019",
                                                          "1.2020","2.2020"))




base_empleo%>%
  select(1,2,8,9) %>% 
  pivot_longer(cols = c(3,4), names_to = "Tasas", values_to = "Valor") %>% 
  ggplot() +  
  aes(x = Período,  
      y = Valor*100,   
      group = Region,  
      color = Region) +
  geom_line(aes(linetype=Region)) + 
  geom_point(aes(shape=Region)) +  
  labs(x = "Trimestre", y = "Tasa", 
       title = "Serie de tiempo tasas de actividad y desempleo", 
       subtitle = "1°trimestre 2017 a 2°trimestre 2020", 
       caption ="Fuente: EPH - INDEC. 2017-2020") +
  facet_wrap(~ Tasas, scales = "free_y") +
  theme_light() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 7), 
        axis.title.x = element_text(vjust = -1, size = rel(1.1), face = "bold"), 
        axis.title.y.left = element_text(size = rel(1.1), face = "bold"), 
        plot.title = element_text(size = rel(1.5), face = "bold"), 
        strip.text = element_text(size = rel(1.1), colour = "white"),
        strip.background = element_rect(fill = "grey30"),
        plot.background = element_rect(fill = "lemonchiffon2", colour = "black", size = 2),
        legend.title = element_text(face = "bold"),
        panel.spacing = unit(0.3, "in"))

Si miramos la variación interanual, observamos que todos los indicadores empeoraron (ocupación, actividad y desocupación). Se puede observar lo que advertíamos previamente: si nos centráramos únicamente en la tasa de desocupación, GBA y el Noroeste parecieran ser los menos afectados (el Noroeste incluso reduce su desocupación), pero si miramos la tasa de actividad, estas dos regiones son las que sufrieron las caídas más abruptas, lo que también se refleja en las fuertes caídas en las tasas de empleo.

base_ocupación <- base_empleo %>%
  filter(Período == "2.2019" | Período == "2.2020") %>% 
  group_by(Region) %>%
  select(1,2,7) %>% 
  pivot_wider(names_from = Período, values_from = Ocupación) %>% 
  rename("ocupación_2019" = "2.2019", "ocupación_2020" = "2.2020")

base_desocupación <- base_empleo %>% 
  filter(Período == "2.2019" | Período == "2.2020") %>% 
  group_by(Region) %>%
  select(1,2,8) %>% 
  pivot_wider(names_from = Período, values_from = Desocupación) %>% 
  rename("desocupación_2019" = "2.2019", "desocupación_2020" = "2.2020") %>%
  ungroup() %>% 
  select(2,3)

base_actividad <- base_empleo %>% 
  filter(Período == "2.2019" | Período == "2.2020") %>% 
  group_by(Region) %>%
  select(1,2,9) %>% 
  pivot_wider(names_from = Período, values_from = Actividad) %>% 
  rename("actividad_2019" = "2.2019", "actividad_2020" = "2.2020") %>% 
  ungroup() %>% 
  select(2,3)


base_interanual <- bind_cols(base_ocupación, base_desocupación, base_actividad)

base_interanual_tabla <- base_interanual

base_interanual_tabla$ocupación_2019 <- scales::percent(base_interanual_tabla$ocupación_2019, accuracy = 0.1)
base_interanual_tabla$ocupación_2020 <- scales::percent(base_interanual_tabla$ocupación_2020, accuracy = 0.1)  
base_interanual_tabla$desocupación_2019 <- scales::percent(base_interanual_tabla$desocupación_2019, accuracy = 0.1)
base_interanual_tabla$desocupación_2020 <- scales::percent(base_interanual_tabla$desocupación_2020, accuracy = 0.1)
base_interanual_tabla$actividad_2019 <- scales::percent(base_interanual_tabla$actividad_2019, accuracy = 0.1)
base_interanual_tabla$actividad_2020 <- scales::percent(base_interanual_tabla$actividad_2020, accuracy = 0.1)


base_interanual_tabla %>% 
  kbl(caption = "<b>Comparación interanual de tasas<b>", align = "c", format = "html",
      col.names = c("Región","2.2019","2.2020","2.2019","2.2020","2.2019", "2.2020")) %>%   
  kable_minimal("striped", full_width = T, font_size = 15, position = "right" ) %>% 
  add_footnote("Fuente: EPH-INDEC. 2°trimestre 2019-2020", notation="alphabet") %>% 
  add_header_above(c(" ", "Ocupación" = 2, "Desocupación" = 2, "Actividad" = 2))
Comparación interanual de tasas
Ocupación
Desocupación
Actividad
Región 2.2019 2.2020 2.2019 2.2020 2.2019 2.2020
Cuyo 41.7% 36.6% 6.3% 11.4% 44.5% 41.3%
GBA 43.7% 32.7% 11.9% 13.2% 49.6% 37.6%
Noreste 37.9% 34.5% 3.7% 7.2% 39.4% 37.1%
Noroeste 41.2% 33.5% 9.4% 9.1% 45.5% 36.8%
Pampeana 42.1% 33.8% 11.0% 16.7% 47.3% 40.6%
Patagonia 41.6% 33.6% 7.1% 10.0% 44.7% 37.3%
a Fuente: EPH-INDEC. 2°trimestre 2019-2020
base_interanual <- base_interanual %>% 
  group_by(Region) %>% 
  summarise(Ocupación = round((ocupación_2020 - ocupación_2019)/ocupación_2019*100, digits = 2),
            Desocupación = round((desocupación_2020 - desocupación_2019)/desocupación_2019*100, digits = 2),
            Actividad = round((actividad_2020 - actividad_2019)/actividad_2019*100, digits = 2)) %>% 
  pivot_longer(cols = c(2:4), names_to = "Tasa", values_to = "Variación")
  

base_interanual$Tasa <- factor(base_interanual$Tasa, levels = c("Ocupación", "Desocupación", "Actividad"))


ggplot(data = base_interanual) +
  aes(x = Region, y = Variación, width=.7, fill = Tasa) +
  geom_bar(stat = "identity",
           position = position_dodge(),
           color = "white") +
  theme_update() +
  scale_fill_manual("Sexo", values = c("Ocupación" = "brown3","Desocupación" = "lightskyblue3", "Actividad" = "palegreen3")) +
  labs(title = "Variación interanual de indicadores de empleo",
       subtitle = "2° trimestre 2019-2020",
       x = "Región",
       y = "Variación (%)", 
       caption = "Fuente: EPH - INDEC. 2° trimestre 2019-2020") +
  geom_text(aes(label=sprintf("%1.1f%%", Variación)), position=position_dodge(width=0.9), vjust=1.2, size = 2, fontface= "bold") +
  facet_wrap(~Tasa) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 8), 
        axis.title.x = element_text(vjust = -1, size = rel(1.1), face = "bold"), 
        axis.title.y.left = element_text(size = rel(1.1), face = "bold"), 
        plot.title = element_text(size = rel(1.5), face = "bold"), 
        strip.text = element_text(size = rel(1.1), colour = "white"),
        legend.title = element_text(face = "bold"),
        strip.background = element_rect(fill = "grey30"),
        plot.background = element_rect(fill = "lemonchiffon2", colour = "black", size = 2))

Conclusiones

A lo largo del trabajo repasamos algunos de los indicadores que reflejan las condiciones del mercado de trabajo en cada una de las regiones, encontrando importantes diferencias entre ellas. También analizamos las mismas condiciones discriminando entre varones y mujeres, encontrando que las mujeres se encuentran en una peor posición en todos los casos.
Estas diferencias regionales y por sexo que encontramos, no pudimos explicarlas ni por la composición educativa del mercado de trabajo de que cada región, ni por la composición etaria de las mismas. Al contrario, los resultados son inversos, en muchos casos, a los que hubiesemos esperado, sobretodo con respecto a la calificación del mercado de trabajo femenino, donde vimos que las mujeres económicamente activas están comparativamente más educadas.

Por último, de manera provisoria, analizamos el impacto del 1° trimestre completo bajo pandemia y medidas de aislamiento sobre los principales indicadores laborales (tasa de desocupación, de ocupación y de actividad), encontrando un empeoramiento en todos ellos. El rasgo distintivo es la fuerte caída de la tasa de actividad, producto del cese de actividades y las medidadas de aislamiento que desincentivaron la búsqueda de trabajo.

Hacia el futuro, con mas períodos bajo pandemia transcurridos, sería interesante analizar el impacto sufrido por cada una de las variables que analizamos en este trabajo, y conocer los diferentes efectos, si es que los hay, entre varones y mujeres.