1. Introducción

El análisis de la productividad laboral constituye un tema central en la economía, ya que permite evaluar la eficiencia con la que se utilizan los recursos en la generación de bienes y servicios para generar valor (Ruralcaja, s.f.). En este contexto, el indicador de PIB por trabajador (ajustado al poder adquisitivo de 2017) permite comparar el desempeño productivo entre países, independientemente de diferencias en precios y niveles de vida.

Diversos factores del mercado laboral influyen en la productividad, tales como la estructura del empleo, la calidad de los puestos de trabajo y la participación de distintos grupos en la actividad económica. Variables como el empleo en el sector agrícola, el trabajo asalariado, el empleo a tiempo parcial y la participación de mujeres en cargos de alta responsabilidad pueden reflejar características estructurales que inciden en la generación de valor por trabajador. Asimismo, las diferencias geográficas entre regiones pueden capturar condiciones institucionales, tecnológicas y económicas que afectan el desempeño productivo.

En este escenario, el año 2018 se caracterizó por iniciar con un crecimiento dinámico, impulsado por el repunte de la manufactura mundial y el comercio internacional observado en 2017. No obstante, este impulso se fue desacelerando a medida que disminuyó la confianza en las perspectivas económicas globales (FMI, 2018). Este comportamiento no fue homogéneo entre regiones. Por un lado, Estados Unidos presentó un crecimiento acelerado, favorecido por una política fiscal expansiva. Por otro lado, economías como China implementaron medidas orientadas a moderar su ritmo de crecimiento, con el objetivo de reducir riesgos financieros asociados a la acumulación de deuda. En contraste, la economía europea experimentó una desaceleración, influenciada por factores como el aumento en los precios del petróleo, la apreciación del euro y diversas incertidumbres internas en países como Italia y Alemania, en un contexto de menor dinamismo del comercio mundial.

Estas diferencias en el desempeño económico entre regiones reflejan condiciones estructurales distintas, particularmente en el mercado laboral. En este sentido, resulta pertinente analizar cómo la estructura del empleo se relaciona con la productividad, medida a través del PIB por trabajador, mediante un modelo de regresión lineal múltiple. Este enfoque permite evaluar simultáneamente el efecto de varias variables explicativas sobre el PIB por trabajador, así como controlar por diferencias regionales mediante la inclusión de una variable categórica.

El objetivo principal es identificar qué factores del mercado laboral están asociados con mayores niveles de productividad, así como evaluar la capacidad explicativa del modelo propuesto en un contexto internacional en el año 2018.

2. Metodología

La información utilizada para el presente análisis proviene de la base de datos World Development Indicators (WDI) del Banco Mundial, la cual contiene indicadores económicos, sociales y laborales para diferentes países. Esta fuente garantiza la comparación y consistencia de los datos, permitiendo estudiar los fenómenos económicos en distintos contextos geográficos.

Para el desarrollo del análisis se emplearon datos correspondientes al año 2018. De esta manera, se parte de un conjunto de países; no obstante, 34 observaciones fueron excluidas de la estimación del modelo debido a la presencia de valores faltantes (NA) en al menos una de las variables incluidas. Esta exclusión corresponde a registros con ausencia de datos en variables como empleo a tiempo parcial o mujeres en altos cargos, los cuales no contaban con información disponible para el período analizado. En consecuencia, el modelo de regresión fue estimado con un total 51 observaciones completas.

Es importante resaltar que esta reducción de la muestra constituye una limitación metodológica relevante, ya que puede permitir sesgos si los datos faltantes no son aleatorios. Por ejemplo, si los países con datos ausentes en mujeres en altos cargos corresponden sistemáticamente a economías de menor desarrollo, los resultados podrían dimensionar el desempeño de países con mayor capacidad estadística.

A continuación, se presenta un la base de datos fitrada con la información correspondiente al año 2018:

library(readr)
library(readxl)
library(dplyr)
library(ggplot2)
library(corrplot)
library(car)
library(lmtest)
library(broom)
library(knitr)
library(kableExtra)
library(scales)
library(plotly)
library(grid)

Base_Taller1 <- read_excel("Base_Taller1.xlsx")
Año_2018 <- Base_Taller1 %>% filter(Año == 2018)

Año_2018 <- Año_2018 %>%
  rename(
    emp_t_parcial = Empleo_Tiempo_Parcial,
    emp_mayores15 = Empleo_Mayores15,
    emp_agri = Empleo_Agricultura,
    emp_asalariados = Total_Trabajadores_Salariados,
    muj_alt_cargo = Mujeres_Alto_Cargo,
    PIB = `PIB_por_trabajador _(PPP 2017)`
  ) %>%
  mutate(across(c(emp_t_parcial, emp_mayores15, emp_agri,  
                  emp_asalariados, muj_alt_cargo, PIB), 
                ~ as.numeric(gsub(",", ".", .x))))

Año_2018

Asimismo, los 85 países contenidos se filtraron según su ubicación geográfica en los siguientes 6 grupos:

América del Norte con 3 países.
América del Centro con 7 países.
El Caribe con 13 países.
América del Sur con 12 países.
Europa con 40 países incluyendo la Federación Rusa.
Asia con 10 países.

Dicha clasificación se realizó con el propósito de lograr una representación más precisa de las características geográficas y económicas de los países analizados, tomando en cuenta todas las regiones disponibles en la base de datos.

norteamerica <- c("Canada", "United States", "Mexico")

centroamerica <- c("Belize", "Costa Rica", "El Salvador", "Guatemala",
"Honduras", "Nicaragua", "Panama")

caribe <- c("Bahamas, The", "Barbados", "Cuba", "Curacao",
            "Dominican Republic", "Haiti", "Jamaica", "Puerto Rico",
            "St. Lucia", "St. Vincent and the Grenadines",
            "Trinidad and Tobago", "British Virgin Islands",
            "Virgin Islands (U.S.)")
suramerica <- c("Argentina", "Bolivia", "Brazil", "Chile", "Colombia",
                "Ecuador", "Guyana", "Paraguay", "Peru",
                "Suriname", "Uruguay", "Venezuela, RB")
europa <- c("Albania", "Austria", "Belarus", "Belgium",
            "Bosnia and Herzegovina", "Bulgaria", "Croatia",
            "Czechia", "Denmark", "Estonia", "Finland", "France",
            "Germany", "Greece", "Hungary", "Iceland", "Ireland",
            "Italy", "Kosovo", "Latvia", "Lithuania", "Luxembourg",
            "Moldova", "Montenegro", "Netherlands", "North Macedonia",
            "Norway", "Poland", "Portugal", "Romania", "Serbia",
            "Slovak Republic", "Slovenia", "Spain", "Sweden",
            "Switzerland", "Ukraine", "United Kingdom",
            "Channel Islands", "Russian Federation")

asia <- c("Armenia", "Azerbaijan", "Cyprus", "Georgia",
          "Kazakhstan", "Kyrgyz Republic", "Tajikistan",
          "Turkiye", "Turkmenistan", "Uzbekistan")


Año_2018 <- Año_2018 %>%
  mutate(region = case_when(
    País %in% norteamerica ~ "America del Norte",
    País %in% centroamerica ~ "America del Centro",
    País %in% suramerica ~ "America del Sur",
    País %in% caribe ~ "Caribe",
    País %in% europa ~ "Europa",
    País %in% asia ~ "Asia",
    TRUE ~ NA_character_
  ))

2.2 Descripción de Variables

Para la realización del modelo se implementa una única variable dependiente y cinco variables explicativas como independientes relacionadas con el mercado laboral.

Variable Dependiente

- Productividad Laboral (PIB por trabajador) (Y): es medida a través del indicador GDP per person employed (constant 2017 PPP $) el cual refleja el valor del producto interno bruto generado por cada trabajador, ajustado por paridad del poder adquisitivo. Este indicador permite evaluar la eficiencia productiva del trabajo para poder realizar comparaciones internacionales.

Variables Independientes

Las variables incluidas en el modelo fueron seleccionadas con base en su relevancia teórica para explicar la productividad laboral. En particular, se consideran indicadores que capturan la estructura del mercado laboral desde distintas dimensiones, tales como la composición por sectores del empleo, el grado de formalización, la intensidad del uso del factor trabajo y la calidad de la participación laboral.

Estas dimensiones resultan fundamentales, ya que, la productividad no depende únicamente de la cantidad de trabajo, sino también de su asignación entre sectores, sus condiciones de empleo y el nivel de desarrollo institucional. De esta manera, las variables seleccionadas permiten aproximar distintos factores estructurales que influyen en la eficiencia productiva a nivel internacional:

-Empleo a tiempo parcial (% del empleo total): representa la proporción de trabajadores que laboran bajo esquemas de jornada reducida. Esta variable puede reflejar niveles de flexibilidad laboral, pero también puede estar asociada a menor intensidad en el uso del factor trabajo, lo cual podría incidir en la productividad.

-Población empleada mayor de 15 años (%): mide la proporción de personas mayores de 15 años que se encuentran empleadas. Esta variable permite capturar el nivel de utilización de la fuerza laboral disponible dentro de la economía.

- Empleo en agricultura (% del empleo total): indica la proporción de trabajadores ocupados en el sector primario. Las regiones cuya estructura laboral se basa en este tipo de actividades tienden, en términos generales, a presentar menores niveles de incorporación tecnológica y una menor generación de valor agregado, en comparación con sectores como la industria o los servicios.

- Trabajadores asalariados (% del empleo total): mide la proporción de trabajadores que reciben un salario formal. Un mayor nivel de empleo asalariados suele reflear mayores tasas de empleos formales, lo cual puede estar asociado a mejores condiciones de trabajo y mayor estabilidad.

-Mujeres en altos cargos (%): representa la participación femenina en posiciones de liderazgo o toma de decisiones dentro de las organizaciones. Esta variable permite aproximar aspectos relacionados con la equidad de género y la diversidad en la gestión, factores que pueden influir en la eficiencia organizacional y la productividad.

Variable Categórica

- Región: clasifica a los países según su ubicación geográfica. Esta variable permite capturar diferencias estructurales entre regiones del mundo, tales como niveles de desarrollo económico, características institucionales y condiciones del mercado laboral. En la estimación, Europa se toma como categoría de referencia, por lo que los coeficientes de las demás regiones indican en cuánto difiere su PIB por trabajador respecto a Europa, considerando constantes las demás variables incluidas en el modelo.

2.3. Modelo Utilizado:

Año_2018$region <- as.factor(Año_2018$region)
Año_2018$region <- relevel(Año_2018$region, ref = "Europa")

modelo <- lm(PIB~
            emp_t_parcial+
            emp_mayores15+
            emp_agri+ 
            emp_asalariados+
            muj_alt_cargo+ region,  
             data = Año_2018)

Con el propósito de analizar la relación entre la productividad laboral y las variables independientes seleccionadas anteriormente, se estimó un modelo de regresión lineal múltiple. El cual permite evaluar de manera simultánea el efecto de varias variables independientes sobre una variable dependiente, controlando la influencia individual de cada una de ellas. Asimismo, se incorpora una variable categórica correspondiente a la región geográfica, con el fin de capturar posibles diferencias estructurales entre regiones y mejorar la capacidad explicativa del modelo.

Como ecuación general se tiene:

\[ PIB_i = \beta_0 + \beta_1(\text{emp_t_parcial})_i + \beta_2(\text{emp_mayores15})_i + \beta_3(\text{emp_agri})_i + \beta_4(\text{emp_asalariados})_i + \beta_5(\text{muj_alt_cargo})_i + \gamma D_i + \varepsilon_i \]

Donde:

-$PIB_i$: Productividad laboral del país $i$, medida como el PIB por trabajador.

-$\beta_0$: Término constante del modelo.

-$\beta_k$: Coeficientes asociados a cada variable independiente.

-$D_i$: Variable categórica que representa la región geográfica del país.

-$\gamma$: Parámetros asociados a las categorías regionales.

-$\varepsilon_i$: Término de error aleatorio.

3. Resultados Descriptivos

Con la finalidad de comprender el comportamiento general de las variables incluidas en el estudio, se realiza un análisis descriptivo de la información, el cual permite identificar patrones, tendencias y características relevantes de los datos, tales como su distribución, dispersión y posibles valores atípicos.

En particular, se examinan tanto las variables cuantitativas como la variable categórica, con el objetivo de obtener una visión general de la estructura del mercado laboral y su relación con el PIB. Lo anterior, proporciona un contexto inicial que facilita la interpretación de los resultados obtenidos posteriormente en el modelo econométrico.

3.1. Estadísticos Descriptivos (Variables Cuántitativas)

tabla <- data.frame(
  Estadistica = c( "Media", "Desviación estándar", "Minimo", "Máximo"),

  PIB = c(
    mean(Año_2018$PIB, na.rm = TRUE),
    sd(Año_2018$PIB, na.rm = TRUE),
    min(Año_2018$PIB, na.rm = TRUE),
    max(Año_2018$PIB, na.rm = TRUE)
  ),

 T_Parcial = c(
    mean(Año_2018$emp_t_parcial, na.rm = TRUE),
    sd(Año_2018$emp_t_parcial, na.rm =TRUE),
    min(Año_2018$emp_t_parcial, na.rm = TRUE),
    max(Año_2018$emp_t_parcial, na.rm = TRUE)
  ),

  Agricultura = c(
    mean(Año_2018$emp_agri, na.rm = TRUE),
    sd(Año_2018$emp_agri, na.rm = TRUE),
    min(Año_2018$emp_agri, na.rm = TRUE),
    max(Año_2018$emp_agri, na.rm = TRUE)
  ),

  Mayoresde15 = c(
    mean(Año_2018$emp_mayores15, na.rm = TRUE ),
    sd(Año_2018$emp_mayores15, na.rm = TRUE),
    min(Año_2018$emp_mayores15, na.rm =TRUE),
    max(Año_2018$emp_mayores15, na.rm = TRUE)
  ),

  Asalariados = c(
    mean(Año_2018$emp_asalariados, na.rm = TRUE),
    sd (Año_2018$emp_asalariados, na.rm = TRUE),
    min (Año_2018$emp_asalariados, na.rm = TRUE),
    max(Año_2018$emp_asalariados, na.rm = TRUE)
  ),

  Muj_Alto_Cargo = c(
    mean(Año_2018$muj_alt_cargo, na.rm = TRUE),
    sd(Año_2018$muj_alt_cargo, na.rm = TRUE),
    min(Año_2018$muj_alt_cargo, na.rm = TRUE),
    max(Año_2018$muj_alt_cargo, na.rm = TRUE)
  )
)


kable(tabla, caption = "Estadísticas Descriptivas")

Estadísticas Descriptivas
Estadistica	PIB	T_Parcial	Agricultura	Mayoresde15	Asalariados	Muj_Alto_Cargo
Media	62978.590	28.36459	12.17415	55.569646	74.29890	33.330357
Desviación estándar	40957.164	10.58908	10.87579	7.731171	15.60198	7.105079
Minimo	8344.735	7.39000	0.10000	34.199001	26.45000	16.299999
Máximo	241924.068	56.66000	45.76000	74.486000	95.82000	49.400002

En primer lugar, como se dijo anteriormente el PIB por trabajador es un indicador de productividad que se utiliza para aproximar el nivel de desarrollo económico de un país. Un mayor valor suele asociarse con economías más eficientes. De esta manera, su desviación estándar (40957.16) es considerablemente alta en relación con la media (62978.59), lo que evidencia una gran dispersión entre países, es decir, diferencias significativas en la productividad, esto se confirma al revisar el amplio rango entre el valor mínimo (8344.74) y el máximo (241924.07).

Por su parte, la variable Empleo a Tiempo Parcial presenta una media de 28.36%, lo que sugiere que, en promedio, cerca de una tercera parte de la población empleada se encuentra en esta modalidad. Su desviación estándar de 10.59 indica una variabilidad moderada, lo que refleja diferencias entre países en la estructura del mercado laboral.

Por otro lado, la variable Empleo en la Agricultura presenta una media de 12.17% y una desviación estándar de 10.88, valores muy cercanos entre sí, lo que indica una alta dispersión relativa. Esto sugiere que existen países donde el sector agrícola tiene una participación muy baja (0.1%), mientras que en otros representa una parte significativa del empleo (hasta 45.7%)*, reflejando diferencias en el desarrollo económico.

En ese orden de ideas, la variable Mayores de 15 años empleados tiene una media de 55.57%, lo que indica que poco más de la mitad de la población en edad de trabajar se encuentra empleada. Su desviación estándar (7.73) no es tan alta comparada con otras variables, lo que sugiere que este comportamiento es relativamente similar entre países. Aun así, al ver el mínimo (34.20%) y el máximo (74.49%), se nota la existencia de diferencias importantes en los niveles de empleo.

En cuanto a la variable Trabajadores asalariados, esta presenta una media de 74.30%, lo que indica que la mayoría de las personas ocupadas trabajan bajo este tipo de contratación. Su desviación estándar (15.60) es más alta, lo que muestra que hay países donde este tipo de empleo es mucho más común que en otros. Esto también se evidencia en el rango de valores, que va desde 26.45% hasta 95.82%, mostrando diferentes estructuras laborales entre países.

Finalmente, la variable Mujeres en altos cargos tiene una media de 33.33%, lo que indica que aproximadamente un tercio de estos cargos son ocupados por mujeres. Su desviación estándar (7.11) es relativamente moderada, lo que sugiere que no hay una variación tan extrema entre países como en otras variables. Sin embargo, al observar el mínimo (16.30%) y el máximo (49.40%), se evidencia que aún existen diferencias importantes en términos de participación femenina en posiciones de liderazgo.

3.2. Análisis de la Variable Categórica.

Luego de realizar el anális de las variables cualitativas del modelo, es pertinente hacer enfásis en los países que conforman la variable categórica región por medio de la siguiente tabla.

tabla_region <- data.frame(
  Frecuencia = table(Año_2018$region),
  Porcentaje = prop.table(table(Año_2018$region)) * 100
)


knitr::kable(tabla_region, caption = "Frecuencias y Porcentajes por Región")

Frecuencias y Porcentajes por Región
Frecuencia.Var1	Frecuencia.Freq	Porcentaje.Var1	Porcentaje.Freq
Europa	40	Europa	47.058824
America del Centro	7	America del Centro	8.235294
America del Norte	3	America del Norte	3.529412
America del Sur	12	America del Sur	14.117647
Asia	10	Asia	11.764706
Caribe	13	Caribe	15.294118

En cuanto a las regiones, se observa que Europa concentra la mayor cantidad de países en la muestra, con un total de 40 países, lo que equivale aproximadamente al 47.06%. Esto indica que casi la mitad de los datos provienen de esta región, por lo que puede tener un peso importante en los resultados generales. Además, es importante tener en cuenta que Europa se toma como la región de referencia en el modelo, por lo que las comparaciones de las demás regiones se hacen con respecto a esta.

Por otro lado, América del Sur representa el 14.12% con 12 países, mientras que Asia tiene una participación similar con el 11.76% equivalente a 10 países. Esto muestra que ambas regiones tienen una presencia moderada dentro del análisis.

Asimismo, el Caribe cuenta con 13 países, lo que corresponde al 15.29%, una proporción ligeramente mayor que América del Sur, lo que resulta interesante considerando el tamaño geográfico de la región.

En el caso de América del Centro, su participación es menor, con solo 7 países (8.24%), lo que indica una menor representación en comparación con otras regiones.

Finalmente, América del Norte con 3 países es decir el (3.53%) es la región con menor cantidad de países en la muestra.

3.3. Análisis de Relación entre Variables

Con el fin de evaluar las relaciones existentes entre las variables de estudio, se utiliza la matriz de correlación como una herramienta clave de análisis. Esta permite observar tanto la magnitud como la dirección de las asociaciones lineales entre variables, lo que facilita la identificación de patrones relevantes en los datos. Asimismo, su interpretación es útil para detectar posibles problemas de multicolinealidad, los cuales pueden afectar la estabilidad y validez de los resultados en el modelo econométrico.

Matriz de Correlación

datos_cor <- Año_2018 %>%
  select(
    PIB,
    emp_t_parcial, emp_mayores15, emp_agri,  
    emp_asalariados, muj_alt_cargo)

matriz_cor <- cor(datos_cor, use = "complete.obs")


col_vinotinto <- colorRampPalette(c("#4D0000", "white", "#800000"))(200)


corrplot(matriz_cor, 
         method = "color", 
         type = "upper", 
         col = col_vinotinto,      
         addCoef.col = "black", 
         tl.cex = 0.7,
         tl.srt = 45, 
         tl.col = "black", 
         cl.pos = "r", 
         cl.ratio = 0.2)

En la matriz, la fuerza de correlación se representa con un mapa de calor cuya escala va de -1 a 1. Los valores cercanos a 1 (vinotinto oscuro) indican una relación positiva fuerte, mientras que los cercanos a -1 (rojo oscuro) indican una relación negativa fuerte. Por su parte, los valores cercanos a 0 (blanco) indican que prácticamente no hay relación entre las variables.

Al analizar la gráfica se puede observar que:

PIB por trabajador vs empleo a tiempo parcial: Hay una relación positiva moderada (0.50), lo que sugiere que en países con mayor empleo a tiempo parcial también se observa un mayor PIB por trabajador, aunque esta relación no es tan fuerte.

PIB por trabajador vs trabajadores asalariados: Se observa una relación positiva moderada (0.61), lo que indica que a mayor proporción de trabajadores asalariados, el PIB por trabajador tiende a ser más alto. Esto puede asociarse con economías más formales y productivas.

PIB por trabajador vs empleo en agricultura: Existe una relación negativa (-0.60), lo que indica que cuando aumenta la participación del empleo en agricultura, el PIB por trabajador tiende a ser menor. Es decir, los países con mayor peso del sector agrícola suelen tener menor nivel de productividad.

PIB por trabajador vs empleo mayores de 15: Se observa una relación positiva baja (0.14), lo que indica que cuando aumenta el porcentaje de personas mayores de 15 años empleadas, el PIB por trabajador tiende a aumentar ligeramente. Sin embargo, como la correlación es débil, esto sugiere que esta variable no tiene una relación fuerte con la productividad económica y que el PIB depende más de otros factores.

Mujeres en altos cargos vs PIB por trabajador: Se observa una relación negativa baja (-0.36), lo que indica que cuando aumenta la participación de mujeres en altos cargos, el PIB por trabajador tiende a disminuir ligeramente. Sin embargo, como la correlación es débil, no se puede afirmar que exista una relación directa o significativa entre estas variables. Esto sugiere que la participación de mujeres en cargos directivos no depende únicamente del nivel de productividad económica, sino de otros factores sociales o institucionales.

En cuanto a la relación entre las variables independientes, en general no se observan correlaciones muy altas, lo cual es algo positivo para el modelo. Sin embargo, sí hay algunas relaciones importantes a tener en cuenta. La más destacada es entre trabajadores asalariados y empleo en la agricultura, que presentan una correlación negativa muy fuerte (-0.84), lo que indica que ambas variables están altamente relacionadas pero en sentido contrario, ya que en países con más empleo formal suele haber menos participación en el sector agrícola.

Por otro lado, el empleo a tiempo parcial y el empleo de mayores de 15 años tienen una correlación positiva moderada (0.46), lo que sugiere que tienden a moverse en la misma dirección. Las demás relaciones, como empleo a tiempo parcial con empleo en la agricultura (-0.32) y empleo de mayores de 15 con empleo en la agricultura (-0.16), son más débiles, por lo que no representan una relación significativa. En general, esto indica que la mayoría de variables no están fuertemente relacionadas entre sí.

3.4. Análisis Gráfico

De la misma manera, para complementar el análisis descriptivo y evaluar de manera más clara las relaciones entre las variables de estudio, se recurre al uso de herramientas gráficas, las cuales permiten identificar patrones, tendencias, posibles relaciones y valores atípicos que no siempre son evidentes a través de las medidas estadísticas ya evaluadas.

En esta sección se presentan diferentes tipos de visualizaciones que facilitan la comprensión del comportamiento de las variables, tanto de forma individual como en su interacción, proporcionando una base sólida para el posterior análisis e interpretación de los resultados del modelo.

3.4.1. Gráficas de Distribución por Variable

grafico1 <- ggplot(Año_2018, aes(x = PIB))+
  geom_histogram(bins = 20, fill = "#5c1212", color = "black")+
  labs(
    title = "Distribución del PIB por Trabajador", 
    x = "PIB por Trabajador (PPP 2017)", 
    y = "Frecuencia"
  )+ 
  geom_vline(aes(xintercept = mean(PIB, na.rm = TRUE)),
           color = "blue", linetype = "dashed")+
  theme_light()+
  theme(plot.title = element_text(face = "bold", color = "#800000"), 
    legend.position = "bottom")

ggplotly(grafico1)

El histograma de la distribución del PIB por trabajador (PPP 2017) muestra una marcada asimetría positiva, lo que indica que la mayoría de los países se concentran en niveles relativamente bajos de productividad, mientras que un grupo reducido alcanza valores significativamente más altos.

La mayor concentración de países se ubica en el primer tramo, entre $8.345 y $45.226, donde se acumulan 37 de los 85 países (aproximadamente el 44% de la muestra). A medida que aumentan los valores, la frecuencia cae notoriamente. Por su parte, el tramo entre $57.519 y $82.107 concentra otros 18 países, mientras que por encima de $94.400 el número de observaciones se reduce de forma progresiva.

De esta manera, se identifican dos valores atípicos en el extremo superior ($180.456 y $241.924), representando dos economías con niveles de productividad elevados en comparación con el resto de los países. Estos valores refuerzan la presencia de una cola larga hacia la derecha y reflejan las profundas desigualdades en productividad a nivel global.

En conjunto, el comportamiento de esta variable refleja una alta disparidad entre países, donde la mayoría presenta niveles moderados o bajos de productividad, mientras que solo unos pocos alcanzan niveles muy elevados, lo cual es consistente con las diferencias en desarrollo económico y estructura productiva a nivel global.

grafico2 <-  ggplot(Año_2018, aes(x = emp_t_parcial))+
  geom_histogram(bins = 20, fill = "#6f0303", color = "black")+
  labs(
    title = "Distribución del Empleo a Tiempo Parcial", 
    x = "% Empleo a Tiempo Parcial", 
    y = "Frecuencia"
  )+
  geom_vline(aes(xintercept = mean(emp_t_parcial, na.rm = TRUE)),
           color = "blue", linetype = "dashed")+
  theme_light()+
  theme(
    plot.title = element_text(face = "bold", color = "#800000"), 
    legend.position = "bottom")

ggplotly(grafico2)

Por su parte, el histograma de la variable empleo a tiempo parcial muestra una distribución con una concentración importante de observaciones en valores intermedios, aproximadamente entre el 22,9% y el 33,3% donde se ubican los tramos con mayor frecuencia indicando que la mayoría de los países presentan niveles moderados de empleo a tiempo parcial.

En términos de forma, la distribución presenta una ligera asimetría positiva, evidenciada por la presencia de algunos valores altos, entre el 20% y el 44%, siendo el valor más alto 56,7%, valores que se alejan del resto de los datos. Estos, pueden considerarse posibles atípicos, ya que no siguen el patrón general de concentración.

Asimismo, la dispersión de los datos es relativamente amplia, lo que sugiere una alta variabilidad entre países en cuanto a la proporción de empleo a tiempo parcial. Esto puede estar asociado a diferencias estructurales en los mercados laborales, como regulaciones, tipos de empleo predominantes o niveles de desarrollo económico.

De esta manera, el comportamiento de esta variable indica que, aunque existe una tendencia central clara, también hay diferencias significativas entre países, algo importante que se debe tener en cuenta en el posterior análisis del modelo.

grafico3 <- ggplot(Año_2018, aes(x = emp_mayores15))+
  geom_histogram(bins = 20, fill = "#982f2f", color = "black")+
  labs(
    title = "Distribución Empleo en Mayores de 15 Años", 
    x = "% Empleo en Mayores de 15 años", 
    y = "Frecuencia"
  )+
  geom_vline(aes(xintercept = mean(emp_mayores15, na.rm = TRUE)),
           color = "blue", linetype = "dashed")+
  theme_light()+
  theme(
    plot.title = element_text(face = "bold", color = "#800000"), 
    legend.position = "bottom")

ggplotly(grafico3)

El histograma de la variable empleo en mayores de 15 años presenta una distribución relativamente simétrica, con una ligera concentración de datos en el rango entre 55,4% y 59,6%, lo que indica que la mayoría de los países tienen una proporción similar de población ocupada dentro de este grupo etario.

A diferencia de otras variables, no se observa una asimetría marcada, aunque existe una leve cola hacia la derecha, evidenciada por algunos valores que superan el 70%. Estos pueden considerarse como valores atípicos moderados, pero no son lo suficientemente extremos como para distorsionar significativamente la distribución.

Asimismo, la dispersión de los datos es moderada, lo que sugiere que, en comparación con otras variables analizadas, existe una menor variabilidad entre países en términos de participación laboral de la población mayor de 15 años. Esto puede deberse a que este indicador está más estandarizado a nivel internacional.

grafico4 <- ggplot(Año_2018, aes(x = emp_agri))+
  geom_histogram(bins = 20, fill = "#800d0d", color = "black")+
  labs(
    title = "Distribución del Empleo en la Agricultura", 
    x = "% Empleo en la Agricultura", 
    y = "Frecuencia"
  )+
  geom_vline(aes(xintercept = mean(emp_agri, na.rm = TRUE)),
           color = "blue", linetype = "dashed")+
  theme_light()+
  theme(
    plot.title = element_text(face = "bold", color = "#800000"), 
    legend.position = "bottom" 
  )

ggplotly(grafico4)

En este caso, el histograma de la distribución del empleo en la agricultura evidencia una clara asimetría positiva, lo que indica que la mayor parte de las observaciones se concentra en valores bajos del porcentaje de empleo agrícola, mientras que existe una cola extendida hacia valores altos.

En particular, se observa que la mayor frecuencia se ubica en el rango aproximado de 0,1% a 9,7%, concentrando 41 países de los 85, lo cual sugiere que, en la mayoría de los casos, el sector agrícola representa una proporción reducida del empleo total. No obstante, la presencia de valores que alcanzan niveles cercanos al 46% refleja una alta dispersión y la existencia de posibles valores atípicos, asociados a economías donde la agricultura mantiene un peso significativo en el mercado laboral.

Este comportamiento es consistente con las diferencias estructurales entre países, donde aquellos con mayor nivel de desarrollo tienden a concentrar el empleo en sectores como servicios e industria, mientras que en economías menos desarrolladas persiste una mayor dependencia del sector agrícola. En conjunto, la distribución observada confirma la heterogeneidad del empleo agrícola a nivel internacional y sugiere que no sigue un patrón normal, sino que está fuertemente sesgada hacia valores bajos.

grafico5 <- ggplot(Año_2018, aes(x = emp_asalariados))+
  geom_histogram(bins = 20, fill = "#982f2f", color = "black")+
  labs(
    title = "Distribución Trabajadores Asalariados", 
    x = "% Empleo Trabajadores Asalariados", 
    y = "Frecuencia"
  )+ geom_vline(aes(xintercept = mean(emp_asalariados, na.rm = TRUE)),
           color = "blue", linetype = "dashed")+
  theme_light()+
  theme(
    plot.title = element_text(face = "bold", color = "#800000"), 
    legend.position = "bottom")

ggplotly(grafico5)

Por otro lado, el histograma correspondiente a la distribución de los trabajadores asalariados presenta una asimetría negativa, lo que indica que la mayoría de las observaciones se concentran en valores altos del porcentaje de empleo asalariado, mientras que existe una cola hacia valores más bajos.

En particular, se evidencia una fuerte concentración en el rango aproximado de 84% a 88,5%, lo cual sugiere que, en la mayor parte de los casos, el empleo asalariado constituye una proporción significativa del empleo total. Sin embargo, la presencia de algunos valores en rangos inferiores, cercanos al 30% o 40%, refleja una cierta heterogeneidad entre países, posiblemente asociada a economías con mayor informalidad laboral o predominio del trabajo independiente.

Asimismo, la dispersión observada, aunque menor que en distribuciones más asimétricas, permite identificar algunos valores atípicos en la parte baja de la distribución. En términos económicos, este comportamiento es consistente con estructuras laborales más formalizadas en países con mayor nivel de desarrollo, donde el empleo asalariado predomina, mientras que en economías menos desarrolladas se observa una menor proporción de este tipo de empleo.

grafico6 <- ggplot(Año_2018, aes(x = muj_alt_cargo))+
  geom_histogram(bins = 20, fill = "#982f2f", color = "black")+
  labs(
    title = "Distribución Empleo en Mujeres en Altos Cargos", 
    x = "% Empleo en Mujeres en Altos Cargos", 
    y = "Frecuencia"
  )+
  geom_vline(aes(xintercept = mean(muj_alt_cargo, na.rm = TRUE)),
  color = "blue", linetype = "dashed")+
  theme_light()+
  theme(
    plot.title = element_text(face = "bold", color = "#800000"), 
    legend.position = "bottom")

ggplotly(grafico6)

Por ultimo, el histograma correspondiente a la distribución del empleo de mujeres en altos cargos presenta una forma relativamente simétrica, con ligera dispersión, en comparación con las variables analizadas anteriormente.

Se observa que la mayor concentración de frecuencias se ubica en el intervalo aproximado de 30,2% a 38,9%, lo que indica que, en la mayoría de los casos, la participación femenina en posiciones de liderazgo se encuentra en niveles intermedios. A diferencia de otras distribuciones con sesgos marcados, en este caso no se evidencia una asimetría pronunciada, lo cual sugiere una distribución más equilibrada de los datos. No obstante, se identifican valores en los extremos, tanto por debajo del 20% como por encima del 45%, lo que refleja la existencia de heterogeneidad entre países en términos de equidad de género en cargos directivos.

Por su parte, la dispersión moderada indica que, aunque existe cierta convergencia hacia valores centrales, persisten diferencias estructurales. Estos resultados sugieren que, a nivel internacional, la participación de las mujeres en altos cargos aún no alcanza niveles mayoritarios, concentrándose en rangos medios, pero con avances diferenciados según el contexto económico y social de cada país.

3.4.2. Análisis de Regresión Lineal por Región

Una vez comprendida la distribución individual de las variables mediante el análisis descriptivo previo, el análisis de regresión lineal por región busca identificar y cuantificar las relaciones de asociación entre ellas. Este modelo permite entender cómo las variables independientes como el empleo agrícola o la participación de las mujeres en altos cargos se vinculan con el desempeño económico, pero con el valor añadido de la división geográfica.

Este análisis permite detectar si los patrones se mantienen constantes de forma global o si existen dinámicas estructurales propias de cada región que alteran los resultados, permitiendo así una interpretación mucho más precisa a la realidad de cada contexto.

grafico7 <- ggplot(Año_2018, 
       aes(x = emp_t_parcial, 
           y = PIB,
           text = paste(
                        "País:", País,
                        "<br>Empleo T Parcial:", round(emp_t_parcial,2),
                        "<br>PIB:", round(PIB,2)
                      ))) +
  geom_point(color = "#800000", size = 2, alpha = 0.6) + 
  geom_smooth(method = "lm", color = "#4D0000", fill = "#D98888", se = FALSE, aes(group = 1), linewidth = 0.6) +
  facet_wrap(~region, ncol = 2) + 
  scale_y_continuous(labels = label_comma()) + 
  scale_x_continuous(labels = label_number(accuracy = 1)) + 
  labs(
    title = "Relación entre el Empleo a Tiempo Parcial vs. Productividad",
    subtitle = "Análisis por región geográfica (Año 2018)",
    x = "% Empleo a Tiempo Parcial",
    y = "PIB por trabajador (PPP 2017)"
  ) +
  theme_light() +
  theme(plot.title = element_text(face = "bold", size = 15, hjust = 0.5, margin = margin(b=15), color = "#800000"), 
    plot.subtitle = element_text(size = 11, color = "#4D0000"),
    strip.background = element_rect(fill = "#800000"), 
    strip.text = element_text(face = "bold", color = "white", size = 8, margin = margin(2,2,2,2)),
    panel.spacing = unit(1, "lines"),
    panel.grid.minor = element_blank(), 
     axis.text = element_text(size = 7),
  axis.title = element_text(size = 11)
  )

ggplotly(grafico7, tooltip = "text") %>%
 layout(margin = list(t = 60))

El análisis por región revela que la relación entre el empleo a tiempo parcial y la productividad laboral no es una cuestión universal, sino que depende profundamente del contexto económico de cada continente. Por ejemplo, en Europa, se observa una correlación positiva y clara, a mayor flexibilidad horaria, mayor es la eficiencia por trabajador. Esto sugiere que en economías avanzadas, el trabajo a tiempo parcial se utiliza como una estrategia para retener talento calificado y optimizar procesos.

Todo lo contrario ocurre en regiones como Asia y el Caribe, la tendencia se invierte o se estanca, lo que indica que el empleo a tiempo parcial en estos contextos podría estar más asociado al subempleo o a sectores de bajo valor agregado donde menos horas de trabajo hacen referencia a una menor generación de riqueza.

En el caso de America del Sur y America del Centro, aunque existe una ligera tendencia al aumento, la dispersión de los datos muestra que la productividad sigue siendo limitada independientemente de la jornada laboral, posiblemente debido a la alta informalidad. Por último, en América del Norte, aunque la productividad es elevada, la falta de una pendiente marcada sugiere que otros factores, como la tecnología o la inversión de capital, tienen un peso mucho mayor que la flexibilidad horaria.

Por lo tanto, según el gráfico es pertinente concucluir que la flexibilidad laboral solo aumenta la productividad cuando está respaldada por una estructura económica sólida y empleos de alta calidad como posiblemente se tienen los diferentes países europeos.

grafico8 <- ggplot(Año_2018, 
       aes(x = emp_agri, 
           y = PIB,
           text = paste(
                        "País:", País,
                        "<br>Empleo Agricultura:", round(emp_agri,2),
                        "<br>PIB:", round(PIB,2)
                      ))) +
  geom_point(color = "#800000", size = 2, alpha = 0.6) + 
  geom_smooth(method = "lm", color = "#4D0000", fill = "#D98888", se = FALSE, aes(group = 1), linewidth = 0.6) +
  facet_wrap(~region, ncol = 2) + 
  scale_y_continuous(labels = label_comma()) + 
  scale_x_continuous(labels = label_number(accuracy = 1)) + 
  labs(
    title = "Relación entre el Empleo en la Agricultura vs. Productividad",
    subtitle = "Análisis por región geográfica (Año 2018)",
    x = "% Empleo en la Agricultura",
    y = "PIB por trabajador (PPP 2017)"
  ) +
  theme_light() +
  theme(plot.title = element_text(face = "bold", size = 15, hjust = 0.5, margin = margin(b=15), color = "#800000"), 
    plot.subtitle = element_text(size = 11, color = "#4D0000"),
    strip.background = element_rect(fill = "#800000"), 
    strip.text = element_text(face = "bold", color = "white", size = 8, margin = margin(2,2,2,2)),
    panel.spacing = unit(1, "lines"),
    panel.grid.minor = element_blank(), 
     axis.text = element_text(size = 7),
  axis.title = element_text(size = 11)
  )

ggplotly(grafico8, tooltip = "text") %>%
 layout(margin = list(t = 60))

Por su parte, la relación entre el sector agrícola y la productividad laboral presenta una relación inversa, ya que, en todas las gráficas se observa que, a medida que aumenta el porcentaje de personas empleadas en la agricultura, el PIB por trabajador tiende a disminuir significativamente. Este fenómeno sugiere que las economías con una alta tasa de mano de obra en el campo suelen enfrentar mayores retos de eficiencia, posiblemente debido a un menor acceso a tecnología avanzada o procesos industriales de alto costo.

Es evidente que en regiones de alta productividad, como Europa y América del Norte, los niveles de empleo agrícola son muy bajos, concentrados mayormente por debajo del 10%, mientras que en Asia, América del Sur y el Caribe, donde el empleo agrícola es más común, la productividad se sitúa en rangos mucho menores.

Por consiguiente,se evidencia que la transición de la fuerza laboral desde la agricultura hacia sectores más tecnicos o de servicios es un factor determinante para elevar la riqueza generada por cada trabajador, independientemente de la ubicación geográfica.

grafico9 <- ggplot(Año_2018, 
       aes(x = emp_mayores15, 
           y = PIB,
           text = paste(
                        "País:", País,
                        "<br>Empleo Mayores de 15:", round(emp_mayores15,2),
                        "<br>PIB:", round(PIB,2)
                      ))) +
  geom_point(color = "#800000", size = 2, alpha = 0.6) + 
  geom_smooth(method = "lm", color = "#4D0000", fill = "#D98888", se = FALSE, aes(group = 1), linewidth = 0.6) +
  facet_wrap(~region, ncol = 2) + 
  scale_y_continuous(labels = label_comma()) + 
  scale_x_continuous(labels = label_number(accuracy = 1)) + 
  labs(
    title = "Relación entre el Empleo en Mayores de 15 vs. Productividad",
    subtitle = "Análisis por región geográfica (Año 2018)",
    x = "% Empleo en Mayores de 15 Años",
    y = "PIB por trabajador (PPP 2017)"
  ) +
  theme_light() +
  theme(plot.title = element_text(face = "bold", size = 15, hjust = 0.5, margin = margin(b=15), color = "#800000"), 
    plot.subtitle = element_text(size = 11, color = "#4D0000"),
    strip.background = element_rect(fill = "#800000"), 
    strip.text = element_text(face = "bold", color = "white", size = 8, margin = margin(2,2,2,2)),
    panel.spacing = unit(1, "lines"),
    panel.grid.minor = element_blank(), 
     axis.text = element_text(size = 7),
  axis.title = element_text(size = 11)
  )

ggplotly(grafico9, tooltip = "text") %>%
 layout(margin = list(t = 60))

El análisis gráfico de la relación entre el porcentaje de empleo en mayores de 15 años y la productividad evidencia comportamientos heterogéneos entre regiones. En Europa y América del Norte se observa una relación positiva, más marcada en esta última, lo que sugiere que mayores niveles de empleo están asociados con incrementos en la productividad, posiblemente debido a una mayor participación en sectores económicos más eficientes.

En contraste, regiones como América del Sur y el Caribe presentan una relación negativa, indicando que un aumento en el empleo no necesariamente se traduce en mayor productividad, lo cual puede estar vinculado a una alta proporción de empleo en sectores informales. Por su parte, Asia muestra una relación débil, reflejando una alta heterogeneidad entre sus economías, mientras que América del Centro presenta una tendencia negativa leve.

Es importante considerar que este indicador se construye a partir de la población mayor de 15 años, siguiendo estándares internacionales que excluyen el trabajo infantil; sin embargo, las diferencias entre países en la regulación y prevalencia del trabajo en menores pueden influir indirectamente en los resultados, al estar asociadas con niveles de informalidad y capital humano que afectan la productividad. En conjunto, estos resultados sugieren que la cantidad de empleo por sí sola no garantiza mayores niveles de productividad, siendo determinante la calidad y estructura del mismo.

grafico10 <- ggplot(Año_2018, 
       aes(x = emp_asalariados, 
           y = PIB,
           text = paste(
                        "País:", País,
                        "<br>Trabajadores Asalariados:", round(emp_asalariados,2),
                        "<br>PIB:", round(PIB,2)
                      ))) +
  geom_point(color = "#800000", size = 2, alpha = 0.6) + 
  geom_smooth(method = "lm", color = "#4D0000", fill = "#D98888", se = FALSE, aes(group = 1), linewidth = 0.6) +
  facet_wrap(~region, ncol = 2) + 
  scale_y_continuous(labels = label_comma()) + 
  scale_x_continuous(labels = label_number(accuracy = 1)) + 
  labs(
    title = "Relación entre los Trabajadores Asalariados vs. Productividad",
    subtitle = "Análisis por región geográfica (Año 2018)",
    x = "% Trabajadores Asalariados",
    y = "PIB por trabajador (PPP 2017)"
  ) +
  theme_light() +
  theme(plot.title = element_text(face = "bold", size = 15, hjust = 0.5, margin = margin(b=15), color = "#800000"), 
    plot.subtitle = element_text(size = 11, color = "#4D0000"),
    strip.background = element_rect(fill = "#800000"), 
    strip.text = element_text(face = "bold", color = "white", size = 8, margin = margin(2,2,2,2)),
    panel.spacing = unit(1, "lines"),
    panel.grid.minor = element_blank(), 
     axis.text = element_text(size = 7),
  axis.title = element_text(size = 11)
  )

ggplotly(grafico10, tooltip = "text") %>%
 layout(margin = list(t = 60))

Del mismo modo, el análisis de la relación entre el empleo asalariado y la productividad revela una tendencia positiva y contundente en todas las regiones del mundo, a medida que aumenta el porcentaje de trabajadores asalariados, el PIB por trabajador crece de manera sostenida. Este fenómeno refleja que el trabajo formal es un motor crítico para el desarrollo económico. En regiones como Europa y América del Norte, se observa una alta concentración de trabajadores dentro de este grupo, lo que coincide con los niveles de productividad más elevados a nivel global.

Por otro lado, en América del Sur, el Caribe y Asia, la pendiente positiva de las líneas sugiere que existe un enorme potencial de crecimiento; en la medida en que estas economías logren migrar de empleos informales o por cuenta propia hacia esquemas asalariados estables, su eficiencia productiva tiende a dispararse. Por lo anterior, la formalidad del mercado laboral no es solo una consecuencia del desarrollo, sino una condición necesaria para alcanzar mayores niveles de riqueza por trabajador a nivel global.

grafico11 <- ggplot(Año_2018, 
       aes(x = muj_alt_cargo, 
           y = PIB,
           text = paste(
                        "País:", País,
                        "<br>Mujeres Altos Cargos:", round(muj_alt_cargo,2),
                        "<br>PIB:", round(PIB,2)
                      ))) +
  geom_point(color = "#800000", size = 2, alpha = 0.6) + 
  geom_smooth(method = "lm", color = "#4D0000", fill = "#D98888", se = FALSE, aes(group = 1), linewidth = 0.6) +
  facet_wrap(~region, ncol = 2) + 
  scale_y_continuous(labels = label_comma()) + 
  scale_x_continuous(labels = label_number(accuracy = 1)) + 
  labs(
    title = "Relación entre Mujeres en Altos Cargos vs. Productividad",
    subtitle = "Análisis por región geográfica (Año 2018)",
    x = "% Mujeres en Altos Cargos",
    y = "PIB por trabajador (PPP 2017)"
  ) +
  theme_light() +
  theme(plot.title = element_text(face = "bold", size = 15, hjust = 0.5, margin = margin(b=15), color = "#800000"), 
    plot.subtitle = element_text(size = 11, color = "#4D0000"),
    strip.background = element_rect(fill = "#800000"), 
    strip.text = element_text(face = "bold", color = "white", size = 8, margin = margin(2,2,2,2)),
    panel.spacing = unit(1, "lines"),
    panel.grid.minor = element_blank(), 
     axis.text = element_text(size = 7),
  axis.title = element_text(size = 11)
  )

ggplotly(grafico11, tooltip = "text") %>%
 layout(margin = list(t = 60))

El análisis de la presencia femenina en altos cargos revela que su impacto en la productividad no es lineal ni uniforme a nivel global.En América del Norte y América del Sur, se observa una tendencia positiva, a mayor porcentaje de mujeres en puestos directivos, mayor es el PIB por trabajador. Esto sugiere que, en estas regiones, la diversidad en la toma de decisiones está alineada con una mayor eficiencia y mejores resultados económicos. Sin embargo, el panorama cambia drásticamente en Asia y América del Centro, donde se aprecia una pendiente negativa pronunciada. Esto no necesariamente implica que la presencia femenina reduzca la productividad, sino que podría reflejar realidades estructurales donde las mujeres acceden a altos cargos en sectores menos dinámicos o en momentos de crisis empresarial.

Por otro lado, Europa muestra una estabilidad notable con una tendencia ligeramente descendente pero con los niveles de productividad más altos de la muestra, lo que indica un mercado de liderazgo ya maduro. En el Caribe, la relación es casi plana, sugiriendo que otros factores externos tienen un peso mucho mayor sobre la productividad que la composición de género en las directivas.

En conclusión, el gráfico demuestra que la diversidad de género en el liderazgo es un factor que potencia la economía en contextos americanos (Norte y Sur), pero que en otras regiones su impacto está condicionado por barreras culturales o estructurales que aún impiden que esta diversidad se traduzca plenamente en valor económico.

3.4.3. Comparación por Regiones

Con el fin de profundizar en las diferencias estructurales entre regiones, se presenta a continuación la distribución del PIB por trabajador (PPP 2017) mediante diagramas de caja. Lo cual permitirá comparar no solo los niveles centrales de productividad entre regiones, sino también la dispersión, la presencia de valores atípicos y la variabilidad interna de cada grupo, proporcionando una visión más completa de las desigualdades económicas a nivel global.

grafico12 <- ggplot(Año_2018, aes(x = reorder(region, - PIB, FUN = median), 
                     y = PIB, 
                     fill = region)) +
  geom_boxplot(show.legend = FALSE) + 
  scale_fill_manual(values = c(
    "#5c1212", 
    "#660000", 
    "#800000", 
    "#991F1F", 
    "#B33E3E", 
    "#CC6666" 
  )) +
  labs(title = "Distribución del PIB por región", 
       x = "Regiones", 
       y = "PIB por Trabajador (PPP 2017)") +
  theme_light() + theme(
    plot.title = element_text(face = "bold", color = "#800000"), 
    legend.position = "bottom" 
  )
ggplotly(grafico12)

El gráfico evidencia diferencias significativas en la distribución del PIB por trabajador entre regiones. América del Norte y Europa presentan las medianas más altas, lo que indica mayores niveles de productividad laboral en comparación con el resto del mundo. En particular, Europa muestra una mayor dispersión en sus datos, lo que sugiere una heterogeneidad considerable entre los países que lo conforman, así mismo, presenta de valores atípicos altos.

Por otro lado, Asia, América del Centro y América del Sur presentan medianas considerablemente más bajas, reflejando menores niveles de productividad. En estas regiones, la dispersión es relativamente menor, lo que indica una mayor homogeneidad, aunque en niveles bajos. El Caribe, aunque muestra una mediana intermedia, presenta una alta variabilidad y algunos valores atípicos, lo que sugiere diferencias marcadas entre sus economías.

De esta manera, el análisis revela una clara brecha regional en términos de productividad laboral, donde las economías más desarrolladas no solo alcanzan mayores niveles de PIB por trabajador, sino que también presentan una mayor variabilidad interna. Esto refuerza la idea de que las diferencias en desarrollo económico, estructura productiva y capital humano juegan un papel fundamental en la explicación de estas realidades.

4. Resultados del Modelo

Antes de presentar la tabla con los resultados del modelo, es importante mencionar que este análisis busca entender cómo se relaciona la variable principal con las demás variables incluidas en el estudio. A partir del modelo de regresión, se pretende observar no solo si existe relación entre ellas, sino también qué tan fuerte es y en qué sentido se da. En la siguiente tabla se muestran los resultados obtenidos, incluyendo los coeficientes estimados y otros indicadores que permiten interpretar el comportamiento del modelo y la influencia de cada variable.

4.1. Tabla del Modelo

Los resultados del modelo de regresión lineal que se ilustran en la siguiente tabla la cual permite analizar la relación entre distintas variables del mercado laboral y el PIB por trabajador.

tabla_modelo <- tidy(modelo)

kable(tabla_modelo, 
      digits = 3, 
      caption = "Resultados del Modelo de Regresion Lineal")

Resultados del Modelo de Regresion Lineal
term	estimate	std.error	statistic	p.value
(Intercept)	-8796.569	79019.001	-0.111	0.912
emp_t_parcial	1568.098	504.380	3.109	0.003
emp_mayores15	330.451	796.396	0.415	0.680
emp_agri	58.235	1163.758	0.050	0.960
emp_asalariados	1228.131	871.709	1.409	0.167
muj_alt_cargo	-2190.769	851.836	-2.572	0.014
regionAmerica del Centro	-14060.161	20896.173	-0.673	0.505
regionAmerica del Norte	20122.669	21757.041	0.925	0.361
regionAmerica del Sur	-20307.059	19303.356	-1.052	0.299
regionAsia	-31784.799	17202.590	-1.848	0.072
regionCaribe	13776.261	31043.849	0.444	0.660

En primer lugar, según los resultados la variable Empleo_Tiempo_Parcial presenta un coeficiente positivo de 1568.098 y un valor p de 0.003, lo que indica que es estadísticamente significativa al 5%. Esto sugiere que un aumento en el empleo de tiempo parcial se asocia con un incremento en el PIB por trabajador, manteniendo constantes las demás variables del modelo. La magnitud del coeficiente indica que, por cada unidad adicional en esta variable, la productividad laboral aumentaría aproximadamente 1568 unidades.

Por su parte, la variable Mujeres_Alto_Cargo tiene un coeficiente negativo de -2190.769 y un valor p de 0.014, lo que también la hace significativa al 5%. Esto indica que existe una relación inversa entre la participación de mujeres en altos cargos y el PIB por trabajador. Sin embargo, aunque el resultado es estadísticamente significativo no implica causalidad ya que puede estar influenciada por factores estructurales o variables omitidas en el modelo.

En cuanto a la variable Empleo_Mayores15, su coeficiente es positivo 330.451, pero su valor p de 0.680 indica que no es estadísticamente significativa. Asimismo, Empleo_Agricultura presenta un coeficiente positivo 58.235 con un valor p de 0.960, y Total_Trabajadores_Salariados tiene un coeficiente de 1228.131 con un valor p de 0.167. En estos casos, aunque los signos sugieren una relación positiva con el PIB por trabajador, no existe evidencia estadística suficiente para afirmar que estas variables tengan un efecto significativo en la productividad laboral.

Respecto a las variables categóricas de región, la variable correspondiente a Asia presenta un coeficiente negativo de -31784.799 con un valor p de 0.072, lo que indica una significancia marginal al 10%. Esto sugiere que, en promedio, los países asiaticos podrían tener un menor PIB por trabajador en comparación con la categoría de referencia es decir con el continente europeo. Por su parte, las demás regiones no muestran efectos estadísticamente significativos.

Finalmente, el intercepto del modelo no es significativo cuenta con un valor p = 0.912, por lo que no tiene una interpretación relevante dentro del análisis.

Por otro lado, los principales indicadores de ajuste del modelo de regresión lineal múltiple estimado se presentan en la siguiente tabla.

resumen <- glance(modelo)

kable(resumen,
      digits = 3,
      caption = "Resumen del Modelo")

Resumen del Modelo
r.squared	adj.r.squared	sigma	statistic	p.value	df	logLik	AIC	BIC	deviance	df.residual	nobs
0.653	0.566	28284.3	7.526	0	10	-588.924	1201.848	1225.03	32000066469	40	51

De este modo, del modelo se obtiene que el coeficiente de determinacion $R^2$ tiene un valor del 0.653, indicando así que el modelo estimado explica aproximandamante el 65.3% de la variabilidad en la productividad laboral (PIB por trabajador), del mismo modo, sugiere que las variables independientes seleccionadas tienen una buena capacidad explicativa de la variable dependiente.

No obstante, al considerar el ajuste por número de variables, esta capacidad explicativa se reduce al 56.6, sugiriendo que no todas las variables elegidas contribuyen de manera significativa al modelo.

Por otro lado, el Estadistico F, arroja que el modelo es globalmente significativo, lo cual confirma la existencia de una relación estadística entre las variables independientes y la productividad laboral.

Sin embargo, es importante tener en cuenta que de las observaciones se eliminaron 34, contando en el análisis final con 51 datos; así mismo, el alto error residual indican que los resultados obtenidos deben ser interpretados con cautela.

4.2. Diagnóstico del Modelo

Multicolinealidad

Se evaluó la presencia de multicolinealidad mediante el Factor de Inflación de la Varianza (VIF)

vif_df <- as.data.frame(vif(modelo))


kbl(vif_df, 
    caption = "Resultados del Factor de Inflación de la Varianza (VIF)",
    digits = 3, 
    col.names = c("GVIF", "Df", "GVIF corregido")) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), 
                full_width = T, 
                position = "left") %>%
  row_spec(0, background = "#800000", color = "white", bold = TRUE)

Resultados del Factor de Inflación de la Varianza (VIF)
	GVIF	Df	GVIF corregido
emp_t_parcial	1.800	1	1.342
emp_mayores15	1.784	1	1.336
emp_agri	7.390	1	2.719
emp_asalariados	8.541	1	2.923
muj_alt_cargo	2.210	1	1.487
region	5.676	5	1.190

Para la evaluación de la multicolinealidad se empleó el GVIF corregido para todas las variables del modelo, dado que permite una comparación consistente tanto para variables cuantitativas como categóricas.

De este modo, los valores de VIF obtenidos para todas las variables del modelo son inferiores a 5, lo cual indica que no existe evidencia de multicolinealidad severa entre las variables independientes del modelo. Es decir, que las variables independientes elegidas no presetan relaciones lineales fuertes entre sí, por lo que los coeficientes estimados pueden interpretarse de manera confiable.

Normalidad

Para determinar la normalidad de los residuos del modelo, se aplicó la Prueba de Shapiro-Wilk.

test_shapiro <- shapiro.test(modelo$residuals)


shapiro_df <- data.frame(
  Estadístico_W = test_shapiro$statistic,
  P_Valor = format(test_shapiro$p.value, scientific = TRUE)
)


kbl(shapiro_df, 
    caption = "Prueba de Normalidad de Shapiro-Wilk",
    digits = 4, 
    align = "c") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), 
                full_width = T,      
                position = "center") %>% 
  row_spec(0, background = "#800000", color = "white", bold = TRUE)

Prueba de Normalidad de Shapiro-Wilk
	Estadístico_W	P_Valor
W	0.7556	7.730394e-08

La prueba arrojó que el p-valor es significativamente menor que 0.05, lo que indica que los residuos no siguen una distribución normal, al mismo tiempo que se incumple uno de los supuestos del modelo de regresión, por lo tanto indica que la hipótesis nula de normalidad es rechazada.

No obstante, al incumplirse el supuesto de normalidad de los residuos, pone en evidencia una limitación del modelo y así mismo sugiere la necesidad de interpretar los resultados con cautela, esto, dado seguramente por la reducción de observaciones en el modelo.

Con el objetivo de complementar el análisis realizado por medio de los resultados obtenidos de la Prueba de Shapiro - Wilk, se presenta el gráfico Q-Q el cual permite identificar desviaciones respecto a la normalidad, así como la presencia de asímetrias y valores atípicos en la distribución.

plot(modelo, which =2)

El gráfico Q-Q de los residuos evidencia que, aunque existe una alineación parcial en la zona del medio, se presentan desviaciones significativas en las colas de la distribución. En particular, las observaciones 42 y 50 en la cola superior muestran residuos estandarizados relativamente altos, mientras que la observación 54 en la cola inferior refleja un valor atípico negativo.

Lo anterior desmuestra la presencia de asimetría positiva y valores atípicos, lo que significa que los residuos no siguen una distribución normal. Esto lo confirma también la prueba de Shapiro-Wilk, la cual rechaza la hipótesis de normalidad. De esta manera, se concluye que el modelo no cumple con este supuesto, lo que constituye una limitación en la validez inferencial y sugiere interpretar los resultados con precaución.

Homocedasticidad

Para evaluar la constancia de la varianza de los errores, se aplicó la Prueba de Breusch-Pagan en su versión studentizada, planteandose bajo la hipótesis nula de homocedasticidad de los residuos, frente a la hipotesis alternativa de presencia de heterocedasticidad.

test_bp <- bptest(modelo)


bp_df <- data.frame(
  Estadístico_BP = test_bp$statistic,
  Grados_Libertad = test_bp$parameter,
  P_Valor = format(test_bp$p.value, scientific = TRUE) 
)


kbl(bp_df, 
    caption = "Prueba de Homocedasticidad de Breusch-Pagan",
    digits = 4,
    align = "c", 
    row.names = FALSE) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), 
                full_width = T) %>%
  row_spec(0, background = "#800000", color = "white", bold = TRUE)

Prueba de Homocedasticidad de Breusch-Pagan
Estadístico_BP	Grados_Libertad	P_Valor
7.6103	10	6.668469e-01

Dado que el p-valor obtenido es superior al nivel de significacia del 5%, no se rechaza hipótesis nula de homocedasticidad.

Por consiguiente, no existe evidencia estadística significativa de heterocedasticididad en el modelo, indicando que la varianza de los errores se mantiene aproximadamente constante a lo largo de las observaciones. Este resultado sugiere que el modelo cumple con uno de los supuestos fundamentales de la regresión lineal, lo que garantiza la validez de las inferencias realizadas.

Por otro lado, se toma en cuenta el análisis suministrado por el gráfico Scale-Location como complemento fundamental a la prueba de Breusch-Pagan

plot(modelo, which = 3)

El gráfico Scale-Location evidencia una dispersión relativamente homogénea de los residuos a lo largo de los valores ajustados, sin la presencia de patrones claros que indiquen heterocedasticidad. Aunque se observa un leve crecimiento en la línea suavizada, no es lo suficientemente pronunciada como para sugerir un incumplimiento del supuesto de varianza constante.

Adicionalmente, la presencia de algunas observaciones destacadas, como las identificadas como 42, 50 y 54, sugiere la posible existencia de valores atípicos que podrían influir en la variabilidad de los residuos.

En conjunto, y en concordancia con la prueba de Breusch-Pagan, se concluye que el modelo cumple con el supuesto de homocedasticidad, aunque se recomienda interpretar los resultados con cautela debido a la presencia de observaciones potencialmente influyentes.

Para evaluar la adecuación del modelo lineal se revisó el gráfico de residuos versus valores ajustados presentado a continuación.

plot(modelo, which = 1)

En este gráfico se observa que la mayoría de los residuos se distribuyen aleatoriamente alrededor de cero; no obstante, la línea de tendencia presenta una ligera inclinación que sugiere pequeñas desviaciones en el supuesto de linealidad. Aunque la dispersión es mayormente constante, validando la homocedasticidad vista en el análisis anterior, se identifican las observaciones 42, 50 y 54 con residuos elevados. Estos puntos actúan como valores atípicos que podrían estar afectando la precisión de los coeficientes, por lo que su análisis detallado en la sección de valores influyentes es fundamental para garantizar un ajuste robusto del modelo.

Valores Influyentes

Por medio del gráfico de residuos estandarizados frente al leverage se busca identificar observaciones que podrían ejercer una influencia desproporcionada sobre el modelo de regresión. Este análisis se complementa mediante la inclusión de las curvas de la Distancia de Cook, las cuales delimitan umbrales de influencia potencial.

plot(modelo, which = 5)

En general, se observa que la mayoría de los datos presenta valores de leverage bajos y residuos cercanos a cero, lo cual sugiere un comportamiento adecuado del modelo para la mayor parte de las observaciones.

No obstante, se identifican algunos casos particulares, como las observaciones 50, 51 y 81, que presentan residuos elevados o altos niveles de leverage. A pesar de ello, ninguna de estas observaciones supera los umbrales definidos por la distancia de Cook, lo que indica que no ejercen una influencia desproporcionada sobre el ajuste del modelo.

Por ello, se concluye que, aunque existen observaciones potencialmente atípicas, el modelo no presenta problemas graves asociados a valores influyentes.

5. Conclusiones

A partir de los resultados obtenidos, se puede concluir que la productividad laboral, medida a través del PIB por trabajador, no depende de manera uniforme de todas las variables del mercado laboral incluidas en el modelo, sino que su comportamiento está influenciado principalmente por algunos factores específicos.

En primer lugar, se evidencia que el empleo a tiempo parcial tiene un efecto positivo y estadísticamente significativo, lo que sugiere que, en ciertos contextos, una mayor participación de este tipo de empleo puede estar asociada con niveles más altos de productividad. Por otro lado, la variable relacionada con la participación de mujeres en altos cargos presenta una relación negativa y significativa, aunque este resultado debe interpretarse con cautela, ya que puede estar influenciado por factores estructurales no incluidos en el modelo.

En contraste, variables como el empleo total, el empleo en agricultura y el empleo asalariado no mostraron evidencia estadísticamente significativa, lo que indica que no se puede afirmar que tengan un efecto directo sobre la productividad laboral. Esto refuerza la idea de que no es solo la cantidad de empleo lo que importa, sino su calidad y composición.

En cuanto a la variable categórica de región, los resultados muestran que las diferencias regionales no son determinantes por sí solas. Aunque Asia presenta una relación negativa con una significancia marginal frente a Europa (categoría de referencia), las demás regiones no muestran efectos relevantes, lo que sugiere que la productividad depende de factores más específicos que la ubicación geográfica.

Por otra parte, el modelo presenta una capacidad explicativa moderada, logrando explicar una proporción importante de la variabilidad del PIB por trabajador. Sin embargo, no todas las variables aportan de manera relevante, lo que se evidencia en la diferencia entre el $R^2$ y el $R^2$ ajustado.

Adicionalmente, desde el punto de vista de los supuestos del modelo, no se evidencia la presencia de multicolinealidad severa, lo que permite interpretar los coeficientes con mayor confianza. Asimismo, se cumple el supuesto de homocedasticidad, indicando que la varianza de los errores se mantiene relativamente constante. No obstante, los residuos no siguen una distribución normal, lo que representa una limitación del modelo y sugiere que los resultados deben interpretarse con cautela. Esto puede estar asociado, entre otros factores, a la reducción del número de observaciones, ya que de 85 inicialmente solo se trabajó con 51, lo cual puede afectar la robustez de las estimaciones.

Finalmente, el análisis de observaciones influyentes muestra que, aunque existen algunos casos con residuos elevados o valores de leverage relativamente altos, estos no afectan de manera significativa el ajuste del modelo.

En síntesis, el modelo permite identificar algunos factores relevantes asociados a la productividad laboral, especialmente aquellos relacionados con la estructura del empleo. Sin embargo, no logra explicarla en su totalidad, lo que evidencia que este fenómeno depende de otros factores no considerados en el análisis. Por ello, los resultados deben interpretarse como una aproximación válida y útil, pero que requiere ser complementada con un análisis más amplio y con una base de datos más robusta.

6. Recomendaciones

A partir de los resultados obtenidos, se pueden plantear una serie de recomendaciones orientadas tanto al análisis económico como a la mejora del modelo estimado.

En primer lugar, los resultados sugieren que la productividad laboral no depende únicamente de la cantidad de empleo, sino principalmente de su calidad y estructura. En este sentido, se recomienda que las economías no se enfoquen exclusivamente en aumentar los niveles de ocupación, sino en promover condiciones que permitan una mejor asignación del trabajo. Particularmente, el empleo a tiempo parcial evidencia un efecto positivo y significativo, lo que indica que la flexibilidad laboral puede contribuir al aumento del PIB por trabajador. No obstante, esta debe implementarse garantizando condiciones laborales adecuadas, evitando efectos negativos sobre la estabilidad y calidad del empleo.

En segundo lugar, el análisis regional evidencia que existen diferencias en productividad que no se explican únicamente por la ubicación geográfica, pero que sí reflejan condiciones estructurales distintas entre economías. En el caso de Asia, donde se observa una tendencia a menores niveles de PIB por trabajador en comparación con Europa, se recomienda impulsar transformaciones en la estructura productiva, orientadas hacia sectores con mayor valor agregado, así como fortalecer el capital humano y la adopción tecnológica.

Respecto a la variable de participación de mujeres en altos cargos, aunque el modelo arroja una relación negativa, esta no debe interpretarse como causal. Por el contrario, se recomienda fortalecer la inclusión femenina en posiciones de liderazgo mediante políticas que mejoren el acceso a educación, formación y oportunidades en sectores de alta productividad, de manera que su participación contribuya efectivamente al desempeño económico.

Adicionalmente, dado que variables como el empleo total, el empleo en agricultura y el empleo asalariado no resultaron significativas, se refuerza la idea de que incrementar el número de trabajadores no es suficiente para mejorar la productividad. Por ello, se recomienda orientar las políticas económicas hacia la modernización de los sectores productivos, promoviendo la innovación, el uso de tecnología y la transición hacia actividades económicas más eficientes.

Finalmente, desde el punto de vista metodológico, se recomienda ampliar la base de datos utilizada, con el fin de mejorar la robustez de los resultados. Asimismo, sería pertinente realizar análisis diferenciados por regiones o niveles de desarrollo, ya que los efectos pueden variar entre grupos de países. También se sugiere explorar modelos econométricos alternativos que permitan capturar de mejor manera la complejidad de la relación entre las variables analizadas.

7. Bibliografía

BBVA Research. (2018). El escenario económico global de 2018. https://www.bbva.com/es/el-escenario-economico-global-de-2018/

Celasun, O., Milesi-Ferretti, G. M., & Obstfeld, M. (2018). Cinco gráficos que explican la economía mundial en 2018. https://www.imf.org/es/blogs/articles/2018/12/20/blog122018-5-charts-that-explain-the-global-economy-in-2018

Ruralcaja. (s.f.). Productividad laboral: guía completa para medirla y mejorarla. https://www.ruralcaja.es/productividad-laboral-guia-completa-para-medirla-y-mejorarla/

Variaciones globales en la relación entre la estructura del mercado laboral y el PIB por trabajador

Luis Fernando Rendon Ascuntar, Maikol David Sandoval Mayorga, Sebastian Dario Luna Noguera, Maria Camila Bedoya Bermudez

2026-03-27