En las útimas décadas, la educación superior ha sido reconocida como un factor clave tanto para el desarrollo económico como social de un país, especialmente en contextos donde la competitividad laboral exige una preparación académica cada vez más especializada. Diversas investigaciones han señalado que el nivel universitario puede tener un impacto significativo en la empleabilidad de las personas, al potenciar sus copetencias, conocimientos técnicos y habilidades de adaptación ante entornos laborales cambiantes (OECD, 2023; Teichler, 2015).
Sin embargo, en muchos países persisten elevados niveles de desempleo, incluso entre los egresados universitarios. Esta situación cuestiona la supuesta relación directa entre formación universitaria y acceso efectivo al secor laboral. Según García y Martínez (2020), el aumento de la cobertura en educación superior no ha sido suficiente para garantizar la iserción laboral de los jóvenes, especialmente en contextos con mercados laborales inestables o altamente segmentados. Tal contradicción sugiere la necesidad de examinar otros factores que podrían tener incidencia con mayor peso en la inserción laboral.
El presente estudio tiene como propósito analizar el papel educativo como factor determinante en la empleavilidad de un país. En particular, se busca examinar si la obtención de un título universitario garantiza efectivamente mayores oportunidades laborales o si, por el contrario, existen otros elementos más decisivos en el proceso de inserción laboral. A partir del análisis de datos dispoibles sobre educación y empleo, se pretende identificar patrones, correlaciones y posibles brechas que relacionen el nivel de estudios superiores con lasiuación laboral de los individuos. Como señala Bolivar (2018), es fundamental repensar el vínculo entre universidad y mundo laboral, incorporando también competencias genéricas y transversales como variables clave en la empleabilidad.
La presente base de datos recopila información estadística de distintos países, segmentada en variables categóricas y cuantitativas que permiten analizar su situación económica, educativa y laboral. Esta, combina indicadores clave como el ingreso nacional, la educación superior y el empleo. Las variables fueron obtenidas con el objetivo de llevar a cabo el estudio “Educación superior y empleo: un vínculo global” y su compilación procede de Our World in Data (https://ourworldindata.org/).
1.Variables categóricas: Describen características cualitativas de cada país, como su nombre, región geográfica, clasificación por nivel de ingreso y niveles de desempeño económico.
2.Variables cuantitativas:
#Paquetes:
library(readxl)
library(ggplot2)
library(ggcorrplot)
library(nortest)
library(lmtest)
library(car)#Base de datos:
empleo <- read_xlsx("datos_empleo3.xlsx")
#Análisis descriptivo variables cuantitativas:
summary(empleo)## pais region clasificacion_ingresos
## Length:145 Length:145 Length:145
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
## poblacion_total PIB_per_capita tasa_desempleo nivel_desempleo
## Min. :1.035e+05 Min. : 834 Min. : 0.140 Length:145
## 1st Qu.:3.796e+06 1st Qu.: 5773 1st Qu.: 4.294 Class :character
## Median :1.087e+07 Median : 14397 Median : 6.167 Mode :character
## Mean :5.130e+07 Mean : 22886 Mean : 8.690
## 3rd Qu.:3.658e+07 3rd Qu.: 32012 3rd Qu.:12.368
## Max. :1.426e+09 Max. :130690 Max. :34.232
## poblacion_no_estud_uni poblacion_estud_uni nivel_empleo
## Min. : 69700 Min. : 1400 Min. :65.77
## 1st Qu.: 937300 1st Qu.: 246800 1st Qu.:87.63
## Median : 3610000 Median : 1008600 Median :93.83
## Mean : 15699066 Mean : 6035932 Mean :91.31
## 3rd Qu.: 7224200 3rd Qu.: 3189700 3rd Qu.:95.71
## Max. :995321710 Max. :169788590 Max. :99.86
## porcentaje_poblacion_uni porcentaje_poblacion_no_uni
## Min. : 0.203 Min. : 0.3572
## 1st Qu.: 4.263 1st Qu.:19.3090
## Median :11.906 Median :48.0072
## Mean :13.066 Mean :42.4812
## 3rd Qu.:18.390 3rd Qu.:62.7501
## Max. :52.888 Max. :97.6195
#Análisis descriptivo varibales categóricas:
A_region <- as.data.frame(table(empleo$region))
colnames(A_region) <- c("Región", "Frecuencia")
print(A_region)## Región Frecuencia
## 1 Africa 45
## 2 Asia 42
## 3 Europe 34
## 4 North America 16
## 5 South America 8
A_Cingresos <- as.data.frame(table(empleo$clasificacion_ingresos))
colnames(A_Cingresos) <- c("Clasificación ingresos", "Frecuencia")
print(A_Cingresos)## Clasificación ingresos Frecuencia
## 1 Ingreso alto 73
## 2 Ingreso bajo 3
## 3 Ingreso medio-alto 42
## 4 Ingreso medio-bajo 27
A_Ndesempleo <- as.data.frame(table(empleo$nivel_desempleo))
colnames(A_Ndesempleo) <- c("Nivel desempleo", "Frecuencia")
print(A_Ndesempleo)## Nivel desempleo Frecuencia
## 1 HIGH 50
## 2 LOW 29
## 3 MEDIUM 66
# Gráficos de dispersión:
ggplot(empleo, aes(x = PIB_per_capita, y = tasa_desempleo)) +
geom_point(color = "steelblue") +
geom_smooth(method = "lm", se = TRUE, color = "red") +
scale_x_continuous(limits = c(1000, 50000)) +
labs(title = "PIB per cápita vs Tasa de desempleo",
x = "PIB per cápita",
y = "Tasa de desempleo(%)")ggplot(empleo, aes(x = PIB_per_capita, y = porcentaje_poblacion_uni)) +
geom_point(color = "steelblue") +
geom_smooth(method = "lm", se = TRUE, color = "red") +
scale_x_continuous(limits = c(1000, 50000)) +
labs(title = "PIB per cápita vs Población con estudios universitarios (rango limitado)",
x = "PIB per cápita",
y = "Población con estudios universitarios")ggplot(empleo, aes(x = porcentaje_poblacion_uni, y = tasa_desempleo)) +
geom_point(color = "darkgreen") +
geom_smooth(method = "lm", se = TRUE, color = "blue") +
scale_y_continuous(labels = scales::comma) +
labs(title = "Porcentaje de la población universitaria contra Tasa de desempleo",
x = "Población con estudios universitarios",
y = "Tasa de desempleo (%)")ggplot(empleo, aes(x = porcentaje_poblacion_no_uni, y = tasa_desempleo)) +
geom_point(color = "darkgreen") +
geom_smooth(method = "lm", se = TRUE, color = "blue") +
scale_y_continuous(labels = scales::comma) +
labs(title = "Porcentaje de la población no universitaria contra Tasa de desempleo",
x = "Población sin estudios universitarios",
y = "Tasa de desempleo (%)")ggplot(empleo, aes(x = nivel_empleo, y = tasa_desempleo)) +
geom_point(color = "orange") +
geom_smooth(method = "lm", se = TRUE, color = "purple") +
labs(title = "Nivel de empleo vs Tasa de desempleo",
x = "Nivel de empleo",
y = "Tasa de desempleo")# Histogramas:
ggplot(empleo, aes(x = PIB_per_capita)) +
geom_histogram(binwidth = 5000, fill = "skyblue", color = "black", boundary = 0) +
stat_bin(binwidth = 5000, boundary = 0, geom = "text", aes(label = after_stat(count)),
vjust = -0.5, size = 3) + scale_x_continuous(breaks = seq(0, 135000, by = 5000),
labels = scales::comma_format(accuracy = 1)) +
labs(title = "Distribución del PIB per cápita",x = "PIB per cápita",y = "Frecuencia")ggplot(empleo, aes(x = tasa_desempleo)) +
geom_histogram(binwidth = 2, fill = "tomato", color = "black", boundary = 0) +
stat_bin(binwidth = 2, boundary = 0, geom = "text", aes(label = after_stat(count)),
vjust = -0.5, size = 3) + scale_x_continuous(
breaks = seq(0, 36, by = 2),labels = scales::number_format(accuracy = 1)) +
labs(title = "Distribución de la tasa de desempleo",
x = "Tasa de desempleo (%)",y = "Frecuencia")ggplot(empleo, aes(x = porcentaje_poblacion_uni)) +
geom_histogram(binwidth = 2, fill = "seagreen", color = "black", boundary = 0) +
stat_bin(binwidth = 2, boundary = 0, geom = "text", aes(label = after_stat(count)),
vjust = -0.5, size = 3) +scale_x_continuous(breaks = seq(0, 54, by = 2),
labels = scales::number_format(accuracy = 1)) +
labs(title = "Distribución del % de población con estudios universitarios",
x = "% población con estudios universitarios",y = "Frecuencia")ggplot(empleo, aes(x = nivel_empleo)) +
geom_histogram(binwidth = 2, fill = "gold", color = "black", boundary = 64) +
stat_bin(binwidth = 2, boundary = 64, geom = "text", aes(label = after_stat(count)),
vjust = -0.5, size = 3) + scale_x_continuous(
breaks = seq(64, 100, by = 2),labels = scales::number_format(accuracy = 1)) +
labs(title = "Distribución del nivel de empleo",
x = "Nivel de empleo (%)",y = "Frecuencia")# Gráfico de barras:
ggplot(empleo, aes(x = clasificacion_ingresos)) +
geom_bar(fill = "purple", color = "black") +
geom_text(stat = "count", aes(label = ..count..), vjust = -0.5) +
labs(title = "Clasificación de ingresos",
x = "Clasificación de ingresos",
y = "Frecuencia")ggplot(empleo, aes(x = nivel_desempleo)) +
geom_bar(fill = "skyblue", color = "black") +
geom_text(stat = "count", aes(label = ..count..), vjust = -0.5) +
labs(title = "Nivel de desempleo",
x = "Nivel de desempleo",
y = "Frecuencia")ggplot(empleo, aes(x = region)) +
geom_bar(fill = "yellow", color = "black") +
geom_text(stat = "count", aes(label = ..count..), vjust = -0.5) +
labs(title = "Países por región",
x = "Región",
y = "Frecuencia")# Boxplot:
ggplot(empleo, aes(x = clasificacion_ingresos, y = nivel_empleo)) +
geom_boxplot(fill = "#b3d4d5", color = "#246467") +
labs( title = "Nivel de empleo por país según la clasificación de ingresos",
x = "Clasificación de ingresos",
y = "Nivel de empleo") + theme_minimal()ggplot(empleo, aes(x = region, y = nivel_empleo)) +
geom_boxplot(fill = "#ffa352", color = "#e2400c") +
labs( title = "Nivel de empleo por país según la región",
x = "Región",
y = "Nivel de empleo") + theme_minimal()ggplot(empleo, aes(x = clasificacion_ingresos, y = tasa_desempleo)) +
geom_boxplot(fill = "#d3b1d2", color = "#a03a83") +
labs( title = "Tasa de desempleo por país según la clasificación de ingresos",
x = "Clasificación de ingresos",
y = "Tasa de desempleo") + theme_minimal()## poblacion_total PIB_per_capita tasa_desempleo
## poblacion_total 1.00000000 -0.05611114 -0.08787036
## PIB_per_capita -0.05611114 1.00000000 -0.19997906
## tasa_desempleo -0.08787036 -0.19997906 1.00000000
## poblacion_no_estud_uni 0.68597382 -0.03214949 -0.05223477
## poblacion_estud_uni 0.93028468 0.07422998 -0.09736679
## nivel_empleo 0.08787036 0.19997906 -1.00000000
## porcentaje_poblacion_uni -0.03726835 0.74923001 -0.12605474
## porcentaje_poblacion_no_uni -0.13505178 0.13324962 0.02323676
## poblacion_no_estud_uni poblacion_estud_uni
## poblacion_total 0.68597382 0.93028468
## PIB_per_capita -0.03214949 0.07422998
## tasa_desempleo -0.05223477 -0.09736679
## poblacion_no_estud_uni 1.00000000 0.70677227
## poblacion_estud_uni 0.70677227 1.00000000
## nivel_empleo 0.05223477 0.09736679
## porcentaje_poblacion_uni -0.01861927 0.13096885
## porcentaje_poblacion_no_uni 0.14843147 -0.13062426
## nivel_empleo porcentaje_poblacion_uni
## poblacion_total 0.08787036 -0.03726835
## PIB_per_capita 0.19997906 0.74923001
## tasa_desempleo -1.00000000 -0.12605474
## poblacion_no_estud_uni 0.05223477 -0.01861927
## poblacion_estud_uni 0.09736679 0.13096885
## nivel_empleo 1.00000000 0.12605474
## porcentaje_poblacion_uni 0.12605474 1.00000000
## porcentaje_poblacion_no_uni -0.02323676 0.13757788
## porcentaje_poblacion_no_uni
## poblacion_total -0.13505178
## PIB_per_capita 0.13324962
## tasa_desempleo 0.02323676
## poblacion_no_estud_uni 0.14843147
## poblacion_estud_uni -0.13062426
## nivel_empleo -0.02323676
## porcentaje_poblacion_uni 0.13757788
## porcentaje_poblacion_no_uni 1.00000000
El presente estudio aplica un modelo de regresión lineal múltiple con el objetivo de analizar la influencia de diversas variables socioeconómicas sobre el nivel de empleo en diferentes países. La variable dependiente es el nivel de empleo, mientras que las variables independientes incluyen factores cuantitativos y categóricos como el PIB per cápita, la población con estudios universitarios, la clasificación de ingresos (bajo, medio-bajo, medio-alto) y la región geográfica (Asia, Europa, Norteamérica, Suramérica).
La ecuación general del modelo puede expresarse de la siguiente forma:
Nivel de empleo = β0 + β1(PIB per cápita) + β2(Población universitaria) + β3(Tasa de desempleo) + β4(Región) + β5(Clasificación de ingresos) + ε
Donde:
modelo <- lm(nivel_empleo ~ poblacion_estud_uni + PIB_per_capita + region +
clasificacion_ingresos,
data = empleo)
summary(modelo)##
## Call:
## lm(formula = nivel_empleo ~ poblacion_estud_uni + PIB_per_capita +
## region + clasificacion_ingresos, data = empleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -22.253 -2.520 1.325 4.140 9.684
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.396e+01 1.738e+00 48.308 < 2e-16
## poblacion_estud_uni 2.967e-08 2.594e-08 1.144 0.254738
## PIB_per_capita 7.363e-05 2.732e-05 2.695 0.007938
## regionAsia 4.934e+00 1.548e+00 3.187 0.001788
## regionEurope 5.076e+00 1.904e+00 2.666 0.008612
## regionNorth America 1.890e+00 1.923e+00 0.983 0.327525
## regionSouth America 2.757e+00 2.476e+00 1.113 0.267558
## clasificacion_ingresosIngreso bajo 8.081e+00 3.771e+00 2.143 0.033901
## clasificacion_ingresosIngreso medio-alto 3.351e+00 1.452e+00 2.308 0.022502
## clasificacion_ingresosIngreso medio-bajo 7.354e+00 1.933e+00 3.804 0.000215
##
## (Intercept) ***
## poblacion_estud_uni
## PIB_per_capita **
## regionAsia **
## regionEurope **
## regionNorth America
## regionSouth America
## clasificacion_ingresosIngreso bajo *
## clasificacion_ingresosIngreso medio-alto *
## clasificacion_ingresosIngreso medio-bajo ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.912 on 135 degrees of freedom
## Multiple R-squared: 0.1719, Adjusted R-squared: 0.1167
## F-statistic: 3.113 on 9 and 135 DF, p-value: 0.001963
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.91931, p-value = 2.833e-07
##
## studentized Breusch-Pagan test
##
## data: modelo
## BP = 13.39, df = 9, p-value = 0.1458
modelo <- lm(nivel_empleo ~ poblacion_estud_uni + PIB_per_capita + region +
clasificacion_ingresos,
data = empleo)
vif(modelo)## GVIF Df GVIF^(1/(2*Df))
## poblacion_estud_uni 1.063575 1 1.031298
## PIB_per_capita 1.858536 1 1.363281
## region 2.484348 4 1.120473
## clasificacion_ingresos 2.704346 3 1.180349
si el valo p < 0.05, se considera estadisticamente significativa:
En el análisis de las variables continuas dentro del modelo de regresión lineal múltiple, se destacan dos variables principales: la población con estudios universitarios y el PIB per cápita. En el caso de la población con estudios universitarios, se encontró que su coeficiente es negativo y muy pequeño, lo que indica una influencia mínima y desfavorable sobre el nivel de empleo. Además, no es estadísticamente significativa (p = 0.254738), por lo que no hay evidencia suficiente para afirmar que un aumento en esta población tenga un efecto real sobre el empleo. Esto resulta interesante, ya que se esperaba que esta variable tuviera un impacto importante, lo que sugiere que podrían necesitarse más datos o un enfoque diferente para evaluar su influencia. Por otro lado, el PIB per cápita presenta un coeficiente positivo (7.363e-05), lo que implica que a medida que aumenta esta variable, también lo hace el nivel de empleo. Esta relación sí es estadísticamente significativa (p = 0.007938), lo que respalda la idea de que el desarrollo económico medido por el PIB tiene una conexión directa con el empleo.
Respecto a las variables categóricas, se analizaron dos grupos: las regiones geográficas y la clasificación de ingresos. En el análisis por regiones, se encontró que tanto Asia como Europa tienen coeficientes positivos y significativos (p = 0.001788 y p = 0.008612, respectivamente), lo que indica que en comparación con otras regiones, presentan un mayor nivel de empleo. En contraste, Norteamérica y Sudamérica no mostraron significancia estadística (p = 0.327525 y p = 0.267558 respectivamente), lo que sugiere que sus niveles de empleo no difieren considerablemente de los de otras regiones en el modelo. En cuanto a la clasificación de ingresos, los países con ingresos bajos, medio-bajos y medio-altos mostraron una relación positiva con el nivel de empleo. Todos estos coeficientes fueron estadísticamente significativos, siendo especialmente fuerte en el caso de los ingresos medio-bajos (p = 0.000215), seguido por los ingresos medio-altos (p = 0.022502) y bajos (p = 0.033901). Estos resultados indican que, dentro del modelo, el nivel de ingreso de una región tiene un papel importante en la explicación del nivel de empleo observado.
En cuanto a la bondad de ajuste delmodelo (R²), el valor es 0.1167, equivalente al 11.67% de la variablidad del nivel de empleo explicada con respecto a las variables incluidas en el modelo. Si bien este valor no es alto,es común en estudios sociales o económicos encontrar niveles de explicación moderados, debido a la complejidad de los fenómenos y la influencia de múltiples factores no observados (Wooldridge, 2016). Este resultado sugiere que hay otros factores externos al modelo que también influyen en el nivel de empleo y que podrían ser considerados en futuras investigaciones para mejorar su capacidad explicativa.
Hipótesis nula (H₀): los residuos son normales. Hipótesis alternativa (H₁): los residuos no son normales.
Se realizó una prueba de normalidad de los residuos mediante la prueba de Shapiro-Wilk. El valor p obtenido fue de 1.178e-09 , lo que indica que los residuos no siguen una distribución normal (p < 0.05). Esto sugiere una violación del supuesto de normalidad en el modelo de regresión lineal, lo cual indica que hay evidencia estadísticamente significativa para rechazar la hipótesis nula.
Hipótesis nula (H₀): Varianza constante (homocedasticidad). Hipótesis alternativa (H₁): Varianza no constante (heterocedasticidad).
Se realizó una prueba de Homocedasticidad: mediante la prueba de Breusch-Pagan . El valor p obtenido fue de 0.0001114 , lo que indica que hay evidencia estadísticamente significativa para rechazar la hipótesis nula por lo tanto los residuos siguen una varianza constante (p < 0.05) (homocedasticidad).
Se obtuvo que la Población con estudios universitarios tiene un vif de 1.04 muy baja multicolinealidad, es decir no hay problemas de multicolinealidad con la variable.
PIB per cápita tiene un vif de 1.41 muy baja multicolinealidad, es decir no hay problemas de multicolinealidad con la variable.
Región tiene un vif de 1.13 muy baja multicolinealidad, es decir no hay problemas de multicolinealidad con la variable, a pesar de que son 4 regiones
La clasificación de ingresos tiene un vif de 1.20 muy baja multicolinealidad, es decir no hay problemas de multicolinealidad con la variable lo mismo para el nivel de desempleo con un vif de 1.07.
A modo de conclusiones se puede resaltar que:
La tasa de desempleo va de cifras menores al 2% hasta valores superiores al 30%.
Los países con nivel económico alto no necesariamente tienen la menor tasa de desempleo.
Países como Canadá tienen más del 20% de su población en educación universitaria. Otros, como Burkina Faso o Burundi, están por debajo del 2%.
Hay una relación visible entre el nivel de ingreso y el porcentaje de población universitaria.
Los niveles de empleo tienden a ser altos en países con buen desempeño económico. Sin embargo, hay casos con alto nivel de empleo pero bajo PIB per cápita, lo que indica empleo informal o subempleo.
Relación entre PIB per cápita y educación universitaria: Hay una correlación positiva visible.
Tasa de desempleo según nivel de ingreso 1.Ingreso alto: desempleo entre 3-9% generalmente. 2.Ingreso medio-bajo o bajo: desempleo más variable Esto indica que una tasa de desempleo baja no siempre refleja buena economía (puede deberse al empleo informal).
Debido a esto es posible concluir que la variable educación universitaria sobre el nivel de desempleo en un país posee una menor influencia que el factor de desempeño económico, por otro lado se puede inferir que hay variabilidad en el nivel educativo de la población dependiendo del comportamiento de factores como el PIB per cápita.
Finalmente, se afirma que la correlación inicial entre las variables: estudios superiores y empleabilidad es casi nula.
Bolívar, A. (2018). Empleabilidad y competencias genéricas en la educación superior: Un análisis desde la perspectiva del estudiante. Revista de Educación, 380, 1-24.
García, M., & Martínez, J. (2020). El vínculo entre educación superior y empleo: desafíos para la inserción laboral juvenil. Revista Latinoamericana de Educación, 22(1), 45-62.
Teichler, U. (2015). Higher education and the world of work: Conceptual frameworks, comparative perspectives, empirical findings. Springer.
OECD. (2023). Education at a Glance 2023: OECD Indicators. OECD Publishing. https://doi.org/10.1787/69096873-en
Wooldridge, J. M. (2016). Introductory Econometrics: A Modern Approach (6th ed.). Cengage Learning.