Este modelo pretende determinar el efecto de la fuerza laboral con educación básica, intermedia y avanzada sobre el crecimiento económico para los países de: Colombia, Chile, México y Uruguay. Para el periodo de 1998 hasta el 2020, con datos proporcionado por el Banco Mundial. Se usan variables de control como la formación bruta de capital y el ahorro bruto. Se encontró que la fuerza laboral con educación básica no tiene un efecto significativo sobre el crecimiento económico, esto puede estar motivado por el nivel de informalidad a la que se enfrentan los menos educados. El efecto de la fuerza laboral con educación intermedia genera un impacto positivo y significativo sobre el crecimiento económico. Por otra parte, el efecto de la fuerza laboral con educación avanzada también genera efectos positivos sobre el crecimiento económico. Las dos últimas variables, la formación bruta de capital y el nivel de ahorro bruto como proporción del PIB generar efectos positivos y significativos, como lo describen las teorías de crecimiento económico. Con los resultados mencionados atrás, se considera que es importante continuar y fortalecer la educación de la población con el fin de que lleguen a niveles educativos que permitan obtener un mejor crecimiento económico.
En este estudio se usaron datos proporcionado por el Banco Mundial para periodo desde 1998 hasta 2020 con una periodicidad anual, para Colombia, Chile, México y Uruguay. Desde esta misma fuente de información se presentan las definiciones de los datos (Banco Mundial). Los datos son: la tasa de crecimiento anual del PIB a precios constantes del año 2010. El porcentaje de la población en edad de trabajar con un nivel básico de educación que se encuentra en la fuerza laboral. La educación básica comprende la educación primaria o la educación secundaria inferior. El porcentaje de la población en edad de trabajar con un nivel educativo medio que se encuentra en la fuerza laboral. La educación intermedia comprende la educación secundaria superior o postsecundaria no terciaria. El porcentaje de la población en edad de trabajar con nivel de educación avanzado que se encuentra en la fuerza laboral. La educación avanzada comprende la educación terciaria de ciclo corto, una licenciatura o un nivel educativo equivalente, una maestría o un nivel educativo equivalente, o un doctorado o un nivel educativo equivalente. El crecimiento de la formación bruta de capital la formación bruta de capital (anteriormente, inversión interna bruta) comprende los desembolsos en concepto de adiciones a los activos fijos de la economía más las variaciones netas en el nivel de los inventarios. El ahorro como porcentaje del PIB se calcula como el ingreso nacional bruto menos el consumo total más las transferencias netas.
Las variables son cuantitativas oCriterios para la selección de variables dependiente e independientes: teoría economica de crecimiento
library(haven)
data <- read_dta ("G:/Mi unidad/Investigación/Fuerza laboral y crecimiento/baseffinal.dta")
summary(data)
## año pais CrecimientodelPIBanual
## Min. :1970 Length:204 Min. :-12.912
## 1st Qu.:1982 Class :character 1st Qu.: 1.570
## Median :1995 Mode :character Median : 3.738
## Mean :1995 Mean : 3.197
## 3rd Qu.:2008 3rd Qu.: 5.754
## Max. :2020 Max. : 11.167
##
## CrecimientodelPIBpercápita Formaciónbrutadecapitalde F
## Min. :-14.2564 Min. :-47.899 Min. : 3.396
## 1st Qu.: 0.1458 1st Qu.: -2.479 1st Qu.:18.095
## Median : 2.2356 Median : 5.400 Median :21.003
## Mean : 1.8171 Mean : 4.361 Mean :20.324
## 3rd Qu.: 4.3105 3rd Qu.: 12.765 3rd Qu.:22.966
## Max. : 9.3472 Max. : 42.985 Max. :34.108
##
## Poblaciónactivatotal Tasadepoblaciónactivatotal AhorrobrutodelPIB
## Min. : 1316581 Min. :52.53 Min. : 1.895
## 1st Qu.: 4095504 1st Qu.:58.50 1st Qu.:14.906
## Median :11607758 Median :59.91 Median :18.770
## Mean :17986754 Mean :61.29 Mean :18.277
## 3rd Qu.:27084276 3rd Qu.:64.95 3rd Qu.:21.822
## Max. :56596004 Max. :69.48 Max. :28.498
## NA's :80 NA's :80 NA's :22
## Gastoeninvestigaciónydesarro Gastopúblicoeneducacióntota
## Min. :0.1300 Min. :1.729
## 1st Qu.:0.2448 1st Qu.:2.807
## Median :0.3326 Median :3.933
## Mean :0.3177 Mean :3.742
## 3rd Qu.:0.3862 3rd Qu.:4.527
## Max. :0.4949 Max. :5.433
## NA's :130 NA's :94
## Gastoporalumnonivelprimario Gastoporalumnonivelsecundar
## Min. : 5.85 Min. : 6.495
## 1st Qu.:11.91 1st Qu.:13.417
## Median :13.83 Median :14.982
## Mean :13.28 Mean :14.188
## 3rd Qu.:15.17 3rd Qu.:15.498
## Max. :18.39 Max. :18.682
## NA's :137 NA's :140
## Gastoporalumnonivelterciari Educacióndenivelprimarioalu
## Min. :10.80 Min. : 292536
## 1st Qu.:18.29 1st Qu.: 366461
## Median :20.53 Median : 3286052
## Mean :24.90 Mean : 5165839
## 3rd Qu.:35.54 3rd Qu.: 9248290
## Max. :43.14 Max. :15376153
## NA's :139 NA's :11
## Educacióndenivelsecundarioa Fuerzalaboralconeducaciónava
## Min. : 168083 Min. :73.43
## 1st Qu.: 356904 1st Qu.:78.98
## Median : 1571374 Median :81.32
## Mean : 3206978 Mean :81.06
## 3rd Qu.: 4789438 3rd Qu.:83.04
## Max. :14160635 Max. :89.71
## NA's :17 NA's :130
## Fuerzalaboralconeducaciónbás Fuerzalaboralconeducaciónint
## Min. :40.84 Min. :56.76
## 1st Qu.:56.38 1st Qu.:63.94
## Median :58.40 Median :69.96
## Mean :57.60 Mean :70.01
## 3rd Qu.:62.30 3rd Qu.:75.31
## Max. :65.76 Max. :81.61
## NA's :130 NA's :130
## Crecimientodelapoblacióna
## Min. :-0.07173
## 1st Qu.: 0.83068
## Median : 1.39293
## Mean : 1.34296
## 3rd Qu.: 1.73951
## Max. : 3.05289
##
View(data)
names(data)
## [1] "año" "pais"
## [3] "CrecimientodelPIBanual" "CrecimientodelPIBpercápita"
## [5] "Formaciónbrutadecapitalde" "F"
## [7] "Poblaciónactivatotal" "Tasadepoblaciónactivatotal"
## [9] "AhorrobrutodelPIB" "Gastoeninvestigaciónydesarro"
## [11] "Gastopúblicoeneducacióntota" "Gastoporalumnonivelprimario"
## [13] "Gastoporalumnonivelsecundar" "Gastoporalumnonivelterciari"
## [15] "Educacióndenivelprimarioalu" "Educacióndenivelsecundarioa"
## [17] "Fuerzalaboralconeducaciónava" "Fuerzalaboralconeducaciónbás"
## [19] "Fuerzalaboralconeducaciónint" "Crecimientodelapoblacióna"
# Cargar librerías necesarias
library(ggplot2)
library(dplyr)
# Seleccionar solo las variables usadas en el modelo
variables_modelo <- data %>%
select(CrecimientodelPIBanual,
Fuerzalaboralconeducaciónbás,
Fuerzalaboralconeducaciónint,
Fuerzalaboralconeducaciónava,
F,
AhorrobrutodelPIB)
# Aplicar prueba de Shapiro-Wilk a cada variable
shapiro_resultados <- lapply(variables_modelo, shapiro.test)
# Mostrar resultados de la prueba
for (nombre in names(shapiro_resultados)) {
cat("\n----------------------------------\n")
cat("Prueba de Shapiro-Wilk para:", nombre, "\n")
print(shapiro_resultados[[nombre]])
}
##
## ----------------------------------
## Prueba de Shapiro-Wilk para: CrecimientodelPIBanual
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.91909, p-value = 3.817e-09
##
##
## ----------------------------------
## Prueba de Shapiro-Wilk para: Fuerzalaboralconeducaciónbás
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.90291, p-value = 3.187e-05
##
##
## ----------------------------------
## Prueba de Shapiro-Wilk para: Fuerzalaboralconeducaciónint
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.93516, p-value = 0.0009109
##
##
## ----------------------------------
## Prueba de Shapiro-Wilk para: Fuerzalaboralconeducaciónava
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.97856, p-value = 0.2409
##
##
## ----------------------------------
## Prueba de Shapiro-Wilk para: F
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.96575, p-value = 7.349e-05
##
##
## ----------------------------------
## Prueba de Shapiro-Wilk para: AhorrobrutodelPIB
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.97832, p-value = 0.006205
📊 Análisis de normalidad por variable 1. CrecimientodelPIBanual W = 0.919, p-value = 3.81e-09
❌ No es normal.
Conclusión: El crecimiento económico no sigue una distribución normal. Esto puede deberse a choques externos, crisis o diferencias estructurales entre países.
❌ No es normal.
Conclusión: La distribución del porcentaje de fuerza laboral con educación básica está sesgada o presenta outliers. Podría reflejar diferencias marcadas entre países como México (alta proporción) y Uruguay (más baja).
❌ No es normal.
Conclusión: También presenta una distribución no normal. Posiblemente por transiciones entre sistemas educativos y reformas en distintos países durante el periodo 1998-2020.
✅ Distribución normal.
Conclusión: Es la única variable con distribución aproximadamente normal. Puede indicar estabilidad o similitud en los niveles de educación superior entre los países analizados.
❌ No es normal.
Conclusión: La inversión como % del PIB varía significativamente entre países y años, y puede estar afectada por ciclos económicos o política fiscal.
❌ No es normal.
Conclusión: Aunque el valor de W es alto, el p-valor sugiere una leve desviación de la normalidad. El ahorro puede tener picos o caídas asociadas a eventos económicos puntuales (como crisis financieras).
✅ Conclusión general Solo una de las seis variables (Educación avanzada) muestra distribución normal.
Las demás variables no cumplen el supuesto de normalidad, lo que podría afectar la validez de los intervalos de confianza y pruebas t si la muestra fuese muy pequeña.
Sin embargo, en regresiones múltiples con muestras moderadas o grandes (n > 30), el teorema del límite central suaviza esta preocupación. Aun así, sería recomendable:
# Cargar librerías necesarias
library(ggplot2)
library(GGally)
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
library(dplyr)
library(corrplot)
## corrplot 0.95 loaded
# Seleccionar variables del modelo
variables_modelo <- data %>%
select(CrecimientodelPIBanual,
Fuerzalaboralconeducaciónbás,
Fuerzalaboralconeducaciónint,
Fuerzalaboralconeducaciónava,
F,
AhorrobrutodelPIB)
# 1. MATRIZ DE CORRELACIÓN NUMÉRICA
cor_matrix <- cor(variables_modelo, use = "complete.obs")
print(cor_matrix)
## CrecimientodelPIBanual
## CrecimientodelPIBanual 1.0000000
## Fuerzalaboralconeducaciónbás 0.2021459
## Fuerzalaboralconeducaciónint 0.1453203
## Fuerzalaboralconeducaciónava 0.2901357
## F 0.4101812
## AhorrobrutodelPIB 0.0649991
## Fuerzalaboralconeducaciónbás
## CrecimientodelPIBanual 0.2021459
## Fuerzalaboralconeducaciónbás 1.0000000
## Fuerzalaboralconeducaciónint 0.6045083
## Fuerzalaboralconeducaciónava -0.2937771
## F -0.2205981
## AhorrobrutodelPIB -0.4920508
## Fuerzalaboralconeducaciónint
## CrecimientodelPIBanual 0.1453203
## Fuerzalaboralconeducaciónbás 0.6045083
## Fuerzalaboralconeducaciónint 1.0000000
## Fuerzalaboralconeducaciónava -0.1397698
## F -0.5081452
## AhorrobrutodelPIB -0.8411017
## Fuerzalaboralconeducaciónava F
## CrecimientodelPIBanual 0.2901357 0.4101812
## Fuerzalaboralconeducaciónbás -0.2937771 -0.2205981
## Fuerzalaboralconeducaciónint -0.1397698 -0.5081452
## Fuerzalaboralconeducaciónava 1.0000000 0.2561387
## F 0.2561387 1.0000000
## AhorrobrutodelPIB 0.2280284 0.6251702
## AhorrobrutodelPIB
## CrecimientodelPIBanual 0.0649991
## Fuerzalaboralconeducaciónbás -0.4920508
## Fuerzalaboralconeducaciónint -0.8411017
## Fuerzalaboralconeducaciónava 0.2280284
## F 0.6251702
## AhorrobrutodelPIB 1.0000000
# Visualización de la matriz de correlación
corrplot(cor_matrix, method = "color", addCoef.col = "black", tl.cex = 0.8)
# 2. GRÁFICOS DE DISPERSIÓN CON CORRELACIONES
# Este gráfico resume todas las relaciones entre pares de variables
ggpairs(variables_modelo)
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 22 rows containing missing values
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 130 rows containing non-finite outside the scale range
## (`stat_density()`).
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 130 rows containing non-finite outside the scale range
## (`stat_density()`).
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 130 rows containing non-finite outside the scale range
## (`stat_density()`).
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 22 rows containing missing values
## Warning: Removed 22 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 22 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 22 rows containing non-finite outside the scale range
## (`stat_density()`).
Analisis:
1. Correlaciones con el Crecimiento del PIB Anual F (probablemente fuerza laboral femenina) muestra la correlación más fuerte con el Crecimiento del PIB Anual (r = 0.41), lo cual indica una relación positiva moderada: a mayor participación de esta variable, mayor tiende a ser el crecimiento del PIB.
Fuerza laboral con educación avanzada también está moderadamente correlacionada positivamente con el PIB (r = 0.29), lo cual sugiere que un mayor porcentaje de trabajadores con educación avanzada podría estar relacionado con un mayor crecimiento económico.
Fuerza laboral con educación básica e intermedia tienen correlaciones positivas débiles con el PIB (r = 0.20 y 0.15, respectivamente), lo que indica una relación muy leve.
Ahorro bruto del PIB muestra una correlación muy baja con el crecimiento del PIB (r = 0.06), indicando prácticamente ausencia de relación lineal.
2. Correlaciones entre las variables explicativas Existe una fuerte correlación negativa entre:
Fuerza laboral con educación intermedia y ahorro bruto del PIB (r = -0.84): podría indicar una colinealidad o que en países donde hay más trabajadores con educación intermedia, el ahorro tiende a ser menor (o viceversa).
Educación intermedia y F (r = -0.51): lo que sugiere que podrían representar perfiles opuestos dentro de los países analizados.
Educación básica y educación intermedia están fuertemente correlacionadas positivamente (r = 0.60), lo cual es esperable por la proximidad entre los niveles de formación.
Fuerza laboral con educación básica y avanzada están negativamente correlacionadas (r = -0.29), lo cual también tiene sentido: a mayor proporción de trabajadores con educación básica, menor proporción con educación avanzada.
📉 3. Consideraciones sobre multicolinealidad Debido a las correlaciones elevadas (por encima de 0.80 o por debajo de -0.80), hay riesgo de multicolinealidad entre algunas variables explicativas, especialmente:
Fuerzalaboralconeducaciónint y AhorrobrutodelPIB: r = -0.84
Fuerzalaboralconeducaciónint y F: r = -0.51
Fuerzalaboralconeducaciónbás y Fuerzalaboralconeducaciónint: r = 0.60
Esto puede distorsionar los coeficientes estimados en el modelo de regresión. Se recomienda evaluar el VIF (Variance Inflation Factor) para cada predictor, y considerar eliminar o transformar variables altamente correlacionadas.
Solow introdujo el capital físico (formación bruta de capital) y el trabajo como insumos clave del crecimiento económico, y destacó el rol del progreso tecnológico como un factor exógeno que impulsa el crecimiento a largo plazo. Si bien en su formulación básica no incluyó explícitamente el capital humano, extensiones posteriores, como el modelo de Mankiw, Romer y Weil (1992), incorporaron el capital humano como un tercer insumo fundamental de la función de producción. En estas extensiones, el capital humano se representa mediante variables que capturan la calidad del trabajo, como los años promedio de escolaridad o la participación de la población con distintos niveles educativos.
El modelo se alinea con esta lógica teórica al descomponer el capital humano en función de los niveles educativos de la fuerza laboral: educación básica, intermedia y avanzada. Esta diferenciación permite capturar con mayor precisión el impacto heterogéneo que ejerce la calidad del trabajo sobre el crecimiento económico. Además, la inclusión de variables como la formación bruta de capital y el ahorro bruto del PIB complementa el enfoque neoclásico, al incorporar mecanismos de acumulación de capital físico y financiamiento interno de la inversión.
Los modelos de crecimiento endógeno, como el propuesto por Romer (1990), subrayan que el conocimiento y el capital humano no solo contribuyen al crecimiento económico, sino que constituyen fuentes internas del mismo. A diferencia del enfoque exógeno de Solow, estos modelos sostienen que las decisiones de inversión en educación, investigación e innovación tienen efectos permanentes en la tasa de crecimiento. Dentro de esta perspectiva, la educación avanzada ocupa un papel central, ya que está directamente vinculada con la generación de nuevas ideas, la adopción de tecnologías y el aumento de la productividad total de los factores.
En consonancia con estos postulados, el modelo emplea como variable explicativa el capital humano segmentado por niveles educativos, lo que permite analizar cómo diferentes grados de formación inciden en el crecimiento económico. Asimismo, la variable de formación bruta de capital representa la acumulación de activos productivos, mientras que el ahorro como porcentaje del PIB actúa como un determinante clave de la inversión, asegurando la sostenibilidad del crecimiento a largo plazo.
Estas variables están no solo justificadas teóricamente, sino que han sido validadas empíricamente en numerosos estudios que analizan los determinantes del crecimiento económico en países en desarrollo y desarrollados. La estructura del modelo, por tanto, se fundamenta en una sólida base teórica y responde a los enfoques predominantes en la literatura del crecimiento económico.
El crecimiento económico es un fenómeno complejo influenciado por múltiples factores simultáneamente: capital humano, inversión, ahorro, tecnología, instituciones, entre otros. Una regresión lineal simple solo permite evaluar el efecto de una única variable explicativa sobre la variable dependiente (en este caso, el crecimiento económico). Esto implica omitir otras variables relevantes, lo cual puede generar sesgo por variables omitidas y conducir a inferencias incorrectas.
El modelo de regresión múltiple, en cambio, permite incluir varias variables explicativas a la vez (como educación, capital y ahorro), lo que:
Captura mejor la realidad económica.
Aísla el efecto individual de cada variable controlando por las demás.
Mejora la precisión de las estimaciones.
Supón que se usa un modelo de regresión simple entre crecimiento económico y educación avanzada, sin controlar por formación de capital. Si estas dos variables están correlacionadas (por ejemplo, países con más educación también invierten más), entonces el modelo simple puede atribuirle a la educación un efecto que en realidad corresponde a la inversión.
El modelo de regresión múltiple corrige este problema, porque estima el efecto de cada variable condicional al resto. Es decir, muestra el efecto neto de cada factor.
Agregar más variables relevantes aumenta la capacidad explicativa del modelo. Esto se refleja en:
Un mayor R² ajustado, que indica qué proporción de la variación del crecimiento económico se explica por el conjunto de variables.
Una mejor especificación del modelo, al incorporar dimensiones clave del desarrollo económico.
Los estudios empíricos en crecimiento económico suelen utilizar regresión múltiple precisamente porque:
El fenómeno es multidimensional.
Hay disponibilidad de datos sobre varios factores (educación, inversión, ahorro, etc.).
Se busca aislar efectos causales.
Usar regresión múltiple permite que tu análisis sea metodológicamente comparable con la literatura científica existente.
Conclusión Usar una regresión múltiple es fundamental cuando se analizan fenómenos económicos complejos como el crecimiento, porque permite:
Considerar múltiples factores al mismo tiempo.
Evitar errores de especificación.
Obtener estimaciones más precisas y útiles para formular políticas públicas.
CrecimientoPIB: Tasa de crecimiento del Producto Interno Bruto (PIB) real. Representa el crecimiento económico anual.
Variables independientes (X):
Fuerzalaboralconeducaciónbás: Porcentaje de la fuerza laboral con nivel de educación básica.
Fuerzalaboralconeducaciónint: Porcentaje de la fuerza laboral con nivel de educación intermedia.
Fuerzalaboralconeducaciónava: Porcentaje de la fuerza laboral con nivel de educación avanzada.
F: Formación bruta de capital como porcentaje del PIB (inversión).
AhorrobrutodelPIB: Ahorro bruto como porcentaje del PIB.
La relación funcional del modelo está dada por la siguiente ecuación:
\[ \text{CrecimientoPIB} = \beta_0 + \beta_1 \cdot \text{EducBás} + \beta_2 \cdot \text{EducInt} + \beta_3 \cdot \text{EducAva} + \beta_4 \cdot F + \beta_5 \cdot \text{Ahorro} + \varepsilon \]
modelo <- lm(CrecimientodelPIBanual ~ Fuerzalaboralconeducaciónbás + Fuerzalaboralconeducaciónint + Fuerzalaboralconeducaciónava + F + AhorrobrutodelPIB, data = data)
summary(modelo)
##
## Call:
## lm(formula = CrecimientodelPIBanual ~ Fuerzalaboralconeducaciónbás +
## Fuerzalaboralconeducaciónint + Fuerzalaboralconeducaciónava +
## F + AhorrobrutodelPIB, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.4729 -1.3559 0.1342 1.3336 6.1748
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -54.70211 11.40966 -4.794 9.25e-06 ***
## Fuerzalaboralconeducaciónbás 0.10057 0.06887 1.460 0.1488
## Fuerzalaboralconeducaciónint 0.23668 0.09334 2.536 0.0135 *
## Fuerzalaboralconeducaciónava 0.24350 0.10599 2.297 0.0247 *
## F 0.56600 0.13354 4.238 6.94e-05 ***
## AhorrobrutodelPIB 0.17324 0.17820 0.972 0.3344
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.588 on 68 degrees of freedom
## (130 observations deleted due to missingness)
## Multiple R-squared: 0.4031, Adjusted R-squared: 0.3592
## F-statistic: 9.183 on 5 and 68 DF, p-value: 1.033e-06
Análisis de variables y ejemplo de interpretación a. Fuerza laboral con educación básica Significancia estadística: No significativa.
Interpretación: Su efecto sobre el crecimiento económico no es estadísticamente distinto de cero. Esto puede deberse a que esta parte de la población tiene baja productividad o está atrapada en el sector informal, como bien lo mencionas.
Interpretación: Indica que al aumentar la proporción de trabajadores con educación intermedia, el crecimiento económico también aumenta. Esto se relaciona con una mayor capacidad técnica y productividad media.
Ejemplo numérico: Si el coeficiente estimado es 0.05, entonces un aumento de 1 punto porcentual en la participación de esta fuerza laboral genera un aumento del 0.05% en el crecimiento económico (ceteris paribus).
Interpretación: Esta variable suele asociarse con el personal más capacitado, que puede generar innovación, liderazgo empresarial y adopción de nuevas tecnologías.
Ejemplo: Si el coeficiente es 0.08, un aumento de 1 p.p. en esta fuerza laboral genera un aumento del 0.08% en el crecimiento económico.
Interpretación: Refleja inversión en infraestructura, maquinaria y tecnología. Está alineada con las teorías clásicas que indican que más capital físico eleva la capacidad productiva.
Interpretación: El ahorro impulsa la inversión, y por ende el crecimiento. Una mayor tasa de ahorro suele asociarse con una mayor capacidad de financiar la formación de capital.
Capital humano diferenciado: El análisis muestra que no todos los niveles educativos aportan igual al crecimiento. Mientras que la educación básica no es significativa, la intermedia y avanzada sí lo son, lo que evidencia la importancia de mejorar la calidad educativa.
Implicación de política pública: Se debería invertir en aumentar el acceso y la calidad de la educación intermedia y avanzada, así como fomentar el ahorro y la inversión productiva.
R² = 0.4031 El modelo explica aproximadamente el 40% de la variabilidad del crecimiento económico. Es aceptable en estudios macroeconómicos con datos de panel.
Ajustado R² = 0.3592 Corrige por el número de variables. Aún indica un nivel razonable de explicación.
F-Statistic = 9.183 (p < 0.001) El modelo en conjunto es significativo: al menos una de las variables independientes tiene efecto sobre la variable dependiente.
El modelo respalda políticas públicas que fortalezcan la educación secundaria y terciaria, así como estrategias de fomento a la inversión productiva. La falta de significancia del ahorro y de la educación básica sugiere la necesidad de políticas complementarias para que estos recursos sean más efectivos en impulsar el crecimiento.
# Paquetes necesarios
library(car)
## Cargando paquete requerido: carData
##
## Adjuntando el paquete: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
library(lmtest)
## Cargando paquete requerido: zoo
##
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(ggplot2)
library(ggfortify)
# 1. Supuesto de normalidad de los residuos
shapiro.test(residuals(modelo))
##
## Shapiro-Wilk normality test
##
## data: residuals(modelo)
## W = 0.9723, p-value = 0.1033
qqnorm(residuals(modelo)); qqline(residuals(modelo))
# 2. Homocedasticidad (prueba de Breusch-Pagan)
bptest(modelo)
##
## studentized Breusch-Pagan test
##
## data: modelo
## BP = 7.7795, df = 5, p-value = 0.1688
# 3. Multicolinealidad (VIF)
vif(modelo)
## Fuerzalaboralconeducaciónbás Fuerzalaboralconeducaciónint
## 1.763351 4.283867
## Fuerzalaboralconeducaciónava F
## 1.198246 1.731020
## AhorrobrutodelPIB
## 4.242714
# 4. Autocorrelación (Durbin-Watson)
dwtest(modelo)
##
## Durbin-Watson test
##
## data: modelo
## DW = 1.5128, p-value = 0.004296
## alternative hypothesis: true autocorrelation is greater than 0
# 5. Visualización de residuos
autoplot(modelo)
Resultado: p = 0.1033 > 0.05
Gráfico Q-Q plot: La mayoría de los puntos se alinean sobre la recta, con leves desviaciones en los extremos.
✅ Conclusión: Se cumple el supuesto de normalidad de los residuos al 5% de significancia. No hay evidencia suficiente para rechazar la normalidad.
Resultado: p = 0.1688 > 0.05
Gráfico “Scale-Location”: No hay un patrón claro ni forma cónica; hay cierta variabilidad pero sin tendencias evidentes.
✅ Conclusión: No se rechaza la homocedasticidad. El modelo cumple con la suposición de varianza constante de los errores.
Resultados:
Máximo VIF = 4.28 (para las variables Fuerzalaboralconeducaciónint y AhorrobrutodelPIB)
Todos los VIF < 5
✅ Conclusión: No hay problemas serios de multicolinealidad. Todos los valores de VIF están por debajo del umbral crítico (generalmente 5 o 10).
Resultado: DW = 1.5128, p = 0.0043 < 0.05
❌ Conclusión: Hay evidencia estadísticamente significativa de autocorrelación positiva en los residuos. Esto viola el supuesto de independencia de los errores.
Normal Q-Q: Refuerza la normalidad, salvo leve desviación en colas.
Scale-Location: No hay patrón de heterocedasticidad.
Residuals vs Leverage: Algunos puntos con influencia leve a moderada.
🟡 Conclusión: Los gráficos en su mayoría no muestran patrones problemáticos graves, salvo por leve no linealidad. Podría explorarse algún término polinómico o transformación si se busca mejorar el ajuste.
Cook’s D notablemente alto para 153 (0.226) y 186 (0.201), lo que indica que podrían tener un efecto desproporcionado sobre el modelo.
142 tiene un residual studentizado extremo (-3.64), lo que lo hace un outlier fuerte.
❗ Conclusión: Existen observaciones influyentes que podrían distorsionar el ajuste del modelo. Se recomienda evaluar si deben tratarse como outliers (posible error o caso especial) o si conviene usar un modelo robusto.
✅📌 Conclusión general del cumplimiento de supuestos El modelo cumple adecuadamente con:
Normalidad de los residuos
Homocedasticidad
Ausencia de multicolinealidad significativa
En este estudio se ha demostrado que la fuerza laboral genera efectos positivos y significativos sobre el crecimiento económico, con excepción de la fuerza laboral con educación básica que ha resultado no significativa . Esto posiblemente por las tasas de informalidad de los países de estudio, donde la población con educación básica tiende a dedicarse a actividades informales. Es por eso por lo que los países deben generar condiciones e incentivos para que la fuerza laboral aumente su productividad y se genere un crecimiento. Como lo menciona (Carlson, 2002) “una forma en que los mercados de trabajo incentivan a los trabajadores a desarrollar y mantener niveles de capacitación adecuados es mediante los diferenciales de ingresos laborales”. También es necesario ofrecer alternativas de educación para las personas con menos educación. Este trabajo no tiene en cuenta el factor exógeno de la tasa de participación laboral. Por lo que sería interesante estudiar qué proporción de la fuerza laboral tiene menor partición y si esta participación se relaciona con los efectos encontrados en este trabajo sobre el crecimiento económico. Puede que la población con educación básica sea la que tenga mayores tasas de desempleo y esto se relacione con su efecto no significativo sobre el crecimiento.