1 INTRODUCCIÓN Y OBJETIVO

Este modelo pretende determinar el efecto de la fuerza laboral con educación básica, intermedia y avanzada sobre el crecimiento económico para los países de: Colombia, Chile, México y Uruguay. Para el periodo de 1998 hasta el 2020, con datos proporcionado por el Banco Mundial. Se usan variables de control como la formación bruta de capital y el ahorro bruto. Se encontró que la fuerza laboral con educación básica no tiene un efecto significativo sobre el crecimiento económico, esto puede estar motivado por el nivel de informalidad a la que se enfrentan los menos educados. El efecto de la fuerza laboral con educación intermedia genera un impacto positivo y significativo sobre el crecimiento económico. Por otra parte, el efecto de la fuerza laboral con educación avanzada también genera efectos positivos sobre el crecimiento económico. Las dos últimas variables, la formación bruta de capital y el nivel de ahorro bruto como proporción del PIB generar efectos positivos y significativos, como lo describen las teorías de crecimiento económico. Con los resultados mencionados atrás, se considera que es importante continuar y fortalecer la educación de la población con el fin de que lleguen a niveles educativos que permitan obtener un mejor crecimiento económico.

2. DATOS

En este estudio se usaron datos proporcionado por el Banco Mundial para periodo desde 1998 hasta 2020 con una periodicidad anual, para Colombia, Chile, México y Uruguay. Desde esta misma fuente de información se presentan las definiciones de los datos (Banco Mundial). Los datos son: la tasa de crecimiento anual del PIB a precios constantes del año 2010. El porcentaje de la población en edad de trabajar con un nivel básico de educación que se encuentra en la fuerza laboral. La educación básica comprende la educación primaria o la educación secundaria inferior. El porcentaje de la población en edad de trabajar con un nivel educativo medio que se encuentra en la fuerza laboral. La educación intermedia comprende la educación secundaria superior o postsecundaria no terciaria. El porcentaje de la población en edad de trabajar con nivel de educación avanzado que se encuentra en la fuerza laboral. La educación avanzada comprende la educación terciaria de ciclo corto, una licenciatura o un nivel educativo equivalente, una maestría o un nivel educativo equivalente, o un doctorado o un nivel educativo equivalente. El crecimiento de la formación bruta de capital la formación bruta de capital (anteriormente, inversión interna bruta) comprende los desembolsos en concepto de adiciones a los activos fijos de la economía más las variaciones netas en el nivel de los inventarios. El ahorro como porcentaje del PIB se calcula como el ingreso nacional bruto menos el consumo total más las transferencias netas.

Las variables son cuantitativas oCriterios para la selección de variables dependiente e independientes: teoría economica de crecimiento

3. NORMALIDAD

library(haven)
data <- read_dta ("G:/Mi unidad/Investigación/Fuerza laboral y crecimiento/baseffinal.dta")
summary(data)
##       año           pais           CrecimientodelPIBanual
##  Min.   :1970   Length:204         Min.   :-12.912       
##  1st Qu.:1982   Class :character   1st Qu.:  1.570       
##  Median :1995   Mode  :character   Median :  3.738       
##  Mean   :1995                      Mean   :  3.197       
##  3rd Qu.:2008                      3rd Qu.:  5.754       
##  Max.   :2020                      Max.   : 11.167       
##                                                          
##  CrecimientodelPIBpercápita Formaciónbrutadecapitalde       F         
##  Min.   :-14.2564           Min.   :-47.899           Min.   : 3.396  
##  1st Qu.:  0.1458           1st Qu.: -2.479           1st Qu.:18.095  
##  Median :  2.2356           Median :  5.400           Median :21.003  
##  Mean   :  1.8171           Mean   :  4.361           Mean   :20.324  
##  3rd Qu.:  4.3105           3rd Qu.: 12.765           3rd Qu.:22.966  
##  Max.   :  9.3472           Max.   : 42.985           Max.   :34.108  
##                                                                       
##  Poblaciónactivatotal Tasadepoblaciónactivatotal AhorrobrutodelPIB
##  Min.   : 1316581     Min.   :52.53              Min.   : 1.895   
##  1st Qu.: 4095504     1st Qu.:58.50              1st Qu.:14.906   
##  Median :11607758     Median :59.91              Median :18.770   
##  Mean   :17986754     Mean   :61.29              Mean   :18.277   
##  3rd Qu.:27084276     3rd Qu.:64.95              3rd Qu.:21.822   
##  Max.   :56596004     Max.   :69.48              Max.   :28.498   
##  NA's   :80           NA's   :80                 NA's   :22       
##  Gastoeninvestigaciónydesarro Gastopúblicoeneducacióntota
##  Min.   :0.1300               Min.   :1.729              
##  1st Qu.:0.2448               1st Qu.:2.807              
##  Median :0.3326               Median :3.933              
##  Mean   :0.3177               Mean   :3.742              
##  3rd Qu.:0.3862               3rd Qu.:4.527              
##  Max.   :0.4949               Max.   :5.433              
##  NA's   :130                  NA's   :94                 
##  Gastoporalumnonivelprimario Gastoporalumnonivelsecundar
##  Min.   : 5.85               Min.   : 6.495             
##  1st Qu.:11.91               1st Qu.:13.417             
##  Median :13.83               Median :14.982             
##  Mean   :13.28               Mean   :14.188             
##  3rd Qu.:15.17               3rd Qu.:15.498             
##  Max.   :18.39               Max.   :18.682             
##  NA's   :137                 NA's   :140                
##  Gastoporalumnonivelterciari Educacióndenivelprimarioalu
##  Min.   :10.80               Min.   :  292536           
##  1st Qu.:18.29               1st Qu.:  366461           
##  Median :20.53               Median : 3286052           
##  Mean   :24.90               Mean   : 5165839           
##  3rd Qu.:35.54               3rd Qu.: 9248290           
##  Max.   :43.14               Max.   :15376153           
##  NA's   :139                 NA's   :11                 
##  Educacióndenivelsecundarioa Fuerzalaboralconeducaciónava
##  Min.   :  168083            Min.   :73.43               
##  1st Qu.:  356904            1st Qu.:78.98               
##  Median : 1571374            Median :81.32               
##  Mean   : 3206978            Mean   :81.06               
##  3rd Qu.: 4789438            3rd Qu.:83.04               
##  Max.   :14160635            Max.   :89.71               
##  NA's   :17                  NA's   :130                 
##  Fuerzalaboralconeducaciónbás Fuerzalaboralconeducaciónint
##  Min.   :40.84                Min.   :56.76               
##  1st Qu.:56.38                1st Qu.:63.94               
##  Median :58.40                Median :69.96               
##  Mean   :57.60                Mean   :70.01               
##  3rd Qu.:62.30                3rd Qu.:75.31               
##  Max.   :65.76                Max.   :81.61               
##  NA's   :130                  NA's   :130                 
##  Crecimientodelapoblacióna
##  Min.   :-0.07173         
##  1st Qu.: 0.83068         
##  Median : 1.39293         
##  Mean   : 1.34296         
##  3rd Qu.: 1.73951         
##  Max.   : 3.05289         
## 
View(data)
names(data)
##  [1] "año"                          "pais"                        
##  [3] "CrecimientodelPIBanual"       "CrecimientodelPIBpercápita"  
##  [5] "Formaciónbrutadecapitalde"    "F"                           
##  [7] "Poblaciónactivatotal"         "Tasadepoblaciónactivatotal"  
##  [9] "AhorrobrutodelPIB"            "Gastoeninvestigaciónydesarro"
## [11] "Gastopúblicoeneducacióntota"  "Gastoporalumnonivelprimario" 
## [13] "Gastoporalumnonivelsecundar"  "Gastoporalumnonivelterciari" 
## [15] "Educacióndenivelprimarioalu"  "Educacióndenivelsecundarioa" 
## [17] "Fuerzalaboralconeducaciónava" "Fuerzalaboralconeducaciónbás"
## [19] "Fuerzalaboralconeducaciónint" "Crecimientodelapoblacióna"
# Cargar librerías necesarias
library(ggplot2)
library(dplyr)

# Seleccionar solo las variables usadas en el modelo
variables_modelo <- data %>%
  select(CrecimientodelPIBanual, 
         Fuerzalaboralconeducaciónbás,
         Fuerzalaboralconeducaciónint,
         Fuerzalaboralconeducaciónava,
         F,
         AhorrobrutodelPIB)

# Aplicar prueba de Shapiro-Wilk a cada variable
shapiro_resultados <- lapply(variables_modelo, shapiro.test)

# Mostrar resultados de la prueba
for (nombre in names(shapiro_resultados)) {
  cat("\n----------------------------------\n")
  cat("Prueba de Shapiro-Wilk para:", nombre, "\n")
  print(shapiro_resultados[[nombre]])
}
## 
## ----------------------------------
## Prueba de Shapiro-Wilk para: CrecimientodelPIBanual 
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.91909, p-value = 3.817e-09
## 
## 
## ----------------------------------
## Prueba de Shapiro-Wilk para: Fuerzalaboralconeducaciónbás 
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.90291, p-value = 3.187e-05
## 
## 
## ----------------------------------
## Prueba de Shapiro-Wilk para: Fuerzalaboralconeducaciónint 
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.93516, p-value = 0.0009109
## 
## 
## ----------------------------------
## Prueba de Shapiro-Wilk para: Fuerzalaboralconeducaciónava 
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.97856, p-value = 0.2409
## 
## 
## ----------------------------------
## Prueba de Shapiro-Wilk para: F 
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.96575, p-value = 7.349e-05
## 
## 
## ----------------------------------
## Prueba de Shapiro-Wilk para: AhorrobrutodelPIB 
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.97832, p-value = 0.006205

📊 Análisis de normalidad por variable 1. CrecimientodelPIBanual W = 0.919, p-value = 3.81e-09

❌ No es normal.

Conclusión: El crecimiento económico no sigue una distribución normal. Esto puede deberse a choques externos, crisis o diferencias estructurales entre países.

  1. Fuerzalaboralconeducaciónbás W = 0.903, p-value = 3.18e-05

❌ No es normal.

Conclusión: La distribución del porcentaje de fuerza laboral con educación básica está sesgada o presenta outliers. Podría reflejar diferencias marcadas entre países como México (alta proporción) y Uruguay (más baja).

  1. Fuerzalaboralconeducaciónint W = 0.935, p-value = 0.00091

❌ No es normal.

Conclusión: También presenta una distribución no normal. Posiblemente por transiciones entre sistemas educativos y reformas en distintos países durante el periodo 1998-2020.

  1. Fuerzalaboralconeducaciónava W = 0.978, p-value = 0.2409

✅ Distribución normal.

Conclusión: Es la única variable con distribución aproximadamente normal. Puede indicar estabilidad o similitud en los niveles de educación superior entre los países analizados.

  1. F (Formación bruta de capital) W = 0.966, p-value = 7.35e-05

❌ No es normal.

Conclusión: La inversión como % del PIB varía significativamente entre países y años, y puede estar afectada por ciclos económicos o política fiscal.

  1. AhorrobrutodelPIB W = 0.978, p-value = 0.0062

❌ No es normal.

Conclusión: Aunque el valor de W es alto, el p-valor sugiere una leve desviación de la normalidad. El ahorro puede tener picos o caídas asociadas a eventos económicos puntuales (como crisis financieras).

✅ Conclusión general Solo una de las seis variables (Educación avanzada) muestra distribución normal.

Las demás variables no cumplen el supuesto de normalidad, lo que podría afectar la validez de los intervalos de confianza y pruebas t si la muestra fuese muy pequeña.

Sin embargo, en regresiones múltiples con muestras moderadas o grandes (n > 30), el teorema del límite central suaviza esta preocupación. Aun así, sería recomendable:

4 CORRELACIÓN Y RELACIÓN ENTRE VARIABLES

# Cargar librerías necesarias
library(ggplot2)
library(GGally)
## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2
library(dplyr)
library(corrplot)
## corrplot 0.95 loaded
# Seleccionar variables del modelo
variables_modelo <- data %>%
  select(CrecimientodelPIBanual, 
         Fuerzalaboralconeducaciónbás,
         Fuerzalaboralconeducaciónint,
         Fuerzalaboralconeducaciónava,
         F,
         AhorrobrutodelPIB)

# 1. MATRIZ DE CORRELACIÓN NUMÉRICA
cor_matrix <- cor(variables_modelo, use = "complete.obs")
print(cor_matrix)
##                              CrecimientodelPIBanual
## CrecimientodelPIBanual                    1.0000000
## Fuerzalaboralconeducaciónbás              0.2021459
## Fuerzalaboralconeducaciónint              0.1453203
## Fuerzalaboralconeducaciónava              0.2901357
## F                                         0.4101812
## AhorrobrutodelPIB                         0.0649991
##                              Fuerzalaboralconeducaciónbás
## CrecimientodelPIBanual                          0.2021459
## Fuerzalaboralconeducaciónbás                    1.0000000
## Fuerzalaboralconeducaciónint                    0.6045083
## Fuerzalaboralconeducaciónava                   -0.2937771
## F                                              -0.2205981
## AhorrobrutodelPIB                              -0.4920508
##                              Fuerzalaboralconeducaciónint
## CrecimientodelPIBanual                          0.1453203
## Fuerzalaboralconeducaciónbás                    0.6045083
## Fuerzalaboralconeducaciónint                    1.0000000
## Fuerzalaboralconeducaciónava                   -0.1397698
## F                                              -0.5081452
## AhorrobrutodelPIB                              -0.8411017
##                              Fuerzalaboralconeducaciónava          F
## CrecimientodelPIBanual                          0.2901357  0.4101812
## Fuerzalaboralconeducaciónbás                   -0.2937771 -0.2205981
## Fuerzalaboralconeducaciónint                   -0.1397698 -0.5081452
## Fuerzalaboralconeducaciónava                    1.0000000  0.2561387
## F                                               0.2561387  1.0000000
## AhorrobrutodelPIB                               0.2280284  0.6251702
##                              AhorrobrutodelPIB
## CrecimientodelPIBanual               0.0649991
## Fuerzalaboralconeducaciónbás        -0.4920508
## Fuerzalaboralconeducaciónint        -0.8411017
## Fuerzalaboralconeducaciónava         0.2280284
## F                                    0.6251702
## AhorrobrutodelPIB                    1.0000000
# Visualización de la matriz de correlación
corrplot(cor_matrix, method = "color", addCoef.col = "black", tl.cex = 0.8)

# 2. GRÁFICOS DE DISPERSIÓN CON CORRELACIONES
# Este gráfico resume todas las relaciones entre pares de variables
ggpairs(variables_modelo)
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 22 rows containing missing values
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 130 rows containing non-finite outside the scale range
## (`stat_density()`).
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 130 rows containing non-finite outside the scale range
## (`stat_density()`).
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 130 rows containing non-finite outside the scale range
## (`stat_density()`).
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 130 rows containing missing values
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning in ggally_statistic(data = data, mapping = mapping, na.rm = na.rm, :
## Removed 22 rows containing missing values
## Warning: Removed 22 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Removed 130 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 22 rows containing missing values or values outside the scale range
## (`geom_point()`).
## Warning: Removed 22 rows containing non-finite outside the scale range
## (`stat_density()`).

Analisis:

1. Correlaciones con el Crecimiento del PIB Anual F (probablemente fuerza laboral femenina) muestra la correlación más fuerte con el Crecimiento del PIB Anual (r = 0.41), lo cual indica una relación positiva moderada: a mayor participación de esta variable, mayor tiende a ser el crecimiento del PIB.

Fuerza laboral con educación avanzada también está moderadamente correlacionada positivamente con el PIB (r = 0.29), lo cual sugiere que un mayor porcentaje de trabajadores con educación avanzada podría estar relacionado con un mayor crecimiento económico.

Fuerza laboral con educación básica e intermedia tienen correlaciones positivas débiles con el PIB (r = 0.20 y 0.15, respectivamente), lo que indica una relación muy leve.

Ahorro bruto del PIB muestra una correlación muy baja con el crecimiento del PIB (r = 0.06), indicando prácticamente ausencia de relación lineal.

2. Correlaciones entre las variables explicativas Existe una fuerte correlación negativa entre:

Fuerza laboral con educación intermedia y ahorro bruto del PIB (r = -0.84): podría indicar una colinealidad o que en países donde hay más trabajadores con educación intermedia, el ahorro tiende a ser menor (o viceversa).

Educación intermedia y F (r = -0.51): lo que sugiere que podrían representar perfiles opuestos dentro de los países analizados.

Educación básica y educación intermedia están fuertemente correlacionadas positivamente (r = 0.60), lo cual es esperable por la proximidad entre los niveles de formación.

Fuerza laboral con educación básica y avanzada están negativamente correlacionadas (r = -0.29), lo cual también tiene sentido: a mayor proporción de trabajadores con educación básica, menor proporción con educación avanzada.

📉 3. Consideraciones sobre multicolinealidad Debido a las correlaciones elevadas (por encima de 0.80 o por debajo de -0.80), hay riesgo de multicolinealidad entre algunas variables explicativas, especialmente:

Fuerzalaboralconeducaciónint y AhorrobrutodelPIB: r = -0.84

Fuerzalaboralconeducaciónint y F: r = -0.51

Fuerzalaboralconeducaciónbás y Fuerzalaboralconeducaciónint: r = 0.60

Esto puede distorsionar los coeficientes estimados en el modelo de regresión. Se recomienda evaluar el VIF (Variance Inflation Factor) para cada predictor, y considerar eliminar o transformar variables altamente correlacionadas.

5. SELLECCIÓN Y PLANTEAMIENTO DEL MODELO

CONTEXTO Y TEORÍAS ECONÓICAS PARA LA JUSTIFICACIÓN DEL MODELO

Modelo de crecimiento de Solow (1956):

Solow introdujo el capital físico (formación bruta de capital) y el trabajo como insumos clave del crecimiento económico, y destacó el rol del progreso tecnológico como un factor exógeno que impulsa el crecimiento a largo plazo. Si bien en su formulación básica no incluyó explícitamente el capital humano, extensiones posteriores, como el modelo de Mankiw, Romer y Weil (1992), incorporaron el capital humano como un tercer insumo fundamental de la función de producción. En estas extensiones, el capital humano se representa mediante variables que capturan la calidad del trabajo, como los años promedio de escolaridad o la participación de la población con distintos niveles educativos.

El modelo se alinea con esta lógica teórica al descomponer el capital humano en función de los niveles educativos de la fuerza laboral: educación básica, intermedia y avanzada. Esta diferenciación permite capturar con mayor precisión el impacto heterogéneo que ejerce la calidad del trabajo sobre el crecimiento económico. Además, la inclusión de variables como la formación bruta de capital y el ahorro bruto del PIB complementa el enfoque neoclásico, al incorporar mecanismos de acumulación de capital físico y financiamiento interno de la inversión.

Modelo de crecimiento endógeno (Romer, 1990)

Los modelos de crecimiento endógeno, como el propuesto por Romer (1990), subrayan que el conocimiento y el capital humano no solo contribuyen al crecimiento económico, sino que constituyen fuentes internas del mismo. A diferencia del enfoque exógeno de Solow, estos modelos sostienen que las decisiones de inversión en educación, investigación e innovación tienen efectos permanentes en la tasa de crecimiento. Dentro de esta perspectiva, la educación avanzada ocupa un papel central, ya que está directamente vinculada con la generación de nuevas ideas, la adopción de tecnologías y el aumento de la productividad total de los factores.

En consonancia con estos postulados, el modelo emplea como variable explicativa el capital humano segmentado por niveles educativos, lo que permite analizar cómo diferentes grados de formación inciden en el crecimiento económico. Asimismo, la variable de formación bruta de capital representa la acumulación de activos productivos, mientras que el ahorro como porcentaje del PIB actúa como un determinante clave de la inversión, asegurando la sostenibilidad del crecimiento a largo plazo.

Estas variables están no solo justificadas teóricamente, sino que han sido validadas empíricamente en numerosos estudios que analizan los determinantes del crecimiento económico en países en desarrollo y desarrollados. La estructura del modelo, por tanto, se fundamenta en una sólida base teórica y responde a los enfoques predominantes en la literatura del crecimiento económico.

Por qué usar un modelo de regresión múltiple y no uno lineal simple?

1. Naturaleza multicausal del crecimiento económico

El crecimiento económico es un fenómeno complejo influenciado por múltiples factores simultáneamente: capital humano, inversión, ahorro, tecnología, instituciones, entre otros. Una regresión lineal simple solo permite evaluar el efecto de una única variable explicativa sobre la variable dependiente (en este caso, el crecimiento económico). Esto implica omitir otras variables relevantes, lo cual puede generar sesgo por variables omitidas y conducir a inferencias incorrectas.

El modelo de regresión múltiple, en cambio, permite incluir varias variables explicativas a la vez (como educación, capital y ahorro), lo que:

Captura mejor la realidad económica.

Aísla el efecto individual de cada variable controlando por las demás.

Mejora la precisión de las estimaciones.

2. Evitar el sesgo por omisión de variables

Supón que se usa un modelo de regresión simple entre crecimiento económico y educación avanzada, sin controlar por formación de capital. Si estas dos variables están correlacionadas (por ejemplo, países con más educación también invierten más), entonces el modelo simple puede atribuirle a la educación un efecto que en realidad corresponde a la inversión.

El modelo de regresión múltiple corrige este problema, porque estima el efecto de cada variable condicional al resto. Es decir, muestra el efecto neto de cada factor.

3. Capacidad explicativa del modelo

Agregar más variables relevantes aumenta la capacidad explicativa del modelo. Esto se refleja en:

Un mayor R² ajustado, que indica qué proporción de la variación del crecimiento económico se explica por el conjunto de variables.

Una mejor especificación del modelo, al incorporar dimensiones clave del desarrollo económico.

4. Comparabilidad con la literatura empírica

Los estudios empíricos en crecimiento económico suelen utilizar regresión múltiple precisamente porque:

El fenómeno es multidimensional.

Hay disponibilidad de datos sobre varios factores (educación, inversión, ahorro, etc.).

Se busca aislar efectos causales.

Usar regresión múltiple permite que tu análisis sea metodológicamente comparable con la literatura científica existente.

Conclusión Usar una regresión múltiple es fundamental cuando se analizan fenómenos económicos complejos como el crecimiento, porque permite:

Considerar múltiples factores al mismo tiempo.

Evitar errores de especificación.

Obtener estimaciones más precisas y útiles para formular políticas públicas.

planteamiento formal del modelo

  1. Variables del modelo Variable dependiente (Y):

CrecimientoPIB: Tasa de crecimiento del Producto Interno Bruto (PIB) real. Representa el crecimiento económico anual.

Variables independientes (X):

Fuerzalaboralconeducaciónbás: Porcentaje de la fuerza laboral con nivel de educación básica.

Fuerzalaboralconeducaciónint: Porcentaje de la fuerza laboral con nivel de educación intermedia.

Fuerzalaboralconeducaciónava: Porcentaje de la fuerza laboral con nivel de educación avanzada.

F: Formación bruta de capital como porcentaje del PIB (inversión).

AhorrobrutodelPIB: Ahorro bruto como porcentaje del PIB.

  1. Estructura funcional del modelo Desde un punto de vista econométrico, se propone un modelo de regresión lineal múltiple de la forma:

La relación funcional del modelo está dada por la siguiente ecuación:

\[ \text{CrecimientoPIB} = \beta_0 + \beta_1 \cdot \text{EducBás} + \beta_2 \cdot \text{EducInt} + \beta_3 \cdot \text{EducAva} + \beta_4 \cdot F + \beta_5 \cdot \text{Ahorro} + \varepsilon \]

modelo <- lm(CrecimientodelPIBanual ~ Fuerzalaboralconeducaciónbás + Fuerzalaboralconeducaciónint + Fuerzalaboralconeducaciónava + F + AhorrobrutodelPIB, data = data)
summary(modelo) 
## 
## Call:
## lm(formula = CrecimientodelPIBanual ~ Fuerzalaboralconeducaciónbás + 
##     Fuerzalaboralconeducaciónint + Fuerzalaboralconeducaciónava + 
##     F + AhorrobrutodelPIB, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.4729 -1.3559  0.1342  1.3336  6.1748 
## 
## Coefficients:
##                               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  -54.70211   11.40966  -4.794 9.25e-06 ***
## Fuerzalaboralconeducaciónbás   0.10057    0.06887   1.460   0.1488    
## Fuerzalaboralconeducaciónint   0.23668    0.09334   2.536   0.0135 *  
## Fuerzalaboralconeducaciónava   0.24350    0.10599   2.297   0.0247 *  
## F                              0.56600    0.13354   4.238 6.94e-05 ***
## AhorrobrutodelPIB              0.17324    0.17820   0.972   0.3344    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.588 on 68 degrees of freedom
##   (130 observations deleted due to missingness)
## Multiple R-squared:  0.4031, Adjusted R-squared:  0.3592 
## F-statistic: 9.183 on 5 and 68 DF,  p-value: 1.033e-06

6.Resultados: Modelo

Análisis de variables y ejemplo de interpretación a. Fuerza laboral con educación básica Significancia estadística: No significativa.

Interpretación: Su efecto sobre el crecimiento económico no es estadísticamente distinto de cero. Esto puede deberse a que esta parte de la población tiene baja productividad o está atrapada en el sector informal, como bien lo mencionas.

  1. Fuerza laboral con educación intermedia Significancia: Positiva y significativa.

Interpretación: Indica que al aumentar la proporción de trabajadores con educación intermedia, el crecimiento económico también aumenta. Esto se relaciona con una mayor capacidad técnica y productividad media.

Ejemplo numérico: Si el coeficiente estimado es 0.05, entonces un aumento de 1 punto porcentual en la participación de esta fuerza laboral genera un aumento del 0.05% en el crecimiento económico (ceteris paribus).

  1. Fuerza laboral con educación avanzada Significancia: Positiva y significativa.

Interpretación: Esta variable suele asociarse con el personal más capacitado, que puede generar innovación, liderazgo empresarial y adopción de nuevas tecnologías.

Ejemplo: Si el coeficiente es 0.08, un aumento de 1 p.p. en esta fuerza laboral genera un aumento del 0.08% en el crecimiento económico.

  1. Formación bruta de capital (FBC) Significancia: Positiva y significativa.

Interpretación: Refleja inversión en infraestructura, maquinaria y tecnología. Está alineada con las teorías clásicas que indican que más capital físico eleva la capacidad productiva.

  1. Ahorro bruto del PIB Significancia: Positiva y significativa.

Interpretación: El ahorro impulsa la inversión, y por ende el crecimiento. Una mayor tasa de ahorro suele asociarse con una mayor capacidad de financiar la formación de capital.

  1. Conclusiones generales del modelo Validez teórica: El modelo se basa en teorías sólidas del crecimiento económico (Solow, Romer, Mankiw), que consideran al capital humano, el capital físico y el ahorro como determinantes clave del crecimiento.

Capital humano diferenciado: El análisis muestra que no todos los niveles educativos aportan igual al crecimiento. Mientras que la educación básica no es significativa, la intermedia y avanzada sí lo son, lo que evidencia la importancia de mejorar la calidad educativa.

Implicación de política pública: Se debería invertir en aumentar el acceso y la calidad de la educación intermedia y avanzada, así como fomentar el ahorro y la inversión productiva.

Estadísticos globales del modelo

R² = 0.4031 El modelo explica aproximadamente el 40% de la variabilidad del crecimiento económico. Es aceptable en estudios macroeconómicos con datos de panel.

Ajustado R² = 0.3592 Corrige por el número de variables. Aún indica un nivel razonable de explicación.

F-Statistic = 9.183 (p < 0.001) El modelo en conjunto es significativo: al menos una de las variables independientes tiene efecto sobre la variable dependiente.

El modelo respalda políticas públicas que fortalezcan la educación secundaria y terciaria, así como estrategias de fomento a la inversión productiva. La falta de significancia del ahorro y de la educación básica sugiere la necesidad de políticas complementarias para que estos recursos sean más efectivos en impulsar el crecimiento.

PRUEBAS DEL MODELO

# Paquetes necesarios
library(car)
## Cargando paquete requerido: carData
## 
## Adjuntando el paquete: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
library(lmtest)
## Cargando paquete requerido: zoo
## 
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(ggplot2)
library(ggfortify)


# 1. Supuesto de normalidad de los residuos
shapiro.test(residuals(modelo))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo)
## W = 0.9723, p-value = 0.1033
qqnorm(residuals(modelo)); qqline(residuals(modelo))

# 2. Homocedasticidad (prueba de Breusch-Pagan)
bptest(modelo)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 7.7795, df = 5, p-value = 0.1688
# 3. Multicolinealidad (VIF)
vif(modelo)
## Fuerzalaboralconeducaciónbás Fuerzalaboralconeducaciónint 
##                     1.763351                     4.283867 
## Fuerzalaboralconeducaciónava                            F 
##                     1.198246                     1.731020 
##            AhorrobrutodelPIB 
##                     4.242714
# 4. Autocorrelación (Durbin-Watson)
dwtest(modelo)
## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 1.5128, p-value = 0.004296
## alternative hypothesis: true autocorrelation is greater than 0
# 5. Visualización de residuos
autoplot(modelo)

Analisis de pruebas:

  1. Normalidad de los residuos Prueba: Shapiro-Wilk

Resultado: p = 0.1033 > 0.05

Gráfico Q-Q plot: La mayoría de los puntos se alinean sobre la recta, con leves desviaciones en los extremos.

✅ Conclusión: Se cumple el supuesto de normalidad de los residuos al 5% de significancia. No hay evidencia suficiente para rechazar la normalidad.

  1. Homocedasticidad (varianza constante) Prueba: Breusch-Pagan

Resultado: p = 0.1688 > 0.05

Gráfico “Scale-Location”: No hay un patrón claro ni forma cónica; hay cierta variabilidad pero sin tendencias evidentes.

✅ Conclusión: No se rechaza la homocedasticidad. El modelo cumple con la suposición de varianza constante de los errores.

  1. Multicolinealidad Prueba: VIF

Resultados:

Máximo VIF = 4.28 (para las variables Fuerzalaboralconeducaciónint y AhorrobrutodelPIB)

Todos los VIF < 5

✅ Conclusión: No hay problemas serios de multicolinealidad. Todos los valores de VIF están por debajo del umbral crítico (generalmente 5 o 10).

  1. Autocorrelación de errores Prueba: Durbin-Watson

Resultado: DW = 1.5128, p = 0.0043 < 0.05

❌ Conclusión: Hay evidencia estadísticamente significativa de autocorrelación positiva en los residuos. Esto viola el supuesto de independencia de los errores.

  1. Supuestos visuales del modelo lineal (gráficos diagnósticos) Residuals vs Fitted: Muestra cierta curvatura → posible no linealidad o mal ajuste en alguna zona.

Normal Q-Q: Refuerza la normalidad, salvo leve desviación en colas.

Scale-Location: No hay patrón de heterocedasticidad.

Residuals vs Leverage: Algunos puntos con influencia leve a moderada.

🟡 Conclusión: Los gráficos en su mayoría no muestran patrones problemáticos graves, salvo por leve no linealidad. Podría explorarse algún término polinómico o transformación si se busca mejorar el ajuste.

  1. Influencia de observaciones individuales (influential points) Observaciones destacadas: 142, 153, 186

Cook’s D notablemente alto para 153 (0.226) y 186 (0.201), lo que indica que podrían tener un efecto desproporcionado sobre el modelo.

142 tiene un residual studentizado extremo (-3.64), lo que lo hace un outlier fuerte.

❗ Conclusión: Existen observaciones influyentes que podrían distorsionar el ajuste del modelo. Se recomienda evaluar si deben tratarse como outliers (posible error o caso especial) o si conviene usar un modelo robusto.

✅📌 Conclusión general del cumplimiento de supuestos El modelo cumple adecuadamente con:

Normalidad de los residuos

Homocedasticidad

Ausencia de multicolinealidad significativa

Conclusiones

En este estudio se ha demostrado que la fuerza laboral genera efectos positivos y significativos sobre el crecimiento económico, con excepción de la fuerza laboral con educación básica que ha resultado no significativa . Esto posiblemente por las tasas de informalidad de los países de estudio, donde la población con educación básica tiende a dedicarse a actividades informales. Es por eso por lo que los países deben generar condiciones e incentivos para que la fuerza laboral aumente su productividad y se genere un crecimiento. Como lo menciona (Carlson, 2002) “una forma en que los mercados de trabajo incentivan a los trabajadores a desarrollar y mantener niveles de capacitación adecuados es mediante los diferenciales de ingresos laborales”. También es necesario ofrecer alternativas de educación para las personas con menos educación. Este trabajo no tiene en cuenta el factor exógeno de la tasa de participación laboral. Por lo que sería interesante estudiar qué proporción de la fuerza laboral tiene menor partición y si esta participación se relaciona con los efectos encontrados en este trabajo sobre el crecimiento económico. Puede que la población con educación básica sea la que tenga mayores tasas de desempleo y esto se relacione con su efecto no significativo sobre el crecimiento.