Tarea Autónoma 2

Author

Emily Montaño, Liliana Romero

Introducción

El presente informe tiene como objetivo analizar el impacto del capital humano y otros factores laborales y productivos sobre el Producto Interno Bruto (PIB) del Ecuador desde 1989 a 2023. En un contexto donde la calidad del empleo, la educación y la inversión en capacidades humanas son cada vez más relevantes para el desarrollo económico, resulta fundamental comprender cómo estos elementos se relacionan con el crecimiento del país.

Para ello, se realiza un análisis estadístico detallado que incluye: matrices de correlación, modelos de regresión lineal simple y múltiple, evaluación de la multicolinealidad entre variables y generación de predicciones a partir de los modelos construidos. Este enfoque integral permite no solo identificar relaciones lineales entre las variables, sino también evaluar la robustez de los modelos predictivos y la independencia de los factores considerados.

Entre las variables analizadas se incluyen el índice de capital humano, número de personas ocupadas, promedio de horas trabajadas, productividad laboral y formación bruta de capital fijo. Todas ellas juegan un papel determinante en la dinámica económica del país.

Análisis de Regresión y Correlación Lineal

Setear base de datos setwd(“C:/Users/LILIANA/Desktop/Tarea4”)

Cargar las librerías necesarias

library(dplyr)  # Para manipulación de datos

Adjuntando el paquete: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
library(ggplot2) # Para visualización de datos
library(haven)  # Para leer archivos .dta de Stata
library(ggcorrplot)
library(corrplot)
corrplot 0.95 loaded
library(car)
Cargando paquete requerido: carData

Adjuntando el paquete: 'car'
The following object is masked from 'package:dplyr':

    recode
library(zoo)

Adjuntando el paquete: 'zoo'
The following objects are masked from 'package:base':

    as.Date, as.Date.numeric

Cargar base de datos

library(readxl)
data <- read_excel("Base de datos.xlsx")
View(data)

Ver las primeras filas del dataset

head(data)
# A tibble: 6 × 8
   Anio PIB (UMN a precios const…¹ Número de personas o…² Promedio horas anual…³
  <dbl>                      <dbl>                  <dbl>                  <dbl>
1  1989                41169477633               3138588.                   1823
2  1990                42684479026               3336441.                   1936
3  1991                44516216200               3479063.                   2078
4  1992                45457427300               3585319.                   2147
5  1993                46354401500               3705065.                   2098
6  1994                48328288000               3847476.                   2182
# ℹ abbreviated names: ¹​`PIB (UMN a precios constantes)`,
#   ²​`Número de personas ocupadas`,
#   ³​`Promedio horas anuales trabajadas por personas ocupadas`
# ℹ 4 more variables:
#   `Productividad laboral (PIB real/personas empleadas)` <dbl>,
#   `Productividad laboral (PIB real/horas trab totales)` <dbl>,
#   `Formación bruta de capital fijo (% del PIB)` <dbl>, …
names(data)
[1] "Anio"                                                                              
[2] "PIB (UMN a precios constantes)"                                                    
[3] "Número de personas ocupadas"                                                       
[4] "Promedio horas anuales trabajadas por personas ocupadas"                           
[5] "Productividad laboral (PIB real/personas empleadas)"                               
[6] "Productividad laboral (PIB real/horas trab totales)"                               
[7] "Formación bruta de capital fijo (% del PIB)"                                       
[8] "Índice de capital humano, basado en años de escolaridad y retornos de la educación"

Interpolamos el índice de capital humano

library(zoo)
data[["Índice de capital humano, basado en años de escolaridad y retornos de la educación"]] <- 
  na.approx(data[["Índice de capital humano, basado en años de escolaridad y retornos de la educación"]], rule = 2)

Correlación entre Capital Humano y PIB

correlacion <- cor(
  data$`PIB (UMN a precios constantes)`, 
  data$`Índice de capital humano, basado en años de escolaridad y retornos de la educación`,
  use = "complete.obs"
)
cat("El coeficiente de correlación de Pearson entre índice de capital humano y PIB es:", correlacion)
El coeficiente de correlación de Pearson entre índice de capital humano y PIB es: 0.9211515

Análisis: El coeficiente de correlación de Pearson entre el índice de capital humano y el PIB muestra el grado de asociación lineal entre ambas variables. Un valor positivo y cercano a 1 indicaría una relación directa y fuerte, lo que sugiere que a mayor nivel de capital humano, mayor tiende a ser el PIB.

Crear un gráfico de dispersión con una línea de regresión

ggplot(data, aes(x = `Índice de capital humano, basado en años de escolaridad y retornos de la educación`,
                 y = `PIB (UMN a precios constantes)`)) +
  geom_point(color = "purple", alpha = 0.5) +
  geom_smooth(method = "lm", color = "blue", se = FALSE) +
  labs(title = "Relación entre Índice de Capital Humano y PIB",
       x = "Índice de capital humano",
       y = "PIB (UMN a precios constantes)") +
  theme_minimal()
`geom_smooth()` using formula = 'y ~ x'

Análisis: El gráfico de dispersión con línea de regresión lineal muestra una tendencia creciente, lo que indica que existe una relación positiva entre el índice de capital humano y el PIB. La línea ajustada refuerza la idea de que a medida que mejora el capital humano, también lo hace el desempeño económico del país.

Matriz de Correlaciones

datos_numericos <- data %>%
  select(`PIB (UMN a precios constantes)`,
         `Número de personas ocupadas`,
         `Promedio horas anuales trabajadas por personas ocupadas`,
         `Productividad laboral (PIB real/personas empleadas)`,
         `Productividad laboral (PIB real/horas trab totales)`,
         `Formación bruta de capital fijo (% del PIB)`,
         `Índice de capital humano, basado en años de escolaridad y retornos de la educación`)

# Matriz de correlación
matriz_cor <- cor(datos_numericos, use = "complete.obs")
print(matriz_cor)
                                                                                   PIB (UMN a precios constantes)
PIB (UMN a precios constantes)                                                                          1.0000000
Número de personas ocupadas                                                                             0.9774342
Promedio horas anuales trabajadas por personas ocupadas                                                -0.6160804
Productividad laboral (PIB real/personas empleadas)                                                     0.7117942
Productividad laboral (PIB real/horas trab totales)                                                     0.7436971
Formación bruta de capital fijo (% del PIB)                                                             0.8800819
Índice de capital humano, basado en años de escolaridad y retornos de la educación                      0.9211515
                                                                                   Número de personas ocupadas
PIB (UMN a precios constantes)                                                                       0.9774342
Número de personas ocupadas                                                                          1.0000000
Promedio horas anuales trabajadas por personas ocupadas                                             -0.5614355
Productividad laboral (PIB real/personas empleadas)                                                  0.5496365
Productividad laboral (PIB real/horas trab totales)                                                  0.6168096
Formación bruta de capital fijo (% del PIB)                                                          0.8246948
Índice de capital humano, basado en años de escolaridad y retornos de la educación                   0.9640613
                                                                                   Promedio horas anuales trabajadas por personas ocupadas
PIB (UMN a precios constantes)                                                                                                  -0.6160804
Número de personas ocupadas                                                                                                     -0.5614355
Promedio horas anuales trabajadas por personas ocupadas                                                                          1.0000000
Productividad laboral (PIB real/personas empleadas)                                                                             -0.6099970
Productividad laboral (PIB real/horas trab totales)                                                                             -0.8753786
Formación bruta de capital fijo (% del PIB)                                                                                     -0.5701817
Índice de capital humano, basado en años de escolaridad y retornos de la educación                                              -0.4100268
                                                                                   Productividad laboral (PIB real/personas empleadas)
PIB (UMN a precios constantes)                                                                                               0.7117942
Número de personas ocupadas                                                                                                  0.5496365
Promedio horas anuales trabajadas por personas ocupadas                                                                     -0.6099970
Productividad laboral (PIB real/personas empleadas)                                                                          1.0000000
Productividad laboral (PIB real/horas trab totales)                                                                          0.9154116
Formación bruta de capital fijo (% del PIB)                                                                                  0.7629846
Índice de capital humano, basado en años de escolaridad y retornos de la educación                                           0.4539128
                                                                                   Productividad laboral (PIB real/horas trab totales)
PIB (UMN a precios constantes)                                                                                               0.7436971
Número de personas ocupadas                                                                                                  0.6168096
Promedio horas anuales trabajadas por personas ocupadas                                                                     -0.8753786
Productividad laboral (PIB real/personas empleadas)                                                                          0.9154116
Productividad laboral (PIB real/horas trab totales)                                                                          1.0000000
Formación bruta de capital fijo (% del PIB)                                                                                  0.7436806
Índice de capital humano, basado en años de escolaridad y retornos de la educación                                           0.4776362
                                                                                   Formación bruta de capital fijo (% del PIB)
PIB (UMN a precios constantes)                                                                                       0.8800819
Número de personas ocupadas                                                                                          0.8246948
Promedio horas anuales trabajadas por personas ocupadas                                                             -0.5701817
Productividad laboral (PIB real/personas empleadas)                                                                  0.7629846
Productividad laboral (PIB real/horas trab totales)                                                                  0.7436806
Formación bruta de capital fijo (% del PIB)                                                                          1.0000000
Índice de capital humano, basado en años de escolaridad y retornos de la educación                                   0.8392311
                                                                                   Índice de capital humano, basado en años de escolaridad y retornos de la educación
PIB (UMN a precios constantes)                                                                                                                              0.9211515
Número de personas ocupadas                                                                                                                                 0.9640613
Promedio horas anuales trabajadas por personas ocupadas                                                                                                    -0.4100268
Productividad laboral (PIB real/personas empleadas)                                                                                                         0.4539128
Productividad laboral (PIB real/horas trab totales)                                                                                                         0.4776362
Formación bruta de capital fijo (% del PIB)                                                                                                                 0.8392311
Índice de capital humano, basado en años de escolaridad y retornos de la educación                                                                          1.0000000
# Matriz de p-valores
cor_matriz_pval <- function(data) {
  n <- ncol(data)
  matriz_pval <- matrix(NA, n, n)
  rownames(matriz_pval) <- colnames(data)
  colnames(matriz_pval) <- colnames(data)
  
  for (i in 1:n) {
    for (j in 1:n) {
      matriz_pval[i, j] <- cor.test(data[[i]], data[[j]], use = "complete.obs")$p.value
    }
  }
  return(matriz_pval)
}

Graficar la matriz de correlaciones con ggcorrplot

ggcorrplot(matriz_cor, lab = TRUE, type = "lower", lab_size = 2)

corrplot(matriz_cor, method = "color", type = "lower", 
         addCoef.col = "black", tl.col = "blue", number.cex = 0.5,
         tl.cex = 0.4, cl.cex = 0.4)

Análisis: La matriz de correlaciones permite evaluar la relación lineal entre múltiples variables económicas relevantes para el contexto ecuatoriano. Entre los hallazgos más importantes, se observa una alta correlación positiva entre el PIB y la productividad laboral, tanto por persona como por hora trabajada. Esto es esperable, ya que a mayor productividad, el PIB tiende a aumentar.

Asimismo, se identifica una correlación positiva significativa entre el índice de capital humano y el PIB, lo cual refuerza los resultados obtenidos previamente. También se evidencian relaciones entre el capital humano y otras variables como la formación bruta de capital fijo, lo que sugiere que una economía con mayor inversión en infraestructura también podría estar asociada con mejor preparación del capital humano.

Regresión Lineal Simple: PIB - Indice de Capital Humano

modelo_ocupados <- lm(`PIB (UMN a precios constantes)` ~ `Número de personas ocupadas`, data = data)
summary(modelo_ocupados)

Call:
lm(formula = `PIB (UMN a precios constantes)` ~ `Número de personas ocupadas`, 
    data = data)

Residuals:
       Min         1Q     Median         3Q        Max 
-8.896e+09 -4.899e+09  9.498e+08  3.603e+09  1.094e+10 

Coefficients:
                                Estimate Std. Error t value Pr(>|t|)    
(Intercept)                   -1.281e+10  3.374e+09  -3.798 0.000595 ***
`Número de personas ocupadas`  1.516e+04  5.702e+02  26.581  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.302e+09 on 33 degrees of freedom
Multiple R-squared:  0.9554,    Adjusted R-squared:  0.954 
F-statistic: 706.5 on 1 and 33 DF,  p-value: < 2.2e-16

Análisis:

El modelo de regresión lineal simple permite evaluar cómo el número de personas ocupadas influye en el PIB. El coeficiente estimado para esta variable indica cuánto aumenta el PIB, en promedio, por cada unidad adicional de personas ocupadas. Si el coeficiente es positivo y estadísticamente significativo (p < 0.05), se puede afirmar que existe una relación directa entre ambas variables.

Este resultado sugiere que el empleo es un factor importante en el crecimiento económico del país. No obstante, dado que este modelo solo considera una variable independiente, no captura posibles efectos de otros factores relevantes.

Regresión Lineal Múltiple

modelo2 <- lm(`PIB (UMN a precios constantes)` ~ 
                `Índice de capital humano, basado en años de escolaridad y retornos de la educación` +
                `Número de personas ocupadas` +
                `Promedio horas anuales trabajadas por personas ocupadas` +
                `Productividad laboral (PIB real/personas empleadas)` +
                `Productividad laboral (PIB real/horas trab totales)` +
                `Formación bruta de capital fijo (% del PIB)`,
              data = data)

summary(modelo2)

Call:
lm(formula = `PIB (UMN a precios constantes)` ~ `Índice de capital humano, basado en años de escolaridad y retornos de la educación` + 
    `Número de personas ocupadas` + `Promedio horas anuales trabajadas por personas ocupadas` + 
    `Productividad laboral (PIB real/personas empleadas)` + `Productividad laboral (PIB real/horas trab totales)` + 
    `Formación bruta de capital fijo (% del PIB)`, data = data)

Residuals:
       Min         1Q     Median         3Q        Max 
-790796789 -350552377 -113125894  346337059 1144810990 

Coefficients:
                                                                                       Estimate
(Intercept)                                                                          -1.110e+11
`Índice de capital humano, basado en años de escolaridad y retornos de la educación` -1.393e-04
`Número de personas ocupadas`                                                         1.463e+04
`Promedio horas anuales trabajadas por personas ocupadas`                             2.795e+07
`Productividad laboral (PIB real/personas empleadas)`                                 2.412e+06
`Productividad laboral (PIB real/horas trab totales)`                                 7.078e+09
`Formación bruta de capital fijo (% del PIB)`                                         2.410e-05
                                                                                     Std. Error
(Intercept)                                                                           2.272e+10
`Índice de capital humano, basado en años de escolaridad y retornos de la educación`  4.161e-05
`Número de personas ocupadas`                                                         4.515e+02
`Promedio horas anuales trabajadas por personas ocupadas`                             9.114e+06
`Productividad laboral (PIB real/personas empleadas)`                                 1.448e+06
`Productividad laboral (PIB real/horas trab totales)`                                 3.035e+09
`Formación bruta de capital fijo (% del PIB)`                                         1.160e-05
                                                                                     t value
(Intercept)                                                                           -4.888
`Índice de capital humano, basado en años de escolaridad y retornos de la educación`  -3.347
`Número de personas ocupadas`                                                         32.411
`Promedio horas anuales trabajadas por personas ocupadas`                              3.067
`Productividad laboral (PIB real/personas empleadas)`                                  1.665
`Productividad laboral (PIB real/horas trab totales)`                                  2.332
`Formación bruta de capital fijo (% del PIB)`                                          2.078
                                                                                     Pr(>|t|)
(Intercept)                                                                          3.77e-05
`Índice de capital humano, basado en años de escolaridad y retornos de la educación`  0.00234
`Número de personas ocupadas`                                                         < 2e-16
`Promedio horas anuales trabajadas por personas ocupadas`                             0.00476
`Productividad laboral (PIB real/personas empleadas)`                                 0.10702
`Productividad laboral (PIB real/horas trab totales)`                                 0.02710
`Formación bruta de capital fijo (% del PIB)`                                         0.04703
                                                                                        
(Intercept)                                                                          ***
`Índice de capital humano, basado en años de escolaridad y retornos de la educación` ** 
`Número de personas ocupadas`                                                        ***
`Promedio horas anuales trabajadas por personas ocupadas`                            ** 
`Productividad laboral (PIB real/personas empleadas)`                                   
`Productividad laboral (PIB real/horas trab totales)`                                *  
`Formación bruta de capital fijo (% del PIB)`                                        *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.53e+08 on 28 degrees of freedom
Multiple R-squared:  0.9996,    Adjusted R-squared:  0.9995 
F-statistic: 1.133e+04 on 6 and 28 DF,  p-value: < 2.2e-16

Análisis: El modelo de regresión lineal múltiple incorpora varias variables predictoras del PIB, incluyendo el índice de capital humano, número de personas ocupadas, horas trabajadas, productividad laboral y formación bruta de capital. Este enfoque permite analizar el efecto conjunto de múltiples factores sobre el desempeño económico.

Los coeficientes individuales indican cómo cambia el PIB ante un cambio unitario en cada predictor, manteniendo constantes las demás variables. Si varios coeficientes son estadísticamente significativos, esto refuerza la idea de que el crecimiento económico es un fenómeno multifactorial.

El valor del R² ajustado indica qué proporción de la variabilidad del PIB es explicada por el modelo. Un R² alto sugiere un buen ajuste. En general, este modelo ofrece una visión más realista y completa de la economía ecuatoriana en comparación con los modelos simples.

Evaluar multicolinealidad

vif(modelo2)
`Índice de capital humano, basado en años de escolaridad y retornos de la educación` 
                                                                            72.28217 
                                                       `Número de personas ocupadas` 
                                                                            57.64334 
                           `Promedio horas anuales trabajadas por personas ocupadas` 
                                                                           157.27296 
                               `Productividad laboral (PIB real/personas empleadas)` 
                                                                           242.79211 
                               `Productividad laboral (PIB real/horas trab totales)` 
                                                                           648.98314 
                                       `Formación bruta de capital fijo (% del PIB)` 
                                                                            16.18227 

Análisis: La evaluación de la multicolinealidad mediante el VIF (Variance Inflation Factor) permite detectar si algunas variables explicativas están altamente correlacionadas entre sí. Valores de VIF mayores a 10 generalmente indican un problema de multicolinealidad severa.

En el contexto del modelo múltiple, si algunas variables tienen VIF elevados, esto podría distorsionar las estimaciones de los coeficientes y dificultar su interpretación. En ese caso, se recomienda revisar la inclusión de esas variables o considerar combinaciones lineales que mitiguen la colinealidad.

Predicciones

nuevos_datos2 <- head(data, 3) %>%
  select(`Índice de capital humano, basado en años de escolaridad y retornos de la educación`,
         `Número de personas ocupadas`,
         `Promedio horas anuales trabajadas por personas ocupadas`,
         `Productividad laboral (PIB real/personas empleadas)`,
         `Productividad laboral (PIB real/horas trab totales)`,
         `Formación bruta de capital fijo (% del PIB)`)

predicciones2 <- predict(modelo2, nuevos_datos2)
data.frame(nuevos_datos2, predicciones2)
  Índice.de.capital.humano..basado.en.años.de.escolaridad.y.retornos.de.la.educación
1                                                                       2.190794e+14
2                                                                       2.216362e+14
3                                                                       2.239014e+14
  Número.de.personas.ocupadas
1                     3138588
2                     3336441
3                     3479063
  Promedio.horas.anuales.trabajadas.por.personas.ocupadas
1                                                    1823
2                                                    1936
3                                                    2078
  Productividad.laboral..PIB.real.personas.empleadas.
1                                            13117.20
2                                            12793.42
3                                            12795.46
  Productividad.laboral..PIB.real.horas.trab.totales.
1                                            7.195391
2                                            6.608170
3                                            6.157586
  Formación.bruta.de.capital.fijo....del.PIB. predicciones2
1                                1.590946e+14   41733064255
2                                1.438663e+14   42126593375
3                                1.415789e+14   44627853885

Análisis: Se han generado predicciones del PIB para nuevas observaciones usando el modelo de regresión múltiple. Esto permite evaluar la capacidad del modelo para generalizar y estimar resultados futuros a partir de valores conocidos de las variables independientes.

La tabla resultante muestra cómo, al cambiar los valores del índice de capital humano, empleo y productividad, varían también las estimaciones del PIB. Esta herramienta es útil para escenarios de simulación económica y toma de decisiones basada en evidencia.

Conclusión

Los análisis realizados permiten confirmar que existe una relación significativa entre el capital humano, las condiciones laborales y el desempeño económico del Ecuador, medido a través del PIB. La regresión lineal simple mostró que variables como el número de personas ocupadas y el índice de capital humano tienen una asociación positiva con el crecimiento económico.

Al incorporar múltiples variables en el modelo de regresión lineal múltiple, se obtuvo una comprensión más integral de los factores que inciden en el PIB. Variables como la productividad laboral, la formación de capital fijo y el tiempo trabajado también resultaron ser elementos relevantes. Además, el análisis de multicolinealidad reveló que algunos factores pueden estar correlacionados entre sí, lo que sugiere la necesidad de un manejo cuidadoso al interpretar los resultados.

Las matrices de correlación y las predicciones generadas a partir del modelo refuerzan la importancia del capital humano como motor clave del desarrollo económico. En este sentido, se recomienda seguir fortaleciendo las políticas públicas orientadas a la educación, la capacitación laboral y la mejora de la productividad, ya que estas inversiones tienen un impacto directo en el crecimiento del país.

En conjunto, los resultados confirman que el desarrollo económico sostenible en Ecuador depende en gran medida del fortalecimiento del capital humano y de condiciones laborales que promuevan la productividad.