TALLER 2, Análisis de Regresión Múltiple Validación Completa de los Modelos

Parte 1: Marco teorico

El análisis econométrico de la producción busca identificar cómo los factores productivos influyen en el crecimiento económico de un país. Una de las formas más utilizadas para representar esta relación es la función de producción Cobb-Douglas, propuesta por Charles Cobb y Paul Douglas en 1928, que describe la relación entre el producto total y los factores de producción, como el capital y el trabajo.

Matemáticamente, la función Cobb-Douglas se expresa como:

PIB=A⋅Kα⋅Lβ

DONDE PIB:Producto Interno Bruto, representa el valor total de los bienes y servicios finales producidos en una economía.

K (FBK): Formación Bruta de Capital, que mide la inversión en maquinaria, infraestructura y equipos.

L (PEA): Población Económicamente Activa, que refleja la fuerza laboral disponible para producir.

A; Nivel de eficiencia o productividad total de los factores.

α y β: Elasticidades del producto respecto al capital y al trabajo, respectivamente.

Esta función supone que el producto depende de la eficiencia tecnológica y del uso de los factores productivos. Los parámetros 𝛼 y 𝛽 indican cuánto cambia el PIB ante una variación porcentual del capital o del trabajo.

Cuando se aplica el logaritmo natural a ambos lados de la ecuación, la función Cobb-Douglas se transforma en una forma lineal que puede estimarse mediante regresión múltiple:

ln(PIB)=ln(A)+αln(K)+βln(L)+u

DONDE 𝑢representa el término de error o perturbación aleatoria.En esta forma, los coeficientes𝛼 y 𝛽se interpretan directamente como elasticidades, lo que significa que, por ejemplo, un valor de α=0.4 indicaría que un aumento del 1% en el capital incrementa el PIB en un 0.4%, manteniendo constante el trabajo.

El análisis también permite determinar los rendimientos a escala:

Si α+β=1, los rendimientos son constantes. α+β>1, los rendimientos son crecientes. α+β<1, los rendimientos son decrecientes.

En este taller, se utilizará la función Cobb-Douglas para analizar el comportamiento de la economía colombiana en el período 2005–2023, tomando como variables:

PIB (Producto Interno Bruto): indicador del nivel de producción nacional.

FBK (Formación Bruta de Capital): aproximación al capital físico disponible.

PEA (Población Económicamente Activa): medida del trabajo disponible.

El objetivo es estimar las elasticidades del PIB respecto al capital y al trabajo, validar los supuestos del modelo, determinar los rendimientos a escala y realizar un pronóstico del PIB, FBK y PEA para 2024, además del cálculo de las tasas de crecimiento promedio anualizadas.

parte 2: Análisis Descriptivo de Variables.

En esta sección se presenta el comportamiento de las principales variables del modelo de producción Cobb-Douglas para la economía colombiana durante el período 2005–2023. Las variables analizadas son el Producto Interno Bruto (PIB), la Formación Bruta de Capital (FBK) y la Población Económicamente Activa (PEA) se presentan los estadísticos descriptivos (media, mediana, desviación estándar, mínimo y máximo) y los gráficos de tendencia para cada variable. Estos resultados ofrecen una primera aproximación sobre el comportamiento de la economía colombiana en el período de estudio.

library(readxl)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)


# Cargar base de datos 
cobb_douglas <- read_excel("cobb_douglas.xlsx")
View(cobb_douglas)

colnames(cobb_douglas)
## [1] "Fecha" "PIB"   "FBK"   "PEA"   "OCU"   "DOCUP"
# calculamos los estadisticos basicos
summary(cobb_douglas)
##     Fecha                PIB              FBK             PEA          
##  Length:74          Min.   :126089   Min.   :19697   Min.   :18422846  
##  Class :character   1st Qu.:154285   1st Qu.:31640   1st Qu.:20515252  
##  Mode  :character   Median :192205   Median :41392   Median :22355756  
##                     Mean   :186749   Mean   :39509   Mean   :22022142  
##                     3rd Qu.:212536   3rd Qu.:46918   3rd Qu.:23521672  
##                     Max.   :247617   Max.   :51173   Max.   :25369927  
##       OCU               DOCUP        
##  Min.   :16005898   Min.   :1896889  
##  1st Qu.:17851438   1st Qu.:2143733  
##  Median :20020376   Median :2380758  
##  Mean   :19495404   Mean   :2464514  
##  3rd Qu.:21015917   3rd Qu.:2581139  
##  Max.   :22787222   Max.   :4446712
resumen <- cobb_douglas %>%
  summarise(
    media_PIB = mean(PIB),
    mediana_PIB = median(PIB),
    sd_PIB = sd(PIB),
    var_PIB = var(PIB),
    min_PIB = min(PIB),
    max_PIB = max(PIB),
    
    media_FBK = mean(FBK),
    mediana_FBK = median(FBK),
    sd_FBK = sd(FBK),
    var_FBK = var(FBK),
    min_FBK = min(FBK),
    max_FBK = max(FBK),
    
    media_PEA = mean(PEA),
    mediana_PEA = median(PEA),
    sd_PEA = sd(PEA),
    var_PEA = var(PEA),
    min_PEA = min(PEA),
    max_PEA = max(PEA)
  )

#matriz de correlacion

library(corrplot)
## corrplot 0.95 loaded
variables <- cobb_douglas %>%
  select(PIB, FBK, PEA)

matriz_cor <- cor(variables, method = "pearson", use = "complete.obs")
matriz_cor
##           PIB       FBK       PEA
## PIB 1.0000000 0.8756671 0.9658844
## FBK 0.8756671 1.0000000 0.8742433
## PEA 0.9658844 0.8742433 1.0000000

visualizacion

library(corrplot)

corrplot(matriz_cor,
         method = "number",      # muestra los valores numéricos
         type = "upper",         # solo la parte superior
         tl.col = "black",       # color de etiquetas
         tl.srt = 45,            # rotación de nombres
         number.cex = 1.2,       # tamaño de los números
         col = colorRampPalette(c("blue", "white", "red"))(200),
         title = "Matriz de Correlación: PIB, FBK y PEA",
         mar = c(0, 0, 2, 0))

La matriz de correlación permite analizar el grado de asociación lineal entre las variables incluidas en el modelo Cobb-Douglas: Producto Interno Bruto (PIB), Formación Bruta de Capital (FBK) y Población Económicamente Activa (PEA). Los resultados obtenidos muestran que todas las correlaciones son positivas y elevadas, lo que indica que las tres variables se mueven en la misma dirección. Esto significa que cuando el capital (FBK) y el trabajo (PEA) aumentan, el PIB también tiende a incrementarse.

Graficos de dispercion:relacion entre variables

#PIB VS FBK
ggplot(variables, aes(x = FBK, y = PIB)) +
  geom_point(color = "steelblue", size = 2) +
  geom_smooth(method = "lm", color = "red", se = FALSE, linewidth = 1) +
  labs(title = " (PIB) VS (FBK)",
       x = "Formación Bruta de Capital (FBK)",
       y = "Producto Interno Bruto (PIB)") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

En esta parte podemos observar una relacion fuerte entre PIB Y FBK, cuando aumenta la iversion capital, el producto tambien crece, lo que indica una alta elasticidad del PIB respecto al capital.

#PIB VS PEA
ggplot(variables, aes(x = PEA, y = PIB)) +
  geom_point(color = "seagreen", size = 2) +
  geom_smooth(method = "lm", color = "red", se = FALSE, linewidth = 1) +
  labs(title = "(PIB) VS (PEA)",
       x = "Población Económicamente Activa (PEA)",
       y = "Producto Interno Bruto (PIB)") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

La relacion entre PIB Y PEA, tambien es positiva aunque con una dispersión ligeramente mayor, lo que sugiere que el trabajo influye en el producto, pero con menor intensidad que el capital.

# FBK VS PEA
ggplot(variables, aes(x = PEA, y = FBK)) +
  geom_point(color = "orange", size = 2) +
  geom_smooth(method = "lm", color = "red", se = FALSE, linewidth = 1) +
  labs(title = " (FBK) VS (PEA)",
       x = "Población Económicamente Activa (PEA)",
       y = "Formación Bruta de Capital (FBK)") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

La relacion entre FBK Y PEA, refleja que el crecimiento de la inversion y el empleo ha ocurrido de manera conjunta, lo cual es coherente con el comportamiento general de la economía colombiana durante el período de estudio.

Boxplots

library(reshape2)
library(ggplot2)

# Convertir los datos a formato largo (automático: detecta la primera columna como "Año")
datos_long <- reshape2::melt(cobb_douglas,
                             id.vars = colnames(cobb_douglas)[1],
                             measure.vars = c("PIB", "FBK", "PEA"),
                             variable.name = "Variable",
                             value.name = "Valor")

# Crear el boxplot comparativo
ggplot(datos_long, aes(x = Variable, y = Valor, fill = Variable)) +
  geom_boxplot(alpha = 0.7, color = "black") +
  scale_fill_manual(values = c("steelblue", "seagreen", "orange")) +
  labs(title = "PIB, FBK y PEA (2005–2023)",
       x = "Variable", y = "Valor") +
  theme_minimal()

El grafico se observa que PEA presenta valores considerables mas altos que el PIB y la FBK, lo cual es logico porque representa el número total de personas activas en la economía, mientras que las otras dos variables se expresan en valores monetarios. Las tres variables muestran una distribución concentrada sin presencia de valores atípicos extremos, lo que indica que los datos son estables y consistentes a lo largo del período analizado.

Parte 3: Estimacion del modelo.

cobb_douglas <- cobb_douglas %>%
  mutate(
    ln_PIB = log(PIB),
    ln_FBK = log(FBK),
    ln_PEA = log(PEA)
  )
# Estimar el modelo lineal
modelo_cobb <- lm(ln_PIB ~ ln_FBK + ln_PEA, data = cobb_douglas)


# Resultados del modelo
summary(modelo_cobb)
## 
## Call:
## lm(formula = ln_PIB ~ ln_FBK + ln_PEA, data = cobb_douglas)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.088457 -0.032870 -0.009252  0.038897  0.091092 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -16.22641    1.63618  -9.917 4.86e-15 ***
## ln_FBK        0.19902    0.04273   4.657 1.45e-05 ***
## ln_PEA        1.55268    0.11909  13.038  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.04455 on 71 degrees of freedom
## Multiple R-squared:  0.9449, Adjusted R-squared:  0.9433 
## F-statistic: 608.5 on 2 and 71 DF,  p-value: < 2.2e-16

ANALISIS DE RESULTADOS:

El coeficiente de ln_FBK (0.199) indica que, si el capital (FBK) aumenta en 1 %, el PIB crecerá en 0.20 %, manteniendo constante la PEA.

El coeficiente de ln_PEA (1.553) muestra que, si la población económicamente activa (PEA) aumenta en 1 %, el PIB crecerá en 1.55 %, manteniendo constante el capital.

Ambos coeficientes son positivos y altamente significativos (p < 0.05), por lo que tanto el capital como el trabajo influyen de manera estadísticamente significativa en el PIB.

SIGNIFICANCIA DE LOS COEFICIENTES:

Dado que los valores p para ln_FBK y ln_PEA son menores que 0.05, se rechaza la hipótesis nula de que sus coeficientes sean iguales a cero. Esto confirma que las dos variables explicativas capital y trabajo tienen un efecto real y significativo sobre el nivel del producto interno bruto.

INTERPRETACION DEL R2:

El coeficiente de determinación R² = 0.9449 indica que el modelo explica el 94.49 % de la variabilidad del PIB. Esto significa que casi toda la variación en el producto se debe a los cambios en el capital y la fuerza laboral, por lo que el modelo tiene un excelente ajuste a los datos observados.

Por lo tanto el modelo cobb douglas estimado presenta elasticidades positivas y significativas del pib respecto al capital y al trbajo, y un R2 alto que desmuestra un muy buen ajuste estadistico, en consecuencia se concluye que el crecimiento economico esta fuertemente explicado por los aumentos en la inversion de capital y la expansion de la poblacion economicamnete activia.

Parte 4: Validacion del modelo

# Normalidad de los residuos
residuos <- residuals(modelo_cobb)

# Histograma
hist(residuos, main = "Distribución de los residuos", col = "skyblue", border = "white")

# Prueba de Shapiro-Wilk
shapiro.test(residuos)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuos
## W = 0.95833, p-value = 0.01565

El valor p obtenido, es menor que 0,05 por lo tanto se rechazala hipotesis nula de normalidad, esto indica que los residuos no siguen perfectamente una distribucion normal. Sin embargo, el estadístico W = 0.958 muestra que la desviación respecto a la normalidad es moderada, y dado que el tamaño de muestra es grande (n = 74), esta ligera desviación no afecta de forma importante la validez del modelo.

# Multicolinealidad(FBK Y PEA)

library(car)
## Cargando paquete requerido: carData
## 
## Adjuntando el paquete: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
# Calcular el Factor de Inflación de la Varianza (VIF)
vif(modelo_cobb)
##   ln_FBK   ln_PEA 
## 4.094486 4.094486

Los valores del VIF para las variables ln_FBK y ln_PEA son aproximadamente 4.09, muy por debajo del umbral crítico de 10 que indicaría multicolinealidad severa.

Esto significa que no existe un problema serio de correlación entre las variables explicativas (capital y trabajo). En otras palabras, FBK y PEA son relativamente independientes entre sí, por lo que sus efectos sobre el PIB pueden estimarse de manera confiable. Por lo tanto, el modelo no presenta multicolinealidad significativa, y los coeficientes estimados son estables y estadísticamente válidos.

# Heterocedasticidad

library(lmtest)
## Cargando paquete requerido: zoo
## 
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
# Prueba de Breusch-Pagan
bptest(modelo_cobb)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_cobb
## BP = 3.6842, df = 2, p-value = 0.1585

El valor p obtenido (p = 0.1585) es mayor que 0.05, por lo tanto no se rechaza la hipótesis nula de homocedasticidad.

Esto significa que los errores del modelo tienen varianza constante, es decir, no existe evidencia de heterocedasticidad. En términos prácticos, los residuos se comportan de manera uniforme a lo largo de los valores ajustados del PIB, lo cual confirma que el supuesto de homocedasticidad se cumple adecuadamente en el modelo Cobb-Douglas.

# Autorrelacion

# Prueba de Durbin-Watson
dwtest(modelo_cobb)
## 
##  Durbin-Watson test
## 
## data:  modelo_cobb
## DW = 0.34143, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0

El estadístico de Durbin-Watson (DW = 0.34) se encuentra muy por debajo de 2, y el valor p es menor que 0.05, por lo tanto se rechaza la hipótesis nula de no autocorrelación.

Esto indica la presencia de autocorrelación positiva en los residuos del modelo. En otras palabras, los errores consecutivos tienden a estar correlacionados entre sí, lo cual puede deberse a la naturaleza temporal de los datos (serie de tiempo 2005–2023).

Por lo tanto al realizar la validacion del modelo aplicando las anteriores pruebas, los resultados obtenidos nos muestran que el modelo cumple en ran medida con los supuestos clasicos de la tegresion linea, por lo cual el modelo es estadisticamente valido y bien ajustado, pero podria mejorarse corrigiendo la autocorrelacion mediante tecnicas para datos de serie de tiempo

Parte 5: Pronosticos y crecimiento