Modelo Minceriano: determinantes de los salarios en El Salvador, 2020

I-2022

INTRODUCCIÓN

Se busca desarrollar un modelo econométrico que permita encontrar los determinantes de los salarios en El Salvador.Este modelo permite comparar la relación entre capital humano e ingresos y medir estadísticamente los retornos de la educación. la teórica empírica, apunta que algunas características como el sexo, la edad, la experiencia, la habilidad innata, así como la propia de la persona aptap para el trabajo en su disposición de aprender e innovar pueden ser cruciales para que una persona consiga un trabajo y un excelente salario. Este modelo se caracteriza por explicar la relacion de los salarios de los trabajadores en función de la edad, el género, la localización, la educación, entre otras variables.

OBJETIVOS

Objetivo General

Desarrollar un modelo econométrico lineal que permita pronosticar los salarios de las personas en El Salvador para el año dos mil veinte.

Objetivos Específicos

MARCO TEÓRICO

Para Mincer, las teorías de capital humano influían en la capacidad de ingreso-edad, dado esto en función de año de escolaridad y experiencia laboral, por medio de la estimación de ingresos a través de Mínimos Cuadrados Ordinarios (MCO), permitiendo el impacto de estimación en años de estudio a sus rentas laborales en los individuos.

Para conocer a cerca del modelo a realizar, estudiaremos la importancia sobre este economista dio un aporte social-económico, siendo este padre de la economía laboral moderna, destacado de la Universidad de Columbia también de la Escuela de Chicago.

Jacob Mincer (Julio 15, 1922 – agosto 20, 2006), desarrollo parte de un trabajo económico que estudiaría los fundamentos empíricos de la teoría de capital humano, junto con el economista Gary Becker (diciembre 2, 1930 – mayo 3,2014). Durante el tiempo en su carrera siendo parte de las enseñanzas de la Universidad de Chicago, tuvo muchos aportes y ensayos hacia la economía y el comportamiento social de las personas, su trabajo más fundamental fue: Escolarización, experiencia y ganancia, publicado en 1974, usando las herramientas por medio de CENSOS para un informe de datos claros para su investigación en los años 1950 a 1960 sobre el cálculo de ganancias anuales de escolaridad.

Siendo una pequeña parte de inversión en las primeras necesidades vitales, como comida y salud, teniendo como prioridad la inversión en la educación, que dado a esto se dará el aumento de nuevas oportunidades y nuevos ingresos en la persona. Los economistas neoclásicos, dan como proceso educativo al elegir la inversión, dan prioridad al aporte económico y su inversión en ella, para poder incrementar la capacidad del personal, de igual manera su productividad, los neoclásicos ven la inversión en la educación y no lo ven como un gasto, y el stock de conocimientos, considerado como un capital.

La teoría de capital humano desarrollado por el economista Becker (1964), su objetivo original era la estimación en el crecimiento de la educación, pero de igual manera se dio cuenta que no existía un marco que explicaría el proceso de inversión sobre las personas.

ESPECIFICACIÓN

Determicación de las varibales

Varible Endógena

Ingreso

El ingreso es la cantidad de recursos monetarios, dinero, que se asigna a cada factor por su contribución al proceso productivo. El ingreso puede tomar la forma de sueldos y salarios, renta, dividendos, regalías, utilidades, honorarios, dependiendo el factor de producción que lo reciba: trabajo, capital, tierra, etc. (htt)

Varibales Exógenas

Sexo

Se refiere a los roles, las características y oportunidades definidos por la sociedad que se consideran apropiados para los hombres, las mujeres, los niños, las niñas y las personas con identidades no binarias.(Salud, s.f.)

Eduación

Es el proceso de facilitar el aprendizaje o la adquisición de conocimientos, habilidades, valores, creencias y hábitos de un grupo de personas que los transfieren a otras personas, a través de la narración de cuentos, la discusión, la enseñanza, el ejemplo, la formación o la investigación. (Educación, s.f.)

Región

Es una zona territorial delimitada por características comunes que pueden ser geográficas, culturales, políticas o económicas

Hipótesis del modelo

Hipótesis 1

Como supuestos del modelo de regresión lineal múltiple se dice que este es lineal en los parámetros

\(Υ = β_0+ β_1 X_1+ β_2 X_2+ β_3 X_3+ β_4 X_4+ β_5 X_5+ β_6X_6\)

Hipótesis 2

Los ingresos de las personas dependen en gran medida del nivel de estudios académicos

Hipótesis 3

Las personas de la zona oriental, poseen ingresos bajos respecto a las demas zonas del país.

EVIDENCIA EMPÍRICA

load("C:/Users/Keiry/Documents/Eco22/EHPM_2020.Rdata")
EHPM_2020[1:10,1:10]
## # A tibble: 10 x 10
##    edicion  lote       tipo folio        viv  r101 idboleta fac00    area region
##      <dbl> <dbl> <hvn_lbll> <dbl> <hvn_lbll> <dbl>    <dbl> <dbl> <hvn_l> <hvn_>
##  1    2020    20          0    69          0     1   237167  486.       1      1
##  2    2020    20          0    69          0     2   237167  486.       1      1
##  3    2020    20          0    69          0     3   237167  486.       1      1
##  4    2020    20          0    70          0     1   237688  484.       1      1
##  5    2020    20          0    70          0     2   237688  484.       1      1
##  6    2020    20          0    71          0     1   236233  482.       1      1
##  7    2020    20          0    71          0     2   236233  482.       1      1
##  8    2020    20          0    71          0     3   236233  482.       1      1
##  9    2020    20          0    71          0     4   236233  482.       1      1
## 10    2020    20          0    72          0     1   236526  486.       1      1

ESTIMACIÓN DEL MODELO

options(scipen = 9999999)
modelo_minceriano_2020 <-
  lm(formula = ingfa ~ region + r104 + r217 + r442a + r454_b1 + area,
     data = EHPM_2020)
stargazer(modelo_minceriano_2020, type = "html", title = "Modelo Minceriano El Salvador 2020")
Modelo Minceriano El Salvador 2020
Dependent variable:
ingfa
region 21.543***
(2.363)
r104 -12.836*
(6.578)
r217 83.839***
(2.413)
r442a 4.641***
(0.453)
r454_b1 -143.498***
(21.003)
area 216.426***
(6.586)
Constant 647.884***
(43.637)
Observations 37,030
R2 0.099
Adjusted R2 0.099
Residual Std. Error 619.172 (df = 37023)
F Statistic 678.422*** (df = 6; 37023)
Note: p<0.1; p<0.05; p<0.01

VERIFICACIÓN DE AJUSTE DE LOS RESIDUOS

options(scipen = 9999999)
verificacion_ajuste<-fitdist(data=as.vector(modelo_minceriano_2020$residuals),dist= "norm")
plot(verificacion_ajuste)

summary(verificacion_ajuste)
## Fitting of the distribution ' norm ' by maximum likelihood 
## Parameters : 
##                     estimate Std. Error
## mean   0.0000000000001325663   3.217036
## sd   619.1134598242375659538   2.274873
## Loglikelihood:  -290582.8   AIC:  581169.6   BIC:  581186.7 
## Correlation matrix:
##      mean sd
## mean    1  0
## sd      0  1

PRUEBAS DE NORMALIDAD

Prueba de Normalidad Jarque-Bera

\(H_0: ε ~ N(0,σ^2)\) \(H_A: ε ≁ N(0,σ^2)\)

options(scipen = 9999999)
jb.norm.test(modelo_minceriano_2020$residuals)
## 
##  Jarque-Bera test for normality
## 
## data:  modelo_minceriano_2020$residuals
## JB = 10684416, p-value < 0.00000000000000022
qqnorm(modelo_minceriano_2020$residuals)
qqline(modelo_minceriano_2020$residuals)

hist(
  modelo_minceriano_2020$residuals,
  main = "Histograma de los residuos",
  xlab = "Residuos",
  ylab = "frecuencia"
)

#se rechaza la hipotesis nula, dado que los residuos no siguen una distrubicion normal

Prueba de Normalidad Kolmogorov-Smirnov \(H_0: ε ~ N(0,σ^2)\) \(H_A: ε ≁ N(0,σ^2)\)

options(scipen = 9999999)
lillie.test(modelo_minceriano_2020$residuals)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  modelo_minceriano_2020$residuals
## D = 0.15212, p-value < 0.00000000000000022
qqnorm(modelo_minceriano_2020$residuals)
qqline(modelo_minceriano_2020$residuals)

hist(
  modelo_minceriano_2020$residuals,
  main = "Histograma de los residuos",
  xlab = "Residuos",
  ylab = "frecuencia"
)

#Se rechaza la hipotesis nula, dado que los residuos no siguen una distribucion normal

PRUEBA DE MULTICOLINEALIDAD

Indice de condicion

options(scipen = 9999999)
X_mat <- model.matrix(modelo_minceriano_2020)
mctest(mod = modelo_minceriano_2020)
## 
## Call:
## omcdiag(mod = mod, Inter = TRUE, detr = detr, red = red, conf = conf, 
##     theil = theil, cn = cn)
## 
## 
## Overall Multicollinearity Diagnostics
## 
##                        MC Results detection
## Determinant |X'X|:         0.7352         0
## Farrar Chi-Square:     11389.6487         1
## Red Indicator:             0.1386         0
## Sum of Lambda Inverse:     6.6843         0
## Theil's Method:            0.0536         0
## Condition Number:         42.4721         1
## 
## 1 --> COLLINEARITY is detected by the test 
## 0 --> COLLINEARITY is not detected by the test

Prueba de Farrar-Glaubar

mctest::omcdiag(mod = modelo_minceriano_2020)
## 
## Call:
## mctest::omcdiag(mod = modelo_minceriano_2020)
## 
## 
## Overall Multicollinearity Diagnostics
## 
##                        MC Results detection
## Determinant |X'X|:         0.7352         0
## Farrar Chi-Square:     11389.6487         1
## Red Indicator:             0.1386         0
## Sum of Lambda Inverse:     6.6843         0
## Theil's Method:            0.0536         0
## Condition Number:         42.4721         1
## 
## 1 --> COLLINEARITY is detected by the test 
## 0 --> COLLINEARITY is not detected by the test

Factores Inflacionarios de la Varianza (FIV)*

mc.plot(mod = modelo_minceriano_2020, vif = 2)

Prueba de Durbin Watson

\(H_0: ρ=0\)

No hay evidencia de autocorrelacion de primer orden, en los residuos del modelo

\(H_1: ρ≠0\)

Hay evidencia de autocorrelacion de primer orden, en los residuos del modelo

dwtest(modelo_minceriano_2020,
       alternative = "two.sided",
       iterations = 1000)
## 
##  Durbin-Watson test
## 
## data:  modelo_minceriano_2020
## DW = 0.54563, p-value < 0.00000000000000022
## alternative hypothesis: true autocorrelation is not 0

Prueba del multiplicador de Lagrange (Breusch-Godfrey)

\(H_0:ρ_1=ρ_2=...=ρ_m=0\)

No hay evidencia de autocorrelacion de orden “m”, en los residuos del modelo

\(H_1:ρ_1=ρ_2=...=ρ_m≠0\)

Hay evidencia de autocorrelacion de orden “m”, en los residuos del modelo

#Primer orden
bgtest(modelo_minceriano_2020, order = 1)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  modelo_minceriano_2020
## LM test = 19992, df = 1, p-value < 0.00000000000000022
#Segundo orden
bgtest(modelo_minceriano_2020, order = 2)
## 
##  Breusch-Godfrey test for serial correlation of order up to 2
## 
## data:  modelo_minceriano_2020
## LM test = 19997, df = 2, p-value < 0.00000000000000022

ESTIMADORES HAC

Modelo sin corregir

coeftest(modelo_minceriano_2020)
## 
## t test of coefficients:
## 
##               Estimate Std. Error t value              Pr(>|t|)    
## (Intercept)  647.88413   43.63678 14.8472 < 0.00000000000000022 ***
## region        21.54276    2.36312  9.1162 < 0.00000000000000022 ***
## r104         -12.83606    6.57756 -1.9515               0.05101 .  
## r217          83.83896    2.41331 34.7402 < 0.00000000000000022 ***
## r442a          4.64142    0.45343 10.2362 < 0.00000000000000022 ***
## r454_b1     -143.49831   21.00303 -6.8323     0.000000000008487 ***
## area         216.42641    6.58596 32.8618 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Corregido

#Se utilizo HC1, dado que hay evidencia de correlacion de primer orden
estimacion_omega <- vcovHC(modelo_minceriano_2020, type = "HC1")
coeftest(modelo_minceriano_2020, vcov. = estimacion_omega)
## 
## t test of coefficients:
## 
##               Estimate Std. Error t value              Pr(>|t|)    
## (Intercept)  647.88413   41.03322 15.7893 < 0.00000000000000022 ***
## region        21.54276    2.65625  8.1102 0.0000000000000005208 ***
## r104         -12.83606    6.65644 -1.9284               0.05382 .  
## r217          83.83896    3.77128 22.2309 < 0.00000000000000022 ***
## r442a          4.64142    0.49022  9.4680 < 0.00000000000000022 ***
## r454_b1     -143.49831   19.59038 -7.3249 0.0000000000002438728 ***
## area         216.42641    6.24410 34.6610 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Estimacion Robusta

modelo_minceriano_robust <-
  lmrob(ingfa ~ region + r104 + r217 + r442a + r454_b1 + area, data = EHPM_2020)
stargazer(
  modelo_minceriano_2020,
  modelo_minceriano_robust,
  type = "html",
  title = "Comparativos"
)
Comparativos
Dependent variable:
ingfa
OLS MM-type
linear
(1) (2)
region 21.543*** 12.431***
(2.363) (1.364)
r104 -12.836* -5.433
(6.578) (3.719)
r217 83.839*** 54.750***
(2.413) (2.113)
r442a 4.641*** 4.201***
(0.453) (0.281)
r454_b1 -143.498*** -112.885***
(21.003) (12.822)
area 216.426*** 145.021***
(6.586) (3.697)
Constant 647.884*** 547.604***
(43.637) (26.646)
Observations 37,030 37,030
R2 0.099 0.147
Adjusted R2 0.099 0.147
Residual Std. Error (df = 37023) 619.172 311.229
F Statistic 678.422*** (df = 6; 37023)
Note: p<0.1; p<0.05; p<0.01

PRONÓSTICO Y SIMULACIÓN

#se trata de pronosticar que, los resultados vayan enfocado a mujeres y que estas tengan un titulo universitario y que sean de la zona oriental del pais.
X_m <-
  data.frame(
    region = 4 ,
    r104 = 2,
    r217 = 7,
    r442a = 14,
    r454_b1 = 1,
    area  = 0
  )

confidense <- c(0.95, 0.90)
predict(
  object = modelo_minceriano_2020,
  newdata = X_m,
  interval = "prediction",
  level = confidense,
  se.fit = TRUE
) -> predicciones
rownames(predicciones$fit) <- as.character(confidense * 100)
colnames(predicciones$fit) <- c("Ym", "Li", "Ls")
stargazer(predicciones$fit,
          title = "Pronostico e intervalos de confianza",
          type = "html")
Pronostico e intervalos de confianza
Ym Li Ls
95 1,216.737 2.117 2,431.358
90 1,216.737 197.403 2,236.071

HIPÓTESIS DE LOS PARÁMETROS

Region

\(H_0:\) La region tiene una relacion lineal con la variable de ingresos \(H_A:\) La region no tiene una relacion lineal con la varibale de ingresos

Edad

\(H_0:\) La edad tiene una relacion lineal con la varible de ingresos \(H_A:\) La edad no tiene una relacion lineal con la varibale de ingresos

Remesas

\(H_0:\) Las remesas no tiene una relacion lineal con la varible de ingresos \(H_A:\) Las remesas si tiene una relacion lineal con la varibale de ingresos

Títulos que aprobó

\(H_0:\) Los titulos que aprobaron tiene una relacion lineal con la varible de ingresos \(H_A:\) Los titulos que aprobaron no tienen una relacion lineal con la varibale de ingresos

Sexo

\(H_0:\) El sexo no tiene una relacion lineal con la varible de ingresos \(H_A:\) El sexo si tienen una relacion lineal con la varibale de ingresos

confint(modelo_minceriano_2020,level = 0.95)
##                   2.5 %        97.5 %
## (Intercept)  562.354817  733.41344668
## region        16.910972   26.17454772
## r104         -25.728266    0.05615273
## r217          79.108803   88.56912660
## r442a          3.752684    5.53015711
## r454_b1     -184.664846 -102.33177116
## area         203.517750  229.33506430