I-2022
Se busca desarrollar un modelo econométrico que permita encontrar los determinantes de los salarios en El Salvador.Este modelo permite comparar la relación entre capital humano e ingresos y medir estadísticamente los retornos de la educación. la teórica empírica, apunta que algunas características como el sexo, la edad, la experiencia, la habilidad innata, así como la propia de la persona aptap para el trabajo en su disposición de aprender e innovar pueden ser cruciales para que una persona consiga un trabajo y un excelente salario. Este modelo se caracteriza por explicar la relacion de los salarios de los trabajadores en función de la edad, el género, la localización, la educación, entre otras variables.
Objetivo General
Desarrollar un modelo econométrico lineal que permita pronosticar los salarios de las personas en El Salvador para el año dos mil veinte.
Objetivos Específicos
Definir las variables a estudiar para realizar el modelo econométrico y su incidencia en los salarios.
Registrar los datos en los que se basara el modelo a explicar la proyección de salarios para verificar las relaciones establecidas.
Demostrar los resultados obtenidos por medio del modelo y su impacto en los salarios de las personas salvadoreñas.
Para Mincer, las teorías de capital humano influían en la capacidad de ingreso-edad, dado esto en función de año de escolaridad y experiencia laboral, por medio de la estimación de ingresos a través de Mínimos Cuadrados Ordinarios (MCO), permitiendo el impacto de estimación en años de estudio a sus rentas laborales en los individuos.
Para conocer a cerca del modelo a realizar, estudiaremos la importancia sobre este economista dio un aporte social-económico, siendo este padre de la economía laboral moderna, destacado de la Universidad de Columbia también de la Escuela de Chicago.
Jacob Mincer (Julio 15, 1922 – agosto 20, 2006), desarrollo parte de un trabajo económico que estudiaría los fundamentos empíricos de la teoría de capital humano, junto con el economista Gary Becker (diciembre 2, 1930 – mayo 3,2014). Durante el tiempo en su carrera siendo parte de las enseñanzas de la Universidad de Chicago, tuvo muchos aportes y ensayos hacia la economía y el comportamiento social de las personas, su trabajo más fundamental fue: Escolarización, experiencia y ganancia, publicado en 1974, usando las herramientas por medio de CENSOS para un informe de datos claros para su investigación en los años 1950 a 1960 sobre el cálculo de ganancias anuales de escolaridad.
Siendo una pequeña parte de inversión en las primeras necesidades vitales, como comida y salud, teniendo como prioridad la inversión en la educación, que dado a esto se dará el aumento de nuevas oportunidades y nuevos ingresos en la persona. Los economistas neoclásicos, dan como proceso educativo al elegir la inversión, dan prioridad al aporte económico y su inversión en ella, para poder incrementar la capacidad del personal, de igual manera su productividad, los neoclásicos ven la inversión en la educación y no lo ven como un gasto, y el stock de conocimientos, considerado como un capital.
La teoría de capital humano desarrollado por el economista Becker (1964), su objetivo original era la estimación en el crecimiento de la educación, pero de igual manera se dio cuenta que no existía un marco que explicaría el proceso de inversión sobre las personas.
Determicación de las varibales
Varible Endógena
Ingreso
El ingreso es la cantidad de recursos monetarios, dinero, que se asigna a cada factor por su contribución al proceso productivo. El ingreso puede tomar la forma de sueldos y salarios, renta, dividendos, regalías, utilidades, honorarios, dependiendo el factor de producción que lo reciba: trabajo, capital, tierra, etc. (htt)
Varibales Exógenas
Sexo
Se refiere a los roles, las características y oportunidades definidos por la sociedad que se consideran apropiados para los hombres, las mujeres, los niños, las niñas y las personas con identidades no binarias.(Salud, s.f.)
Eduación
Es el proceso de facilitar el aprendizaje o la adquisición de conocimientos, habilidades, valores, creencias y hábitos de un grupo de personas que los transfieren a otras personas, a través de la narración de cuentos, la discusión, la enseñanza, el ejemplo, la formación o la investigación. (Educación, s.f.)
Región
Es una zona territorial delimitada por características comunes que pueden ser geográficas, culturales, políticas o económicas
Hipótesis 1
Como supuestos del modelo de regresión lineal múltiple se dice que este es lineal en los parámetros
\(Υ = β_0+ β_1 X_1+ β_2 X_2+ β_3 X_3+ β_4 X_4+ β_5 X_5+ β_6X_6\)
Hipótesis 2
Los ingresos de las personas dependen en gran medida del nivel de estudios académicos
Hipótesis 3
Las personas de la zona oriental, poseen ingresos bajos respecto a las demas zonas del país.
## # A tibble: 10 x 10
## edicion lote tipo folio viv r101 idboleta fac00 area region
## <dbl> <dbl> <hvn_lbll> <dbl> <hvn_lbll> <dbl> <dbl> <dbl> <hvn_l> <hvn_>
## 1 2020 20 0 69 0 1 237167 486. 1 1
## 2 2020 20 0 69 0 2 237167 486. 1 1
## 3 2020 20 0 69 0 3 237167 486. 1 1
## 4 2020 20 0 70 0 1 237688 484. 1 1
## 5 2020 20 0 70 0 2 237688 484. 1 1
## 6 2020 20 0 71 0 1 236233 482. 1 1
## 7 2020 20 0 71 0 2 236233 482. 1 1
## 8 2020 20 0 71 0 3 236233 482. 1 1
## 9 2020 20 0 71 0 4 236233 482. 1 1
## 10 2020 20 0 72 0 1 236526 486. 1 1
options(scipen = 9999999)
modelo_minceriano_2020 <-
lm(formula = ingfa ~ region + r104 + r217 + r442a + r454_b1 + area,
data = EHPM_2020)
stargazer(modelo_minceriano_2020, type = "html", title = "Modelo Minceriano El Salvador 2020")| Dependent variable: | |
| ingfa | |
| region | 21.543*** |
| (2.363) | |
| r104 | -12.836* |
| (6.578) | |
| r217 | 83.839*** |
| (2.413) | |
| r442a | 4.641*** |
| (0.453) | |
| r454_b1 | -143.498*** |
| (21.003) | |
| area | 216.426*** |
| (6.586) | |
| Constant | 647.884*** |
| (43.637) | |
| Observations | 37,030 |
| R2 | 0.099 |
| Adjusted R2 | 0.099 |
| Residual Std. Error | 619.172 (df = 37023) |
| F Statistic | 678.422*** (df = 6; 37023) |
| Note: | p<0.1; p<0.05; p<0.01 |
options(scipen = 9999999)
verificacion_ajuste<-fitdist(data=as.vector(modelo_minceriano_2020$residuals),dist= "norm")
plot(verificacion_ajuste)## Fitting of the distribution ' norm ' by maximum likelihood
## Parameters :
## estimate Std. Error
## mean 0.0000000000001325663 3.217036
## sd 619.1134598242375659538 2.274873
## Loglikelihood: -290582.8 AIC: 581169.6 BIC: 581186.7
## Correlation matrix:
## mean sd
## mean 1 0
## sd 0 1
Prueba de Normalidad Jarque-Bera
\(H_0: ε ~ N(0,σ^2)\) \(H_A: ε ≁ N(0,σ^2)\)
##
## Jarque-Bera test for normality
##
## data: modelo_minceriano_2020$residuals
## JB = 10684416, p-value < 0.00000000000000022
hist(
modelo_minceriano_2020$residuals,
main = "Histograma de los residuos",
xlab = "Residuos",
ylab = "frecuencia"
)Prueba de Normalidad Kolmogorov-Smirnov \(H_0: ε ~ N(0,σ^2)\) \(H_A: ε ≁ N(0,σ^2)\)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: modelo_minceriano_2020$residuals
## D = 0.15212, p-value < 0.00000000000000022
hist(
modelo_minceriano_2020$residuals,
main = "Histograma de los residuos",
xlab = "Residuos",
ylab = "frecuencia"
)Indice de condicion
options(scipen = 9999999)
X_mat <- model.matrix(modelo_minceriano_2020)
mctest(mod = modelo_minceriano_2020)##
## Call:
## omcdiag(mod = mod, Inter = TRUE, detr = detr, red = red, conf = conf,
## theil = theil, cn = cn)
##
##
## Overall Multicollinearity Diagnostics
##
## MC Results detection
## Determinant |X'X|: 0.7352 0
## Farrar Chi-Square: 11389.6487 1
## Red Indicator: 0.1386 0
## Sum of Lambda Inverse: 6.6843 0
## Theil's Method: 0.0536 0
## Condition Number: 42.4721 1
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
Prueba de Farrar-Glaubar
##
## Call:
## mctest::omcdiag(mod = modelo_minceriano_2020)
##
##
## Overall Multicollinearity Diagnostics
##
## MC Results detection
## Determinant |X'X|: 0.7352 0
## Farrar Chi-Square: 11389.6487 1
## Red Indicator: 0.1386 0
## Sum of Lambda Inverse: 6.6843 0
## Theil's Method: 0.0536 0
## Condition Number: 42.4721 1
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
\(H_0: ρ=0\)
No hay evidencia de autocorrelacion de primer orden, en los residuos del modelo
\(H_1: ρ≠0\)
Hay evidencia de autocorrelacion de primer orden, en los residuos del modelo
##
## Durbin-Watson test
##
## data: modelo_minceriano_2020
## DW = 0.54563, p-value < 0.00000000000000022
## alternative hypothesis: true autocorrelation is not 0
\(H_0:ρ_1=ρ_2=...=ρ_m=0\)
No hay evidencia de autocorrelacion de orden “m”, en los residuos del modelo
\(H_1:ρ_1=ρ_2=...=ρ_m≠0\)
Hay evidencia de autocorrelacion de orden “m”, en los residuos del modelo
##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: modelo_minceriano_2020
## LM test = 19992, df = 1, p-value < 0.00000000000000022
##
## Breusch-Godfrey test for serial correlation of order up to 2
##
## data: modelo_minceriano_2020
## LM test = 19997, df = 2, p-value < 0.00000000000000022
Modelo sin corregir
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 647.88413 43.63678 14.8472 < 0.00000000000000022 ***
## region 21.54276 2.36312 9.1162 < 0.00000000000000022 ***
## r104 -12.83606 6.57756 -1.9515 0.05101 .
## r217 83.83896 2.41331 34.7402 < 0.00000000000000022 ***
## r442a 4.64142 0.45343 10.2362 < 0.00000000000000022 ***
## r454_b1 -143.49831 21.00303 -6.8323 0.000000000008487 ***
## area 216.42641 6.58596 32.8618 < 0.00000000000000022 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Corregido
#Se utilizo HC1, dado que hay evidencia de correlacion de primer orden
estimacion_omega <- vcovHC(modelo_minceriano_2020, type = "HC1")
coeftest(modelo_minceriano_2020, vcov. = estimacion_omega)##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 647.88413 41.03322 15.7893 < 0.00000000000000022 ***
## region 21.54276 2.65625 8.1102 0.0000000000000005208 ***
## r104 -12.83606 6.65644 -1.9284 0.05382 .
## r217 83.83896 3.77128 22.2309 < 0.00000000000000022 ***
## r442a 4.64142 0.49022 9.4680 < 0.00000000000000022 ***
## r454_b1 -143.49831 19.59038 -7.3249 0.0000000000002438728 ***
## area 216.42641 6.24410 34.6610 < 0.00000000000000022 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Estimacion Robusta
modelo_minceriano_robust <-
lmrob(ingfa ~ region + r104 + r217 + r442a + r454_b1 + area, data = EHPM_2020)
stargazer(
modelo_minceriano_2020,
modelo_minceriano_robust,
type = "html",
title = "Comparativos"
)| Dependent variable: | ||
| ingfa | ||
| OLS | MM-type | |
| linear | ||
| (1) | (2) | |
| region | 21.543*** | 12.431*** |
| (2.363) | (1.364) | |
| r104 | -12.836* | -5.433 |
| (6.578) | (3.719) | |
| r217 | 83.839*** | 54.750*** |
| (2.413) | (2.113) | |
| r442a | 4.641*** | 4.201*** |
| (0.453) | (0.281) | |
| r454_b1 | -143.498*** | -112.885*** |
| (21.003) | (12.822) | |
| area | 216.426*** | 145.021*** |
| (6.586) | (3.697) | |
| Constant | 647.884*** | 547.604*** |
| (43.637) | (26.646) | |
| Observations | 37,030 | 37,030 |
| R2 | 0.099 | 0.147 |
| Adjusted R2 | 0.099 | 0.147 |
| Residual Std. Error (df = 37023) | 619.172 | 311.229 |
| F Statistic | 678.422*** (df = 6; 37023) | |
| Note: | p<0.1; p<0.05; p<0.01 | |
#se trata de pronosticar que, los resultados vayan enfocado a mujeres y que estas tengan un titulo universitario y que sean de la zona oriental del pais.
X_m <-
data.frame(
region = 4 ,
r104 = 2,
r217 = 7,
r442a = 14,
r454_b1 = 1,
area = 0
)
confidense <- c(0.95, 0.90)
predict(
object = modelo_minceriano_2020,
newdata = X_m,
interval = "prediction",
level = confidense,
se.fit = TRUE
) -> predicciones
rownames(predicciones$fit) <- as.character(confidense * 100)
colnames(predicciones$fit) <- c("Ym", "Li", "Ls")
stargazer(predicciones$fit,
title = "Pronostico e intervalos de confianza",
type = "html")| Ym | Li | Ls | |
| 95 | 1,216.737 | 2.117 | 2,431.358 |
| 90 | 1,216.737 | 197.403 | 2,236.071 |
Region
\(H_0:\) La region tiene una relacion lineal con la variable de ingresos \(H_A:\) La region no tiene una relacion lineal con la varibale de ingresos
Edad
\(H_0:\) La edad tiene una relacion lineal con la varible de ingresos \(H_A:\) La edad no tiene una relacion lineal con la varibale de ingresos
Remesas
\(H_0:\) Las remesas no tiene una relacion lineal con la varible de ingresos \(H_A:\) Las remesas si tiene una relacion lineal con la varibale de ingresos
Títulos que aprobó
\(H_0:\) Los titulos que aprobaron tiene una relacion lineal con la varible de ingresos \(H_A:\) Los titulos que aprobaron no tienen una relacion lineal con la varibale de ingresos
Sexo
\(H_0:\) El sexo no tiene una relacion lineal con la varible de ingresos \(H_A:\) El sexo si tienen una relacion lineal con la varibale de ingresos
## 2.5 % 97.5 %
## (Intercept) 562.354817 733.41344668
## region 16.910972 26.17454772
## r104 -25.728266 0.05615273
## r217 79.108803 88.56912660
## r442a 3.752684 5.53015711
## r454_b1 -184.664846 -102.33177116
## area 203.517750 229.33506430
Con el 95% no se rechaza la hipotesis, dado que hay evidencia de que la varibale region presenta una relacion lineal con la varible ingresos
Con el 95% se rechaza la hipotesis, dado que hay evidencia de que la varibale no presenta una relacion lineal con la varible ingresos
Con el 95% no se rechaza la hipotesis nula, dado que hay evidencia de que la varibale titulos que aprobo presenta una relacion lineal con la varible ingresos
Con el 95% no se rechaza la hipotesis nula, dado que hay evidencia de que la varibale edad presenta una relacion lineal con la varible ingresos
Con el 95% se rechaza la hipotesis nula, dado que hay evidencia de que la varibale remesas presenta una relacion no lineal con la varible ingresos
Con el 95% no se rechaza la hipotesis nula, dado que hay evidencia de que la varibale area presenta una relacion lineal con la varible ingresos