Multiconealidad: Se le llama asi cuando hay variables en el modelo que estan correlacionadas.
datos <- read_excel("~/Desktop/empleados.xlsx")
cor(datos)
## genero educ catlab salario salini
## genero 1.00000000 -0.35598562 -0.377660072 -0.44992300 -0.45667563
## educ -0.35598562 1.00000000 0.513853677 0.66055891 0.63319565
## catlab -0.37766007 0.51385368 1.000000000 0.78011486 0.75466244
## salario -0.44992300 0.66055891 0.780114863 1.00000000 0.88011747
## salini -0.45667563 0.63319565 0.754662438 0.88011747 1.00000000
## tiempemp -0.06646673 0.04737878 0.005328829 0.08409227 -0.01975347
## expprev -0.16485670 -0.25235252 0.062644949 -0.09746693 0.04513563
## minoria -0.07566758 -0.13288857 -0.143781245 -0.17733731 -0.15759773
## tiempemp expprev minoria
## genero -0.066466734 -0.164856699 -0.07566758
## educ 0.047378777 -0.252352521 -0.13288857
## catlab 0.005328829 0.062644949 -0.14378124
## salario 0.084092267 -0.097466926 -0.17733731
## salini -0.019753475 0.045135627 -0.15759773
## tiempemp 1.000000000 0.002978134 0.04950064
## expprev 0.002978134 1.000000000 0.14474651
## minoria 0.049500639 0.144746512 1.00000000
datos.round <- round(cor(datos[,-1]),2);datos.round
## educ catlab salario salini tiempemp expprev minoria
## educ 1.00 0.51 0.66 0.63 0.05 -0.25 -0.13
## catlab 0.51 1.00 0.78 0.75 0.01 0.06 -0.14
## salario 0.66 0.78 1.00 0.88 0.08 -0.10 -0.18
## salini 0.63 0.75 0.88 1.00 -0.02 0.05 -0.16
## tiempemp 0.05 0.01 0.08 -0.02 1.00 0.00 0.05
## expprev -0.25 0.06 -0.10 0.05 0.00 1.00 0.14
## minoria -0.13 -0.14 -0.18 -0.16 0.05 0.14 1.00
Existe nulticolinealidad en el salario incial y categoria laboral.
Autocorrelación: Se llama asi cuando hay pertubaciones , la probabilidad de aceptar una autocorrelación significativa cuando es verdadera y se rechaza Ho
datos.lm <- lm(salario ~ salini + tiempemp + expprev,data=datos)
summary(datos.lm)
##
## Call:
## lm(formula = salario ~ salini + tiempemp + expprev, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -32736 -3965 -1214 2458 46474
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027e+04 2.960e+03 -3.469 0.000571 ***
## salini 1.927e+00 4.437e-02 43.435 < 2e-16 ***
## tiempemp 1.732e+02 3.468e+01 4.995 8.32e-07 ***
## expprev -2.251e+01 3.339e+00 -6.742 4.59e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7586 on 470 degrees of freedom
## Multiple R-squared: 0.8039, Adjusted R-squared: 0.8026
## F-statistic: 642.2 on 3 and 470 DF, p-value: < 2.2e-16
datos.lm.rs <- rstudent(datos.lm)
plot(datos.lm.rs,pch=16,type="bg")
## Warning in plot.xy(xy, type, ...): plot type 'bg' will be truncated to first
## character
Homoscedasticidad: La homocedasticidad es cuando es constante un termino de error en un modelo de regresión , es importante por que de no controlarlo el resulta que hagamos puede estar sesgado.
# Valores ajustados
datos.lm.f <- fitted(datos.lm)
# Residuos del modelo
datos.lm.r <- residuals(datos.lm)
par(mfrow=c(2,2))
# Residuos versus valores ajustados
plot(datos.lm.f,datos.lm.r,pch=16)
# Residuos versus salini
plot(datos$salini,datos.lm.r,pch=16)
# Residuos versus expprev
plot(datos$expprev,datos.lm.r,pch=16)
# Residuos versus tiempemp
plot(datos$tiempemp,datos.lm.r,pch=16)