MODELOS DE LABORATORIO 1

Multiconealidad: Se le llama asi cuando hay variables en el modelo que estan correlacionadas.

datos <- read_excel("~/Desktop/empleados.xlsx")
cor(datos)
##               genero        educ       catlab     salario      salini
## genero    1.00000000 -0.35598562 -0.377660072 -0.44992300 -0.45667563
## educ     -0.35598562  1.00000000  0.513853677  0.66055891  0.63319565
## catlab   -0.37766007  0.51385368  1.000000000  0.78011486  0.75466244
## salario  -0.44992300  0.66055891  0.780114863  1.00000000  0.88011747
## salini   -0.45667563  0.63319565  0.754662438  0.88011747  1.00000000
## tiempemp -0.06646673  0.04737878  0.005328829  0.08409227 -0.01975347
## expprev  -0.16485670 -0.25235252  0.062644949 -0.09746693  0.04513563
## minoria  -0.07566758 -0.13288857 -0.143781245 -0.17733731 -0.15759773
##              tiempemp      expprev     minoria
## genero   -0.066466734 -0.164856699 -0.07566758
## educ      0.047378777 -0.252352521 -0.13288857
## catlab    0.005328829  0.062644949 -0.14378124
## salario   0.084092267 -0.097466926 -0.17733731
## salini   -0.019753475  0.045135627 -0.15759773
## tiempemp  1.000000000  0.002978134  0.04950064
## expprev   0.002978134  1.000000000  0.14474651
## minoria   0.049500639  0.144746512  1.00000000
datos.round <- round(cor(datos[,-1]),2);datos.round
##           educ catlab salario salini tiempemp expprev minoria
## educ      1.00   0.51    0.66   0.63     0.05   -0.25   -0.13
## catlab    0.51   1.00    0.78   0.75     0.01    0.06   -0.14
## salario   0.66   0.78    1.00   0.88     0.08   -0.10   -0.18
## salini    0.63   0.75    0.88   1.00    -0.02    0.05   -0.16
## tiempemp  0.05   0.01    0.08  -0.02     1.00    0.00    0.05
## expprev  -0.25   0.06   -0.10   0.05     0.00    1.00    0.14
## minoria  -0.13  -0.14   -0.18  -0.16     0.05    0.14    1.00

Existe nulticolinealidad en el salario incial y categoria laboral.

Autocorrelación: Se llama asi cuando hay pertubaciones , la probabilidad de aceptar una autocorrelación significativa cuando es verdadera y se rechaza Ho

datos.lm <-  lm(salario ~ salini + tiempemp + expprev,data=datos)
summary(datos.lm)
## 
## Call:
## lm(formula = salario ~ salini + tiempemp + expprev, data = datos)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -32736  -3965  -1214   2458  46474 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027e+04  2.960e+03  -3.469 0.000571 ***
## salini       1.927e+00  4.437e-02  43.435  < 2e-16 ***
## tiempemp     1.732e+02  3.468e+01   4.995 8.32e-07 ***
## expprev     -2.251e+01  3.339e+00  -6.742 4.59e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7586 on 470 degrees of freedom
## Multiple R-squared:  0.8039, Adjusted R-squared:  0.8026 
## F-statistic: 642.2 on 3 and 470 DF,  p-value: < 2.2e-16
datos.lm.rs <- rstudent(datos.lm)
plot(datos.lm.rs,pch=16,type="bg")
## Warning in plot.xy(xy, type, ...): plot type 'bg' will be truncated to first
## character

Homoscedasticidad: La homocedasticidad es cuando es constante un termino de error en un modelo de regresión , es importante por que de no controlarlo el resulta que hagamos puede estar sesgado.

# Valores ajustados
datos.lm.f <- fitted(datos.lm)

# Residuos del modelo
datos.lm.r <- residuals(datos.lm)

par(mfrow=c(2,2))

# Residuos versus valores ajustados
plot(datos.lm.f,datos.lm.r,pch=16)

# Residuos versus salini
plot(datos$salini,datos.lm.r,pch=16)

# Residuos versus expprev
plot(datos$expprev,datos.lm.r,pch=16)

# Residuos versus tiempemp
plot(datos$tiempemp,datos.lm.r,pch=16)