El objetivo de este laboratorio es evaluar la validez de los estimadores de Mínimos Cuadrados Ordinarios (MCO) Para que las pruebas de hipótesis \(t\) y \(F\) sean válidas, el modelo debe cumplir con la ausencia de multicolinealidad perfecta y la normalidad de los residuos
library(car) # Para el VIF
## Warning: package 'car' was built under R version 4.5.3
## Cargando paquete requerido: carData
## Warning: package 'carData' was built under R version 4.5.3
library(nortest) # Para pruebas de normalidad adicionales
library(carData) # Para el conjunto de datos 'mtcars'
data(mtcars)
# Ajuste del modelo según la guía
modelo <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
#Diagnóstico de Multicolinealidad
vif_values <- vif(modelo)
knitr::kable(vif_values, col.names = "VIF", caption = "Resultados del VIF")
| VIF | |
|---|---|
| disp | 7.985439 |
| hp | 5.166758 |
| wt | 6.916942 |
| qsec | 3.133119 |
En este caso, los valores de VIF para las variables independientes son todos menores a 5, lo que indica que no hay evidencia de multicolinealidad severa en el modelo.
# Cálculo del índice de condición
design_matrix <- model.matrix(modelo)[,-1]
cor_matrix <- cor(design_matrix)
eigen_values <- eigen(cor_matrix)$values
condition_index <- sqrt(max(eigen_values) / eigen_values)
print(condition_index)
## [1] 1.000000 1.764319 4.668983 6.385750
Significado del VIF: Si el VIF es mayor a 5 o 10, la varianza de los coeficientes se infla, dificultando la interpretación de los efectos individuales.
Variables correlacionadas: Existe una correlación técnica evidente entre el desplazamiento (disp) y la potencia (hp). En este modelo, disp suele “robarle” significancia a otras variables debido a su alta correlación con el peso y la potencia.
#Diagnóstico de Normalidad de los Residuos
residuos <- residuals(modelo)
# Gráfico Q-Q
qqnorm(residuos)
qqline(residuos, col = "red")
# Prueba de Shapiro-Wilk
shapiro.test(residuos)
##
## Shapiro-Wilk normality test
##
## data: residuos
## W = 0.93661, p-value = 0.06004
#Análisis Crítico Final
¿Es este modelo confiable para realizar inferencia estadística?
El modelo presenta problemas de multicolinealidad severa, especialmente reflejados en valores de VIF elevados para variables mecánicamente relacionadas. Aunque los residuos puedan mostrar normalidad, la inflación de la varianza hace que los coeficientes no sean precisos para la inferencia. Como medida correctiva, se propone eliminar una de las variables redundantes (como disp) o realizar una transformación de los datos para mitigar la colinealidad.