Leer datos

load("C:/Users/ejhar/Downloads/data_clave_D.RData")

Calcular los residuos del problema

N <- nrow(P)
Iden<-diag(x=1,N,N)
#Residuos E = (I-P)*Y
u_i<- (Iden-P)%*%TASTE
print(u_i)
##         [,1]
## 1  -38.36458
## 2  -39.81687
## 3  -24.15468
## 4  -16.68853
## 5  -45.90793
## 6  -30.05951
## 7  -19.79563
## 8  -46.04235
## 9  -40.21717
## 10 -44.82998
## 11 -33.07190
## 12 -18.37380
## 13 -51.36114
## 14 -34.19329
## 15 -16.16415
## 16  25.19337
## 17 -39.01366
## 18 -54.89742
## 19 -41.02372
## 20 -16.26884
## 21 -33.21377
## 22 -45.21340
## 23 -17.30341
## 24  -1.52087
## 25 -50.31225
## 26 -70.09473
## 27 -50.97383
## 28 -64.25431
## 29 -47.61858
## 30 -70.55002

Pruebas de normalidad

Jarque Bera

library(normtest)
jb.norm.test(u_i)
## 
##  Jarque-Bera test for normality
## 
## data:  u_i
## JB = 4.5742, p-value = 0.045
  • En caso de la prueba de Jarque-Bera la condicion de no rechazar de la \(H_o\) se puede evaluar por medio del p-value en la cual no se rechasa si p > \(\alpha\)

p (0.045) < \(\alpha\)(0.05)

  • SE RECHAZA LA HIPOTESIS NULA POR LO QUE NO HAY EVIDENCIA QUE LOS RESIDUOS SIGUEN UNA DISTRIBUCION NORMAL

Kolmogorov Smirnov - Lilliefors

library(nortest)
lillie.test(u_i)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  u_i
## D = 0.11556, p-value = 0.3879
  • En caso de la prueba de Kolmogorov-Smirnov para un nivel de significancia del 5% y una muesta n=47 el V.C. = 0.159 la condicion de no rechazar de la \(H_o\) es que el estadistico D < V.C., además también se puede evaluar por medio del p-value en la cual la condición de no rechazo es p-value > \(\alpha\)

D (0.11556) < V.C.(0.159) p-value (0.3879) > \(\alpha\)(0.05)

  • NO SE RECHAZA LA HIPOTESIS NULA POR LO QUE HAY EVIDENCIA QUE LOS RESIDUOS SIGUEN UNA DISTRIBUCION NORMAL

Shapiro - Wilk

shapiro.test(u_i)
## 
##  Shapiro-Wilk normality test
## 
## data:  u_i
## W = 0.94748, p-value = 0.1446

En caso de la prueba de Shapiro-Wilk para un nivel de significanciadel 5% el V.C. = 1.644854 la condicion de no rechazar de la \(H_o\) es que el estadistico SW < V.C., además también se puede evaluar por medio del p-value en la cual la condición de no rechazo es p-value > \(\alpha\)

SW (0.94748) < V.C.(1.644854) p-value (0.1446) > \(\alpha\)(0.05)

  • NO SE RECHAZA LA HIPOTESIS NULA POR LO QUE HAY EVIDENCIA QUE LOS RESIDUOS SIGUEN UNA DISTRIBUCION NORMAL

Normalizar Sn y la version normalizada de X’X guardar

library(stargazer)
# Sn
options(scipen = 9999)
XX<-solve(inv_XX)
Sn<-solve(diag(sqrt(diag(XX))))
stargazer(Sn,type = "text")
## 
## =======================
## 0.271   0     0     0  
## 0     0.051   0     0  
## 0       0   0.032   0  
## 0       0     0   0.163
## -----------------------
#Xnormalizada
XXnorm<-(Sn%*%XX)%*%Sn
stargazer(XXnorm,type = "text",digits = 5)
## 
## ===============================
## 1       0.98363 0.87736 0.95136
## 0.98363    1    0.88592 0.95541
## 0.87736 0.88592    1    0.94555
## 0.95136 0.95541 0.94555    1   
## -------------------------------

Calculo de los autovalores de XX normalizada

#autovalores de la matriz XXnorm -comando eigen()-
lambdas <- eigen(XXnorm,symmetric = TRUE)
stargazer(lambdas$values,type = "text")
## 
## =======================
## 3.800 0.155 0.029 0.016
## -----------------------
#El índice de condición es la división de la raiz cuadrada del max(lambdas$values) entre la raiz de min(lambdas$values)
K<-sqrt(max(lambdas$values)/min(lambdas$values))
print(K)
## [1] 15.32662
  • Para interpretar la severidad de colinealidad del modelo ver los siguientes supuestos k < 20 Existe una leve multicolinealidad 20 < k < 30 Existe una multicolinealidad moderada k >= 30 la multicolinealidad es severa
  • 15.32662 < 20, POR LO QUE SE CONCLUYE QUE EL MODELO PRESENTA UNA MULTICOLINEALIDAD LEVE

Calcular los VIF’s

R_1 <- solve(R) #Inversa ded R
VIFs<-diag(R_1)
print(VIFs)
##   ACETIC      H2S   LACTIC 
## 1.152769 1.716417 1.829328
  • Tradicionalmente un valor VIF<2 se consideran variables colineales, si son VIF>5 o VIF>10 indicaría que el modelo de regresión lineal presenta un grado de multicolinealidad preocupante
  • EN ESTE CASO TODAS LAS VARIABLES SON NO COLINEALES