Leer datos

load("C:/Users/ejhar/Downloads/data_clave_A.RData")

Calcular los residuos del problema

N <- nrow(P)
Iden<-diag(x=1,N,N)
#Residuos E = (I-P)*Y
Y<-C
u_i<- (Iden-P)%*%Y
print(u_i)
##          [,1]
## 1   -5.859103
## 2    2.605057
## 3   45.765735
## 4   31.102448
## 5  -21.037889
## 6    7.008120
## 7   17.859663
## 8   10.705631
## 9   22.002328
## 10  -2.689665
## 11   7.784083
## 12 -13.127696
## 13  17.521565
## 14  17.304695
## 15 -16.308260
## 16  -5.255508
## 17   2.788211
## 18 -16.379339
## 19 -14.327554
## 20  11.749135
## 21 -31.424669
## 22 -23.329596
## 23  22.171806
## 24  -5.040038
## 25 -36.191398
## 26 -25.211753
## 27 -21.411271
## 28   1.410519
## 29 -24.229564
## 30  20.971808
## 31  43.342653
## 32  36.808458
## 33  17.882297
## 34 -33.100273
## 35 -37.819995
## 36 -49.370820
## 37  23.456143
## 38 -25.510341
## 39 -11.960629
## 40  -9.234201
## 41  21.949616
## 42   3.211123
## 43 -14.511436
## 44   3.197576
## 45 -62.396763
## 46 -66.854500
## 47   8.330745
## 48  91.963380
## 49  61.620735
## 50  48.148861
## 51 -10.717721
## 52 -84.069717
## 53 -56.426627
## 54 125.113605

Pruebas de normalidad

Jarque Bera

library(normtest)
jb.norm.test(u_i)
## 
##  Jarque-Bera test for normality
## 
## data:  u_i
## JB = 11.587, p-value = 0.01
  • En caso de la prueba de Jarque-Bera para un nivel de significancia del 5% V.C. = 5.9915 la condicion de no rechazar de la \(H_o\) es que el estadistico JB < V.C., además también se puede evaluar por medio del p-value en la cual la condición de no rechazo es p =< \(\alpha\)

JB(11.587) >= V.C.(5.9915) p (0.01) =< \(\alpha\)(0.05)

  • SE RECHAZA LA HIPOTESIS NULA POR LO QUE NO HAY EVIDENCIA QUE LOS RESIDUOS SIGUEN UNA DISTRIBUCION NORMAL

Kolmogorov Smirnov - Lilliefors

library(nortest)
lillie.test(u_i)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  u_i
## D = 0.11329, p-value = 0.08115
  • En caso de la prueba de Kolmogorov-Smirnov para un nivel de significancia del 5% y una muesta n=54 el V.C. = 0.1192 la condicion de no rechazar de la \(H_o\) es que el estadistico D < V.C., además también se puede evaluar por medio del p-value en la cual la condición de no rechazo es p-value =< \(\alpha\)

D (0.11329) < V.C.(0.1192) p-value (0.08115) > \(\alpha\)(0.05)

  • NO SE RECHAZA LA HIPOTESIS NULA POR LO QUE HAY EVIDENCIA QUE LOS RESIDUOS SIGUEN UNA DISTRIBUCION NORMAL

Shapiro - Wilk

shapiro.test(u_i)
## 
##  Shapiro-Wilk normality test
## 
## data:  u_i
## W = 0.95975, p-value = 0.06716

En caso de la prueba de Shapiro-Wilk para un nivel de significanciadel 5% el V.C. = 1.644854 la condicion de no rechazar de la \(H_o\) es que el estadistico SW < V.C., además también se puede evaluar por medio del p-value en la cual la condición de no rechazo es p-value =< \(\alpha\)

SW (0.95975) < V.C.(1.644854) p-value (0.06716) > \(\alpha\)(0.05)

  • NO SE RECHAZA LA HIPOTESIS NULA POR LO QUE HAY EVIDENCIA QUE LOS RESIDUOS SIGUEN UNA DISTRIBUCION NORMAL

Normalizar Sn y la version normalizada de X’X guardar

library(stargazer)
# Sn
options(scipen = 9999)
Sn<-solve(diag(sqrt(diag(XX))))
stargazer(Sn,type = "text")
## 
## ===========================
## 0.136    0       0      0  
## 0     0.00004    0      0  
## 0        0    0.00001   0  
## 0        0       0    0.046
## ---------------------------
#Xnormalizada
XXnorm<-(Sn%*%XX)%*%Sn
stargazer(XXnorm,type = "text",digits = 5)
## 
## ===============================
## 1       0.89331 0.87015 0.40712
## 0.89331    1    0.99245 0.59728
## 0.87015 0.99245    1    0.59661
## 0.40712 0.59728 0.59661    1   
## -------------------------------

Calculo de los autovalores de XX normalizada

#autovalores de la matriz XXnorm -comando eigen()-
lambdas <- eigen(XXnorm,symmetric = TRUE)
stargazer(lambdas$values,type = "text")
## 
## =======================
## 3.226 0.646 0.122 0.006
## -----------------------
#El índice de condición es la división de la raiz cuadrada del max(lambdas$values) entre la raiz de min(lambdas$values)
K<-sqrt(max(lambdas$values)/min(lambdas$values))
print(K)
## [1] 22.99502
  • Para interpretar la severidad de colinealidad del modelo ver los siguientes supuestos k < 20 Existe una leve multicolinealidad 20 < k < 30 Existe una multicolinealidad moderada k >= 30 la multicolinealidad es severa
  • 20 < 22.99505 < 30, POR LO QUE SE CONCLUYE QUE EL MODELO PRESENTA UNA MULTICOLINEALIDAD MODERADA

Calcular los VIF’s

R_1 <- solve(R) #Inversa ded R
VIFs<-diag(R_1)
print(VIFs)
##        Yd         W         I 
## 18.708175 17.815221  1.486972
  • Tradicionalmente un valor VIF>10 indicaría que el modelo de regresión lineal presenta un grado de multicolinealidad preocupante
  • POR LO QUE yd y W son considerados altamente colineales