USO DE LA LIBRERIA FASTGRAPH
El ejercicio se ha tomado del Libro de Andersson “Estadistica para Negocios y Economia” del Capitulo 9, Pagina 362. Las hipotesis que presenta el ejercicio son:
H0 : μ = μ0
Ha: μ ≠ μ0
library(fastGraph)
#Calculo del Estadistico de Prueba Z
media<-297.6
mediaPob_hipo<- 295
des_stand<- 12
n<-50
Z<- (media- mediaPob_hipo)/(des_stand/sqrt(n))
print(Z)
## [1] 1.532065
#Valor Critico para una significancia del 5%
VCZ<-(1.96)
print(VCZ)
## [1] 1.96
shadeDist(xshade = c(-Z,Z),ddist = "dnorm",parm1 = 0,parm2 = 1, lower.tail = TRUE, sub=paste("Z Stadistic:",Z,"VC-:",-VCZ, "VC+:", VCZ))
valor_p <- 0.1255 #Sacado de las Tablas de Probabilidad de Distribucion Normal Estandar, aunque el grafico,, lo presenta en la parte superior.
print(valor_p)
## [1] 0.1255
Como -Z es mayor al VC- (-1.53>-1.96) y Z es menor al VC+ (1.53<1.96), entonces No se Rechaza la Hipotesis Nula.
El Estadistico de Prueba Z cae dentro de la Zona de No Rechazo.
El Valor-p es mayor al nivel de significancia, que es del 5%, por lo que tambien significa que no se rechaza la Hipotesis Nula. En otras palabras, existe evidencia de que la media poblacional es igual a 295
Para este ejercicio se usará un ejemplo de regresion lineal
Hipotesis
Ho: βj = 0
Hi: βj ≠ 0
options(scipen = 999999)
# Carga de Datos de un archivo .csv
library(readr)
datos <- read_csv("~/ejemplo_regresion.csv")
head(datos,n = 5)
## # A tibble: 5 x 3
## X1 X2 Y
## <dbl> <dbl> <dbl>
## 1 3.92 7298 0.75
## 2 3.61 6855 0.71
## 3 3.32 6636 0.66
## 4 3.07 6506 0.61
## 5 3.06 6450 0.7
# Corremos el modelo
Modelo_Lineal<-lm(formula = Y~X1+X2,data = datos)
# Usando summary
summary(Modelo_Lineal)
##
## Call:
## lm(formula = Y ~ X1 + X2, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.085090 -0.039102 -0.003341 0.030236 0.105692
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.56449677 0.07939598 19.705 0.00000000000000182 ***
## X1 0.23719747 0.05555937 4.269 0.000313 ***
## X2 -0.00024908 0.00003205 -7.772 0.00000009508790794 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.0533 on 22 degrees of freedom
## Multiple R-squared: 0.8653, Adjusted R-squared: 0.8531
## F-statistic: 70.66 on 2 and 22 DF, p-value: 0.000000000265
summary_modelo<- summary(Modelo_Lineal)$coefficients
t_stadistics<-summary_modelo[,"t value"]
etiquetas<- names(t_stadistics)
# Grados de libertad n-k y nivel de significancia del 5%
model.matrix(Modelo_Lineal)-> matrizX
n<- nrow(matrizX)
k<- ncol(matrizX)
gl_t<-(n-k)
#Buscamos el Valor Critico en las tablas de distribucion t student: t,α/2,n-k, donde α=0.05, n-k=22
VCt<- 2.074
print(VCt)
## [1] 2.074
for (j in 2:3) {
tc<-t_stadistics[j]
t_VC<- shadeDist(xshade = c(-tc,tc),ddist = "dt",parm1 = gl_t, parm2 = NULL, lower.tail = TRUE, sub=paste("Estadistico t de la Variable:",etiquetas[j]))
}
Para ambos parametros estimadores, el valor-p es menor al nivel de significancia (que es del 5%)
Para el parametro de la variable X1, El Estadistico t es mayor al valor critico (|t|>t,α/2,n-k), donde |t|=4.27 y t,α/2,n-k = 2.074
Para el parametro de la variable X2, El Estadistico t es mayor al valor critico (|t|>t,α/2,n-k), donde |t|=7.77 y t,α/2,n-k = 2.074
Se sigue con el Ejemplo del ejercicio Anterior
Ho: β1 = β2 = β3 = 0
Hi: β1 ≠ β2 ≠ β3 ≠ 0
F_Anova<-summary(Modelo_Lineal)$fstatistic[1]
gl_num<-summary(Modelo_Lineal)$fstatistic[2]
gl_den<-summary(Modelo_Lineal)$fstatistic[3]
F_VC<-qf(0.95,gl_num,gl_den,lower.tail = TRUE)
print(F_VC)
## [1] 3.443357
shadeDist(xshade = F_Anova,ddist = "df",parm1 = gl_num,parm2 = gl_den,lower.tail = FALSE,sub=paste("VC:",F_VC," ","F:",F_Anova))
El Estadistico F es mayor al Valor Critico (70.6>3.4), por lo que se rechaza la Hipotesis Nula. Existe Evidencia de una relacion lineal entre la variable Y con todas sus variables explicativas.
Por medio del valor-p, este es menor al nivel de significancia (0.00000… < 0.05)
Utilisamos el mismo modelo lineal de los dos ejercicios anteriores. Vamos a realizar la Prueba de Farrer-Glaubar
Pruebas de Hipotesis
H0: R∼I
H1: R≁I
library(psych)
library(fastGraph)
# Corremos la Prueba
FG_test<-cortest.bartlett(matrizX[,-1])
print(FG_test)
## $chisq
## [1] 48.75753
##
## $p.value
## [1] 0.000000000002896446
##
## $df
## [1] 1
#Calculamos el Valor Critico
VCchisq<-qchisq(p = 0.95,df = FG_test$df,lower.tail = FALSE)
shadeDist(xshade = FG_test$chisq,ddist = "dchisq",parm1 = FG_test$df,lower.tail = FALSE,sub=paste("VC:",VCchisq,"FG:",FG_test$chisq))
Como el Estadistico de Prueba FG es mayor al Valor Critico, entonces se rechaza la Hipotesis Nula. Existe Evidencia de Multicolinealidad.
Con el valor.p, este es menor al nivel de significancia, lo que arroja la misma conclusion.