USO DE LA LIBRERIA FASTGRAPH

1. Graficar el valor critico en la distribucion normal Z. Prueba de dos Colas

El ejercicio se ha tomado del Libro de Andersson “Estadistica para Negocios y Economia” del Capitulo 9, Pagina 362. Las hipotesis que presenta el ejercicio son:

H0 : μ = μ0

Ha: μ ≠ μ0

library(fastGraph)
#Calculo del Estadistico de Prueba Z
media<-297.6
mediaPob_hipo<- 295
des_stand<- 12
n<-50
Z<- (media- mediaPob_hipo)/(des_stand/sqrt(n))
print(Z)
## [1] 1.532065
#Valor Critico para una significancia del 5% 
VCZ<-(1.96) 
print(VCZ)
## [1] 1.96
shadeDist(xshade = c(-Z,Z),ddist = "dnorm",parm1 = 0,parm2 = 1, lower.tail = TRUE, sub=paste("Z Stadistic:",Z,"VC-:",-VCZ, "VC+:", VCZ))

valor_p <- 0.1255 #Sacado de las Tablas de Probabilidad de Distribucion Normal Estandar, aunque el grafico,, lo presenta en la parte superior. 
print(valor_p)
## [1] 0.1255

Como -Z es mayor al VC- (-1.53>-1.96) y Z es menor al VC+ (1.53<1.96), entonces No se Rechaza la Hipotesis Nula.

El Estadistico de Prueba Z cae dentro de la Zona de No Rechazo.

El Valor-p es mayor al nivel de significancia, que es del 5%, por lo que tambien significa que no se rechaza la Hipotesis Nula. En otras palabras, existe evidencia de que la media poblacional es igual a 295

2. Graficar el Estadistico t de los Parametros Estimados

Para este ejercicio se usará un ejemplo de regresion lineal

Hipotesis

Ho: βj = 0

Hi: βj ≠ 0

options(scipen = 999999)
# Carga de Datos de un archivo .csv
library(readr)
datos <- read_csv("~/ejemplo_regresion.csv")
head(datos,n = 5)
## # A tibble: 5 x 3
##      X1    X2     Y
##   <dbl> <dbl> <dbl>
## 1  3.92  7298  0.75
## 2  3.61  6855  0.71
## 3  3.32  6636  0.66
## 4  3.07  6506  0.61
## 5  3.06  6450  0.7
# Corremos el modelo
Modelo_Lineal<-lm(formula = Y~X1+X2,data = datos)
# Usando summary
summary(Modelo_Lineal)
## 
## Call:
## lm(formula = Y ~ X1 + X2, data = datos)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.085090 -0.039102 -0.003341  0.030236  0.105692 
## 
## Coefficients:
##                Estimate  Std. Error t value            Pr(>|t|)    
## (Intercept)  1.56449677  0.07939598  19.705 0.00000000000000182 ***
## X1           0.23719747  0.05555937   4.269            0.000313 ***
## X2          -0.00024908  0.00003205  -7.772 0.00000009508790794 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.0533 on 22 degrees of freedom
## Multiple R-squared:  0.8653, Adjusted R-squared:  0.8531 
## F-statistic: 70.66 on 2 and 22 DF,  p-value: 0.000000000265
summary_modelo<- summary(Modelo_Lineal)$coefficients

t_stadistics<-summary_modelo[,"t value"]
etiquetas<- names(t_stadistics)


# Grados de libertad n-k y nivel de significancia del 5%

model.matrix(Modelo_Lineal)-> matrizX
n<- nrow(matrizX)
k<- ncol(matrizX)
gl_t<-(n-k)
#Buscamos el Valor Critico en las tablas de distribucion t student:  t,α/2,n-k,  donde α=0.05, n-k=22
VCt<- 2.074
print(VCt)
## [1] 2.074
for (j in 2:3) {
tc<-t_stadistics[j]
t_VC<- shadeDist(xshade = c(-tc,tc),ddist = "dt",parm1 = gl_t, parm2 = NULL, lower.tail = TRUE, sub=paste("Estadistico t de la Variable:",etiquetas[j]))
}

Para ambos parametros estimadores, el valor-p es menor al nivel de significancia (que es del 5%)

Para el parametro de la variable X1, El Estadistico t es mayor al valor critico (|t|>t,α/2,n-k), donde |t|=4.27 y t,α/2,n-k = 2.074

Para el parametro de la variable X2, El Estadistico t es mayor al valor critico (|t|>t,α/2,n-k), donde |t|=7.77 y t,α/2,n-k = 2.074

3. Graficar el Estadistico F del modelo

Se sigue con el Ejemplo del ejercicio Anterior

Ho: β1 = β2 = β3 = 0

Hi: β1 ≠ β2 ≠ β3 ≠ 0

F_Anova<-summary(Modelo_Lineal)$fstatistic[1]
gl_num<-summary(Modelo_Lineal)$fstatistic[2]
gl_den<-summary(Modelo_Lineal)$fstatistic[3]

F_VC<-qf(0.95,gl_num,gl_den,lower.tail = TRUE)
print(F_VC)
## [1] 3.443357
shadeDist(xshade = F_Anova,ddist = "df",parm1 = gl_num,parm2 = gl_den,lower.tail = FALSE,sub=paste("VC:",F_VC," ","F:",F_Anova))

El Estadistico F es mayor al Valor Critico (70.6>3.4), por lo que se rechaza la Hipotesis Nula. Existe Evidencia de una relacion lineal entre la variable Y con todas sus variables explicativas.

Por medio del valor-p, este es menor al nivel de significancia (0.00000… < 0.05)

4. Graficar el Estadistico ji-cruadrada de los Parametros Estimados

Utilisamos el mismo modelo lineal de los dos ejercicios anteriores. Vamos a realizar la Prueba de Farrer-Glaubar

Pruebas de Hipotesis

H0: R∼I

H1: R≁I

library(psych)
library(fastGraph)
# Corremos la Prueba
FG_test<-cortest.bartlett(matrizX[,-1])
print(FG_test)
## $chisq
## [1] 48.75753
## 
## $p.value
## [1] 0.000000000002896446
## 
## $df
## [1] 1
#Calculamos el Valor Critico
VCchisq<-qchisq(p = 0.95,df = FG_test$df,lower.tail = FALSE)

shadeDist(xshade = FG_test$chisq,ddist = "dchisq",parm1 = FG_test$df,lower.tail = FALSE,sub=paste("VC:",VCchisq,"FG:",FG_test$chisq))

Como el Estadistico de Prueba FG es mayor al Valor Critico, entonces se rechaza la Hipotesis Nula. Existe Evidencia de Multicolinealidad.

Con el valor.p, este es menor al nivel de significancia, lo que arroja la misma conclusion.