Prueba de la Ji-cuadrada

1._Se lanza un dado 600 veces se obtuvieron los siguientes resultados.
\[\begin{array}{|c ||c |c |c|c|c|c|} \hline \textbf{Número del dado} & 1& 2& 3&4&5&6 \\ \hline \textbf{Observaciones} & 87 & 96 &108&89&122&98 \\ \hline \end{array}\]
¿El dado está balanceado (es decir, los datos tienen distribución uniforme con proba 1/6)? Use α=0.10

La prueba a utilizar Prueba Ji-cuadrada

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{los datos tienen distribución uniforme con proba 1/6}\] \[vs\] \[\textbf{H}_α: \ \mbox{los datos no tienen distribución uniforme con proba 1/6}\]

Nos ayudaremos de la siguiente tablita:

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[Q=\sum_{j=0}^{k}\frac{(f_{j}-e_{j})^2}{e_{j}}=\sum_{j=0}^{5}\frac{(f_{j}-e_{j})^2}{e_{j}}=\]

residuos=round((observados-esperados)^2/esperados,5)
ji_cal=sum(residuos)
print(c("Estadístico T =", ji_cal),quote = FALSE)
## [1] Estadístico T = 8.58

Sabemos que:

  1. \(α = 10\% = 0.10\) el nivel de significancia

  2. Confianza \(=1-α =90\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \({(k-1)}(1-\alpha)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(k-1)}(1-\alpha)\]

#Tenemos 6 categorías menos una que corresponden a nuestros grados de libertad.
alpha = 0.10

ji_teo=qchisq(1-alpha,df=5)
print(c("Cuantil Ji-cuadrado con 5 grados de libertad  = ", ji_teo),quote=FALSE)
## [1] Cuantil Ji-cuadrado con 5 grados de libertad  = 
## [2] 9.23635689978112

Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si \(p-value<0.10\), o con \[T > t\]

if(ji_cal>ji_teo){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T = ", ji_cal),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ",ji_teo),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar $H_0$",quote = FALSE)
 print(c("Estadístico T1 = ", ji_cal),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ",ji_teo),quote = FALSE)
 }
## [1] No hay información suficiente para rechazar $H_0$
## [1] Estadístico T1 =  8.58             
## [1] Cuantil Ji-cuadrado con 1 grado de libertad  = 
## [2] 9.23635689978112

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los datos no tienen distribución uniforme con proba 1/6

2._Cierto banco otorga crédito a las personas con una tasa preferencial, de tal manera que los acreditados pueden pagar en cualquier momento desde que piden el préstamo hasta 8 semanas posteriores para que les sea respetada la tasa preferencial. Se seleccionaron aleatoriamente a 1,000 personas y observó su comportamiento de pago, generando de esta manera la siguiente tabla de frecuencia:

\[\begin{array}{|c|c| } \hline \mbox{Semana}& \mbox{Créditos Pagados}\\ \hline \mbox{Menos de 1 semana} &64\\ 1 \leq x < 2& 191\\ 2 \leq x < 3 &283\\ 3 \leq x < 4 &241\\ 4 \leq x < 5 &140\\ 5 \leq x < 6 &51\\ 6 \leq x < 7 &25\\ 7 \leq x < 8 &4\\ \mbox{8 semanas o más} & 1\\ \hline \end{array}\]

Probar que el pago de estos créditos, sigue una distribución binomial con parámetros n=10 y p=0.25.

La prueba a utilizar Prueba Ji-cuadrada

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{Los datos tienen una distribución binomial con parámetros n=10 y proba 0.25}\] \[vs\] \[\textbf{H}_α: \ \mbox{los datos no tienen una distribución binomial con parámetros n=10 y proba 0.25}\]

Nos ayudaremos de la siguiente tablita:

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[Q=\sum_{j=0}^{k}\frac{(f_{j}-e_{j})^2}{e_{j}}=\sum_{j=0}^{5}\frac{(f_{j}-e_{j})^2}{e_{j}}=\]

residuos=round((observados-esperados)^2/esperados,7)
#ji_cal_2=sum(x2)
ji_cal=sum(residuos)
print(c("Estadístico T =", ji_cal),quote = FALSE)
## [1] Estadístico T = 8.0299333
#ji_cal_2

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \({(k-1)}(1-\alpha)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(k-1)}(1-\alpha)\]

#Tenemos 6 categorías menos una que corresponden a nuestros grados de libertad.
alpha = 0.05

ji_teo=qchisq(1-alpha,df=6)
print(c("Cuantil Ji-cuadrado con 6 grados de libertad  = ", ji_teo),quote=FALSE)
## [1] Cuantil Ji-cuadrado con 6 grados de libertad  = 
## [2] 12.591587243744

Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si \(p-value<0.10\), o con \[T > t\]

if(ji_cal>ji_teo){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T = ", ji_cal),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ",ji_teo),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar $H_0$",quote = FALSE)
 print(c("Estadístico T1 = ", ji_cal),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ",ji_teo),quote = FALSE)
 }
## [1] No hay información suficiente para rechazar $H_0$
## [1] Estadístico T1 =  8.0299333        
## [1] Cuantil Ji-cuadrado con 1 grado de libertad  = 
## [2] 12.591587243744

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los datos no tienen una distribución binomial con parámetros n=10 y proba 0.25

Prueba Kolmogorov

1._ Dada la siguiente muestra: 0.6379, 1.5299, 0.35005, 2.0505, 2.1906, 0.3459, 2.3214, 0.3128, 0.6548, 2.4373, 1.803, 2.3674, 1.2716, 0.2566, 0.2513.

Se desea hacer el siguiente contraste:

\[\textbf{H}_0: \ \mbox{Los datos} \ \sim LogN(0,1) \ \ vs \ \ \textbf{H}_a: \ mbox{Los datos} \ \nsim \ LogN(0,1)\] Realice la prueba de Kolmogorov al 5% de significancia.

La prueba a utilizar es Prueba de Bondad de Ajuste Kolmogorov

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{Los datos} \ \sim LogN(0,1)\]

\[vs\] \[\textbf{H}_a: \ mbox{Los datos} \ \nsim \ LogN(0,1)\] La siguiente tabla representa los cálculos para encontrar nuestro Estadístico de Prueba \(T\):

X = c(0.6379, 1.5299, 0.35005, 2.0505, 2.1906, 0.3459, 2.3214, 0.3128,0.6548, 2.4373, 1.803, 2.3674, 1.2716, 0.2566, 0.2513)
n =length(X)
i = c(1:15) #Representa el numero de nuestra muestra
X_i = sort(X) #ordena nuestros datos
F_x= plnorm(i, meanlog = 0, sdlog = 1)
Sn =c(i/15)
F_x_Sn = c(abs(F_x-Sn))

Tabla = cbind(i,X_i,F_x,Sn,F_x_Sn)
data.frame(Tabla)

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\underset{x}{sup}|F^*(x)-S(x)|\]

EstdPrueba = max(Tabla [,5])
print(c("Estadístico T =", EstdPrueba),quote = FALSE)
## [1] Estadístico T =   0.664031392358576

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

3.El cuantil W que acumula 1−α de probabilidad, usando α=0.05 es W = 0.338, encontrado en las Tablas Kolmogorov correspondientes.

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil= 0.338
print(c("Cuantil W = ", cuantil),quote = FALSE)
## [1] Cuantil W =  0.338
## 
##  Two-sample Kolmogorov-Smirnov test
## 
## data:  F_x and Sn
## D = 0.66667, p-value = 0.001837
## alternative hypothesis: two-sided

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(EstdPrueba>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", EstdPrueba),quote = FALSE)
  print(c("Cuantil W = ", cuantil),quote = FALSE)
  print(c("p-value  = ", p_value$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , EstdPrueba),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
 print(c("p-value  = ", p_value$p.value),quote = FALSE)
}
## [1] Se rechaza H_0
## [1] Estadístico T1 =  0.664031392358576
## [1] Cuantil W =  0.338       
## [1] p-value  =         0.0018373939965004

Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que $    LogN(0,1)$

2._Se desea probar la hipótesis de que los tiempos entre las llegadas de los pacientes a un hospital con una emergencia se distribuyen exponencial con media \(\bar{x}\). Para ello se registró el tiempo transcurrido entre las llegadas sucesivas de pacientes en una mañana. El tiempo en minutos es el siguiente:

\[\begin{array}{c c c} 14.3, & 38.0, & 3.8, \\ 10.8, & 6.1,& 10.1, \\ 3.6, & 6.2, & 12.8, \\ 22.1, & 4.2, & 4.6, \\ 1.5, & 3.3, & 1.2, \\ 20.0, & 7.1,& 8.1.\\ \end{array}\]

Pruebe la hipótesis con un nivel se significancia del 5%.

La prueba a utilizar es Prueba de Bondad de Ajuste Kolmogorov

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{Los datos tienen una distribución exponencial con media } \ \bar{x}\]

\[vs\] \[\textbf{H}_0: \ \mbox{Los datos no tienen una distribución exponencial con media } \ \bar{x}\] La siguiente tabla representa los cálculos para encontrar nuestro Estadístico de Prueba \(T\):

X = c(14.3,38.0,3.8,10.8,6.1,10.1,3.6,6.2,12.8,22.1,4.2,4.6,1.5, 3.3,1.2,20.0,7.1,8.1)
n =length(X)
i = c(1:18) #Representa el numero de nuestra muestra
X_i = sort(X) #ordena nuestros datos
media =mean(X_i)
# Función de densidad exponencial con media 9.877778
F_x= pexp(1:18, rate = 1/media) # E(X) = 1/lambda 
Sn =c(i/18)
F_x_Sn = c(abs(F_x-Sn))

Tabla = cbind(i,X_i,F_x,Sn,F_x_Sn)
data.frame(Tabla)

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\underset{x}{sup}|F^*(x)-S(x)|\]

EstdPrueba = max(Tabla [,5])
print(c("Estadístico T =", EstdPrueba),quote = FALSE)
## [1] Estadístico T =   0.161658011384629

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

3.El cuantil W que acumula 1−α de probabilidad, usando α=0.05 es W = 0.309, encontrado en las Tablas Kolmogorov correspondientes.

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil= 0.309
print(c("Cuantil W = ", cuantil),quote = FALSE)
## [1] Cuantil W =  0.309
## 
##  Two-sample Kolmogorov-Smirnov test
## 
## data:  F_x and Sn
## D = 0.16667, p-value = 0.9715
## alternative hypothesis: two-sided

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(EstdPrueba>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", EstdPrueba),quote = FALSE)
  print(c("Cuantil W = ", cuantil),quote = FALSE)
  print(c("p-value  = ", p_value$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , EstdPrueba),quote = FALSE)
 print(c("Cuantil W = ", cuantil),quote = FALSE)
 print(c("p-value  = ", p_value$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 =  0.161658011384629
## [1] Cuantil W =  0.309       
## [1] p-value  =        0.971539782332501

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que \(\mbox{los datos no tienen una distribución exponencial con media } \ \bar{x}\)

Prueba Lilliefors para Normalidad

1.Se desea probar la hipótesis de que las tasas de interés de un determinado producto financiero tiene el comportamiento de una variable aleatoria como función de distribución normal.

9.1, 5, 7.3, 7.4, 5.5, 8.6, 7, 4.3, 4.7, 8, 4, 8.5, 6.4,6.1, 5.8, 9.5, 5.2, 6.7, 8.3, 9.2.

La prueba a utilizar Prueba de Bondad de Ajuste Lilliefors para Normalidad

Planteamineto de Hipótesis:

\[\textbf{H}_0: \ \mbox{Los datos tienen una distribución normal}\] \[vs\]

\[\textbf{H}_a: \ \mbox{Los datos no tienen una distribución normal}\] 1._Se procede a ordenar nuestras observaciones de menor a mayor.

X = c(9.1, 5, 7.3, 7.4, 5.5, 8.6, 7, 4.3, 4.7, 8, 4, 8.5, 6.4,6.1, 5.8, 9.5, 5.2, 6.7, 8.3, 9.2)
n =length(X)
i = c(1:20) #Representa el numero de nuestra muestra
X_i = sort(X) #ordena nuestros datos

2._Se obtienen los estimadores puntuales de distribución normal con los datos de la muestra

media =mean(X_i)
s = sd(X_i)

3._Después calcularemos los valores de muestra “normalizados” \(Z_i\)definidos por: \[Z_{i}=\frac{X_{i}-\overline{X}}{s} \ \ \ \ i=1,2,\ldots,20\]

Z_i=c((X_i-media)/s) #Calculado xi-xbarra/s

4._Se calcula la función empírica: \[S_{n}= \frac{i}{n}=\frac{1}{20},\frac{2}{20}, \ldots, 1.\]

Sn_Zi=c(i/20)

5._Se calcula la función empírica menos un valor, es decir: \[S_{n}= \frac{i-1}{n}=\frac{0}{20},\frac{1}{20}, \ldots, \frac{19}{20}.\]

Sn_Zi_1=c(0:19/20)

6._Se calcula \(D^+\) que es el resultado de la resta de la distribución conocida menos la distribución empírica, es decir: \[D^+= max\ \{ \ S_{n}(Z_{i})-F^*(Z_{i}) \ \}\]

F_Zi= pnorm(Z_i) 
D_mas=c(Sn_Zi-F_Zi)   #Sn(Zi)-F_i

7._Se calcula \(D^−\) que es el resultado de la resta de la distribución empírica menos uno menos la distribución conocida, es decir: \[D^-= max\ \{\ S_{n}(Z_{i-1})-F^*(Z_{i}) \ \}\]

D_menos=c(Sn_Zi_1-F_Zi)    #Sn(Zi-1)-F_i

Finalmente realizada la tabla, se calcula el máximo de las columnas \(D^+\) y \(D^−\) de ésta manera, se tiene la siguiente tabla:

Tabla = cbind(i,X_i,F_Zi,Sn_Zi,Sn_Zi_1,D_mas,D_menos)
data.frame(Tabla)

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T_{1}=\underset{x}{sup}\ | \ S_{n}(z)-F^*(z) \ |=max \ \{\ D^+,D^- \ \}\]

EstdPrueba=max(D_mas,D_menos)
print(c("Estadístico T =", EstdPrueba),quote = FALSE)
## [1] Estadístico T =    0.0798427470600117

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

3.El cuantil W que acumula 1−α de probabilidad, usando α=0.05 es W = 0.192, encontrado en las Tablas Kolmogorov correspondientes.

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil= 0.192
print(c("Cuantil W = ", cuantil),quote = FALSE)
## [1] Cuantil W =  0.192

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(EstdPrueba>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", EstdPrueba),quote = FALSE)
  print(c("Cuantil W = ", cuantil),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , EstdPrueba),quote = FALSE)
 print(c("Cuantil W = ", cuantil),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 =   0.0798427470600117
## [1] Cuantil W =  0.192

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los datos no tienen una distribución normal

Pueba de Lilliefors Exponencial

1.El gerente de una tienda quiere probar la hipótesis de que los clientes llegan aleatoriamente a su tienda, para ello registro el tiempo transcurrido entre las llegadas sucesivas de clientes en una mañana. El tiempo en minutos es el siguiente:.

\[3.6, 6.2, 12.9, 14.2, 38.0, 3.8, 10.8, 6.1, 10.1, 22.1, 4.2, 4.6, 1.4, 3.3, 8.2.\]

Pruebe la hipótesis nula de que el tiempo entre las llegadas de los clientes se distribuyen con función de distribución exponencial.

La prueba a utilizar Prueba de Bondad de Ajuste Lilliefors Exponencial

Planteamineto de Hipótesis:

\[\textbf{H}_0: \ \mbox{El tiempo entre las llegadas de los clientes se distribuyen con función de distribución exponencial}\] \[vs\]

\[\textbf{H}_a: \ \mbox{El tiempo entre las llegadas de los clientes no se distribuyen con función de distribución exponencial}\] 1._Se procede a ordenar nuestras observaciones de menor a mayor.

X = c(3.6, 6.2, 12.9, 14.2, 38.0, 3.8,10.8, 6.1, 10.1, 22.1, 4.2, 4.6,1.4, 3.3, 8.2)
n =length(X)
i = c(1:15) #Representa el numero de nuestra muestra
X_i = sort(X) #ordena nuestros datos

2._Calculamos la media

media =mean(X_i)

3._Después calcularemos los valores de muestra \(Z_i\) definidos por: \[Z_{i}=\frac{X_{i}}{\overline{X}} \ \ \ \ i=1,2,\ldots,15\]

Z_i=c(X_i/media) #Calculado xi-xbarra/s

4._Se calcula la función empírica: \[S_{n}= \frac{i}{n}=\frac{1}{15},\frac{2}{15}, \ldots, 1.\]

Sn_Zi=c(i/15)

5._Se calcula la función empírica menos un valor, es decir: \[S_{n}= \frac{i-1}{n}=\frac{0}{15},\frac{1}{15}, \ldots, \frac{14}{15}.\]

Sn_Zi_1=c(0:14/15)

6._Se calcula \(D^+\) que es el resultado de la resta de la distribución conocida menos la distribución empírica, es decir: \[D^+= max\ \{ \ S_{n}(Z_{i})-F^*(Z_{i}) \ \}\]

F_Zi= pexp(Z_i,1) 
D_mas=c(Sn_Zi-F_Zi)   #Sn(Zi)-F*(Zi)

7._Se calcula \(D^−\) que es el resultado de la resta de la distribución empírica menos uno menos la distribución conocida, es decir: \[D^-= max\ \{\ S_{n}(Z_{i-1})-F^*(Z_{i}) \ \}\]

D_menos=c(Sn_Zi_1-F_Zi)    #Sn(Zi-1)-F*(Zi)

Finalmente realizada la tabla, se calcula el máximo de las columnas \(D^+\) y \(D^−\) de ésta manera, se tiene la siguiente tabla:

Tabla = cbind(i,X_i,F_Zi,Sn_Zi,Sn_Zi_1,D_mas,D_menos)
data.frame(Tabla)

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T_{1}=\underset{x}{sup}\ | \ S_{n}(z)-F^*(z) \ |=max \ \{\ D^+,D^- \ \}\]

EstdPrueba=max(D_mas,D_menos)
print(c("Estadístico T =", EstdPrueba),quote = FALSE)
## [1] Estadístico T =   0.107235465651723

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

3.El cuantil W que acumula 1−α de probabilidad, usando α=0.05 es W = 0.338, encontrado en las Tablas Kolmogorov correspondientes.

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil= 0.338
print(c("Cuantil W = ", cuantil),quote = FALSE)
## [1] Cuantil W =  0.338

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(EstdPrueba>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", EstdPrueba),quote = FALSE)
  print(c("Cuantil W = ", cuantil),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , EstdPrueba),quote = FALSE)
 print(c("Cuantil W = ", cuantil),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 =  0.107235465651723
## [1] Cuantil W =  0.338

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que el tiempo entre las llegadas de los clientes no se distribuyen con función de distribución exponencial

Otras estadísticas

1.Cinco niños de cuarto grado de primaria fueron seleccionados al azar de todos los niños de ese grado en la escuela “15 de septiembre,” para participar en una carrera. Sus tiempos en segundos fueron: 6.3, 4.2, 4.7, 6.0, y 5.7. Probar con la hipótesis de que los tiempos provienen de una distribución uniforme en el intervalo de 4 a 8 segundos.

La prueba a utilizar Anderson-Darling

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{Los datos tienen distribución uniforme }\] \[vs\] \[\textbf{H}_α: \ \mbox{Los datos no tienen distribución uniforme}\]

Contamos con la siguiente información:

ocupando la prueba de Anderson–Darling en R

library(goftest)
Anderson= ad.test(observados,null = "punif",min=4,max=8)
Anderson
## 
##  Anderson-Darling test of goodness-of-fit
##  Null hypothesis: uniform distribution
##  with parameters min = 4, max = 8
##  Parameters assumed to be fixed
## 
## data:  observados
## An = 0.96915, p-value = 0.3688

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si \(p-value<0.05\)

if(Anderson$p.value<0.05){
  print("Se rechaza H_0",quote = FALSE)
  print(c("ya que el p-value = ", Anderson$p.value,"< 0.05"),quote = FALSE)

}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("yq que el p-value = ", Anderson$p.value,"> 0.05"),quote = FALSE)
 }
## [1] No hay información suficiente para rechazar H_0
## [1] yq que el p-value =  0.36880802423698     > 0.05

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los datos no tienen distribución uniforme en dichos intervalos.

2.La siguiente muestra aleatoria hace referencia a los rendimientos positivos de cierta acción a lo largo del tiempo.

0.2513, 0.2566, 0.3459, 0.6379, 2.0505, 1.803, 2.1906,1.5299, 0.35005, 0.3128, 1.2726, 2.3674, 2.3214, 2.4373, 0.6548.

¿Usted piensa que la anterior muestra sigue una distribución normal?

Realizar la prueba correspondiente para verificar que su suposición es cierta con un nivel de confianza del 90%.

La prueba a utilizar Cramer-von

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{Los datos tienen distribución normal}\] \[vs\] \[\textbf{H}_α: \ \mbox{Los datos no tienen distribución normal}\]

Primero calculo la media y la desviación estandar de mis datos:

print(c("media = ", media),quote = FALSE)
## [1] media =          1.25213666666667
print(c("desviación estandar = ", s),quote = FALSE)
## [1] desviación estandar =  0.883786951635377

Realizamos la prueba de Cramer-von:

library(goftest)
Cramer = cvm.test(observados,null = "pnorm",mean=media,sd=s)
Cramer
## 
##  Cramer-von Mises test of goodness-of-fit
##  Null hypothesis: Normal distribution
##  with parameters mean = 1.25213666666667, sd = 0.883786951635377
##  Parameters assumed to be fixed
## 
## data:  observados
## omega2 = 0.13394, p-value = 0.4466

Sabemos que:

  1. \(α = 10\% = 0.10\) el nivel de significancia

  2. Confianza \(=1-α =90\%\)

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.10\)

if(Cramer$p.value < 0.10){
  print("Se rechaza H_0",quote = FALSE)
  print(c("ya que el p-value = ", Cramer$p.value,"< 0.10"),quote = FALSE)

}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("yq que el p-value = ", Cramer$p.value,"> 0.10"),quote = FALSE)
 }
## [1] No hay información suficiente para rechazar H_0
## [1] yq que el p-value =  0.446632518850089    > 0.10

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los datos no siguen una distribucción normal.

3.Se obtuvieron sesenta y dos observaciones de un experimento, y se plantea la pregunta de si dichas observaciones provienen de una distribución normal con media 12 y desviación estándar 3. Ninguna observación se encontró por debajo del cuartil inferior de la distribución, 35 estuvieron por arriba de cuartil superior, 22 tomaron valores menores a la mediana, y 5 estuvieron entre la mediana y el cuartil superior. ¿Es posible concluir que las observaciones provienen de la distribución mencionada?

La prueba a utilizar Prueba Ji-cuadrada

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{Los datos tienen distribución normal con media 12 y desviación estándar 3}\] \[vs\] \[\textbf{H}_α: \ \mbox{Los datos no tienen distribución normal con media 12 y desviación estándar 3}\]

Nos ayudaremos de la siguiente tablita:

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[Q=\sum_{j=0}^{k}\frac{(f_{j}-e_{j})^2}{e_{j}}=\sum_{j=0}^{5}\frac{(f_{j}-e_{j})^2}{e_{j}}=\]

residuos=round((observados-esperados)^2/esperados,3)
ji_cal=sum(residuos)
print(c("Estadístico T =", ji_cal),quote = FALSE)
## [1] Estadístico T = 34.258

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \({(k-1)}(1-\alpha)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(k-1)}(1-\alpha)\]

#Tenemos 3 categorías menos una que corresponden a nuestros grados de libertad.
alpha = 0.05

ji_teo=qchisq(1-alpha,df=2)
print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ", ji_teo),quote=FALSE)
## [1] Cuantil Ji-cuadrado con 2 grados de libertad  = 
## [2] 5.99146454710798

Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(ji_cal>ji_teo){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T = ", ji_cal),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ",ji_teo),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar $H_0$",quote = FALSE)
 print(c("Estadístico T1 = ", ji_cal),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ",ji_teo),quote = FALSE)
 }
## [1] Se rechaza H_0
## [1] Estadístico T =  34.258          
## [1] Cuantil Ji-cuadrado con 2 grados de libertad  = 
## [2] 5.99146454710798

Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que podemos decir que los datos no tienen distribución normal con media 12 y desviación estándar 3.