Prueba U-Mann y Witney

1._Siete estudiantes aprendieron álgebra utilizando el método actual y seis estudiantes aprendieron álgebra según un nuevo método.
\[\begin{array}{|c| c c c c c c c c|} \hline \textbf{Método} &\textbf{Puntajes} &&&&& & & \\ \hline \mbox{Actual} & 68 & 72 & 79 & 69 & 84 & 80 & 78 &\\ \hline \mbox{Nuevo} & 64 & 60 & 68 & 73 & 72 & 70& & \\ \hline \end{array}\]
¿Con una α del 5% podría decir que la efectividad (medida con los punatjes) de ambos métodos es similar?

La prueba a utilizar Prueba U-Mann y Witney Caso A- dos colas

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{El aprendizaje sobre álgebra de los estudiantes que utiliza el método actual son iguales a los que utilizán el nuevo método}\] \[vs\] \[\textbf{H}_α: \ \mbox{El aprendizaje sobre álgebra de los estudiantes que utiliza el método actual son distintos a los que utilizán el nuevo método}\]

De manera alternativa:

\[\textbf{H}_0:\mathbf{E}[X] = \mathbf{E}[Y] ~~~~~~~vs~~~~~~~~\textbf{H}_a: \mathbf{E}[X] \neq \mathbf{E}[Y]\]

Ordenamos de menor a mayor

Actual <- c(68L, 72L, 79L, 69L, 84L, 80L,78L)
Nuevo <- c(64L, 60L, 68L, 73L, 72L, 70L)

names(Actual) <- rep("Actual", length(Actual))
names(Nuevo) <- rep("Nuevo", length(Nuevo))
orden <- sort(c(Actual, Nuevo))
orden
##  Nuevo  Nuevo Actual  Nuevo Actual  Nuevo Actual  Nuevo  Nuevo Actual Actual 
##     60     64     68     68     69     70     72     72     73     78     79 
## Actual Actual 
##     80     84

Supuestos:

  1. Muestra aleatoria de tamaño
n <- length(Actual)
m <- length(Nuevo)
N <- length(orden)
n
## [1] 7
m
## [1] 6
N
## [1] 13
  1. Tomaremos \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

Estadístico de prueba Como tenemos empates utilizaremos el estadistico T:

\(T = 62\)

significance = 0.05
order <- rank(orden)
 # order <- 1:length(orden)
est1 <- sum(order[which(names(orden)=="Actual")])
est1
## [1] 62

\(T_1 = 1.862266\)

    est <- (est1- (n*((N+1)/2)))/
      (sqrt((n*m/(N*(N-1)))*(sum(order^2))-
              ((n*m*(N+1)^2)/(4*(N-1)))))
est
## [1] 1.862266

\[T_1= \frac{T-n\frac{N+1}{2}}{\sqrt{\frac{nm}{N(N-1)}\sum_{i=1}^{N}R_i^2-\frac{nm(N+1)^2}{4(N-1)}}}=1.862266\]

p_val <- 2*min(pnorm(est), pnorm(est, lower.tail = F))
print(c("P-value: ", p_val))
## [1] "P-value: "          "0.0625656026808089"

Con ayuda del TestApp sabemos que \(t_1=-1.95996398\), \(t_2=1.95996398\)y que \(p-value = 0.062565\) como se muestra en el la prueba mcnemar.test que se encuentra abajo

Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si, o con \(p-value<0.05\) \[T < t_{1} \ \ \ o \ \ \ T > t_{2}\] Como \(p-value = 0.062565>0.05\) y \(T_1 = 1.862266>t_1=-1.95996398\),\(T_1 = 1.862266<t_1=1.95996398\) no se rechaza \(H_0\)

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que la efectividad (medida con los punatjes) de ambos métodos podria ser un poco similar

2._En un laboratorio con entorno controlado, 10 hombres y 10 mujeres fueron evaluados para determinar la temperatura ambiente que encontraron más cómoda. los resultados fueron los siguientes:
\[\begin{array}{|c| c c c c c c c c|} \hline \textbf{Método} &\textbf{Puntajes} &&&&& & & \\ \hline \mbox{Actual} & 68 & 72 & 79 & 69 & 84 & 80 & 78 &\\ \hline \mbox{Nuevo} & 64 & 60 & 68 & 73 & 72 & 70& & \\ \hline \end{array}\]
Suponiendo que estas temperaturas son una muestra aleatoria de la población, ¿la temperatura promedio es la misma para hombres y mujeres?.

La prueba a utilizar Prueba U-Mann y Witney Caso A- dos colas

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{La temperatura promedio es igual para hombres y mujeres}\] \[vs\] \[\textbf{H}_α: \ \mbox{La temperatura promedio es diferente para hombres y mujeres}\]

De manera alternativa:

\[\textbf{H}_0:\mathbf{E}[X] = \mathbf{E}[Y] ~~~~~~~vs~~~~~~~~\textbf{H}_a: \mathbf{E}[X] \neq \mathbf{E}[Y]\]

Ordenamos de menor a mayor

Hombres <- c(74L,72L,77L,76L,76L,73L,75L,73L,74L,75L)
Mujeres <- c(75L,77L,78L,79L,77L,73L,78L,79L,78L,80L)

names(Hombres) <- rep("Actual", length(Hombres))
names(Mujeres) <- rep("Nuevo", length(Mujeres))
orden <- sort(c(Hombres, Mujeres))
orden
## Actual Actual Actual  Nuevo Actual Actual Actual Actual  Nuevo Actual Actual 
##     72     73     73     73     74     74     75     75     75     76     76 
## Actual  Nuevo  Nuevo  Nuevo  Nuevo  Nuevo  Nuevo  Nuevo  Nuevo 
##     77     77     77     78     78     78     79     79     80

Supuestos:

  1. Muestra aleatoria de tamaño
n <- length(Hombres)
m <- length(Mujeres)
N <- length(orden)
n
## [1] 10
m
## [1] 10
N
## [1] 20
  1. Tomaremos \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

Estadístico de prueba Como tenemos empates utilizaremos el estadistico T:

\[T_1= \frac{T-n\frac{N+1}{2}}{\sqrt{\frac{nm}{N(N-1)}\sum_{i=1}^{N}R_i^2-\frac{nm(N+1)^2}{4(N-1)}}}=-2.817132\] \(T = 68\)

significance = 0.05
order <- rank(orden)
 # order <- 1:length(orden)
est1 <- sum(order[which(names(orden)=="Actual")])
est1
## [1] 68

\(T_1 = -2.817132\)

est <- (est1- (n*((N+1)/2)))/
      (sqrt((n*m/(N*(N-1)))*(sum(order^2))-
              ((n*m*(N+1)^2)/(4*(N-1)))))
est
## [1] -2.817132
 p_val <- 2*min(pnorm(est), pnorm(est, lower.tail = F))
 print(c("P-value: ", p_val))
## [1] "P-value: "           "0.00484546288472287"

Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si, o con \(p-value<0.05\) \[T < t_{1} \ \ \ o \ \ \ T > t_{2}\] Como \(p-value=0.0048454<0.05\) y \(T_1 = -2.817132<t_1=-1.95996398\), \(T_1 = -2.817132<t_2=1.95996398\) se rechaza \(H_0\)

Conclusión Hay información sufiente para rechazar \(H_0\), por lo que la temperatura promedio es diferente para hombres y mujeres

Prueba de Kruskal-Wallis

1._Una muestra aleatoria de 5 diferentes marcas de focos son probados para medir la duración del foco, y los resultados fueron los siguientes:
\[\begin{array}{||c| |c| |c| |c||c||} \hline A & B&C&D&E \\ \hline 73&84&82&80&85\\ \hline 64&80&79&85&82\\ \hline 67&81&71&82&80\\ \hline 62&77&75&86&\\ \hline 70&&80&&\\ \hline \hline \end{array}\]
Los datos observados indican una diferencia significativa entre las marcas? De haber diferencia, que marcas parecen ser las diferentes? Use α=10%

La prueba a utilizar Prueba de Rangos Kruskal-Wallis

Hipótesis al problema planteado \[\textbf{H}_0: \ \mbox{Las 5 muestras de diferentes marcas de foco son idénticas a cuanto duración}\] \[vs\] \[\textbf{H}_α: \ \mbox{Al menos una muestra indican una diferencia significativa entre las marcas respecto a su duración}\]

Muestra1=c(73,64,67,62,70)    

Muestra2=c(84,80,81,77)

Muestra3=c(82,79,71,75,80)        

Muestra4=c(80,85,82,86)

Muestra5=c(85,82,80)
calif =list(M1=Muestra1,M2=Muestra2,M3=Muestra3,M4=Muestra4,M5=Muestra5)
calif
## $M1
## [1] 73 64 67 62 70
## 
## $M2
## [1] 84 80 81 77
## 
## $M3
## [1] 82 79 71 75 80
## 
## $M4
## [1] 80 85 82 86
## 
## $M5
## [1] 85 82 80

Supuestos:

  1. Muestra de tamaño
n1=length(Muestra1)
n2=length(Muestra2)
n3=length(Muestra3)
n4=length(Muestra4)
n5=length(Muestra5)
N=n1+n2+n3+n4+n5
N
## [1] 21
  1. Tomaremos \(α =10\% = 0.10\) el nivel de significancia

  2. Confianza \(=1-α =90\%\)

  3. Rangos

rangos=rank(c(Muestra1,Muestra2,Muestra3,Muestra4,Muestra5))
rangos2 = rangos^2
R1=sum(rangos[1:5])
R1
## [1] 16
R2=sum(rangos[6:9])
R2
## [1] 51.5
R3=sum(rangos[10:14])
R3
## [1] 48.5
R4=sum(rangos[15:18])
R4
## [1] 68
R5=sum(rangos[19:21])
R5
## [1] 47

Utilizaremos el estadístico Como hubo empates utilizaremos:

\[S^2 = \frac{1}{N-1}\left(\sum_{todos los rangos}R(X_{ij})^2-N\frac{(N+1)^2}{4}\right)\]

S2=(1/(N-1))*(sum(rangos2)-(N*((N+1)^2/4)))
S2
## [1] 38.125

\[T= \frac{1}{S^2}\left(\sum_{i=1}^{k}\frac{R^2_{i}}{n_{i}}-\frac{N(N+1)^2}{4}\right)\]

T=(1/S2)*((R1^2/n1)+(R2^2/n2)+(R3^2/n3)+(R4^2/n4)+(R5^2/n5)-(N*(N+1)^2/4))
T
## [1] 14.06022

Comparamos con el cuantil

qchisq(0.90,4)
## [1] 7.77944

Regla de decisión Rechazamos \(H_0\) a un nivel \(\alpha\) si \(T > \chi^2_{(k-1)}(1-\alpha)\) como \(T=14.06022>7.77944=t\) se rechaza \(H_0\)

Conclusión Tenemos información suficiente para rechazar \(H_0\), por lo que los datos observados indican una diferencia significativa entre las marcas

2._Tres maestros desean comparar las claificaciones que pusieron en el semestre pasado para ver si alguno tiende a dar calificaciones diferentes que los otros.
\[\begin{array}{||c| |c| |c| |c||} \hline \mbox{Calificación} & A & B&C \\ \hline 10&4&10&6\\ \hline 9&14&6&7\\ \hline 8&17&9&8\\ \hline 7&6&7&6\\ \hline 6&2&6&1\\ \hline \hline \end{array}\]
Con los datos observados se puede corroborar la sospecha de que alguno de los maestros da calificaciones diferentes a los otros? Use α=5%

La prueba a utilizar Prueba de Rangos Kruskal-Wallis

Hipótesis al problema planteado \[\textbf{H}_0: \ \mbox{Los 3 maestros tienden a dar calificaciones parecidas}\] \[vs\] \[\textbf{H}_α: \ \mbox{Al menos un maestro tiende a dar calificaciones distintas}\]

Maestro_A =c(rep(10,4),rep(9,14),rep(8,17),rep(7,6),rep(6,2))    

Maestro_B =c(rep(10,10),rep(9,6),rep(8,9),rep(7,7),rep(6,6))

Maestro_C =c(rep(10,6),rep(9,7),rep(8,8),rep(7,6),rep(6,1))        
calif =list(MA=Maestro_A,MB=Maestro_B,MC=Maestro_C)
calif
## $MA
##  [1] 10 10 10 10  9  9  9  9  9  9  9  9  9  9  9  9  9  9  8  8  8  8  8  8  8
## [26]  8  8  8  8  8  8  8  8  8  8  7  7  7  7  7  7  6  6
## 
## $MB
##  [1] 10 10 10 10 10 10 10 10 10 10  9  9  9  9  9  9  8  8  8  8  8  8  8  8  8
## [26]  7  7  7  7  7  7  7  6  6  6  6  6  6
## 
## $MC
##  [1] 10 10 10 10 10 10  9  9  9  9  9  9  9  8  8  8  8  8  8  8  8  7  7  7  7
## [26]  7  7  6

Supuestos:

  1. Muestra de tamaño
n1=length(Maestro_A)
n2=length(Maestro_B)
n3=length(Maestro_C)

N=n1+n2+n3
N
## [1] 109
  1. Tomaremos \(α =5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. Rangos

rangos=rank(c(Maestro_A,Maestro_B,Maestro_C))
rangos2 = rangos^2
R1=sum(rangos[1:43])
R1
## [1] 2359.5
R2=sum(rangos[44:81])
R2
## [1] 2023.5
R3=sum(rangos[82:109])
R3
## [1] 1612

Utilizaremos el estadístico Como hubo empates utilizaremos:

\[S^2 = \frac{1}{N-1}\left(\sum_{todos los rangos}R(X_{ij})^2-N\frac{(N+1)^2}{4}\right)\]

S2=(1/(N-1))*(sum(rangos2)-(N*((N+1)^2/4)))
S2
## [1] 941.7083

\[T= \frac{1}{S^2}\left(\sum_{i=1}^{k}\frac{R^2_{i}}{n_{i}}-\frac{N(N+1)^2}{4}\right)\]

T=(1/S2)*((R1^2/n1)+(R2^2/n2)+(R3^2/n3)-(N*(N+1)^2/4))
T
## [1] 0.3209288

Comparamos con el cuantil

qchisq(0.95,2)
## [1] 5.991465

Regla de decisión Rechazamos \(H_0\) a un nivel \(\alpha\) si \(T > \chi^2_{(k-1)}(1-\alpha)\) como \(T=0.3209288<5.991465=t\) no se rechaza \(H_0\)

Conclusión No tenemos información suficiente para rechazar \(H_0\), por lo que no podemos rechazar que los 3 maestros tienden a dar calificaciones parecidas

3._El Hospital “Los Ángeles” realizó un estudio en 4 Dietas a un grupo de 20 individuos; cada Dieta se aplicó aleatoriamente a cada individio. Se registró la pérdida de peso en kg. Realiza la prueba correspondiente para poder concluir si, ¿Hay diferencia significativa entre la efectividad de las Dietas?
\[\begin{array}{c c c c} \textbf{Dieta 1} & \textbf{Dieta 2} & \textbf{Dieta 3} & \textbf{Dieta 4}\\ 6.1&5&7.6&6.2\\ 4.3&5.6&6.8&8\\ 4.5&7.3&3.9&7.4\\ 2.4&5.7&7.9&4.6\\ 9.1&2.1&5.9&7\\ \end{array}\]

La prueba a utilizar Prueba de Rangos Kruskal-Wallis

Hipótesis al problema planteado \[\textbf{H}_0: \ \mbox{Las 4 dietas son idénticas en cuanto efectividad a la pérdida de peso}\] \[vs\] \[\textbf{H}_α: \ \mbox{Al menos una dieta de las 4 indica una diferencia significativa en cuanto efectividad}\]

Dieta1=c(6.1,4.3,4.5,2.4,9.1)    

Dieta2=c(5,5.6,7.3,5.7,2.1)

Dieta3=c(7.6,6.8,3.9,7.9,5.9)        

Dieta4=c(6.2,8,7.4,4.6,7)
calif =list(D1=Dieta1,D2=Dieta2,D3=Dieta3,D4=Dieta4)
calif
## $D1
## [1] 6.1 4.3 4.5 2.4 9.1
## 
## $D2
## [1] 5.0 5.6 7.3 5.7 2.1
## 
## $D3
## [1] 7.6 6.8 3.9 7.9 5.9
## 
## $D4
## [1] 6.2 8.0 7.4 4.6 7.0

Supuestos:

  1. Muestra de tamaño
n1=length(Dieta1)
n2=length(Dieta2)
n3=length(Dieta3)
n4=length(Dieta4)

N=n1+n2+n3+n4
N
## [1] 20
  1. Tomaremos \(α =10\% = 0.10\) el nivel de significancia

  2. Confianza \(=1-α =90\%\)

  3. Rangos

rangos=rank(c(Dieta1,Dieta2,Dieta3,Dieta4))
rangos2 = rangos^2
rangos
##  [1] 11  4  5  2 20  7  8 15  9  1 17 13  3 18 10 12 19 16  6 14
R1=sum(rangos[1:5])
R1
## [1] 42
R2=sum(rangos[6:10])
R2
## [1] 40
R3=sum(rangos[11:15])
R3
## [1] 61
R4=sum(rangos[16:20])
R4
## [1] 67

Utilizaremos el estadístico Como No hay empates utilizaremos: \[S^2= \frac{N*(N+1)}{12}\]

S2 = (N*(N+1))/12
S2
## [1] 35

\[T= \frac{12}{N*(N+1)}*\sum_{i=1}^{k}\frac{R_{i}^2}{n_{i}} - 3*(N+1)\]

T=(1/S2)*((R1^2/n1)+(R2^2/n2)+(R3^2/n3)+(R4^2/n4))-3*(N+1)
T
## [1] 3.137143

Comparamos con el cuantil

qchisq(0.95,3)
## [1] 7.814728

Regla de decisión Rechazamos \(H_0\) a un nivel \(\alpha\) si \(T > \chi^2_{(k-1)}(1-\alpha)\) como \(T=3.137143<7.814728=t\) no se rechaza \(H_0\)

Conclusión No hay información suficiente para rechazar \(H_0\), por lo que no podemos rechazar que las 4 dietas son idénticas en cuanto efectividad.

Prueba de Igualdad de Varianzas

1._ Un banco de sangre mantuvo un registro de la frecuencia cardíaca de varios donadores de sangre.
\[\begin{array}{||c| |c||} \hline \mbox{Hombres}& \mbox{Mujeres} \\ \hline 58&66\\ \hline 76&74\\ \hline 82&69\\ \hline 74&76\\ \hline 79&72\\ \hline 65&73\\ \hline 74&75\\ \hline 86&67\\ \hline &68\\ \hline \hline \end{array}\]
¿Es la variación entre los hombres significativamente mayor que la variación entre las mujeres? nivel de significancia 5%

La prueba a utilizar Prueba de Igualdad de Varianzas caso C

Hipótesis al problema planteado

\[\textbf{H}_0: \mbox{La frecuencia cardíaca de los donadores hombres es idénticamente distribuida al de las mujeres}\]

\[vs\] \[\textbf{H}_a: \ Var(Hombres) > Var(Mujeres)\]

Supuestos:

  1. Muestra de tamaño
Hombres = c(58,76,82,74,79,65,74,86)
Mujeres = c(66,74,69,76,72,73,75,67,68)

n=length(Hombres)  #Tamaño de Hombres
m=length(Mujeres)  #Tamaño de Mujeres
N=n+m              #Tamaño Total
N
## [1] 17
  1. Tomaremos \(α =5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

Resolviendo el problema utilizando R

alpha=0.05  #Nivel de significancia 

Xbarra=mean(Hombres)
cat("Media muestral de los Hombres: ", Xbarra, "\n")
## Media muestral de los Hombres:  74.25
Ybarra=mean(Mujeres)
cat("Media muestral de las Mujeres: ", Ybarra, "\n")
## Media muestral de las Mujeres:  71.11111

Desviación Hombres

U = abs(Xbarra-Hombres)
U
## [1] 16.25  1.75  7.75  0.25  4.75  9.25  0.25 11.75

Desviación Mujeres

V = abs(Ybarra-Mujeres)
V
## [1] 5.1111111 2.8888889 2.1111111 4.8888889 0.8888889 1.8888889 3.8888889
## [8] 4.1111111 3.1111111
rangos=rank(c(U,V))
rangos2 = rangos^2
rangos
##  [1] 17.0  4.0 14.0  1.5 11.0 15.0  1.5 16.0 13.0  7.0  6.0 12.0  3.0  5.0  9.0
## [16] 10.0  8.0
R1=sum(rangos[1:8]) #Hombres
R1
## [1] 80
R2=sum(rangos[9:17]) #Mujeres
R2
## [1] 73

$= $ \[\overline{R^2}= \frac{1}{N}\left(\sum_{i=1}^{n}[R(U_{i})]^2+\sum_{j=1}^{m}[R(V_{j})]^2\right)=104.9706\]

Rbarra_2 = (1/N)*(sum(rangos^2))
Rbarra_2
## [1] 104.9706

\[\sum_{i=1}^{N}R_{i}^4= \sum_{i=1}^{n}[R(U_{i})]^4+\sum_{j=1}^{m}[R(V_{j})]^4=327362.1\]

Rbarra_4 = sum(rangos^4)
Rbarra_4
## [1] 327362.1

Utilizaremos el estadístico Como tenemos empates utilizamos: \[T_{1} = \frac{T-n\overline{R^2}}{\left[\frac{nm}{N(N-1)}\sum_{i=1}^{N}R_{i}^4-\frac{nm}{N-1}(\overline{R^2})^2\right]^\frac{1}{2}}\]

T = sum(rangos[1:8]^2)
T
## [1] 1107.5
T_1  =(T- (n*(Rbarra_2)))/
      (sqrt((n*m/(N*(N-1)))*(Rbarra_4)-
              ((n*m*(Rbarra_2)^2)/(N-1))))
T_1 
## [1] 1.390575
t1=qnorm(alpha/2,0,1)
t1
## [1] -1.959964
t2=qnorm(1-alpha/2,0,1)
t2
## [1] 1.959964

Regla de decisión Rechazamos \(H_0\)al nivel de significancia \(α=5\%\) si \(T>t_{1-\frac{\alpha}{2}} \ \ \ o \ \ \ T<t_{\frac{\alpha}{2}}\)

como \(T=1.993318>1.959964=t_{1-\frac{\alpha}{2}}\) se rechaza \(H_0\)

Conclusión Hay informacion suficiente para rechazar \(H_0\)

2._Se desea probar que las variaciones de las temperaturas altas en Des Moines son mayores que las variaciones de las temperaturas altas en Spokane, para ello se tomó una muestra de las temperaturas altas diarias durante el verano. Use nivel de significancia 10%
\[\begin{array}{||c| |c||} \hline \mbox{Des Moines}& \mbox{Spokane} \\ \hline 83&78\\ \hline 91&82\\ \hline 94&81\\ \hline 89&77\\ \hline 89&79\\ \hline 96&81\\ \hline 91&80\\ \hline 92&81\\ \hline 82&79\\ \hline 93&80\\ \hline 90&\\ \hline 93&\\ \hline \hline \end{array}\]

La prueba a utilizar Prueba de Igualdad de Varianzas caso C

Hipótesis al problema planteado

\[\textbf{H}_0: \mbox{Las temperaturas de Des Moines son idénticamente distribuidas a las de Spokane, excepto por medias diferentes}\]

\[vs\] \[\textbf{H}_a: \ Var(Des Moines) > Var(Spokane)\]

Supuestos:

  1. Muestra de tamaño
Des_Moines= c(83,91,94,89,89,96,91,92,82,93,90,93)
Spokane = c(78,82,81,77,79,81,80,81,80,79)

n=length(Des_Moines)  #Tamaño de Hombres
m=length(Spokane)  #Tamaño de Mujeres

N=n+m              #Tamaño Total
N
## [1] 22
  1. Tomaremos \(α =5\% = 0.10\) el nivel de significancia

  2. Confianza \(=1-α =90\%\)

Resolviendo el problema utilizando R

alpha=0.10  #Nivel de significancia 

Xbarra=mean(Des_Moines)
cat("Media muestral de Des Moines: ", Xbarra, "\n")
## Media muestral de Des Moines:  90.25
Ybarra=mean(Spokane)
cat("Media muestral de Spokane: ", Ybarra, "\n")
## Media muestral de Spokane:  79.8

Desviación Hombres

U = abs(Xbarra-Des_Moines)
U
##  [1] 7.25 0.75 3.75 1.25 1.25 5.75 0.75 1.75 8.25 2.75 0.25 2.75

Desviación Mujeres

V = abs(Ybarra-Spokane)
V
##  [1] 1.8 2.2 1.2 2.8 0.8 1.2 0.2 1.2 0.2 0.8
rangos=rank(c(U,V))
rangos2 = rangos^2
rangos
##  [1] 21.0  4.5 19.0 11.5 11.5 20.0  4.5 13.0 22.0 16.5  3.0 16.5 14.0 15.0  9.0
## [16] 18.0  6.5  9.0  1.5  9.0  1.5  6.5
R1=sum(rangos[1:12]) #Hombres
R1
## [1] 163
R2=sum(rangos[13:22]) #Mujeres
R2
## [1] 90

$= $ \[\overline{R^2}= \frac{1}{N}\left(\sum_{i=1}^{n}[R(U_{i})]^2+\sum_{j=1}^{m}[R(V_{j})]^2\right)=104.9706\]

Rbarra_2 = (1/N)*(sum(rangos^2))
Rbarra_2
## [1] 172.2955

\[\sum_{i=1}^{N}R_{i}^4= \sum_{i=1}^{n}[R(U_{i})]^4+\sum_{j=1}^{m}[R(V_{j})]^4=327362.1\]

Rbarra_4 = sum(rangos^4)
Rbarra_4
## [1] 1149021

Utilizaremos el estadístico Como tenemos empates utilizamos: \[T_{1} = \frac{T-n\overline{R^2}}{\left[\frac{nm}{N(N-1)}\sum_{i=1}^{N}R_{i}^4-\frac{nm}{N-1}(\overline{R^2})^2\right]^\frac{1}{2}}\]

T = sum(rangos[1:12]^2)
T
## [1] 2713.5
T_1  =(T- (n*(Rbarra_2)))/
      (sqrt((n*m/(N*(N-1)))*(Rbarra_4)-
              ((n*m*(Rbarra_2)^2)/(N-1))))
T_1 
## [1] 1.799783
t1=qnorm(alpha/2,0,1)
t1
## [1] -1.644854
t2=qnorm(1-alpha/2,0,1)
t2
## [1] 1.644854

Regla de decisión Rechazamos \(H_0\)al nivel de significancia \(α=10\%\) si \(T>t_{1-\frac{\alpha}{2}} \ \ \ o \ \ \ T<t_{\frac{\alpha}{2}}\)

como \(T=1.799783>1.644854=t_{1-\frac{\alpha}{2}}\) se rechaza \(H_0\)

Conclusión Hay informacion suficiente para rechazar \(H_0\)

Prueba para más de dos Muestras

  1. Una muestra aleatoria de 5 diferentes marcas de focos son probados para medir la duración del foco, y los resultados fueron los siguientes:
\[\begin{array}{||c| |c| |c| |c||c||} \hline A & B&C&D&E \\ \hline 73&84&82&80&85\\ \hline 64&80&79&85&82\\ \hline 67&81&71&82&80\\ \hline 62&77&75&86&\\ \hline 70&&80&&\\ \hline \hline \end{array}\]
Los datos observados indican una diferencia significativa entre las varianzas de las duraciones por marca? Use α=10%

La prueba a utilizar Prueba de Rangos para más de dos Muestras

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{Las 5 muestras son idénticos, excepto por diferencias en las medias.}\] \[vs\] \[\textbf{H}_a:\ \mbox{Al menos alguna de las muestras tiene varianzas distintas}\]

Supuestos: 1. Tomaremos \(α =10\% = 0.10\) el nivel de significancia

  1. Confianza \(=1-α =90\%\)

  2. Muestra de tamaño

M1=c(73,64,67,62,70)
M2=c(84,80,81,77)
M3=c(82,79,71,75,80)
M4=c(80,85,82,86)
M5=c(85,82,80)

Muestras <- c(M1,M2,M3,M4,M5)
rangos = rank(Muestras)
n1=length(M1)
n2=length(M2)
n3=length(M3)
n4=length(M4)
n5=length(M5)
N=n1+n2+n3+n4+n5
N
## [1] 21
U1=sort(abs(M1-mean(M1)))
U2=sort(abs(M2-mean(M2)))
U3=sort(abs(M3-mean(M3)))
U4=sort(abs(M4-mean(M4)))
U5=sort(abs(M4-mean(M5)))
#U=rbind(U1,U2,U3,U4)
R1 = rangos[1:5]
R2 = rangos[6:9]
R3 = rangos[10:14]
R4 = rangos[15:18]
R5 = rangos[19:21]

#rangos al cuadrado
R1s=R1^2
R2s=R2^2
R3s=R3^2
R4s=R4^2
R5s=R5^2

#suma del cuadrado de los rangos
S1=sum(R1s)
S2=sum(R2s)
S3=sum(R3s)
S4=sum(R4s)
S5=sum(R5s)

Utilizaremos el estadístico Como tenemos empates: \[T_{2}= \frac{1}{D^2}\left[\sum_{j=1}^{k}\frac{S_{j}^2}{n_j}-N(\overline{S})^2\right]=11.87125\]

S=sum(S1,S2,S3,S4,S5)/N
S
## [1] 157.3095
R6=sum(R1s^2)+sum(R2s^2)+sum(R3s^2)+sum(R4s^2)+sum(R5s^2)
R6
## [1] 908954.4
D2=(R6-N*S^2)/(N-1)
D2
## [1] 19464.12
T2=(S1^2/n1+S2^2/n2+S3^2/n3+S4^2/n4+S5^2/n5-N*S^2)/D2
T2
## [1] 11.87125

El cuantil que hay que buscar es en una distribución Ji-cuadrada con k−1=4 grados de libertad. Consideremos α=0.10.

t=qchisq(.90,4)
t
## [1] 7.77944

Regla de decisión Rechamos \(H_0\) si \(T_{2}>t_{1-\alpha}\), como \(T_{2}=11.87125>7.77944=t_{1-\alpha}\) se rechaza \(H_0\)

Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que al menos alguna de las muestras tiene varianzas distintas