Clase 3.5
Prueba de hipótesis para el cociente de varianzas de dos poblaciones
Universidad Tecnológica de Bolivar
2024-01-29
La necesidad de disponer de métodos estadı́sticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varı́a el procedimiento para calificar de un profesor universitario con la de otro.
Recordemos que la variable aleatoria \(F\) se define como el cociente de dos variables aleatorias chi-cuadrada(\(\chi^2\)) independientes, cada una dividida entre sus respectivos grados de libertad.
\[ \begin{align*} \frac{n_1S^2_1}{\sigma^2_1} & \sim \chi^2_{gl_1}\\ \frac{n_2S^2_2}{\sigma^2_2} & \sim \chi^2_{gl_2} \end{align*} \]
donde \(\chi^2_1\) y \(\chi^2_2\) son variables aleatorias chi-cuadrada independientes con grados de libertad \(gl_1 = n_1-1\) y \(gl_2 = n_2 -1\) respectivamente.
Sean \(s^2_1\) y \(s^2_2\) son las varianzas muestrales independientes de tamaño \(n_1\) y \(n_2\) tomadas de poblaciones normales con varianzas \(\sigma^2_1\) y \(\sigma^2_2\), respectivamente. Si lo que interesa es contrastar si las dos variables, \(s^2_1\) y \(s^2_2\), tienen la misma varianza, entonces la parte constante se asume igual, es decir: \(\frac{gl_1}{\sigma^2_1} = \frac{gl_2}{\sigma^2_2}\), de manera que el estadístico será:
\[\frac{\chi^2_{gl_1}}{\chi^2_{gl_2}} = \frac{\frac{n_1S^2_1}{\sigma^2_1}}{\frac{n_2S^2_2}{\sigma^2_2}} = \frac{\frac{\frac{n_1S_1}{\sigma^2_1}}{n_1-1}}{\frac{\frac{n_2S^2_2}{\sigma^2_2}}{n_2-1}} = \frac{n_1S^2_1\sigma^2_2(n_2-1)}{n_2S^2_2\sigma^2_1(n_1-1)}\rightsquigarrow F_{(gl_1,gl_2)} \]
Puesto que nos intereza que el cociente \(\frac{\sigma^2_1}{\sigma^2_2} \sim 1\), entonces, si \(n_1\) y \(n_2\) son suficientemente grandes, tenemos que \(\frac{n_1-1}{n_1} \sim 1 \quad y \quad \frac{n_2-1}{n_2} \sim 1\). Haciendo los respectivos cálculos, además,
\[\frac{S^2_1}{S^2_2}\rightsquigarrow F_{(gl_1,gl_2)}\] donde \(gl_1= n_1 -1\) y \(gl_2 =n_2-1\) son los grados de libertad del numerador y del denominador respectivamente.
\[\displaystyle F_0=\frac{S^2_1}{S^2_2} \sim F_{gl_1,gl_2}\]
La variabilidad en la cantidad de impurezas presentes en un lote de productos químicos, utilizada para un proceso en particular, depende del tiempo que tarda el proceso. Un fabricante que emplea dos líneas de producción 1 y 2, hizo un pequeño ajuste al proceso 2, con la esperanza de reducir la variabilidad, así como la cantidad media de impurezas en los productos químicos. Muestras de \(n_1=25\) y \(n_2=20\) mediciones de dos lotes produjeron las siguientes medias y varianzas:
\[\begin{align*} \bar{x}_1 & =3.2,\ S^2_1= 3.0 \\ \bar{x}_2 & =1.04, \ S^2_2= 0.51 \end{align*}\]
¿Presentan los datos evidencia suficiente para indicar que las variaciones del proceso son menores para el 2? Realice una prueba con un \(\alpha = 0.05\).
Un investigador en el campo educativo sostiene que el módulo didáctico empleado en la enseñanza de Matemáticas es uno de los factores que influye y determina en el proceso de enseñanza aprendizaje y por lo tanto, el módulo adoptado incidirá en el rendimiento académico de los estudiantes. Para verificar su hipótesis decidió realizar el siguiente experimento: durante un semestre llevó a cabo el trabajo lectivo para dos grupos de estudiantes de la misma carrera en la misma universidad, empleando dos módulos (A y B) de características bien diferenciadas. Al final del curso aplicó el mismo examen a todos los estudiantes y obtuvo las siguientes notas.
¿Se puede decir que existe diferencia en la variabilidad de los rendimientos empleando los módulos A y B?. Supongamos normalidad en la distribución de las variables consideradas y usemos el nivel de significancia del 0.20.
Se intenta hacer un ensayo con un fármaco real y un placebo. Un total de 18 personas reciben el fármaco con la esperanza de aumentar la producción de endorfinas. Se ha comprobado que el aumento de endorfinas es de 8 microgramos por persona, en promedio, y la desviación típica de la muestra es de 5.4 microgramos. A 11 personas se les da el placebo, y su aumento promedio de endorfinas es de 4 microgramos con una desviación típica de 2.4. Pruebe al 5% para ver si la media de la población para el fármaco tenía un impacto significativamente mayor en las endorfinas que la media de la población con el placebo.
El departamento de zoología de la Universidad de Virginia llevó a cabo un estudio para estimar la diferencia en la cantidad de ortofósforo químico medido en dos estaciones diferentes del río James. El ortofósforo se mide en miligramos por litro. Se reunieron 15 muestras de la estación 1 y se ontuvo una media de 3.84 con una desviación estándar de 3.07 miligramos por litro, mientras que 12 muestras de la estación 2 tuvieron un contenido promedio de 1.49 con una desviación estándar 0.80 miligramos por litro. Los científicos tienen la impresión de que los niveles medios de ortofósforo varian de acuerdo al lugar de toma de las muestras. A un nivel de significancia del 5%, ¿la suposición de los científicos es correcta?.