Clase 1.5
Distribución muestral del cociente de varianzas muestrales
Distribución de Fisher (F)
Msc. Roberto Trespalacios
Universidad Tecnológica de Bolivar
2024-01-29
Tabla de contenido
Distribución muestral del cociente de varianzas muestrales
Distribución muestral del cociente de varianzas
Distribución de la razón de varianzas \(F\)
Propiedades de la distribución de la razón de varianzas \(F\)
Relación entre \(F\) y \(\frac{1}{F}\)
Ejemplos
Distribución muestral del cociente de varianzas muestrales
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población.
Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro.
Sea \(x_1, x_2, \dots, x_{n_1}\) una muestra aleatoria extraída de una población normal con varianza poblacional \(\sigma^2_1\) y del mismo modo, sea \(y_1, y_2, \dots, y_{n_2}\) una muestra aleatoria extraída de una población normal con varianza poblacional \(\sigma^2_2\). Supongamos también que ambas poblaciones son independientes.
Distribución muestral del cociente de varianzas muestrales
Intuitivamente, podríamos comparar las varianzas de dos poblaciones \(\sigma^2_1\) y \(\sigma^2_2\) utilizando la razón de las varianzas muestrales
\[
\frac{s^2_1}{s^2_2}
\]
Si \(\frac{s^2_1}{s^2_2} \sim 1\), se tendrá poca evidencia para indicar que \(\sigma^2_1\) y \(\sigma^2_2\) no son iguales.
Si \(\frac{s^2_1}{s^2_2} \nsim 1\), nos proporciona evidencia de una diferencia en las varianzas de las poblaciones.
Distribución de la razón de varianzas \(F\)
La variable aleatoria \(F\) se define como el cociente de dos variables aleatorias chi-cuadrada(\(\chi^2\)) independientes, cada una dividida entre sus respectivos grados de libertad.
donde \(\chi^2_1\) y \(\chi^2_2\) son variables aleatorias chi-cuadrada independientes con grados de libertad \(gl_1 = n_1-1\) y \(gl_2 = n_2 -1\) respectivamente.
Distribución de la razón de varianzas \(F\)
Sean \(s^2_1\) y \(s^2_2\) son las varianzas muestrales independientes de tamaño \(n_1\) y \(n_2\) tomadas de poblaciones normales con varianzas \(\sigma^2_1\) y \(\sigma^2_2\), respectivamente. Si lo que interesa es contrastar si las dos variables, \(s^2_1\) y \(s^2_2\), tienen la misma varianza, entonces la parte constante se asume igual, es decir: \(\frac{gl_1}{\sigma^2_1} = \frac{gl_2}{\sigma^2_2}\), de manera que el estadístico será:
Propiedades de la distribución de la razón de varianzas \(F\)
La variable aleatoria \(F\) es no negativa, y la distribución tiene un sesgo hacia la derecha.
La distribución \(F\) tiene una apariencia muy similar a la distribución \(\chi^2\); sin embargo, se encuentra centrada respecto a 1, y los dos parámetros \(gl_1\) y \(gl_2\) proporcionan una flexibilidad adicional con respecto a la forma de la distribución.
A continuación vamos a trabajar en la busqueda de valores de probabilidad y de cuantiles en la tabla de la distribución F.
Uso de la tabla F y relación entre \(F\) y \(\frac{1}{F}\)
Supongamos que buscamos una probabilidad para un valor de \(F\) y no tenemos una tabla que tenga las probabilidades del extremo; entonces, podemos recurrir a la siguiente relación entre \(F\) y \(\frac{1}{F}\):
Se desea conocer el valor de \(F(0.9995, 3, 6)\); entonces, usando la propiedad inversa, se tiene que:
\[F_{(1-\alpha=0.9995;3,6)=\frac{1}{F_{(\alpha=0.0005;6, 3)}}}=30.45\] En R
qf(0.9995,3,6)1/qf(0.0005,6,3)
Solución
Ejemplo 2
Encontrar el valor del cuantil \(F\), en cada uno de los siguientes casos:
El cuantil \(F\), que deja un área a la derecha de 0.05, con \(gl_1=4\) y \(gl_2=9\).
El cuantil \(F\), que deja un área a la izquierda de 0.95, con \(gl_1=15\) y \(gl_2=10\).
El cuantil \(F\), que deja un área a la derecha de 0.99, con \(gl_1=6\) y \(gl_2=8\).
El cuantil \(F\), que deja un área a la derecha de 0.01, con con \(gl_1=8\) y \(gl_2=6\).
En R
# F(0.05, 4, 9) cola derechaqf(0.05,4,9, lower.tail =FALSE)# F(0.95,15,10) cola izquierdaqf(0.95,15,10)# F(0.99, 6, 8) cola derechaqf(0.99,6,8, lower.tail =FALSE)# F(0.01, 8, 6) cola derecha1/qf(0.01,8,6, lower.tail =FALSE)
Ejemplo 3
Si \(s_1^2\) y \(s_2^2\) representan las varianzas de las muestras aleatorias independientes, tomadas de poblaciones con distribución normal. Encontrar la probabilidad en cada uno de los siguientes problemas:
Tenemos muestras de tamaño \(n_1=10\) y \(n_2 =20\), encuentre \(P(\frac{s_1^2}{s^2_2} < 2.42)\).
Tenemos muestras de tamaño \(n_1= 25\) y \(n_2 = 31\) y varianzas \(\sigma_1^2 =10\) y \(\sigma_2^2 = 15\), respectivamente, encuentre \(P(\frac{s_1^2}{s^2_2} > 1.26)\).
Encuentre el valor de \(K\), tal que \(p(s_1^2 < s^2_2K) = 0.88\).
Ejercicios
Estudios anteriores plantearon que la heterogeneidad en el nivel alcanzado por el PBI en América Latina, medida a través de la variabilidad de esta variable al interior de la región latinoamericana, siempre ha existido; esto es, de un año a otro puede esperarse que exista una similar variabilidad en el nivel del PBI registrado por los países latinos. Partiéndose del PBI, expresado en millones de dólares, se obtuvieron los siguientes resultados: Que la desviación estándar del PBI registrado para el 2003 en una muestra de 16 países latinos fue de 67803 mientras que para 2004 fue de 95136.
¿Cuál es la probabilidad de que exista una mayor variabilidad en el año 2004 respecto a 2003? Plantee los supuestos necesarios e interpreta los resultados.?
Una agencia distribuidora de café afirma que el peso promedio de las bolsas de dos tipos de café que distribuye es la misma. Para probar esta afirmación se tomaron dos muestras aleatorias de tamaño 36 de cada tipo de café. Si el peso medio de la primera muestra es mayor al peso medio de la segunda muestra, se aceptará que el peso medio de ambos tipos de café es la misma; en caso contrario, se rechazará la afirmación. Si las varianzas de los pesos de las bolsas son de 9 y 4, respectivamente,
¿Cuál es la probabilidad de aceptar la afirmación?