Estadística Inferencial

Clase 2.5
Estimación por intervalos para el cociente de varianzas poblacionales

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Estimación por intervalos para el cociente de varianzas poblacionales
    • Distribución de la razón de varianzas \(F\)
    • Construcción de un intervalo para el cociente de varianzas
    • Intervalos de confianza para el cociente de varianzas
    • Ejemplos
    • Ejercicio

Distribución de la razón de varianzas \(F\)

Recordemos que la variable aleatoria \(F\) se define como el cociente de dos variables aleatorias chi-cuadrada(\(\chi^2\)) independientes, cada una dividida entre sus respectivos grados de libertad.

\[ \begin{align*} \frac{n_1S^2_1}{\sigma^2_1} & \sim \chi^2_{gl_1}\\ \frac{n_2S^2_2}{\sigma^2_2} & \sim \chi^2_{gl_2} \end{align*} \]

donde \(\chi^2_1\) y \(\chi^2_2\) son variables aleatorias chi-cuadrada independientes con grados de libertad \(gl_1 = n_1-1\) y \(gl_2 = n_2 -1\) respectivamente.

Distribución de la razón de varianzas \(F\)

Sean \(s^2_1\) y \(s^2_2\) son las varianzas muestrales independientes de tamaño \(n_1\) y \(n_2\) tomadas de poblaciones normales con varianzas \(\sigma^2_1\) y \(\sigma^2_2\), respectivamente. Si lo que interesa es contrastar si las dos variables, \(s^2_1\) y \(s^2_2\), tienen la misma varianza, entonces la parte constante se asume igual, es decir: \(\frac{gl_1}{\sigma^2_1} = \frac{gl_2}{\sigma^2_2}\), de manera que el estadístico será:

\[\frac{\chi^2_{gl_1}}{\chi^2_{gl_2}} = \frac{\frac{n_1S^2_1}{\sigma^2_1}}{\frac{n_2S^2_2}{\sigma^2_2}} = \frac{\frac{\frac{n_1S_1}{\sigma^2_1}}{n_1-1}}{\frac{\frac{n_2S^2_2}{\sigma^2_2}}{n_2-1}} = \frac{n_1S^2_1\sigma^2_2(n_2-1)}{n_2S^2_2\sigma^2_1(n_1-1)}\rightsquigarrow F_{(gl_1,gl_2)} \]

Construcción de un intervalo para el cociente de varianzas

De lo anterior, vemos que \(\frac{n_2S^2_2\sigma^2_1(n_1-1)}{n_1S^2_1\sigma^2_2(n_2-1)}\) es un “pivote” para el intervalo de confianza, con una probabilidad del \((1-\alpha)\%\).

\[p \left(F_{[1-\frac{\alpha}{2},(gl_1,gl_2)]} \leqslant \frac{n_1S^2_1\sigma^2_2(n_2-1)}{n_2S^2_2\sigma^2_1(n_2-1)} \leqslant F_{[\frac{\alpha}{2},(gl_1,gl_2)]}\right) = 1-\alpha\]

Pero nos intereza el cociente \(\frac{\sigma^2_1}{\sigma^2_2}\), así que despejamos y teniendo en cuenta que si \(n_1\) y \(n_2\) son suficientemente grandes, entonces \(\frac{n_1-1}{n_1} \sim 1\) y \(\frac{n_2-1}{n_2} \sim 1\). Finalmente, le damos la vuelta al cociente y obtenemos

\[p \left(F_{[\frac{\alpha}{2},(gl_1,gl_2)]} \leqslant \frac{n_2S^2_2\sigma^2_1(n_1-1)}{n_1S^2_1\sigma^2_2(n_2-1)} \leqslant F_{[1-\frac{\alpha}{2},(gl_1,gl_2)]}\right) = 1-\alpha\]

\[p \left(F_{[\frac{\alpha}{2},(gl_1,gl_2)]} \leqslant \frac{S^2_2\sigma^2_1}{S^2_1\sigma^2_2} \leqslant F_{[1-\frac{\alpha}{2},(gl_1,gl_2)]}\right) = 1-\alpha\]

Intervalo para el cociente de varianzas

Despejando \(\frac{\sigma^2_1}{\sigma^2_2}\) dentro de la probabilidad, tenemos que:

\[p \left(\frac{\frac{S^2_1}{S^2_2}}{F_{[\frac{\alpha}{2},(gl_1,gl_2)]}} \leqslant \frac{\sigma^2_1}{\sigma^2_2} \leqslant \frac{\frac{S^2_1}{S^2_2}}{F_{[1-\frac{\alpha}{2},(gl_1,gl_2)]}}\right) = 1-\alpha\]

Nuestro intervalo de confianza del \(1-\alpha\) para el cociente de varianzas poblacionales será:

\[\boldsymbol{\left(\frac{\frac{S^2_1}{S^2_2}}{F_{[\frac{\alpha}{2},(gl_1,gl_2)]}}, \frac{\frac{S^2_1}{S^2_2}}{F_{[1-\frac{\alpha}{2},(gl_1,gl_2)]}}\right)}\]

Ejemplo 1

Una muestra de 6 soldaduras de tipo B1, tiene resistencia promedio de 83.2 \(ksi\) y desviación estándar de 5.2 \(ksi^2\) y una muestra de 10 soldaduras de tipo B2, tiene resistencia promedio de 71.3 \(ksi\) y desviación estándar de 3.1 \(ksi^2\). Suponga que ambos conjuntos de soldaduras son muestras aleatorias de poblaciones normales. Encuentre un intervalo de confianza de 95% para el cociente de varianzas poblacionales de las resistencias de los dos tipos de soldaduras.

Solución

  • Del problema podemos ver, que las desviaciones estandar para los dos tipos de soldadura son: \(S^2_1=5.2\) y \(S^2_2=3.1\)
  • Los tamaños de muestras son respectivamente: \(n_1=6\) y \(n_2= 10\).
  • El nivel de confianza es del \(1-\alpha =0.95\), luego \(\frac{\alpha}{2}=0.025\) y así,

\[F_{[1-\frac{\alpha}{2},(gl_1,gl_2)]} =F_{[0.925,(5,9)]} = 0.15\]

\[F_{[\frac{\alpha}{2},(gl_1,gl_2)]} =F_{[0.025,(5,9)]} = 4.48\]

El intervalo será

\[\boldsymbol{\left(\frac{\frac{S^2_1}{S^2_2}}{F_{[\frac{\alpha}{2},(gl_1,gl_2)]}}, \frac{\frac{S^2_1}{S^2_2}}{F_{[1-\frac{\alpha}{2},(gl_1,gl_2)]}}\right) \\ = \left(\frac{\frac{5.2^2}{3.1^2}}{4.48}, \frac{\frac{5.2^2}{3.1^2}}{0.15}\right)\\ = (0.63, 18.76)}\]

Por lo tanto, un intervalo de confianza del 95% para el cociente de varianzas de la resistencia de las soldaduras es (0.63, 18.76) \(ksi^2\) o también,tomando la raiz cuadrada, entonces (0.79, 4.33) \(ksi\)

Solución en R, construyendo el código

Code
n1 = 6
n2 = 10
alpha = 0.05
S1 = 5.2
S2 = 3.1
  
F1 = qf(1-alpha/2,5,9,lower.tail = F)
F2 = qf(alpha/2,5,9,lower.tail = F)


Li = (S1^2/S2^2)/F2
Ls = (S1^2/S2^2)/F1

cat("Un intervalo de confianza al 95% para el cociente de varianzas \nde la resistencia de las soldaduras es:", "(", Li, ",", Ls, ")")
Un intervalo de confianza al 95% para el cociente de varianzas 
de la resistencia de las soldaduras es: ( 0.6274482 , 18.79872 )

Observación

Como el intervalo ( 0.6274482 , 18.79872 ) contiene el \(1 \sim \frac{\sigma^2_1}{\sigma^2_2}\), entonces podemos decir que las varianzas son estadísticamente iguales.

Ejemplo 2

  1. Se piensa que la concentración del ingrediente activo de un detergente líquido para ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricación. Se realizan 10 observaciones con cada catalizador, y se obtienen los datos siguientes:
  • Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0
  • Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 68.8

Asumiendo que ambas muestras fueron extraídas de poblaciones normales e independientes, encuentre un intervalo de confianza del 90% para el cociente de las concentraciones activas para los dos catalizadores y concluya si las varianzas son estadísticamente iguales.

Solución en R usando la librería Stats (viene por defecto en R, no hay que instalarla)

Code
catalizador1 = c(57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0)
catalizador2 = c(66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 68.8)
  
var.test( x = catalizador1,
          y = catalizador2,
          alternative = 'two.sided', 
          conf.level = 0.90)

    F test to compare two variances

data:  catalizador1 and catalizador2
F = 2.3986, num df = 9, denom df = 9, p-value = 0.2086
alternative hypothesis: true ratio of variances is not equal to 1
90 percent confidence interval:
 0.7545388 7.6248875
sample estimates:
ratio of variances 
          2.398598 

Como el intervalo ( 0.7545388, 7.6248875 ) contiene el \(1 \sim \frac{\sigma^2_1}{\sigma^2_2}\), entonces podemos decir que las varianzas son estadísticamente iguales.

Ejercicios

  1. Se administra un medicamento para la ansiedad a 14 personas, de las cuales 6 lo hacen por primera vez y 8 ya son habituales de ella. La droga produjo en el primer grupo sueños de duración \(G_1\) horas, mientras que en el segundo grupo \(G_2\) horas; donde,
  • \(G_1\): 11, 12, 13, 16, 17, 15
  • \(G_2\): 8, 7, 9, 10, 6, 7, 9, 8

Para un nivel de confianza del 98%, ¿son las desviaciones estandar poblacionales iguales?

  1. De dos poblaciones normales \(X\) e \(Y\) se han extraído muestras de tamaño \(n_X=15\) y \(n_Y=10\) cuyas cuasivarianzas valen \(S^2_X=69\) y \(S^2_Y=44\). Construir intervalos de estimación para el cociente de las varianzas poblacionales a los niveles de confianza del 90% y 95%. Interprete.