RAZÓN DE VARIANZAS - EJEMPLO 3.6.5

Enunciado (Ejemplo 3.6.5)

Se compararon las varianzas de los vencimientos de dos tipos de bonos. Para una muestra aleatoria de 17 bonos del primer tipo, la varianza de los vencimientos (en años al cuadrado) fue de 123,35. Para una muestra aleatoria independiente de 11 bonos del segundo tipo, la varianza de los vencimientos fue de 8,02. Al nivel del 2%, determinar si las dos varianzas poblacionales son diferentes. Asuma que las dos poblaciones tienen distribución normal. Halle también el P-valor.

Desarrollo

Para este ejercicio usaremos el esquema utilizado en clase para resolver problemas de este indole:

1. Datos

Unidades Experimentales: Bonos.

Población: Vencimientos de los bonos.

Estadístico: Razón de varianzas muestrales \(\left(\frac{s^2_1}{s^2_2}\right)\).

Parámetro: Razón de varianzas poblacionales \(\left(\frac{\sigma^2_1}{\sigma^2_2}\right)\).

Tamaño muestral: \(n_1 = 17\) y \(n_2 = 11\).

Tamaño poblacional: \(N = \text{Desconocido}\).

Hipótesis: Queremos contrastar: \(\quad H_0:\sigma_1^2 = \sigma_2^2\) \(\quad\) vs \(\quad\) \(\ H_0:\sigma_1^2 \neq \sigma_2^2\).

Método de decisión: (a) Región crítica con \(\alpha = 0,02\); (b) P-valor.

Otros datos: Tenemos que, \(s_1^2 = 123,35\), \(s_2^2 = 8,02\) y que ambas poblaciones son normales.

2. Supuestos

¿Forma de la población? Ambas normales

3. Conclusión

La distribución muestral de la razón de varianzas muestrales es \(F\) de Fisher con \(v_1 = 17 - 1 = 16\), \(v_2 = 11 - 1 = 10\) grados de libertad.

4. Fórmula

La fórmula está dada por:

\[F = \frac{s_1^2 / \sigma_1^2}{s_2^2 / \sigma_2^2}\]

Sin embargo, bajo la hipótesis \(H_0\) entonces \(\sigma_1^2 = \sigma_2^2\). Por lo tanto:

\[F = \frac{s_1^2}{s_2^2}\]

5. Cálculos

Reemplazando los valores en la fórmula obtenemos:

\[F_0 = \frac{123.35}{8.02} \approx 15.380\]

6. Método de decisión

Para confirmar si rechazamos o aceptamos la hipótesis nula tenemos estos dos métodos:

6.1 Región Crítica

La prueba es bilateral con \(\alpha = 0.02\) y \(\frac{\alpha}{2} = 0.01\). Para determinar si se rechaza o acepta la hipótesis nula calculamos el valor crítico con ayuda de la función qf:

f = qf(0.99, 16, 10)

\[F_{\alpha / 2}(16,10) = F_{0.01}(16,10) = 4.52\] Dado que \(F_0 = 15.380 > 4.52 = F_{0.01}(16,10)\) se rechaza \(H_0\), es decir, \(\sigma_1^2 \neq \sigma_2^2\). Por lo tanto, \(\sigma_1^2 > \sigma_2^2\) o \(\sigma_1^2 < \sigma_2^2\).

De hecho, podemos verlo de manera gráfica:

#Valor de prueba
s1 = 123.35
s2 = 8.02
F0 = s1 / s2


#Límite superior e inferior
F_inf = qf(0.01, 16, 10)
F_sup = qf(0.99, 16, 10)

#Grados de libertad
v1 = 16
v2 = 11

#Definimos los valores de la curva
x <- seq(0, 18, length.out = 600) #Seq: Crea una secuencia de números en R (from, to, length.out = cantidad de valores)
y <- df(x, v1, v2)

#Creamos un data frame
df_grafico <- data.frame(x, y)

#Creamos el gráfico
ggplot(df_grafico, aes(x, y * 2)) + #Crea el gráfico base, indicando cual será el eje x e y.
  geom_line(color = "darkblue", size = 1) + #Dibuja la curva de la distribución F 
  geom_area(data = subset(df_grafico, x <= F_inf), #Geom_area: Sirve para rellenar un área bajo la curva. Data = subset(...) Toma solo puntos del dataframe donde el valor de x sea menor igual a F_inf
  aes(y = y * 2), fill = "red", alpha = 0.4) +
  geom_area(data = subset(df_grafico, x >=F_sup), aes(y = y * 2), fill = "red", alpha = 0.4) +
  
  #Dibujar lineas
  geom_vline(xintercept = F_inf, color = "red", linetype = "dashed", size = 1) + 
  geom_vline(xintercept = F_sup, color = "red", linetype = "dashed", size = 1) +
  geom_vline(xintercept = F0, color = "black", linetype = "dashed", size = 1) + 
  
  expand_limits(y = -0.07) + 
  scale_x_continuous(trans = "sqrt", limits = c(0, 18))+
  
  #Etiquetas
  annotate("text", x = F0, y = 0.02, #sirve para añadir elementos estáticos al gráfico: textos,líneas, flechas.
           label = paste0("F = ", round(F0, 2)),
           vjust = 3, hjust = 0.4, size = 4) + 
  annotate("text", x = F_inf, y = 0.02,
           label = paste0("F = ", round(F_inf, 2)),
           vjust = 3, hjust = 0.4, size = 4) +
  annotate("text", x = F_sup, y = 0.02, 
           label = paste0("F = ", round(F_sup, 2)),
           vjust = 3, hjust = 0.4, size = 4) +
  
  labs(title = "Distribución F y región crítica (α = 0.02, bilateral)",
       x = "Valor F", y = "Densidad") +
  theme_minimal() +
  theme(
  plot.title = element_text(
    color = "darkblue",   # Color del título
    face = "bold",        # Negrita
    size = 14,            # Tamaño del texto
    hjust = 0.5           # Centrar el título horizontalmente (0 = izq, 0.5 = centro, 1 = der)
  )
)

6.2 P-Valor

Como la hipótesis alternativa es de dos colas, el P-valor es:

pb = pf(F0, 16, 11)
pb2 = 1 - pb

\[ \text{P-valor} = 2 \cdot P(F \geq |F_0|) = 2P(F \geq 15.380) \approx 2 \cdot 0 = 0 \]

Dado que \(\text{P-valor} = 0 < 0.02 = \alpha\), al nivel de significancia de 2% se rechaza \(H_0\), es decir, \(\sigma_1^2 \neq \sigma_2^2\). Por lo tanto, \(\sigma_1^2 > \sigma_2^2\) o \(\sigma_1^2 < \sigma_2^2\).

7. Interpretación

Con un nivel de significancia del 2%, podemos afirmar que existen diferencias estadísticamente significativas entre las varianzas de los vencimientos de los dos tipos de bonos.