Se compararon las varianzas de los vencimientos de dos tipos de bonos. Para una muestra aleatoria de 17 bonos del primer tipo, la varianza de los vencimientos (en años al cuadrado) fue de 123,35. Para una muestra aleatoria independiente de 11 bonos del segundo tipo, la varianza de los vencimientos fue de 8,02. Al nivel del 2%, determinar si las dos varianzas poblacionales son diferentes. Asuma que las dos poblaciones tienen distribución normal. Halle también el P-valor.
Para este ejercicio usaremos el esquema utilizado en clase para resolver problemas de este indole:
Unidades Experimentales: Bonos.
Población: Vencimientos de los bonos.
Estadístico: Razón de varianzas muestrales \(\left(\frac{s^2_1}{s^2_2}\right)\).
Parámetro: Razón de varianzas poblacionales \(\left(\frac{\sigma^2_1}{\sigma^2_2}\right)\).
Tamaño muestral: \(n_1 = 17\) y \(n_2 = 11\).
Tamaño poblacional: \(N = \text{Desconocido}\).
Hipótesis: Queremos contrastar: \(\quad H_0:\sigma_1^2 = \sigma_2^2\) \(\quad\) vs \(\quad\) \(\ H_0:\sigma_1^2 \neq \sigma_2^2\).
Método de decisión: (a) Región crítica con \(\alpha = 0,02\); (b) P-valor.
Otros datos: Tenemos que, \(s_1^2 = 123,35\), \(s_2^2 = 8,02\) y que ambas poblaciones son normales.
¿Forma de la población? Ambas normales
La distribución muestral de la razón de varianzas muestrales es \(F\) de Fisher con \(v_1 = 17 - 1 = 16\), \(v_2 = 11 - 1 = 10\) grados de libertad.
La fórmula está dada por:
\[F = \frac{s_1^2 / \sigma_1^2}{s_2^2 / \sigma_2^2}\]
Sin embargo, bajo la hipótesis \(H_0\) entonces \(\sigma_1^2 = \sigma_2^2\). Por lo tanto:
\[F = \frac{s_1^2}{s_2^2}\]
Reemplazando los valores en la fórmula obtenemos:
\[F_0 = \frac{123.35}{8.02} \approx
15.380\]
Para confirmar si rechazamos o aceptamos la hipótesis nula tenemos estos dos métodos:
La prueba es bilateral con \(\alpha =
0.02\) y \(\frac{\alpha}{2} =
0.01\). Para determinar si se rechaza o acepta la hipótesis nula
calculamos el valor crítico con ayuda de la función qf:
f = qf(0.99, 16, 10)
\[F_{\alpha / 2}(16,10) = F_{0.01}(16,10) = 4.52\] Dado que \(F_0 = 15.380 > 4.52 = F_{0.01}(16,10)\) se rechaza \(H_0\), es decir, \(\sigma_1^2 \neq \sigma_2^2\). Por lo tanto, \(\sigma_1^2 > \sigma_2^2\) o \(\sigma_1^2 < \sigma_2^2\).
De hecho, podemos verlo de manera gráfica:
#Valor de prueba
s1 = 123.35
s2 = 8.02
F0 = s1 / s2
#Límite superior e inferior
F_inf = qf(0.01, 16, 10)
F_sup = qf(0.99, 16, 10)
#Grados de libertad
v1 = 16
v2 = 11
#Definimos los valores de la curva
x <- seq(0, 18, length.out = 600) #Seq: Crea una secuencia de números en R (from, to, length.out = cantidad de valores)
y <- df(x, v1, v2)
#Creamos un data frame
df_grafico <- data.frame(x, y)
#Creamos el gráfico
ggplot(df_grafico, aes(x, y * 2)) + #Crea el gráfico base, indicando cual será el eje x e y.
geom_line(color = "darkblue", size = 1) + #Dibuja la curva de la distribución F
geom_area(data = subset(df_grafico, x <= F_inf), #Geom_area: Sirve para rellenar un área bajo la curva. Data = subset(...) Toma solo puntos del dataframe donde el valor de x sea menor igual a F_inf
aes(y = y * 2), fill = "red", alpha = 0.4) +
geom_area(data = subset(df_grafico, x >=F_sup), aes(y = y * 2), fill = "red", alpha = 0.4) +
#Dibujar lineas
geom_vline(xintercept = F_inf, color = "red", linetype = "dashed", size = 1) +
geom_vline(xintercept = F_sup, color = "red", linetype = "dashed", size = 1) +
geom_vline(xintercept = F0, color = "black", linetype = "dashed", size = 1) +
expand_limits(y = -0.07) +
scale_x_continuous(trans = "sqrt", limits = c(0, 18))+
#Etiquetas
annotate("text", x = F0, y = 0.02, #sirve para añadir elementos estáticos al gráfico: textos,líneas, flechas.
label = paste0("F = ", round(F0, 2)),
vjust = 3, hjust = 0.4, size = 4) +
annotate("text", x = F_inf, y = 0.02,
label = paste0("F = ", round(F_inf, 2)),
vjust = 3, hjust = 0.4, size = 4) +
annotate("text", x = F_sup, y = 0.02,
label = paste0("F = ", round(F_sup, 2)),
vjust = 3, hjust = 0.4, size = 4) +
labs(title = "Distribución F y región crítica (α = 0.02, bilateral)",
x = "Valor F", y = "Densidad") +
theme_minimal() +
theme(
plot.title = element_text(
color = "darkblue", # Color del título
face = "bold", # Negrita
size = 14, # Tamaño del texto
hjust = 0.5 # Centrar el título horizontalmente (0 = izq, 0.5 = centro, 1 = der)
)
)
Como la hipótesis alternativa es de dos colas, el P-valor es:
pb = pf(F0, 16, 11)
pb2 = 1 - pb
\[ \text{P-valor} = 2 \cdot P(F \geq |F_0|) = 2P(F \geq 15.380) \approx 2 \cdot 0 = 0 \]
Dado que \(\text{P-valor} = 0 < 0.02 = \alpha\), al nivel de significancia de 2% se rechaza \(H_0\), es decir, \(\sigma_1^2 \neq \sigma_2^2\). Por lo tanto, \(\sigma_1^2 > \sigma_2^2\) o \(\sigma_1^2 < \sigma_2^2\).
Con un nivel de significancia del 2%, podemos afirmar que existen diferencias estadísticamente significativas entre las varianzas de los vencimientos de los dos tipos de bonos.