Al probar la diferencia en el desgaste abrasivo de los dos materiales en el ejemplo 3.3, se asumió que las varianzas poblacionales eran iguales. ¿Es esta justificación correcta? Utilice un nivel de significancia del 10% y halle también el \(P\)-valor.
Se llevó a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminados diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una máquina para medir el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observó la profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado) de 85 unidades con una desviación estándar muestral de 4, mientras que las muestras del material 2 dieron un promedio de 81 y una desviación estándar muestral de 5. ¿Puede concluirse en el nivel de significancia del 5% que el deterioro abrasivo del material 1 excede al del material 2 por más de 2 unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales. Halle también el P-valor.
(1) Unidades experimentales: Piezas del material lamindado 1 y 2.
(2) Poblaciones: Deterioro abrasivo (Unidades).
(3) Estadístico: Razón de varianzas muestrales \(\frac{S_1^2}{S_2^2}\)
(4) Parámetro: Razón de varianzas poblacionales \(\theta = \frac{\sigma_1^2}{\sigma_2^2}\)
(5) Hipótesis: Queremos verificar si era correcto asumir varianzas iguales en el experimento de desgaste abrasivo, por tanto planteamos una prueba bilateral:
\[
H_0: \sigma_1^2 = \sigma_2^2
\quad \Longleftrightarrow \quad
\theta = \frac{\sigma_1^2}{\sigma_2^2} = 1
\] \[
H_1: \sigma_1^2 \neq \sigma_2^2
\quad \Longleftrightarrow \quad
\theta = \frac{\sigma_1^2}{\sigma_2^2} \neq 1
\] (6) Método de decisión: Para dar solución al
problema consideramos los siguientes métodos de decisión:
a) Región crítica con \(\alpha = 0{,}10\)
b) P-valor
(7) Otros datos: 7.1 Tamaños muestrales:
\(n_1=12\)
\(n_2=10\)
7.2 Desviaciones estándar muestrales:
\(s_1=4\)
\(s_2=5\)
7.3 Varianzas muestrales:
\(s_1^2=16\)
\(s_2^2=25\)
Por hipótesis, se asume que las poblaciones son aproximadamente normales, por lo tanto:
¿Forma de la población? Ambas normales
La distribución muestral de la razón de varianzas de muestrales es F de Fisher con \(v_1=n_1 -1=11\) y \(v_2=n_2 -1=9\) grados de libertad: \[ F = \frac{S_1^2}{S_2^2} \sim F(v_1, v_2) \]
\[
F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2}.
\] Sin embargo, bajo la hipótesis nula \(H_0: \sigma_1^2 = \sigma_2^2\), ambas
varianzas poblacionales son iguales.
Por lo tanto, el cociente \(\sigma_1^2 /
\sigma_2^2 = 1\), y el estadístico se simplifica a:
\[ F_0 = \frac{S_1^2}{S_2^2}. \]
Dado que la distribución F tiene una forma muy sesgada hacia la derecha, y solo toma valores positivos, por conveniencia, para el cálculo del estadístico de prueba colocamos la varianza mayor en el numerador y así garantizar \(F_0≥1\): \[ F_0 = \frac{S_1^2}{S_2^2} = \frac{25}{16} = 1,5625 \] Así, el estadístico observado es: \(F_0 = 1,5625\)
La prueba es bilateral, con nivel de significancia:\(\alpha=0.10\) y \(\alpha/2 = 0,05\)
Apoyandonos de la función qf() en R:
alpha=0.10
v1=9
v2=11
F_sup <- qf(1 - alpha/2, v1, v2) # Límite superior
F_inf <- qf(alpha/2, v1, v2) # Límite inferior
F_inf; F_sup
## [1] 0.3223222
## [1] 2.896223
Entonces, los valores críticos para una distribución \(F(9,11)\) son:
\[
F_{\text{inf}} = F_{0{,}05;(9,11)} \approx 0{,}3323
\] \[
F_{\text{sup}} = F_{0{,}95;(9,11)} \approx 2{,}896
\]
library(knitr)
library(kableExtra)
tabla_decision <- data.frame(
Condición = c(
'$F \\le F_{\\alpha/2;v_1,v_2}$',
'$F \\ge F_{1-\\alpha/2;v_1,v_2}$',
'$F_{\\alpha/2;v_1,v_2} < F < F_{1-\\alpha/2;v_1,v_2}$'
),
Decisión = c(
'Rechazar $H_0$',
'Rechazar $H_0$',
'No rechazar $H_0$'
),
Interpretación = c(
'El estadístico cae en la "cola izquierda" => varianza 1 < varianza 2.',
'El estadístico cae en la "cola derecha" => varianza 1 > varianza 2.',
'El estadístico cae dentro del intervalo de aceptación => las varianzas pueden considerarse iguales.'
)
)
kable(tabla_decision, escape = FALSE, align = "c",
caption = "Regla de decisión para la prueba bilateral de igualdad de varianzas (Distribución F)") %>%
kable_styling(full_width = FALSE, position = "center",
font_size = 12,
bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>%
column_spec(1, bold = TRUE, width = "6cm") %>%
column_spec(2, bold = TRUE, color = "white", background = "#1565C0") %>%
column_spec(3, width = "10cm")
| Condición | Decisión | Interpretación |
|---|---|---|
| \(F \le F_{\alpha/2;v_1,v_2}\) | Rechazar \(H_0\) | El estadístico cae en la “cola izquierda” => varianza 1 < varianza 2. |
| \(F \ge F_{1-\alpha/2;v_1,v_2}\) | Rechazar \(H_0\) | El estadístico cae en la “cola derecha” => varianza 1 > varianza 2. |
| \(F_{\alpha/2;v_1,v_2} < F < F_{1-\alpha/2;v_1,v_2}\) | No rechazar \(H_0\) | El estadístico cae dentro del intervalo de aceptación => las varianzas pueden considerarse iguales. |
Entonces, la región de rechazo es:\(\mathcal{R} = \left\{ F : F < F_{\text{inf}} \ \text{o} \ F > F_{\text{sup}} \right\}= \left\{ F : F < 0{,}322 \ \text{o} \ F > 2{,}89 \right\}\)
Como \(F_0=1,5625\) se encuentra dentro del intervalo [0,322, 2,896], podemos afirmar que NO se rechaza \(H_0\)
# Librerías necesarias
library(ggplot2)
# Parámetros del problema
v1 <- 9 # grados de libertad del numerador
v2 <- 11 # grados de libertad del denominador
alpha <- 0.10
F0 <- 1.5625
# Valores críticos
F_inf <- qf(alpha/2, df1 = v1, df2 = v2)
F_sup <- qf(1 - alpha/2, df1 = v1, df2 = v2)
# Datos para la curva
x <- seq(0, 6, length.out = 600)
y <- df(x, df1 = v1, df2 = v2)
df_data <- data.frame(x, y)
# Gráfico
ggplot(df_data, aes(x, y)) +
geom_line(color = "steelblue", size = 1) +
# Sombrear regiones críticas
geom_area(data = subset(df_data, x <= F_inf),
aes(y = y), fill = "#EF5350", alpha = 0.5) +
geom_area(data = subset(df_data, x >= F_sup),
aes(y = y), fill = "#EF5350", alpha = 0.5) +
# Líneas verticales
geom_vline(xintercept = F_inf, linetype = "dashed", color = "red", linewidth = 0.9) +
geom_vline(xintercept = F_sup, linetype = "dashed", color = "red", linewidth = 0.9) +
geom_vline(xintercept = F0, linetype = "dashed", color = "darkgreen", linewidth = 1.1) +
# Etiquetas en el eje X
annotate("text", x = F_inf, y = -0.02, label = paste0("F_inf = ", round(F_inf, 3)),
color = "red", vjust = 1.5, size = 3.8, fontface = "bold", angle = 0) +
annotate("text", x = F_sup, y = -0.02, label = paste0("F_sup = ", round(F_sup, 3)),
color = "red", vjust = 1.5, size = 3.8, fontface = "bold", angle = 0) +
annotate("text", x = F0, y = -0.02, label = paste0("F = ", round(F0, 3)),
color = "darkgreen", vjust = 1.5, size = 3.8, fontface = "bold", angle = 0) +
# Líneas base invisibles para ampliar el margen inferior
expand_limits(y = -0.05) +
# Estilo del gráfico
labs(
title = paste0("Distribución F(", v1, ", ", v2, ") — Prueba Bilateral"),
x = "Valor F",
y = "Densidad"
) +
theme_minimal(base_size = 13) +
theme(
plot.title = element_text(face = "bold", size = 14, color = "#0D47A1"),
plot.subtitle = element_text(size = 11, color = "gray25"),
panel.grid.minor = element_blank(),
panel.grid.major.x = element_line(linetype = "dotted", color = "gray80"),
axis.text.y = element_blank(),
axis.ticks.y = element_blank(),
plot.margin = margin(10, 10, 25, 10)
)
Para una prueba bilateral, el valor P se calcula como:\(P\text{-valor} = 2 \cdot P\left(F \ge F_0\right)= 2 \cdot P\left(F(9,11) \ge 1{,}5625\right).\)
Al consultar en R:
p_right <- 1 - pf(F0, df1 = v1, df2 = v2) # cola derecha
p_valor <- 2 * p_right # prueba bilateral
c(p_right = p_right, p_valor = p_valor)
## p_right p_valor
## 0.2393248 0.4786496
Se obtiene entonces:\(P\left(F(9,11) \ge 1{,}5625\right) \approx 0{,}24.\)
Y por tanto:\(P-valor \approx 2 * 0{,}24 =0,48\)
Comparando el P-valor con el nivel de significancia: \(P-valor\approx 0,48 > \alpha=0.10\)
Por lo tanto, NO rechazamos la hipótesis nula H_0 de igualdad de varianzas.
Con un nivel de significancia del 10%, los datos no proporcionan evidencia suficiente para afirmar que las varianzas poblacionales de los dos materiales sean diferentes.En consecuencia, la suposición de varianzas iguales utilizada en el Ejemplo 3.5.7 se considera estadísticamente razonable.