1 Enunciado del Ejercicio 3.6.6

Al probar la diferencia en el desgaste abrasivo de los dos materiales en el ejemplo 3.3, se asumió que las varianzas poblacionales eran iguales. ¿Es esta justificación correcta? Utilice un nivel de significancia del 10% y halle también el \(P\)-valor.


1.0.0.1 Ejercicio base 3.5.7 (Datos de referencia)

Se llevó a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminados diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una máquina para medir el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observó la profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado) de 85 unidades con una desviación estándar muestral de 4, mientras que las muestras del material 2 dieron un promedio de 81 y una desviación estándar muestral de 5. ¿Puede concluirse en el nivel de significancia del 5% que el deterioro abrasivo del material 1 excede al del material 2 por más de 2 unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales. Halle también el P-valor.


2 Solución

2.1 Datos del problema

(1) Unidades experimentales: Piezas del material lamindado 1 y 2.

(2) Poblaciones: Deterioro abrasivo (Unidades).

(3) Estadístico: Razón de varianzas muestrales \(\frac{S_1^2}{S_2^2}\)

(4) Parámetro: Razón de varianzas poblacionales \(\theta = \frac{\sigma_1^2}{\sigma_2^2}\)

(5) Hipótesis: Queremos verificar si era correcto asumir varianzas iguales en el experimento de desgaste abrasivo, por tanto planteamos una prueba bilateral:

\[ H_0: \sigma_1^2 = \sigma_2^2 \quad \Longleftrightarrow \quad \theta = \frac{\sigma_1^2}{\sigma_2^2} = 1 \] \[ H_1: \sigma_1^2 \neq \sigma_2^2 \quad \Longleftrightarrow \quad \theta = \frac{\sigma_1^2}{\sigma_2^2} \neq 1 \] (6) Método de decisión: Para dar solución al problema consideramos los siguientes métodos de decisión:
a) Región crítica con \(\alpha = 0{,}10\)
b) P-valor

(7) Otros datos: 7.1 Tamaños muestrales:
\(n_1=12\)
\(n_2=10\)
7.2 Desviaciones estándar muestrales:
\(s_1=4\)
\(s_2=5\)
7.3 Varianzas muestrales:
\(s_1^2=16\)
\(s_2^2=25\)

2.2 2. Supuestos

Por hipótesis, se asume que las poblaciones son aproximadamente normales, por lo tanto:

¿Forma de la población? Ambas normales

2.3 Conclusión

La distribución muestral de la razón de varianzas de muestrales es F de Fisher con \(v_1=n_1 -1=11\) y \(v_2=n_2 -1=9\) grados de libertad: \[ F = \frac{S_1^2}{S_2^2} \sim F(v_1, v_2) \]

2.4 Fórmula

\[ F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2}. \] Sin embargo, bajo la hipótesis nula \(H_0: \sigma_1^2 = \sigma_2^2\), ambas varianzas poblacionales son iguales.
Por lo tanto, el cociente \(\sigma_1^2 / \sigma_2^2 = 1\), y el estadístico se simplifica a:

\[ F_0 = \frac{S_1^2}{S_2^2}. \]

2.5 Cálculo del estadístico

Dado que la distribución F tiene una forma muy sesgada hacia la derecha, y solo toma valores positivos, por conveniencia, para el cálculo del estadístico de prueba colocamos la varianza mayor en el numerador y así garantizar \(F_0≥1\): \[ F_0 = \frac{S_1^2}{S_2^2} = \frac{25}{16} = 1,5625 \] Así, el estadístico observado es: \(F_0 = 1,5625\)

2.6 Aplicación del método de decisión

2.6.1 Región crítica

La prueba es bilateral, con nivel de significancia:\(\alpha=0.10\) y \(\alpha/2 = 0,05\)
Apoyandonos de la función qf() en R:

alpha=0.10
v1=9
v2=11
F_sup <- qf(1 - alpha/2, v1, v2) # Límite superior
F_inf <- qf(alpha/2, v1, v2) # Límite inferior
F_inf; F_sup
## [1] 0.3223222
## [1] 2.896223

Entonces, los valores críticos para una distribución \(F(9,11)\) son:
\[ F_{\text{inf}} = F_{0{,}05;(9,11)} \approx 0{,}3323 \] \[ F_{\text{sup}} = F_{0{,}95;(9,11)} \approx 2{,}896 \]

library(knitr)
library(kableExtra)

tabla_decision <- data.frame(
  Condición = c(
    '$F \\le F_{\\alpha/2;v_1,v_2}$',  
    '$F \\ge F_{1-\\alpha/2;v_1,v_2}$',  
    '$F_{\\alpha/2;v_1,v_2} < F < F_{1-\\alpha/2;v_1,v_2}$'
  ),
  Decisión = c(
    'Rechazar $H_0$',
    'Rechazar $H_0$',
    'No rechazar $H_0$'
  ),
  Interpretación = c(
    'El estadístico cae en la "cola izquierda" => varianza 1 < varianza 2.',
    'El estadístico cae en la "cola derecha" => varianza 1 > varianza 2.',
    'El estadístico cae dentro del intervalo de aceptación => las varianzas pueden considerarse iguales.'
  )
)

kable(tabla_decision, escape = FALSE, align = "c",
      caption = "Regla de decisión para la prueba bilateral de igualdad de varianzas (Distribución F)") %>%
  kable_styling(full_width = FALSE, position = "center",
                font_size = 12,
                bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>%
  column_spec(1, bold = TRUE, width = "6cm") %>%
  column_spec(2, bold = TRUE, color = "white", background = "#1565C0") %>%
  column_spec(3, width = "10cm")
Regla de decisión para la prueba bilateral de igualdad de varianzas (Distribución F)
Condición Decisión Interpretación
\(F \le F_{\alpha/2;v_1,v_2}\) Rechazar \(H_0\) El estadístico cae en la “cola izquierda” => varianza 1 < varianza 2.
\(F \ge F_{1-\alpha/2;v_1,v_2}\) Rechazar \(H_0\) El estadístico cae en la “cola derecha” => varianza 1 > varianza 2.
\(F_{\alpha/2;v_1,v_2} &lt; F &lt; F_{1-\alpha/2;v_1,v_2}\) No rechazar \(H_0\) El estadístico cae dentro del intervalo de aceptación => las varianzas pueden considerarse iguales.

Entonces, la región de rechazo es:\(\mathcal{R} = \left\{ F : F < F_{\text{inf}} \ \text{o} \ F > F_{\text{sup}} \right\}= \left\{ F : F < 0{,}322 \ \text{o} \ F > 2{,}89 \right\}\)

Como \(F_0=1,5625\) se encuentra dentro del intervalo [0,322, 2,896], podemos afirmar que NO se rechaza \(H_0\)

# Librerías necesarias
library(ggplot2)

# Parámetros del problema
v1 <- 9     # grados de libertad del numerador
v2 <- 11    # grados de libertad del denominador
alpha <- 0.10
F0 <- 1.5625

# Valores críticos
F_inf <- qf(alpha/2, df1 = v1, df2 = v2)
F_sup <- qf(1 - alpha/2, df1 = v1, df2 = v2)

# Datos para la curva
x <- seq(0, 6, length.out = 600)
y <- df(x, df1 = v1, df2 = v2)
df_data <- data.frame(x, y)

# Gráfico
ggplot(df_data, aes(x, y)) +
  geom_line(color = "steelblue", size = 1) +
  
  # Sombrear regiones críticas
  geom_area(data = subset(df_data, x <= F_inf),
            aes(y = y), fill = "#EF5350", alpha = 0.5) +
  geom_area(data = subset(df_data, x >= F_sup),
            aes(y = y), fill = "#EF5350", alpha = 0.5) +
  
  # Líneas verticales
  geom_vline(xintercept = F_inf, linetype = "dashed", color = "red", linewidth = 0.9) +
  geom_vline(xintercept = F_sup, linetype = "dashed", color = "red", linewidth = 0.9) +
  geom_vline(xintercept = F0, linetype = "dashed", color = "darkgreen", linewidth = 1.1) +
  
  # Etiquetas en el eje X
  annotate("text", x = F_inf, y = -0.02, label = paste0("F_inf = ", round(F_inf, 3)),
           color = "red", vjust = 1.5, size = 3.8, fontface = "bold", angle = 0) +
  annotate("text", x = F_sup, y = -0.02, label = paste0("F_sup = ", round(F_sup, 3)),
           color = "red", vjust = 1.5, size = 3.8, fontface = "bold", angle = 0) +
  annotate("text", x = F0, y = -0.02, label = paste0("F = ", round(F0, 3)),
           color = "darkgreen", vjust = 1.5, size = 3.8, fontface = "bold", angle = 0) +
  
  # Líneas base invisibles para ampliar el margen inferior
  expand_limits(y = -0.05) +
  
  # Estilo del gráfico
  labs(
    title = paste0("Distribución F(", v1, ", ", v2, ") — Prueba Bilateral"),
    x = "Valor F",
    y = "Densidad"
  ) +
  theme_minimal(base_size = 13) +
  theme(
    plot.title = element_text(face = "bold", size = 14, color = "#0D47A1"),
    plot.subtitle = element_text(size = 11, color = "gray25"),
    panel.grid.minor = element_blank(),
    panel.grid.major.x = element_line(linetype = "dotted", color = "gray80"),
    axis.text.y = element_blank(),
    axis.ticks.y = element_blank(),
    plot.margin = margin(10, 10, 25, 10)
  )

2.6.2 P-Valor

Para una prueba bilateral, el valor P se calcula como:\(P\text{-valor} = 2 \cdot P\left(F \ge F_0\right)= 2 \cdot P\left(F(9,11) \ge 1{,}5625\right).\)

Al consultar en R:

p_right <- 1 - pf(F0, df1 = v1, df2 = v2)  # cola derecha
p_valor <- 2 * p_right                     # prueba bilateral
c(p_right = p_right, p_valor = p_valor)
##   p_right   p_valor 
## 0.2393248 0.4786496

Se obtiene entonces:\(P\left(F(9,11) \ge 1{,}5625\right) \approx 0{,}24.\)

Y por tanto:\(P-valor \approx 2 * 0{,}24 =0,48\)

Comparando el P-valor con el nivel de significancia: \(P-valor\approx 0,48 > \alpha=0.10\)

Por lo tanto, NO rechazamos la hipótesis nula H_0 de igualdad de varianzas.

2.7 Interpretación

Con un nivel de significancia del 10%, los datos no proporcionan evidencia suficiente para afirmar que las varianzas poblacionales de los dos materiales sean diferentes.En consecuencia, la suposición de varianzas iguales utilizada en el Ejemplo 3.5.7 se considera estadísticamente razonable.