Se desea probar si las medias poblacionales son iguales o distintas:
\[ \begin{cases} H_0: \mu_1 = \mu_2 & \text{(no hay diferencia de medias)} \\ H_A: \mu_1 \neq \mu_2 & \text{(las medias son diferentes)} \end{cases} \]
Nivel de significación: \(\alpha = 0.05\)
Se usa una prueba t de Welch para dos muestras
independientes (no se asumen varianzas iguales).
Criterio: se rechaza \(H_0\) si \(p\text{-valor} < \alpha\).
Conclusión: los supuestos se consideran razonablemente satisfechos.
Estimador de la diferencia: \[ D = \bar{x}_1 - \bar{x}_2 \]
Error estándar: \[ SE = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} \]
Estadístico t: \[ t = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{SE} \]
Grados de libertad (Welch): \[ \nu = \frac{\left( \dfrac{s_1^2}{n_1} + \dfrac{s_2^2}{n_2} \right)^2} {\dfrac{s_1^4}{n_1^2 (n_1-1)} + \dfrac{s_2^4}{n_2^2 (n_2-1)}} \]
p-valor (bilateral): \[ p = 2 \cdot P(T_{\nu} \ge |t|) \]
Error estándar:
\[ SE = \sqrt{\frac{0.839^2}{186} + \frac{0.966^2}{172}} = \sqrt{\frac{0.704721}{186} + \frac{0.933156}{172}} \approx 0.09597 \]
Diferencia muestral:
\[ D = \bar{x}_1 - \bar{x}_2 = 0.379 \]
Estadístico t:
\[ t = \frac{0.379}{0.09597} \approx 3.949 \]
Grados de libertad (aprox. Welch):
\[ \nu \approx 339.9 \ (\text{aprox. } 340) \]
p-valor (bilateral):
\[ p \approx 7.8 \times 10^{-5} \ (\approx 0.000078) \]
Comparando con el nivel de significación: \[ 0.000078 < 0.05 \implies \text{Rechazamos } H_0 \]
Decisión: se rechaza la hipótesis nula al 5% de significación.
Existe evidencia estadística significativa de que
las medias poblacionales difieren entre hombres y mujeres.
La media de los hombres (\(4.059\)) es mayor que la de las
mujeres (\(3.680\)), y
la diferencia observada de aproximadamente 0.379 en la escala 1–5 es
estadísticamente significativa (\(p \approx
0.000078\)).
Interpretación práctica:
Los expertos hombres tienden a mostrar un mayor acuerdo con la
afirmación “Las mujeres matemáticas tienen la misma oferta de
trabajo que los hombres” que las expertas mujeres. Esta diferencia
no puede atribuirse al azar con un nivel de significación del 5%.