Un estudio comparó las actitudes de las personas hacia el feminismo con su grado de “autoritarismo”. Se utilizaron dos muestras, una compuesta por 30 sujetos que fueron calificados como altos en autoritarismo, y una segunda muestra de 31 sujetos que fueron calificados como bajos. A cada sujeto se le aplicó una prueba de 18 ítems, diseñada para revelar actitudes sobre el feminismo, con puntuaciones informadas en una escala de 18 a 90 (las puntuaciones altas indicaban profeminismo). El resultado estadístico-descriptivo (exploratorio) del estudio es el siguiente:
| Autoritarismo | \(n_{i}\) | \(\bar{x}_{n_{i}}\) | \(s_{n_{i}}^{\prime}\) |
|---|---|---|---|
| Alto | 30 | 67.7 | 11.8 |
| Bajo | 31 | 52.4 | 13.0 |
La hipótesis nula en el estudio es que el autoritarismo no es un factor en las actitudes hacia el feminismo. Bajo \(H_{0}\), las puntuaciones de los tipos de autoritarismo alto y bajo son iguales en promedio: \(\delta=0\). Tomaremos \(\delta\neq0\) como la alternativa, por lo que los valores grandes de \(\left\vert \tfrac{\bar{X}_{n_{1}}-\bar{X}_{n_{2}}}{S_{p}\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}\right\vert\) en
\[ R=\left\{ (x_{1},\ldots,x_{n})\in \mathbb{R}^{n}:\left\vert \frac{\bar{x}_{n_1}-\bar{x}_{n_2}}{s_{p}\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}\right\vert >t_{n_{1}+n_{2}-2,\frac{\alpha}{2}}\right\} \]
son extremos y conducen al rechazo. Calculamos \(t_{n_{1}+n_{2}-2,\frac{\alpha}{2}}=2.001\)
(en R, qt(0.975,59)),
\[ t=\frac{\bar{x}_{n_{1}}-\bar{x}_{n_{2}}}{s_{p}\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}=\frac{67.7-52.4}{12.42\sqrt{\frac{1}{30}+\frac{1}{31}}}=4.81, \]
donde \(s_{p}=\sqrt{\frac{(n_{1}-1)s_{n_{1}}^{\prime2}+(n_{2}-1)s_{n_{2}%
}^{\prime2}}{n_{1}+n_{2}-2}}=12.42\). Observamos \(\text{p-valor}=10^{-5}\) (en
R,
2*min(pt(4.81, 59, lower.tail = T), pt(4.81, 59, lower.tail = F)))
a partir de lo cual se concluye que apenas existe evidencia alguna de
que sea cierta la hipótesis nula y que por ello se debería rechazar la
hipótesis nula bajo es supuesto de que la población se distribuye como
una v.a. normal y que para ambas poblaciones la varianza sea igual.
Obsérvese que la distribución \(t\)
con \(59\) g.l. tiende hacia la de una
normal cuando crece \(n\).
Alternativamente al anterior estadístico de contraste, al tener \(g.l.=n_{1}+n_{2}-2=59>40\), podríamos
cambiar a un estadístico de contraste asintótico y calcular \(z_{\frac{\alpha}{2}}=1.96\) (en
R, qnorm(0.975)),
\[ R=\left\{ (x_{1},\ldots,x_{n})\in \mathbb{R}^{n}:\left\vert \frac{\bar{x}_{n_{1}}-\bar{x}_{n_{2}}}{\sqrt{\frac{s^{\prime2}_{n_{1}}}{n_{1}}+\frac{s^{\prime2}_{n_{2}}}{n_{2}}}}\right\vert >z_{\frac{\alpha}{2}}\right\}. \]
Obtenemos
\[ z=\frac{\bar{x}_{n_{1}}-\bar{x}_{n_{2}}}{\sqrt{\frac{s^{\prime2}_{n_{1}}}{n_{1}}+\frac{s^{\prime2}_{n_{2}}}{n_{2}}}}=\frac{67.7-52.4}{\sqrt{\frac{11.8^{2}}{30}+\frac{13^{2}}{31}}}=4.82. \]
El resultado es muy cercano al valor anterior (generalmente, \(t\) y \(z\) no coincidirán exactamente, ya que se basan en diferentes estimaciones de varianza) y la decisión final es también la misma. Al obtener la misma decisión final no tenemos duda pero si tuviéramos dudas, ¿Cuál de los dos estadísticos es mejor? Si los tamaños muestrales fueran muy grandes apenas habrá diferencia, pero no es el caso. Si no existen evidencias de falta de normalidad de la población junto a la falta de igualdad de varianzas, el test de la \(t\) sería en principio mejor por ser un contraste exacto. El primer supuesto se podría explorar gráficamente con un gráfico de normalidad (existen también contrastes de hipótesis), mientras que el segundo se podría contrastar con un estadístico \(\chi^2\) para la igualdad de varianzas. En caso de que existieran evidencias en contra de alguno de los dos supuestos, se recurre al contraste asintótico, siempre y cuando los tamaños muestrales sean conjuntamente lo suficientemente grandes.
Con la información que tenemos no podemos llevar a cabo un estudio de la normalidad pero sí podemos llevar a cabo el contraste (bilateral) de igualdad de varianzas teniendo en cuenta que \[ R=\left\{ (x_{1},\ldots,x_{n})\in% %TCIMACRO{\U{211d} }% %BeginExpansion \mathbb{R} %EndExpansion ^{n}:\frac{s^{\prime2}_{n_{1}}}{s^{\prime2}_{n_{2}}}>F_{n_{1}-1,n_{2}-1,\frac{\alpha}{2}}% \quad\text{ó}\quad\frac{s^{\prime2}_{n_{1}}}{s^{\prime2}_{n_{2}}}<F_{n_{1}-1,n_{2}% -1,1-\frac{\alpha}{2}}\right\} . \]
Calculamos con \(\alpha=0.05\), las
dos cotas como \(F_{29,30-1,0.025}=0.478\) y \(F_{29,30,0.975}=2.083\), que con se
obtienen como y respectivamente. Con únicamente tablas de cuantiles a
derecha la cota izquierda se calcularía como \(F_{29,30,0.975}=\frac{1}{F_{30,29,0.025}}\).
Al ser \(\frac{s^{\prime2}_{n_{1}}}{s^{\prime2}_{n_{2}}}=\frac{11.8}{13}=0.907\)
un valor que queda fuera de la región de rechazo. El p-valor es 0.796,
que se calcula con R mediante
2*min(pf(11.8/13,29,30,lower.tail = T),pf(11.8/13,29,30,lower.tail = F))},
indica una falta de evidencia para poder rechazar la hipótesis de
igualdad de varianzas.