Las pruebas de hipótesis son una herramienta alternativa para hacer inferencia estadística sobre los parámetros de una población.
En pruebas de hipótesis se busca rechazar o no rechazar una afirmación acerca de una característica de la población, con base en la información de una muestra aleatoria de la población.
Para probar una hipótesis estadística, se utiliza directamente el método científico:
Hipótesis estadística (\(H\)): afirmación sobre la distribución de la población, que comúnmente se expresa por medio de un parámetro \(\theta\in\Theta\), donde \(\Theta\) es el conjunto de todos los posibles valores que puede asumir \(\theta\).
Ejemplos:
Hipótesis nula (\(H_0\)): hipótesis que refleja el estado actual de conocimiento de la población. Es la hipótesis que al final del protocolo se debe rechazar o no rechazar. \[ H_0: \theta\in\Theta_0\qquad \text{donde $\Theta_0\subset\Theta$.} \]
Hipótesis alternativa (\(H_1\)): hipótesis sobre la cual se quiere encontrar evidencia empírica. \[ H_1: \theta\in\Theta_1\qquad\text{donde $\Theta_1\subseteq\Theta$ y $\Theta_0\cap\Theta_1=\emptyset$.} \]
Sistema de hipótesis: pareja de hipótesis conformada por la hipótesis nula y la hipótesis alternativa.
\[H_0: \theta\in\Theta_0\qquad \text{frente a}\qquad H_1: \theta\in\Theta_1\,.\] Test (\(\tau\)): regla, norma, procedimiento o protocolo que permite tomar una decisión (rechazar \(H_0\) o no rechazar \(H_0\)).
Observaciones:
En un juicio el acusado se considera inocente hasta que se demuestre lo contrario más allá de cualquier duda razonable.
Cierto tipo de motor de automóvil emite una media de 100 mg de óxidos de nitrógeno (NO) por segundo con 100 caballos de fuerza. Se ha propuesto una modificación al diseño del motor para reducir las emisiones de NO. El nuevo diseño se producirá si se demuestra que la media de las emisiones es menor de 100 mg/seg. Se construye y se prueba una muestra de 50 motores modificados. La media muestral de emisiones de NO es de 92 mg/s, y la desviación estándar muestral es de 21 mg/s.
Cuando se hace una prueba de hipótesis podría ocurrir que la muestra no dé evidencias acerca de lo que ocurre en la población:
Errores tipo en el juzgamiento de hipótesis
El error tipo I consiste en rechazar la hipótesis nula, cuando ésta es cierta.
La probabilidad de cometer el error tipo I se llama nivel de significancia (\(\alpha\)) y se fija antes de iniciar el estudio:
\[\alpha = \textsf{Pr}(\text{Rechazar }H_0\mid H_0\text{ es cierta})\]
El complemento de \(\alpha\) es la confiabilidad:
\[1-\alpha = \textsf{Pr}(\text{No rechazar }H_0\mid H_0\text{ es cierta})\]
El error tipo II consiste en no rechazar la hipótesis nula, cuando ésta es falsa.
La probabilidad de cometer el error tipo II se llama función característica (\(\beta(\theta)\)) porque se puede calcular para cada \(\theta\in\Theta_1\):
\[\beta(\theta)=\textsf{Pr}(\text{No rechazar }H_0\mid H_0\text{ es falsa})\]
El complemento de \(\beta(\theta)\) se llama función de potencia:
\[\pi(\theta)=1-\beta(\theta) = \textsf{Pr}(\text{Rechazar }H_0\mid H_0\text{ es falsa})\]
En el ejemplo del juicio:
En el ejemplo de emisiones de óxidos de nitrógeno (NO):
¿Cómo decidir si se debe rechazar o no la hipótesis nula?
El valor \(p\) se define como
\[ p = \textsf{Pr}(\text{Observar datos tan o más extremos en dirección de } H_1\mid H_0\text{ es cierta}) \] El test consiste en:
\[\tau:\text{Rechazar }H_0\text{ si el valor }p<\alpha\]
En el ejemplo de emisiones de óxidos de nitrógeno (NO):
Sistema de hipótesis: \(H_0:\mu = 100\) frente a \(H_1:\mu < 100\).
Nivel de significancia: \(\alpha = 0.05\).
Valor \(p\):
Bajo \(H_0\), se tiene que el estadístico de prueba es
\[Z = \frac{\bar{X} - \mu_0}{S/\sqrt{n}}\sim\textsf{N}(0,1)\] que al calcularse con la información muestral (\(n=50\), \(\bar{x} = 92\), \(s = 21\)) da como resultado \(z_c=-2.69\).
La región crítica (región de rechazo) es \((-\infty,-1.64)\).
# info muestral
n <- 50
xb <- 92
s <- 21
# valor hipotetico
mu0 <- 100
# estadistico de prueba
est <- (xb - mu0)/(s/sqrt(n))
print(est)
## [1] -2.69374
# percentil 5% (cola izquierda)
z05 <- qnorm(p = 0.05)
z05
## [1] -1.644854
El valor \(p\) es
\[p = \textsf{Pr}(Z < z_c\mid H_0\text{ es cierta}) = \int_{-\infty}^{z_c} f_Z(z)\,\textsf{d}z = 0.003532762\]
# valor p
pnorm(q = est, lower.tail = TRUE)
## [1] 0.003532762
Intervalo de confianza unilateral:
Utilizando la cantidad pivotal se tiene que \[ \textsf{Pr}\left( \textsf{z}_\alpha < Z \right) = \textsf{Pr}\left( \textsf{z}_\alpha < \frac{\bar{X} - \mu}{S/\sqrt{n}} \right) = \textsf{Pr}\left( \mu < \bar{X} - \text{z}_{\alpha}\,\frac{S}{\sqrt{n}} \right) = \textsf{Pr}\left( \mu < \bar{X} + \text{z}_{1-\alpha}\,\frac{S}{\sqrt{n}} \right) = 1-\alpha \]
El intervalo calculado es \((-\infty; 96.88)\).
# info muestral
n <- 50
xb <- 92
s <- 21
# percentiles
z05 <- qnorm(p = 0.05)
z95 <- qnorm(p = 0.95)
# intervalo de confianza unilateral al 95%
xb - z05*s/sqrt(n)
## [1] 96.88497
xb + z95*s/sqrt(n)
## [1] 96.88497
Decisión: rechazar \(H_0\) dado que \(p = 0.0035 < \alpha = 0.05\).
Conclusión: existe suficiente evidencia empírica para establecer que el diseño del motor modificado sí reduce significativamente las emisiones de NO promedio a menos de 100 mg/s.
Potencia de la prueba:
\[ \begin{align*} \pi(\mu) &= \textsf{Pr}\left(Z < -1.64\mid H_0\text{ es falsa}\right) \\ &=\textsf{Pr}\left(\frac{\bar{X}-100}{S/\sqrt{n}} < -1.64\mid \mu < 100\right) \\ &=\textsf{Pr}\left(\bar{X} < 100 -1.64\frac{S}{\sqrt{n}}\mid \mu < 100\right) \\ &=\textsf{Pr}\left( Z < \frac{100 - \mu}{S/\sqrt{n}} -1.64\right) \\ \end{align*} \]
# funcion de potencia
f <- function (mu, mu0, n, s, alpha) {
z_alpha <- qnorm(p = alpha)
z <- (mu0 - mu)/(s/sqrt(n)) + z_alpha
return(pnorm(q = z, lower.tail = TRUE))
}
# funcion de caracteristica
g <- function (mu, mu0, n, s, alpha) {
z_alpha <- qnorm(p = alpha)
z <- (mu0 - mu)/(s/sqrt(n)) + z_alpha
return(pnorm(q = z, lower.tail = FALSE))
}
# grafico de la funcion de potencia
curve(expr = f(x, mu0 = 100, n = 50, s = 21, alpha = 0.05), lwd = 2, col = 4, from = 85, to = 100, ylim = c(0,1), xlab = expression(mu), ylab = "Potencia")
curve(expr = g(x, mu0 = 100, n = 50, s = 21, alpha = 0.05), lwd = 2, col = 2, add = TRUE)