La prueba de hipótesis es una herramienta estadística utilizada para tomar decisiones sobre una población a partir de información obtenida de una muestra.
Uno de los conceptos más importantes en este proceso es el nivel de significancia, representado por la letra griega α (alfa).
El nivel de significancia representa la probabilidad máxima de cometer un Error Tipo I, es decir, rechazar una hipótesis nula cuando en realidad es verdadera.
Los valores más utilizados son:
| Nivel de Confianza | Nivel de Significancia |
|---|---|
| 90% | 0.10 |
| 95% | 0.05 |
| 99% | 0.01 |
Representa la afirmación que se desea poner a prueba.
Ejemplo:
\[ H_0:\mu = 50 \]
La media poblacional es igual a 50.
Representa la afirmación que se acepta cuando existe suficiente evidencia para rechazar la hipótesis nula.
Ejemplo:
\[ H_1:\mu \neq 50 \]
La media poblacional es diferente de 50.
| Decisión | Realidad: H₀ Verdadera | Realidad: H₀ Falsa |
|---|---|---|
| No rechazar H₀ | Correcto | Error Tipo II |
| Rechazar H₀ | Error Tipo I | Correcto |
El nivel de significancia controla la probabilidad de cometer un Error Tipo I.
La distribución normal estándar tiene media 0 y desviación estándar 1.
x <- seq(-4,4,0.01)
y <- dnorm(x)
plot(x,y,
type="l",
lwd=3,
main="Distribución Normal Estándar",
xlab="Valor Z",
ylab="Densidad")
Cuando se trabaja con una prueba bilateral y α = 0.05, el área de rechazo se divide en dos colas:
\[ \alpha/2 = 0.025 \]
Los valores críticos son:
z_critico_izq <- qnorm(0.025)
z_critico_der <- qnorm(0.975)
z_critico_izq
## [1] -1.959964
z_critico_der
## [1] 1.959964
x <- seq(-4,4,0.01)
y <- dnorm(x)
plot(x,y,
type="l",
lwd=3,
main="Nivel de Significancia α = 0.05",
xlab="Valor Z",
ylab="Densidad")
abline(v=qnorm(0.025),
col="red",
lwd=3)
abline(v=qnorm(0.975),
col="red",
lwd=3)
text(-2.5,0.05,"Región\nRechazo")
text(2.5,0.05,"Región\nRechazo")
Las zonas rojas representan las regiones donde se rechaza la hipótesis nula.
Suponga que una empresa afirma que sus focos duran en promedio 1000 horas.
Se toma una muestra de 30 focos y se obtiene:
Se desea probar:
\[ H_0:\mu = 1000 \]
\[ H_1:\mu \neq 1000 \]
media_muestral <- 950
media_poblacional <- 1000
desviacion <- 120
n <- 30
z <- (media_muestral-media_poblacional)/(desviacion/sqrt(n))
z
## [1] -2.282177
valor_p <- 2*pnorm(z)
valor_p
## [1] 0.02247887
alpha <- 0.05
if(valor_p < alpha){
"Se rechaza H0"
}else{
"No se rechaza H0"
}
## [1] "Se rechaza H0"
## El valor-p es menor que el nivel de significancia. Existe evidencia estadística suficiente para rechazar la hipótesis nula.
La decisión en una prueba de hipótesis puede resumirse mediante la siguiente regla:
resumen <- data.frame(
Concepto = c("Nivel de Significancia",
"Valor Crítico Inferior",
"Valor Crítico Superior",
"Estadístico Z",
"Valor-p"),
Valor = c(
alpha,
qnorm(0.025),
qnorm(0.975),
z,
valor_p
)
)
resumen
## Concepto Valor
## 1 Nivel de Significancia 0.05000000
## 2 Valor Crítico Inferior -1.95996398
## 3 Valor Crítico Superior 1.95996398
## 4 Estadístico Z -2.28217732
## 5 Valor-p 0.02247887
El nivel de significancia es una herramienta fundamental en las pruebas de hipótesis porque establece el riesgo máximo aceptable de cometer un Error Tipo I.
En la práctica, los niveles más utilizados son 0.10, 0.05 y 0.01, correspondientes a niveles de confianza del 90%, 95% y 99%, respectivamente.
La comparación entre el valor-p y el nivel de significancia permite tomar decisiones objetivas acerca de la hipótesis nula y facilita la interpretación de los resultados estadísticos.