Nivel de Significancia en Pruebas de Hipótesis

Introducción

La prueba de hipótesis es una herramienta estadística utilizada para tomar decisiones sobre una población a partir de información obtenida de una muestra.

Uno de los conceptos más importantes en este proceso es el nivel de significancia, representado por la letra griega α (alfa).

El nivel de significancia representa la probabilidad máxima de cometer un Error Tipo I, es decir, rechazar una hipótesis nula cuando en realidad es verdadera.

Los valores más utilizados son:

Nivel de Confianza Nivel de Significancia
90% 0.10
95% 0.05
99% 0.01

Conceptos Fundamentales

Hipótesis Nula (H₀)

Representa la afirmación que se desea poner a prueba.

Ejemplo:

\[ H_0:\mu = 50 \]

La media poblacional es igual a 50.

Hipótesis Alternativa (H₁)

Representa la afirmación que se acepta cuando existe suficiente evidencia para rechazar la hipótesis nula.

Ejemplo:

\[ H_1:\mu \neq 50 \]

La media poblacional es diferente de 50.


Error Tipo I y Error Tipo II

Decisión Realidad: H₀ Verdadera Realidad: H₀ Falsa
No rechazar H₀ Correcto Error Tipo II
Rechazar H₀ Error Tipo I Correcto

El nivel de significancia controla la probabilidad de cometer un Error Tipo I.


Distribución Normal Estándar

La distribución normal estándar tiene media 0 y desviación estándar 1.

x <- seq(-4,4,0.01)

y <- dnorm(x)

plot(x,y,
     type="l",
     lwd=3,
     main="Distribución Normal Estándar",
     xlab="Valor Z",
     ylab="Densidad")


Nivel de Significancia α = 0.05

Cuando se trabaja con una prueba bilateral y α = 0.05, el área de rechazo se divide en dos colas:

\[ \alpha/2 = 0.025 \]

Los valores críticos son:

z_critico_izq <- qnorm(0.025)

z_critico_der <- qnorm(0.975)

z_critico_izq
## [1] -1.959964
z_critico_der
## [1] 1.959964

Visualización de la Región de Rechazo

x <- seq(-4,4,0.01)

y <- dnorm(x)

plot(x,y,
     type="l",
     lwd=3,
     main="Nivel de Significancia α = 0.05",
     xlab="Valor Z",
     ylab="Densidad")

abline(v=qnorm(0.025),
       col="red",
       lwd=3)

abline(v=qnorm(0.975),
       col="red",
       lwd=3)

text(-2.5,0.05,"Región\nRechazo")
text(2.5,0.05,"Región\nRechazo")

Las zonas rojas representan las regiones donde se rechaza la hipótesis nula.


Ejemplo Práctico

Suponga que una empresa afirma que sus focos duran en promedio 1000 horas.

Se toma una muestra de 30 focos y se obtiene:

Se desea probar:

\[ H_0:\mu = 1000 \]

\[ H_1:\mu \neq 1000 \]


Cálculo del Estadístico de Prueba

media_muestral <- 950

media_poblacional <- 1000

desviacion <- 120

n <- 30

z <- (media_muestral-media_poblacional)/(desviacion/sqrt(n))

z
## [1] -2.282177

Obtención del Valor-p

valor_p <- 2*pnorm(z)

valor_p
## [1] 0.02247887

Regla de Decisión

alpha <- 0.05

if(valor_p < alpha){
  "Se rechaza H0"
}else{
  "No se rechaza H0"
}
## [1] "Se rechaza H0"

Interpretación

## El valor-p es menor que el nivel de significancia. Existe evidencia estadística suficiente para rechazar la hipótesis nula.

Relación entre α y el Valor-p

La decisión en una prueba de hipótesis puede resumirse mediante la siguiente regla:


Resumen

resumen <- data.frame(
  Concepto = c("Nivel de Significancia",
               "Valor Crítico Inferior",
               "Valor Crítico Superior",
               "Estadístico Z",
               "Valor-p"),
  Valor = c(
    alpha,
    qnorm(0.025),
    qnorm(0.975),
    z,
    valor_p
  )
)

resumen
##                 Concepto       Valor
## 1 Nivel de Significancia  0.05000000
## 2 Valor Crítico Inferior -1.95996398
## 3 Valor Crítico Superior  1.95996398
## 4          Estadístico Z -2.28217732
## 5                Valor-p  0.02247887

Conclusiones

El nivel de significancia es una herramienta fundamental en las pruebas de hipótesis porque establece el riesgo máximo aceptable de cometer un Error Tipo I.

En la práctica, los niveles más utilizados son 0.10, 0.05 y 0.01, correspondientes a niveles de confianza del 90%, 95% y 99%, respectivamente.

La comparación entre el valor-p y el nivel de significancia permite tomar decisiones objetivas acerca de la hipótesis nula y facilita la interpretación de los resultados estadísticos.