Pruebas de Hipótesis

Cuando estamos dispuestos a realizar una prueba de hipótesis, en la forma más general, nos interesa establecer una hipótesis respecto a la población que se está estudiando (generalmente sobre sus parámetros), de la cual, basándonos en una muestra de la misma tenemos como objetivo, decidir entre la hipótesis planteada y una hipótesis complementaria, cual de estas es verdadera.

Las hipótesis se contrastan en la siguiente expresión:

$H_{0}: H_{0} \text{ es verdadera} \quad vs \quad H_{1}: H_{0} \text{ es falsa}$ Donde $H_{0}$ es llamada hipótesis nula y $H_{1}$ es llamada hipótesis alternativa, complementaria o de investigación.

Al inferir sobre un parámetro poblacional $\theta$ , se define el espacio de parámetros $\Theta = \Theta_{0} \cup \Theta_{1}$ , y el contraste se establece como

$H_{0}: \theta \in \Theta_{0} \quad vs \quad H_{1}: \theta \in \Theta_{1}$ Se define además un estadístico de prueba o cantidad Pivotal $T$ que está en función de la muestra y el parámetro del cual deseamos inferir de tal forma que, el estadístico de prueba T siga una distribución conocida $D$ bajo el supuesto de que $H_{0}$ es verdadera.

$T \stackrel{H_0}{\sim} D(x; \theta_{0})$

La regla de decisión consta de una llamada Regíón Crítica o de Rechazo (RC) con una probabilidad de cometer Error tipo I(Rechazar $H_{0}$ dado que $H_{0}$ es verdadera), de tal forma que, si el estadístico observado $T \in RC$ , entonces se rechaza la hipótesis $H_{0}$ a favor de $H_{1}$ en base a la evidencia observada.

Valor-P

Una alternativa a la región crítica es el valor p.

El valor p se define como la probabilidad de que el estadístico de prueba tome valores mayores al observado, es decir

$p_{value} = \textbf{P}(T> T_{obs})$

Este es el mínimo nivel de significancia $\alpha$ para el cual es posible rechazar $H_{0}$ .

Para un nivel de significancia $\alpha$ .

Si el valor- $p \leq \alpha$ : Rechazamos $H_0$ .
Si el valor- $p > \alpha$ : No rechazamos $H_0$ .

Prueba de Hipótesis para la Media $\mu$

$\sigma^{2}$ Conocida

Sea $X_{1}, X_{2},\dots , X_{n}$ una muestra aleatoria de una población $N(\mu, \sigma^{2})$ o, bajo las condiciones del Teorema del Límite Central (TLC), la variable aleatoria

$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \stackrel{D}{\longrightarrow} Z$

converge en distribución a una normal estándar $Z$ .

Contraste de Hipótesis

$\begin{aligned} H_0 : \mu = \mu_0 \quad \text{vs} \quad H_1: & \mu \neq \mu_0 & (\text{bilateral}) \\ & \mu < \mu_0& (\text{unilateral a la izquierda}) \\ & \mu > \mu_0& (\text{unilateral a la derecha}) \end{aligned}$ Basado en la distribución muestral de $\bar{X}$

$\begin{aligned} Z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}} \stackrel{H_0}{\sim} N(0, 1). \end{aligned}$

Región crítica o de rechazo:

$H_1 : \mu \neq \mu_0 \Rightarrow C(x) = \{ x \in \mathbb{R}^n : |z_{\text{obs}}| > z_{1-\alpha/2} \}$ .
$H_1 : \mu < \mu_0 \Rightarrow C(x) = \{ x \in \mathbb{R}^n : z_{\text{obs}} < z_{\alpha} \}$ .
$H_1 : \mu > \mu_0 \Rightarrow C(x) = \{ x \in \mathbb{R}^n : z_{\text{obs}} > z_{1-\alpha} \}$ .

Ejemplo:

Una fábrica de lápices afirma que la longitud promedio de sus lápices es de 17 centímetros, con una desviación estándar de 0.5 centímetros. Un grupo de estudiantes desea verificar esta afirmación seleccionando una muestra aleatoria de 30 lápices y midiendo su longitud. Después de realizar las mediciones, obtienen una media muestral de 16.8 centímetros. Se desea probar la hiótesis a un nivel $\alpha = 0.03$ de significancia.

Se plantea el contraste

$H_{0}: \mu = 17 \quad vs \quad H_{1}: \mu \neq 17 \quad (\mu \neq \mu_{0})$

Por TLC con $n \geq 30$

$\begin{aligned} Z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}} \stackrel{H_0}{\sim} N(0, 1). \end{aligned}$
Calculamos el estadístico de Prueba observado

n <- 30 # Tamaño de La muestra
var <- 0.5^{2} # Varianza Poblacional
mu_0 <- 17 # Media bajo Hipótesis Nula
x_barra <- 16.8 # Estadístico Observado
alpha <- 0.03 # Nivel de significancia

(Z <- (x_barra - mu_0)/sqrt(var/n))# Estadístico de Prueba

[1] -2.19089

Calculamos el percentil $z_{1 -\alpha}$

(z_alpha <- qnorm(1 - (alpha/2))) # Percentil 1 - 0.03 de Una dist. Normal Estándar

[1] 2.17009

Verificamos el estadístico observado en la región crítica

$RC:\left\{\left|z_{obs}\right| > z_{1-\alpha/2}\right\}$

(abs(Z) > z_alpha)

[1] TRUE

Basandonos en el $P_{value} = \mathbb{P}(|Z| > z_{obs})$

# P(|Z|>z) = P(Z < -z) + P(Z > z) = 2*P(Z > z)
(pvalue <- 2*pnorm(Z,lower.tail = TRUE))

[1] 0.02845974

(pvalue < alpha)

[1] TRUE

Dado que el estadístico de Prueba pertenece a la Región de rechazo, con un nivel de significancia del 0.03, existe evidencia suficiente para decir que la longitud promedio de los lápices es diferente de 17cm.

Por otra parte con un valor p de 0.0284 < 0.03, se llega a la misma conclusión.

$\sigma^{2}$ Desconocida

Sea $X_{1}, X_{2},\dots , X_{n}$ una muestra aleatoria de una población $N(\mu, \sigma^{2})$ , con $S^{2} = \frac{1}{n-1}\sum_{i = 1}^{n}(x_{i}-\bar{x})^{2}$ el estimador de $\sigma^{2}$

Basado en la distribución muestral de $\bar{X}$

$\begin{aligned} t = \frac{\bar{X} - \mu_0}{S/\sqrt{n}} \stackrel{H_0}{\sim} t_{(n-1)}. \end{aligned}$

Región crítica o de rechazo:

$H_1 : \mu \neq \mu_0 \Rightarrow RC = \{ x \in \mathbb{R}^n : |t_{\text{obs}}| > t_{(n-1, 1-\alpha/2)} \}$ .
$H_1 : \mu < \mu_0 \Rightarrow RC = \{ x \in \mathbb{R}^n : t_{\text{obs}} < t_{(n-1, \alpha)} \}$ .
$H_1 : \mu > \mu_0 \Rightarrow RC = \{ x \in \mathbb{R}^n : t_{\text{obs}} > t_{(n-1, 1-\alpha)} \}$ .

Observación: Si n es lo suficientemente grande, $\frac{\bar{X} - \mu_0}{s/\sqrt{n}} \stackrel{H_0}{\sim} N(0,1)$ y el procedimiento es el mismo que para $\sigma^{2}$ conocido

Ejemplo:

Un estudio se propone examinar si la estatura promedio de los estudiantes de una universidad difiere de la cifra convencional de 175 cm. Se seleccionó una muestra aleatoria de 20 estudiantes matriculados en diferentes programas académicos. Cada estudiante tuvo su estatura registrada en centímetros. El objetivo es investigar si hay suficiente evidencia en los datos recolectados para respaldar la idea de que la estatura promedio de los estudiantes es mayor de 175 cm. Las mediciones de 20 estudiantes seleccionados aleatoriamente son:

168.5	171.8	168.9	166.8	167.9
172.3	169.6	170.5	168.3	170.4
170.1	173.2	172.0	170.7	168.6
165.7	167.4	169.2	171.2	172.1

Suponiendo que la estatura de los estudiantes proviene de una distribución $N(\mu, \sigma^{2})$ , se plantea el siguiente contraste.

$H_{0}: \mu = 175 \quad vs \quad H_{1}: \mu > 175 \quad (\mu > \mu_{0})$

Calculamos el estadístico de prueba Observado:

estatura <- c(168.5, 172.3, 170.1, 165.7, 171.8, 169.6, 173.2, 167.4,168.9, 170.5, 172.0, 169.2, 166.8, 168.3, 170.7, 171.2,167.9, 170.4, 168.6, 172.1) #DATOS

n <- length(estatura) # Tamaño de la muestra

mu_0 <- 175 # Media bajo la Hipótesis Nula
s <- sd(estatura) # Desviación Estándar de la muestra
x_barra <- mean(estatura) # Media Muestral

(t_obs <- (x_barra - mu_0)/(s/sqrt(n)))

[1] -11.61145

Calculamos el percentil $t_{19,1-\alpha}$ , estableciendo $\alpha = 0.05$

alpha <- 0.05
(t_alpha <- qt(1 - alpha, df = n - 1))

[1] 1.729133

Verificamos el estadístico observado en la Región Crítica

$RC : \{t_{\text{obs}} > t_{(n-1, 1-\alpha)} \}$

(t_obs > t_alpha)

[1] FALSE

Basándonos en el $P_{value}= \mathbb{P}(t > t_{obs})$

(pvalue <- pt(t_obs, df = n - 1, lower.tail = FALSE))

[1] 1

pvalue < alpha

[1] FALSE

Ya que el valor observado no se encuentra en la Región Crítica, con un nivel de significancia de 0.05, podemos decir que no hay evidencia suficiente para decir que la estatura promedio de los estudiantes universitarios es mayor a 175cm.

Con un valor p de 1 > 0.05, la evidencia a favor de $H_{0}$ es muy fuerte.

Otra alternativa para realizar este contraste de hipótesis en Rstudio es la función t.test

t.test(estatura, # Muestra
       mu = mu_0, # Media de la hipótesis nula
       alternative = "greater", # Dirección del contraste ("two.sided", "less", "greater")
       conf.level = 1 - alpha # Nivel de Confianza para el IC
       )


    One Sample t-test

data:  estatura
t = -11.611, df = 19, p-value = 1
alternative hypothesis: true mean is greater than 175
95 percent confidence interval:
 168.9797      Inf
sample estimates:
mean of x 
   169.76

Prueba de Hipótesis para la Varianza $\sigma^{2}$

Se tiene la muestra $X_1, \ldots, X_n$ provieniente de una población normal, $X \sim N(\mu, \sigma^2)$ .

Se establece el contraste de hipótesis para $\sigma^{2}$ :

$\begin{aligned} H_0 : \sigma^2 = \sigma^2_0 \quad \text{vs} \quad H_1: & \sigma^2 \neq \sigma^2_0 & (\text{bilateral}) \\ & \sigma^2 < \sigma^2_0& (\text{unilateral a la izquierda}) \\ & \sigma^2 > \sigma^2_0& (\text{unilateral a la derecha}) \end{aligned}$

Con el estadístico de Prueba

$Q = \frac{(n - 1) s^2}{\sigma_0^2} \stackrel{H_0}{\sim} \chi_{(n-1)}^2.$

Región Crítica o de rechazo:

$H_1 : \sigma^2 \neq \sigma^2_0$ $\Rightarrow RC = \{ x \in \mathbb{R}^n : q_{\text{obs}} < \chi^2_{(n-1, \alpha/2)} \text{ o } q_{\text{obs}} > \chi^2_{(n-1, 1-\alpha/2)} \}$
$H_1 : \sigma^2 < \sigma^2_0 \Rightarrow RC = \{ x \in \mathbb{R}^n : q_{\text{obs}} < \chi^2_{(n-1, \alpha)} \}$ .
$H_1 : \sigma^2 > \sigma^2_0 \Rightarrow RC = \{ x \in \mathbb{R}^n : q_{\text{obs}} > \chi^2_{(n-1, 1-\alpha)} \}$ .

Ejemplo:

Se hicieron las siguientes observaciones sobre la tenacidad a la fractura de una placa base de acero inoxidable con 18% de níquel:

69.5	72.6	73.3	75.5	75.8	76.2	77.0	78.1	79.7	80.1	83.7
71.9	73.1	73.5	75.7	76.1	76.2	77.9	79.6	79.9	82.2	93.7

Se cree que la desviación estándar de la distribución de la dureza de la fractura es de 4 unidades, mientras que el operador percibe que esta variabilidad pudo haber aumentado. Realice el contraste con una significancia de 0.01

Suponiendo que las observaciones sobre la tenacidad a la fractura provienen de una distribución $N(\mu, \sigma^{2})$ . Se define el siguiente contraste

$H_0 : \sigma^2 = 4^{2}\quad \text{vs} \quad H_1: \sigma^2 > 4^{2} \quad (\sigma^2 > \sigma^2_0)$

Calculamos el estadístico observado

datos <-  c(69.5, 71.9 ,72.6, 73.1 ,73.3, 73.5 ,
            75.5 ,75.7, 75.8 ,76.1, 76.2 ,76.2,
            77.0, 77.9 ,78.1 ,79.6, 79.7, 79.9,
            80.1, 82.2, 83.7 ,93.7)
n <- length(datos)

alpha <- 0.01

sig_0 <- 4^{2}

S_2 <- var(datos)

(qobs <- ((n - 1)*S_2)/sig_0)

[1] 33.29548

Calculamos el percentil $\chi^{2}_{(19,0.95)}$

(chiq <- qchisq(1 - alpha, df = n - 1))

[1] 38.93217

Verificamos en la Región Crítica

$RC = \{ x \in \mathbb{R}^n : q_{\text{obs}} > \chi^2_{(n-1, 1-\alpha)} \}$

qobs > chiq

[1] FALSE

Basándonos en el $P_{value}= \mathbb{P}(\chi_{(19)} > q_{obs})$

pchisq(q = qobs, df = n - 1, lower.tail = FALSE)

[1] 0.04304163

Con un valor p > 0.01, no hay evidencia suficiente para decir que la varianza de la dureza de la fractura es mayor que $4^{2}$ unidades cuadradas.

Prueba de Hipótesis para la proporción $p$

Sea $X_{1}, X_{2},\dots , X_{n}$ una muestra aleatoria de una población con cierta característica de interés. Para un $n$ suficientemente grande

$Z = \frac{\hat{p} - p_{0}}{\sqrt{\frac{p_{0}(1 - p_{0})}{n}}} \stackrel{H_0}{\sim} N(0 , 1)$

Contraste de Hipótesis

$\begin{aligned} H_0 : p = p_0 \quad \text{vs} \quad H_1: & p \neq p_0 & (\text{bilateral}) \\ & p < p_0& (\text{unilateral a la izquierda}) \\ & p > p_0& (\text{unilateral a la derecha}) \end{aligned}$

Región crítica o de rechazo:

$H_1 : p \neq p_0 \Rightarrow RC = \{ x \in \mathbb{R}^n : |z_{\text{obs}}| > z_{1-\alpha/2} \}$ .
$H_1 : p < p_0 \Rightarrow RC = \{ x \in \mathbb{R}^n : z_{\text{obs}} < z_{\alpha} \}$ .
$H_1 : p > p_0 \Rightarrow RC = \{ x \in \mathbb{R}^n : z_{\text{obs}} > z_{1-\alpha} \}$ .

Ejemplo:

Se cree que la proporción de productos defectuosos en una línea de producción es del 10%, mientras que la gerencia sospecha que esta proporción podría ser mayor. Realice el contraste con una significancia de 0.05, utilizando una muestra de 500 productos, de los cuales 75 resultaron defectuosos.

Se tiene el siguiente contraste

$H_0: p = 0.10 \quad \text{vs} \quad H_1: p > 0.10 \quad (p > p_0)$

Calculamos el estadístico observado:

# Se establecen los datos y parámetros
exitos <- 75
total <- 500
alpha <- 0.05
prop_0 <- 0.10  # Proporción bajo la hipótesis nula

# Se calcula la proporción muestral
prop_muestral <- exitos / total

# Se calcula el estadístico de contraste (Z)
z_obs <- (prop_muestral - prop_0) / sqrt((prop_0 * (1 - prop_0) / total))

z_obs

[1] 3.72678

Calculamos el percentil para $Z_{ 1 - \alpha}$ :

# Se calcula el percentil Z para el nivel de significancia dado
z_crit <- qnorm(1 - alpha)

z_crit

[1] 1.644854

Verificamos en la Región Crítica:

$RC = \{ x \in \mathbb{R} : z_{\text{obs}} > z_{\alpha} \}$

z_obs > z_crit

[1] TRUE

Basándonos en el valor p:

#Se calcula el valor p

p_value <- pnorm(z_obs, lower.tail = FALSE)
p_value

[1] 9.697081e-05

Basándonos en un valor p cercano a 0 < 0.05, rechazamos la hipótesis nula. Por lo tanto, hay evidencia suficiente para concluir que la proporción de productos defectuosos ha aumentado significativamente.

Prueba de Hipótesis para Dos Muestras

Estas pruebas son útiles para comparar diversos parámetros poblacionales entre dos grupos diferentes. Su importancia radica en su capacidad para determinar si existen diferencias significativas entre dos grupos en una población, lo cual ayuda a los investigadores a comprender mejor las relaciones entre variables y a tomar decisiones informadas basadas en evidencia estadística.

Diferencia de Proporciones $p_{1} - p_{2}$

Considerando $X_{1}, X_{2}, \dots, X_{n}$ y $Y_{1}, Y_{2}, \dots, Y_{m}$ dos muestras independientes, tal que $X\sim Ber(p_{1})$ y $Y\sim Ber(p_{2})$ .

Si n y m son grandes entonces por TLC

$\hat{p_{1}} \sim N\left(p_{1}, \frac{p_{1}(1 - p_{1})}{n}\right) \quad y \quad \hat{p_{2}} \sim N\left(p_{2}, \frac{p_{2}(1 - p_{2})}{n}\right)$

Se tiene el siguiente contraste

$\begin{aligned} H_0 : p_{1} - p_{2} = 0 \quad \text{vs} \quad H_1: & p_{1} - p_{2} \neq 0 & (\text{bilateral}) \\ & p_{1} - p_{2} < 0& (\text{unilateral a la izquierda}) \\ & p_{1} - p_{2} > 0& (\text{unilateral a la derecha}) \end{aligned}$ Con el estadístico de Prueba

$Z = \frac{\hat{p_{1}} - \hat{p_{2}}}{\sqrt{\hat{p}(1-\hat{p})\left(\frac{1}{n} + \frac{1}{m}\right)}} \ \stackrel{H_0}{\sim} N(0, 1)$ Con $\hat{p} = \frac{n\hat{p_{1}} + m\hat{p_{2}}}{n+m}$

Pruebas de Hipótesis

Valor-P

Prueba de Hipótesis para la Media μ\mu

σ2\sigma^{2} Conocida

σ2\sigma^{2} Desconocida

Prueba de Hipótesis para la Varianza σ2\sigma^{2}

Prueba de Hipótesis para la proporción pp

Prueba de Hipótesis para Dos Muestras

Diferencia de Proporciones p1−p2p_{1} - p_{2}

Prueba de Hipótesis para la Media $\mu$

$\sigma^{2}$ Conocida

$\sigma^{2}$ Desconocida

Prueba de Hipótesis para la Varianza $\sigma^{2}$

Prueba de Hipótesis para la proporción $p$

Diferencia de Proporciones $p_{1} - p_{2}$