1 Introducción

Se asume que \(X_1,\ldots,X_n\) es una muestra aleatoria tal que \(X_i\stackrel{\text{IID}}{\sim} \textsf{N}(\mu, \sigma^2)\), para \(i=1,\ldots,n\).

Antes de implementar los intervalos, es indispensable verificar que la distribución de la variable aleatoria objeto de estudio tenga distribución Normal, de lo contrario, se deben utilizar otras técnicas de inferencia (e.g., Bootstrap).

2 Para la media pobacional \(\mu\)

El proceso de prueba para \(\mu\) se puede resumir con el siguiente esquema:

Observaciones

Se pueden utilizar estas pruebas de acuerdo con la condición de \(\sigma\) siempre que:

La distribución de la población es Normal, sin importar el tamaño de la muestra.
El tamaño de la muestra es grande para aplicar los teoremas de convergencia.

2.1 Ejemplo

Se simula una muestra de 50 estudiantes para determinar si en promedio los estudiantes no tienen sobrepeso (IMC < 25) con un nivel de significancia del \(5\%\).

Solución

El sistema de hipótesis que se quiere probar es:

\[H_0:\mu= 25\qquad\text{ frente a }\qquad H_1: \mu< 25\]

# simulación de la muestra aleatoria
set.seed(123)
imc <- rnorm(n = 50, mean = 25.5, sd = 1)
head(imc)

## [1] 24.93952 25.26982 27.05871 25.57051 25.62929 27.21506

# prueba sobre el promedio poblacional
t.test(x = imc, alternative = "less", mu = 25, conf.level = 0.95)

## 
##  One Sample t-test
## 
## data:  imc
## t = 4.0814, df = 49, p-value = 0.9999
## alternative hypothesis: true mean is less than 25
## 95 percent confidence interval:
##      -Inf 25.75393
## sample estimates:
## mean of x 
##   25.5344

Dado que el valor \(p > 0.05\), con una confiabilidad del 95% no existe suficiente evidencia empírica para establecer que en promedio los estudiantes no tienen sobrepeso.

Para probar los supuestos del modelo se debe probar el sistema de hipótesis:

\[ H_0: \text{La población tiene distribución Normal} \qquad\text{ frente a }\qquad H_1: \text{La población no tiene distribución Normal} \]

# prueba de normalidad de Shapiro-Wilk
shapiro.test(imc)

## 
##  Shapiro-Wilk normality test
## 
## data:  imc
## W = 0.98928, p-value = 0.9279

# prueba de normalidad de Kolmogorov-Smirnov
nortest::lillie.test(imc)

## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  imc
## D = 0.083232, p-value = 0.5233

# prueba de normalidad de Anderson-Darling
nortest::ad.test(imc)

## 
##  Anderson-Darling normality test
## 
## data:  imc
## A = 0.20995, p-value = 0.8529

Dado que el valor \(p > 0.05\), con una confiabilidad del 95% no existe suficiente evidencia empírica para establecer el IMC de la población no tiene distribución Normal.

# descripcion
summary(imc)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   23.53   24.94   25.43   25.53   26.20   27.67

# grafico
par(mfrow = c(1,2))
# histograma
hist(x = imc, freq = F, col = "white", xlim = c(21,29), ylim = c(0,0.5), xlab = "Balance", ylab = "Densidad", main = "")
curve(expr = dnorm(x, mean = mean(imc), sd = sd(imc)), col = 2, add = TRUE)
# grfico cuantil-cuantil
qqnorm(imc, xlab = "Cuantiles normales", ylab = "Cuantiles observados", main = "")
qqline(imc, col = 2)

3 Para la varianza poblacional \(\sigma^2\)

El proceso de prueba para \(\mu\) se puede resumir con el siguiente esquema:

Generalmente, \(\epsilon=\alpha/2\) y \(\delta=1-\alpha/2\).

3.1 Ejemplo

Una pieza debe fabricarse con medidas de tolerancia muy estrechas para que sea aceptada por el cliente. Las especificaciones de producción indican que la varianza máxima en la longitud de la pieza debe ser 0.0004. En 30 piezas la varianza muestral encontrada es 0.0005. Use un nivel de significancia de 0.05 para probar si se está violando la especificación acerca de la variabilidad poblacional.

Solución

var1_test_V1 <- function(s2, n, sigma2, alternativa = "diferente", confianza = 0.95) {
  # informacion muestral
  s2 <- as.numeric(s2)
  n  <- as.numeric(n)
  # estadistico de prueba
  chi <- (n-1)*s2/sigma2
  # valor p
  if (alternativa == "menor") {
    p <- pchisq(q = chi, df = n-1, lower.tail = T)
  }
  if (alternativa == "mayor") {
    p <- pchisq(q = chi, df = n-1, lower.tail = F)
  }
  if (alternativa == "diferente") {
    p1 <- pchisq(q = chi, df = n-1, lower.tail = T)
    p2 <- pchisq(q = chi, df = n-1, lower.tail = F)
    p  <- 2*min(p1,p2)
  }
  # salida
  return(p)
}

var1_test_V2 <- function(s2, n, sigma2, alternativa = "diferente", confianza = 0.95) {
  # informacion muestral
  s2 <- as.numeric(s2)
  n  <- as.numeric(n)
  # estadistico de prueba
  chi <- (n-1)*s2/sigma2
  # valor p
  if (alternativa == "menor") {
    p <- pchisq(q = chi, df = n-1, lower.tail = T)
  }
  if (alternativa == "mayor") {
    p <- pchisq(q = chi, df = n-1, lower.tail = F)
  }
  if (alternativa == "diferente") {
    p1 <- pchisq(q = chi, df = n-1, lower.tail = T)
    p2 <- pchisq(q = chi, df = n-1, lower.tail = F)
    p  <- 2*min(p1,p2)
  }
  # imprimir en pantalla
  cat("Prueba sobre la varianza poblaciónal bajo normalidad \n",
      "El valor valor p es ", p, sep = "")
}

El sistema de hipótesis que se quiere probar es:

\[H_0:\sigma^2 = 0.0004\qquad\text{ frente a }\qquad H_1: \sigma^2 > 0.0004\]

# prueba sobre la varianza poblacional
var1_test_V1(s2 = 0.0005, n = 30, sigma2 = 0.0004, alternativa = "mayor", confianza = 0.95)

## [1] 0.1663945

# prueba sobre la varianza poblacional
var1_test_V2(s2 = 0.0005, n = 30, sigma2 = 0.0004, alternativa = "mayor", confianza = 0.95)

## Prueba sobre la varianza poblaciónal bajo normalidad 
## El valor valor p es 0.1663945

Dado que el valor \(p > 0.05\), con una confiabilidad del 95% no existe suficiente evidencia empírica para establecer que se está violando la especificación acerca de la variabilidad poblacional del proceso de producción.

4 Para la proporción poblacional \(\pi\)

Se considera una muestra aleatoria \(X_1,\ldots,X_n\) de una población \(\textsf{Bernoulli}(\pi)\).

Se tienen los siguientes sistemas de hipótesis:

\[\text{Sistema A: }\qquad H_0:\pi=\pi_0\qquad\text{ frente a }\qquad H_1:\pi<\pi_0\] \[\text{Sistema B: }\qquad H_0:\pi=\pi_0\qquad \text{ frente a }\qquad H_1:\pi>\pi_0\] \[\text{Sistema C: }\qquad H_0:\pi=\pi_0\qquad \text{ frente a }\qquad H_1:\pi\neq\pi_0\] El estadístico de prueba es

\[Z=\frac{P-\pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}}\]

y los tests son respectivamente:

\[\tau_A:\qquad \text{Rechazar }H_0\text{ si }z_c<z_{\alpha}\]

\[\tau_B:\qquad \text{Rechazar }H_0\text{ si }z_c>z_{1-\alpha}\]

\[\tau_C:\qquad \text{Rechazar }H_0\text{ si }|z_c|>z_{1-\alpha/2}\]

4.1 Ejemplo

Se observa una muestra aleatoria de 300 componentes electrónicos fabricados mediante un proceso específico y se encuentra que 25 son defectuosos. Sea \(\pi\) la proporción poblacional de componentes fabricados mediante este proceso que presentan defectos. El responsable del proceso de producción afirma que \(p \leq 0.05\). ¿La muestra proporciona suficiente evidencia para rechazar la afirmación?

Pruebas de Hipótesis para 1 Población Bajo Normalidad

Lina Buitrago PhD(c), labuitragor@unal.edu.co

Juan Sosa PhD, jcsosam@unal.edu.co