Ejemplo

Se desea evaluar si el pH de una solución oral es igual a pH = 5.5.

1. Planteamiento de hipótesis

Ho: pH = 5.5
Ha: pH ≠ 5.5

2. Especificar el nivel de significancia

El nivel de significancia α = 0.05.

3. Elección del estadístico de prueba

\[ t_{\text{cal}} = \frac{{\bar{x} - \mu}}{{\frac{s}{{\sqrt{n}}}}} \]

4. Ejecución del experimento

Los datos encontrados en el experimento son:

##  [1] 5.22 5.38 6.28 5.54 5.56 6.36 5.73 4.87 5.16 5.28 6.11 5.68 5.70 5.56 5.22
## [16] 6.39 5.75 4.52 5.85 5.26 4.97 5.39 4.99 5.14 5.19 4.66 5.92 5.58 4.93 6.13

Análisis descriptivo de los datos

adesc <- function(x) {
  cat("ANÁLISIS DESCRIPTIVO", "\n")
  cat("\n")
  x <- na.omit(x)
  n <- length(x)
  cat("Número de datos (n): ", length(x), "\n")
  cat("Promedio: ", mean(x), "\n")                       
  cat("Mínimo: ", min(x), "\n")
  cat("Cuantil 25: ", quantile(x,0.25), "\n")
  cat("Mediana: ", median(x), "\n")                      
  cat("Cuantil 75: ", quantile(x,0.75), "\n")
  cat("Máximo: ", max(x), "\n")
  cat("Varianza muestral: ", var(x), "\n")               
  cat("Varianza poblacional: ", var(x) * (n - 1) / n, "\n")
  cat("Desviación estándar muestral: ", sd(x), "\n")     
  cat("Desviación estándar poblacional: ", sqrt(var(x) * ((n - 1) / n)), "\n")
  cat("Coeficiente de variación: ", (sd(x) / mean(x)) * 100, "\n")
  cat("Rango: ", max(x) - min(x), "\n")
  cat("Error típico: ", sd(x) / sqrt(n), "\n") 
  cat("Suma total: ", sum(x), "\n")             
}
adesc(data)
## ANÁLISIS DESCRIPTIVO 
## 
## Número de datos (n):  30 
## Promedio:  5.477333 
## Mínimo:  4.52 
## Cuantil 25:  5.1675 
## Mediana:  5.465 
## Cuantil 75:  5.745 
## Máximo:  6.39 
## Varianza muestral:  0.2398271 
## Varianza poblacional:  0.2318329 
## Desviación estándar muestral:  0.4897215 
## Desviación estándar poblacional:  0.4814903 
## Coeficiente de variación:  8.940874 
## Rango:  1.87 
## Error típico:  0.0894105 
## Suma total:  164.32

5. Criterio de rechazo y conclusiones

Información requerida

xprom <- 5.477333 
mu <- 5.5
sd <- 0.4897215    
n <- 30
alfa <- 0.05
nc <- 1-alfa
df <- n-1

5.1. Estadístico de prueba

En el ejemplo del pH de la solución oral, el estadístico de prueba está dado por:

\[ t_{\text{calc}} = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}} \] \[ t_{\text{calc}} = \frac{5.47 - 5.5}{\frac{0.49}{\sqrt{30}}} \] \[ t_{\text{calc}} = -0.2535 \]

El estadístico tabulado \(t_{\text{tab}} = -2.04523\).

El \(t_{\text{cal}}\) cae en la zona de aceptación por lo que no se rechaza la hipótesis nula.

Conclusión: El pH de la solución no es significativamente diferente de 5.5

# Estadistico t calculado
tcal <- (xprom-mu)/(sd/sqrt(n))
tcal
## [1] -0.2535161
# Estadistico t tabulado
ttab <- qt(0.025, df)
ttab
## [1] -2.04523
if (tcal < ttab) {
  cat("Se rechaza la hipótesis nula")
} else {
  cat("No se rechaza la hipótesis nula")
}
## No se rechaza la hipótesis nula

5.2 p-valor

Se calcula la probabilidad “más allá” de \(t_{\text{cal}}\), encontrando el siguiente valor:

pval <- pt(tcal, df = df)
pval=pval*2
pval
## [1] 0.8016581

El p-valor > alfa, por lo que no se rechaza la hipótesis nula.

Conclusión: El pH de la solución no es significativamente diferente de 5.5

if (pval < alfa) {
  cat("Se rechaza la hipótesis nula")
} else {
  cat("No se rechaza la hipótesis nula")
}
## No se rechaza la hipótesis nula

5.3 Intervalo de confianza

Se calcula el intervalo de confianza de los datos obtenidos en el experimento, así:

\[ \bar{x} \pm t_{\frac{\alpha}{2},n-1} \frac{s}{\sqrt{n}} \] \[ 5.4773 \pm 2.04523 \frac{0.4897}{\sqrt{30}} \] \[ 5.4773 \pm 0.1828 \]

Notar que el valor enunciado en la hipótesis nula, en este caso, 5,5 se encuentra en el intervalo de confianza de los datos, entonces, no se rechaza la hipótesis nula.

Conclusión: El pH de la solución no es significativamente diferente de 5.5

# Calcula el margen de error
margen <- abs(ttab)*sd/sqrt(n)
int_conf <- c(xprom - margen, xprom + margen)
int_conf
## [1] 5.294468 5.660198
if (pval < alfa) {
  cat("Se rechaza la hipótesis nula")
} else {
  cat("No se rechaza la hipótesis nula")
}
## No se rechaza la hipótesis nula

6. Codigo en R

El siguiente es el código en R para realizar la prueba de medias con varianza desconocida. Notar que en la salida de R se encuentran todos los criterios evaluados previamente:

t.test(data, alternative = "two.sided", mu=mu, conf.level=nc)
## 
##  One Sample t-test
## 
## data:  data
## t = -0.25351, df = 29, p-value = 0.8017
## alternative hypothesis: true mean is not equal to 5.5
## 95 percent confidence interval:
##  5.294468 5.660198
## sample estimates:
## mean of x 
##  5.477333

Referencias:

  1. Gutiérrez Pulido, H., & De la Vara Salazar, R. (2009). Control estadístico de calidad y seis sigma. México DF: Mc Graw Hill.