Estimación de la media, una muestra

Con frecuencia debemos de tratar de estimar la media de una población sin conocer la varianza. Recordemos que si tenemos una muestra aleatoria tomada de una población normal, entonces la variable aleatoria\[ T =\dfrac{\bar{x}-\mu}{S/{\sqrt{n}}} \] Sigue una distribución \(T\) de student con \(\upsilon =n-1\) grados de libertad. Aquí S es la desviación estándar de la muestra. En el caso que no se conozca la varianza poblacinal \(\sigma^2\) se puede utilizar la distribución \(T\) para construir un intervalo de confianza para \(\mu\). El procedimiento es similar que cuando se conoce \(\sigma^2\), sólo se reemplaza \(\sigma\) por S y la distribución normal estándar por la distribución T de student. De esta manera

Si \(\bar{x}\) y s son la media y desviación estándar de una muestra aleatoria de una población normalde la que se desconoce la varianza \(\sigma^2\), un intervalo de confianza del \(100(1-\alpha)\%\) para \(\mu\) es: \[ \bar{x}-t_{\alpha/2}\dfrac{s}{\sqrt{n}}<\mu<\bar{x}-t_{\alpha/2}\dfrac{s}{\sqrt{n}} \] donde \(t_{\alpha/2}\) es el valor \(t\) con \(\upsilon = n-1\) grados de libertad que deja un área de \(\alpha/2\) a la derecha de la distribución \(T\) de student.

Ejemplo.

El contenido de ácido sulfurico de 7 contenedores similares es de 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6 litros. Calcule un intervalo de confianza del 95% para el contenido promedio de todos los contenedores suponiendo una distribución aproximadamente normal.

La media y la varianza son calculadas con la función ´mean´ y ´sd´ respectivamente, como se muestra a continuación

dat_con<-c(9.8, 10.2, 10.4, 9.8, 10.0, 10.2, 9.6)
mean(dat_con)
## [1] 10
sd(dat_con)
## [1] 0.2828427

el valor \(t_{\alpha/2}\) con \(7-1=6\) grados de libertada es calculado la función qt(probabilidad , grados de libertad):

qt(0.025, 6) * -1
## [1] 2.446912

Con estos valores podemos calcular el intervalo de confianza para \(\mu\) de la siguiente manera

\[10-2.4469*\frac{0.2828}{\sqrt(10)}<\mu<10+2.4469*\frac{0.2828}{\sqrt(10)} \]

Función en R

La función ´t.test(x, y=NULL, )´ realiza pruebas de hipótesis y calcula intervalos de confianza usando la distribución \(T\), si queremos calcular un intervalo de confianza del 95% para el contenido medio de los tanque \(\mu\) tecleamos el siguiente codigo.

dat_con<-c(9.8, 10.2, 10.4, 9.8, 10.0, 10.2, 9.6)
t.test(dat_con)
## 
##  One Sample t-test
## 
## data:  dat_con
## t = 93.541, df = 6, p-value = 1.006e-10
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##   9.738414 10.261586
## sample estimates:
## mean of x 
##        10

Creando nuestra propia función

Si deseamos crear una función para calcular los intervalos de confianza para la media cuando se desconoce \(\sigma\) podemos realizar de la siguiente manera. Llamaremos a la función ´conf.med´y los arguemetos son ´x´ los datos, ´alpha´ el nivel de significancia, la función queda de lasiguente manera.

conf.media<-function(x, alpha = 0.05){
  cat("\t", "Intervalo de confianza para la media", "\n")
  cat("Media", mean(x), "\n")
  gl<-length(x)-1
  des.st.mu<-sd(x)/sqrt(length(x))
  cat("Error estándar de la media", des.st.mu, "\n")
  t_alp<-qt(1 - alpha / 2, gl)
  error<-t_alp * des.st.mu
  Li<-mean(x) - error
  Ls<-mean(x) + error
  cat("Limite inferior", Li, "\n")
  cat("Limite superior", Ls, "\n")
}

Una vez definida nuestra función calculamos un intervalo de confianza del 95% para la media como sigue

conf.media(dat_con)
##   Intervalo de confianza para la media 
## Media 10 
## Error estándar de la media 0.1069045 
## Limite inferior 9.738414 
## Limite superior 10.26159

Si queremos calcular el intervalo de confianza del 99% solo especificamos el nivel de significancia alpha = 0.01

conf.media(dat_con, alpha = 0.01)
##   Intervalo de confianza para la media 
## Media 10 
## Error estándar de la media 0.1069045 
## Limite inferior 9.603659 
## Limite superior 10.39634

Limite de control unilateral

En algunas ocaciones se peude estar interesado en calcular límites de control unilaterales