Con frecuencia debemos de tratar de estimar la media de una población sin conocer la varianza. Recordemos que si tenemos una muestra aleatoria tomada de una población normal, entonces la variable aleatoria\[ T =\dfrac{\bar{x}-\mu}{S/{\sqrt{n}}} \] Sigue una distribución \(T\) de student con \(\upsilon =n-1\) grados de libertad. Aquí S es la desviación estándar de la muestra. En el caso que no se conozca la varianza poblacinal \(\sigma^2\) se puede utilizar la distribución \(T\) para construir un intervalo de confianza para \(\mu\). El procedimiento es similar que cuando se conoce \(\sigma^2\), sólo se reemplaza \(\sigma\) por S y la distribución normal estándar por la distribución T de student. De esta manera
Si \(\bar{x}\) y s son la media y desviación estándar de una muestra aleatoria de una población normalde la que se desconoce la varianza \(\sigma^2\), un intervalo de confianza del \(100(1-\alpha)\%\) para \(\mu\) es: \[ \bar{x}-t_{\alpha/2}\dfrac{s}{\sqrt{n}}<\mu<\bar{x}-t_{\alpha/2}\dfrac{s}{\sqrt{n}} \] donde \(t_{\alpha/2}\) es el valor \(t\) con \(\upsilon = n-1\) grados de libertad que deja un área de \(\alpha/2\) a la derecha de la distribución \(T\) de student.
El contenido de ácido sulfurico de 7 contenedores similares es de 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6 litros. Calcule un intervalo de confianza del 95% para el contenido promedio de todos los contenedores suponiendo una distribución aproximadamente normal.
La media y la varianza son calculadas con la función ´mean´ y ´sd´ respectivamente, como se muestra a continuación
dat_con<-c(9.8, 10.2, 10.4, 9.8, 10.0, 10.2, 9.6)
mean(dat_con)
## [1] 10
sd(dat_con)
## [1] 0.2828427
el valor \(t_{\alpha/2}\) con \(7-1=6\) grados de libertada es calculado la función qt(probabilidad , grados de libertad)
:
qt(0.025, 6) * -1
## [1] 2.446912
Con estos valores podemos calcular el intervalo de confianza para \(\mu\) de la siguiente manera
\[10-2.4469*\frac{0.2828}{\sqrt(10)}<\mu<10+2.4469*\frac{0.2828}{\sqrt(10)} \]
La función ´t.test(x, y=NULL, )´ realiza pruebas de hipótesis y calcula intervalos de confianza usando la distribución \(T\), si queremos calcular un intervalo de confianza del 95% para el contenido medio de los tanque \(\mu\) tecleamos el siguiente codigo.
dat_con<-c(9.8, 10.2, 10.4, 9.8, 10.0, 10.2, 9.6)
t.test(dat_con)
##
## One Sample t-test
##
## data: dat_con
## t = 93.541, df = 6, p-value = 1.006e-10
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 9.738414 10.261586
## sample estimates:
## mean of x
## 10
Si deseamos crear una función para calcular los intervalos de confianza para la media cuando se desconoce \(\sigma\) podemos realizar de la siguiente manera. Llamaremos a la función ´conf.med´y los arguemetos son ´x´ los datos, ´alpha´ el nivel de significancia, la función queda de lasiguente manera.
conf.media<-function(x, alpha = 0.05){
cat("\t", "Intervalo de confianza para la media", "\n")
cat("Media", mean(x), "\n")
gl<-length(x)-1
des.st.mu<-sd(x)/sqrt(length(x))
cat("Error estándar de la media", des.st.mu, "\n")
t_alp<-qt(1 - alpha / 2, gl)
error<-t_alp * des.st.mu
Li<-mean(x) - error
Ls<-mean(x) + error
cat("Limite inferior", Li, "\n")
cat("Limite superior", Ls, "\n")
}
Una vez definida nuestra función calculamos un intervalo de confianza del 95% para la media como sigue
conf.media(dat_con)
## Intervalo de confianza para la media
## Media 10
## Error estándar de la media 0.1069045
## Limite inferior 9.738414
## Limite superior 10.26159
Si queremos calcular el intervalo de confianza del 99% solo especificamos el nivel de significancia alpha = 0.01
conf.media(dat_con, alpha = 0.01)
## Intervalo de confianza para la media
## Media 10
## Error estándar de la media 0.1069045
## Limite inferior 9.603659
## Limite superior 10.39634
En algunas ocaciones se peude estar interesado en calcular límites de control unilaterales