Distribución de la media muestral
Universidad Tecnológica de Bolivar
2024-01-29
En estadística, la distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población.
Consideremos la variable aleatoria \(\Rightarrow\) \(X\): edad de hermanos de una familia, en años y además, sean:
Tabla de la distribución de la población(muestra)
Los parámetros: media \(\mu\) y varianza \(\sigma^2\) son respectivamente.
Ahora, tomemos muestras de tamaño 2, con reposición. Es decir,
Consideremos la variable aleatoria \(\Rightarrow\) \(X\): edad de cada hermanos de una familia, en años y además, sean:
Sea \(\bar{x}\) el promedio y \(s^2\) la varianza de la muestra por fila.
Consideramos ahora una nueva variable aleatoria \(\bar{x}\): edad promedio de 2 hermanos elegidos al azar de entre los 4, con reposición.
Ahora, tomemos muestras de tamaño 3 con reposición. Es decir, cada muestra (\(n=3\)), es de la forma \((x_1 , x_2, x_3)\), donde: \(x_i\) es el \(i\)-ésimo elemento de la muestra. tenemos:
Obtenemos las distribuciones de los promedios que mostramos a continuación, acompañadas de las gráficas respectivas:
muestra3 = permutations(4, 3, x, repeats.allowed = TRUE)
n = nrow(muestra3)
df3 = data.frame(x1 = muestra3[,1], x2 = muestra3[,2], x3 = muestra3[,3], xbar = rowMeans(muestra3))
dfp3 = data.frame(table(df3$xbar))
dfp3 = data.frame(x = round(as.numeric(levels(dfp3$Var1)),4), p = round(dfp3$Freq/n,4))
dfp3t = dfp3
names(dfp3) <- c("$\\bar{x}$", "$p(x)$")
knitr::kable(dfp3, "pipe")Nota: Notemos que el promedio muestral es también una variable aleatoria.
Ahora, tomemos muestras de tamaño 4 con reposición. Es decir, cada muestra (\(n=4\)), es de la forma \((x_1 , x_2, x_3, x_4)\), donde: \(x_i\) es el \(i\)-ésimo elemento de la muestra. Tenemos:
La distribución de medias es:
muestra4 = permutations(4, 4, x, repeats.allowed = TRUE)
n = nrow(muestra4)
df4 = data.frame(x1 = muestra4[,1], x2 = muestra4[,2], x3 = muestra4[,3], x4 = muestra4[,4], xbar = rowMeans(muestra4))
dfp4 = data.frame(table(df4$xbar))
dfp4 = data.frame(x = round(as.numeric(levels(dfp4$Var1)),4), p = round(dfp4$Freq/n,4))
dfp4t = dfp4
names(dfp4) <- c("$\\bar{x}$", "$p(x)$")
knitr::kable(dfp4, "pipe")Nota: Notemos que el promedio muestral es también una variable aleatoria.
Ahora, tomemos muestras de tamaño 5 con reposición. Es decir, cada muestra (\(n=5\)), es de la forma \((x_1 , x_2, x_3, x_4, x_5)\), donde: \(x_i\) es el \(i\)-ésimo elemento de la muestra. Tenemos:
La distribución de medias es:
muestra5 = permutations(4, 5, x, repeats.allowed = TRUE)
n = nrow(muestra5)
df5 = data.frame(x1 = muestra5[,1], x2 = muestra5[,2], x3 = muestra5[,3],
x4 = muestra5[,4], x5 = muestra5[,5], xbar = rowMeans(muestra5))
dfp5 = data.frame(table(df5$xbar))
dfp5 = data.frame(x = round(as.numeric(levels(dfp5$Var1)),4), p = round(dfp5$Freq/n,4))
dfp5t = dfp5
names(dfp5) <- c("$\\bar{x}$", "$p(x)$")
knitr::kable(dfp5, "pipe")Nota: Notemos que el promedio muestral es también una variable aleatoria.
Vemos que las medias poblacionales se mantienen iguales a 5 (la esperanza matemática de las edades de los 4 hermanos), mientras que las varianzas poblacionales disminuyen su valor a medida que aumenta el tamaño de la muestra.
| Media | Varianza | |
|---|---|---|
| Población | \(\mu_x=5\) | \(\sigma^2_x=5\) |
| Tamaño de muesta | \(\mu_{\bar{x}}\) | \(\sigma^2_{\bar{x}} = \frac{\sigma^2_x}{n}\) |
| 2 | 5 | 2.5 |
| 3 | 5 | 1.667 |
| 4 | 5 | 1.25 |
| 5 | 5 | 1 |
Sea \(X_1,\dots, X_n\) una m.a.s. de una población con media poblacional \(\mu_x\) y varianza poblacional \(\sigma^2_x\). Se define la media muestral como el estadístico:
\[ \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i \]
entonces, la distribución de la media muestral \(\bar{X}\), tiene
\[\begin{align*} \text{Media: } E[\bar{X}]&=\mu_{\bar{x}} =\mu_x, \\ \text{Varianza: } Var[\bar{X}]&=\sigma^2_{\bar{x}} =\frac{\sigma^2_x}{n} \end{align*}\]Dada una muestra aleatoria simple \(x_1,x_2,\dots, x_n\) de tamaño \(n\) obtenida de una variable aleatoria \(X\) con media \(\mu\) y varianza \(\sigma^2\), se cumple que
\[ Z = \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1), \qquad \text{ cuando } n \rightarrow \infty \]
En la práctica, para aplicar el teorema del límite central, debe estandarizarse la variable \(\bar{X}\); es decir, si \(X\) tiene media poblacional \(\mu_x\) y varianza poblacional \(\sigma^2_x\), entonces
\[ Z = \frac{\bar{X}-\mu_{\bar{x}}}{\frac{\sigma_{\bar{x}}}{\sqrt{n}}}= \frac{\bar{X}-\mu_x}{\frac{\sigma_x}{\sqrt{n}}} \sim N(0,1) \]
Considérese una población en la que se estudia la variable \(X\): “peso de los niños de 2 años en una ciudad de Colombia”. Se sabe el peso sigue una distribución normal de media \(\mu=12\) y varianza \(\sigma^2=16\). Se pide:
En un servicio de atención al cliente, el tiempo de espera hasta recibir atención es una variable normal de media 10 minutos y desviación típica 2 minutos. Se toman muestras aleatorias del tiempo de espera de los clientes que llegan un día concreto. Se pide:
Se supone que los resultados de un examen siguen una distribución normal con media 78 y desviación típica 36. Se pide: