Se toman \(10\) muestras de tamaño \(n=12\) para generar \(10\) valores de la media muestral asociada con lanzar un dado balanceado
Y1 <- matrix(runif(12*10,1,6),ncol=12)
Y1media <- apply(Y1, 1, mean)
mean(Y1media); sd(Y1media)
## [1] 3.503194
## [1] 0.4257131
library(rcompanion)
plotNormalHistogram( Y1media, prob = TRUE,
main = "", xlab= "Media muestral", ylab="Frequencia Relativa")
Ahora se toman \(100\) muestras de tamaño \(n=12\)
Y2 <- matrix(runif(12*100,1,6),ncol=12)
Y2media <- apply(Y2, 1, mean)
mean(Y2media); sd(Y2media)
## [1] 3.518956
## [1] 0.4001718
plotNormalHistogram(Y2media, prob =TRUE, xlab= "Media muestral", ylab="Frequencia Relativa", main="")
Al aumentar la cantidad de muestras obtenidas la aproximación hacia la distribución mejora de acuerdo al teorema del límite central.
Se puede comparar la media de las medias muestrales de tamaño \(n=12\) con una distribución muestral tomando muestras de tamaño \(n=3\)
Y3 <- matrix(runif(3*100,1,6),ncol=3)
Y3media <- apply(Y3, 1, mean)
mean(Y3media); sd(Y3media)
## [1] 3.430573
## [1] 0.7866666
plotNormalHistogram(Y3media, prob =TRUE, xlab= "Media muestral", ylab="Frequencia Relativa", main="")
Se observa que para la misma repetición de las muestras las distribuciones son similares lo que va a corde con la ley de los grandes números y notando que se están formando muestras con variables idependientes e idénticamente distribuidas, por lo que la forma en que se toman las muestras no impacta a largo plazo en la tendencia central de la información pero si en su dispersión, pues la desviación estándar se vuelve más pequeña al agrupar en muestras de mayor tamaño (\(\sigma^2/n\)).
Además como el valor teórico de la varianza poblacional de la media es igual a \(V(\overline{Y})= \sigma ^2/n\), conforme \(n\) crezca, el valor de la varianza muestral de la media, \(\overline{V}(\overline{Y})=\sigma^2/(n-1)\) se aproximará al de la población que se desconoce, por lo que al considerar la razón entre la desviación estándar muestral para muestras de tamaño \(n=12\) con la dedsviación estándar muestral para muestras de tamaño \(n=3\) se logra obtener la aproximación al cociente \(\sqrt{3/12} = 1/2\) (se elimina el factor \(\sigma^2\) conforme mejora la aproximación con \(n\) más grande).
sd(apply(Y2,1,mean))/sd(apply(Y3,1,mean))
## [1] 0.508693