Es la diferencia entre el estadístico de una muestra y el parámetro de la población correspondiente.
Es la distribución de probabilidad de todas las posibles muestras de un determinado tamaño de muestra de la población.
El teorema del límite central hace hincapié en que, en el caso de muestras aleatorias grandes, la forma de la distribución muestral de la media se aproxima a la distribución de probabilidad normal. La aproximación es más exacta en el caso de muestras grandes que en el de muestras pequeñas. Esta es una de las conclusiones más útiles de la estadística. Permite razonar sobre la distribución de las medias muestrales sin ninguna información acerca de la forma de la distribución de la población de la que se toma la muestra.
1. Una población consta de los siguientes cuatro valores: 12, 12, 14, y 16.
a) Enumere todas las muestras de tamaño 2 y calcule la media de cada muestra
pobl<- c(12, 12, 14, 16)
(combPobl<- as.table(combn(pobl, 2)))
A B C D E F
A 12 12 12 12 12 14
B 12 14 16 14 16 16
colMeans(combPobl)
A B C D E F
12 13 14 13 14 15
b) Calcule la media de la distribución muestral de la media \(\mu_{\bar{x}}\) y la media de la población \(\mu\) Compare los dos valores
mean(colMeans(combPobl)) # media de la distribución muestral de la media
[1] 13.5
mean(pobl) # media de la población
[1] 13.5
Por lo tanto, \(\mu_\bar{x} = \mu\)
c) Compare la dispersión en la población con la de las medias de las muestras.
Mayor dispersión con los datos de la población, en comparación con las medias muestrales. Las medias muestrales varían de 12 a 15, mientras que la población varía de 12 a 16
2. Una población consta de los siguientes cinco valores: 12, 12, 14, 15 y 20.
a) Enumere todas las muestras de tamaño 3 y calcule la media de cada muestra
pobl2 <- c(12, 12, 14, 15, 20)
combPobl2 <- as.table(combn(pobl2, 3))
combPobl2
A B C D E F G H I J
A 12 12 12 12 12 12 12 12 12 14
B 12 12 12 14 14 15 14 14 15 15
C 14 15 20 15 20 20 15 20 20 20
colMeans(combPobl2)
A B C D E F G H
12.66667 13.00000 14.66667 13.66667 15.33333 15.66667 13.66667 15.33333
I J
15.66667 16.33333
b) Calcule la media de la distribución muestral de las medias y la media de la población
mean(colMeans(combPobl2))
[1] 14.6
mean(pobl2)
[1] 14.6
Por lo tanto, \(\mu_\bar{x} = \mu\)
c) Compare la dispersión en la población con la de las medias de las muestras
range(pobl2)
[1] 12 20
range(colMeans(combPobl2))
[1] 12.66667 16.33333
La dispersión de la población es mayor que la de las medias muestrales. Las medias muestrales varían de 12.66 a 16.33, mientras que la población varía de 12 a 20.
3. En el despacho de abogados Tybo and Associates, hay seis socios. En la siguiente tabla se incluye el número de casos que en realidad atendió cada socio en los tribunales durante el mes pasado:
Casos
Ruud 3
Wu 6
Sass 3
Flores 3
Wilhelms 0
Schueller 1
a) ¿Cuántas muestras de 3 son posibles?
combtybo <- as.table(combn(Casos, 3))
combtybo
A B C D E F G H I J K L M N O P Q R S T
A 3 3 3 3 3 3 3 3 3 3 6 6 6 6 6 6 3 3 3 3
B 6 6 6 6 3 3 3 3 3 0 3 3 3 3 3 0 3 3 0 0
C 3 3 0 1 3 0 1 0 1 1 3 0 1 0 1 1 0 1 1 1
dim(combtybo)
[1] 3 20
Son posibles 20 muestras
b) Calcule el número medio de casos en cada muestra
colMeans(combtybo)
A B C D E F G H
4.000000 4.000000 3.000000 3.333333 3.000000 2.000000 2.333333 2.000000
I J K L M N O P
2.333333 1.333333 4.000000 3.000000 3.333333 3.000000 3.333333 2.333333
Q R S T
2.000000 2.333333 1.333333 1.333333
c) Compare la media de la distribución de las medias con la de la media poblacional
mean(colMeans(combtybo))
[1] 2.666667
mean(Casos)
[1] 2.666667
Por lo tanto, \(\mu_\bar{x} = \mu\)
4. Una población consta de los siguientes cinco valores: 2, 2 ,4, 4 y 8
a) Enumere todas las muestras de tamaño 2 y calcule la media de cada muestra
pobl3 <- c(2, 2, 4, 4, 8)
combPobl3 <- as.table(combn(pobl3, 2))
combPobl3
A B C D E F G H I J
A 2 2 2 2 2 2 2 4 4 4
B 2 4 4 8 4 4 8 4 8 8
colMeans(combPobl3)
A B C D E F G H I J
2 3 3 5 3 3 5 4 6 6
b) Calcule la media de la distribución muestral de las medias y la media de la población
mean(colMeans(combPobl3))
[1] 4
mean(pobl3)
[1] 4
Por lo tanto, \(\mu_\bar{x} = \mu\)
c) Compare la dispersión en la población con la de las medias de las muestras
range(pobl3)
[1] 2 8
range(colMeans(combPobl3))
[1] 2 6
5. Quinientos cojinetes de bolas tienen un peso medio de 5.02 onzas y una desviación estándar de 0.30 onzas. Hallar la probabilidad de que una muestra al azar de 100 cojinetes elegidos entre este grupo tenga un peso total:
a) Comprendido entre 4.96 y 5 onzas
Para la distribución muestral de medias, \(\mu_\bar{x} = \mu = 5.02\)
Considerando un muestreo sin reemplazo,
\[\sigma_\bar{x} = \frac{\sigma}{\sqrt{n}} \sqrt{\frac{N - n}{N - 1}} = \frac{0.30}{\sqrt{100}} \sqrt{\frac{500 - 100}{500 - 1}} = 0.027 \]
diff(x = pnorm(c(4.96, 5.00), mean = 5.02, sd = 0.027))
[1] 0.2162912
b) De más de 5.10 onzas
pnorm(q = 5.10, mean = 5.02, sd = 0.027, lower.tail = FALSE)
[1] 0.001523466
Así, pues, solamente se darán 3 casos cada 2000 de obtener una muestra de 100 cojinetes con un peso total superior a 5.10 onzas
Lind, Douglas A, William G Marchal, and Samuel Adam Wathen. 2012. Statistical Techniques in Business & Economics. New York, NY: McGraw-Hill/Irwin,
Myers, R, S Myers, R Walpole, and K Ye. 2012. “Probability & Statistics for Engineers and Scientists, Ninth Editon.” Pearson.
Spiegel, Murray R. 1970. “Estadística. Edit.” Mc Graw-Hill Colombia.