Determinar la distribución muestral de la media.
Se simula población con sueldos de trabajadores de una Institución educativa.
Se crean datos relacionados con la población y se determinan los parámetros descriptivos.
Se crean 100 y 1000 muestras diferentes con n elementos diferentes relacionados con la población y se determinan la media aritmética de cada muestra.
Se determina la distribución muestral de la media de las cien muestras y se idnetifica que la distribución se acera a una distribución normal además de que la media de la distribución muestral se acerca a la media de la población.
Si se organizan las medias de todas las muestras posibles (por decir cien y mil) en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media.
DISTRIBUCIÓN MUESTRAL DE LA MEDIA es la distribución de probabilidad de todas las posibles medias de las muestras de un determinado tamaño muestral de la población. [@lind2015].
library(cowplot)
## Warning: package 'cowplot' was built under R version 4.1.3
library(ggplot2)
library(knitr)
## Warning: package 'knitr' was built under R version 4.1.3
Para que no aparezca notación científica
options(scipen=999)
set.seed(2021)
N <- 650 # Cantidad de datos de población
rango <- 5000:35000 # Rango
n = 100 # Cantidad de datos de muestra
q1 = 100 # Cantidad de muestras m1, m2, m3
q2 = 1000 # Cantidad de muestras m1, m2, m3
Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de 650 trabajadores que laboran en una Institución educativa. El rango está entre 5000 y 35000 pesos ($) mensuales.
\[ poblacion = \text{ {x | x es un trabajador de una Institución educativa; }} \therefore \\ x_1, x_2, x_3, ... ,x_{N=6500} \]
poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size = N, replace = TRUE))
poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size = N, replace = TRUE))
head(poblacion$sueldo, 30)
## [1] 7646 17800 19935 9402 26515 13642 24722 19697 19335 23170 30955 23636
## [13] 12555 15871 10775 13851 22742 16813 5112 14742 30582 24038 21128 5907
## [25] 30007 24472 10014 26615 25008 21828
tail(poblacion$sueldo, 30)
## [1] 24259 32260 27674 22529 13336 6448 18538 24195 22030 26875 21592 14914
## [13] 6618 7469 26938 24413 26709 5183 32993 16748 13663 6922 12411 15591
## [25] 20874 9014 27858 17942 6020 34710
summary(poblacion$sueldo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5083 12526 19920 19996 27236 34970
media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)
Se tiene una media aritmética poblacional de 19996.41 con una desviación estándar de 8602.6.
\[ \mu = \frac{\sum{sueldo_x}}{N} = 19671.45 \]
Se determina una primera muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el valor de \(x\). \[ muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100} \]
La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.
xs <- sample(x = 1:n, size = n, replace = FALSE)
muestra <- poblacion[xs,]
summary(muestra$sueldo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5112 12898 20481 19493 25890 34580
media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)
Se tiene una media aritmética de la primera muestra de 19492.81 con una desviación estándar de 8602.6.
\[ \bar{x_1} = \frac{\sum{sueldo_x}}{n} = 21002.77 \]
El error muestral es porque los estadísticos no son valores numéricos igual que los parámetros de la población, siempre existirá una diferencia.
media.p; media.m
## [1] 19996.41
## [1] 19492.81
desv.p; desv.m
## [1] 8602.6
## [1] 7960.58
Se determina el error muestral del estadístico media de la muestra con respecto al parámetro de la media poblacional
dif.media <- media.p - media.m
paste("El error muestral con respecto a la media es de: ", dif.media)
## [1] "El error muestral con respecto a la media es de: 503.599999999999"
\[ \text{Error muestral =} (\mu - \bar{x}) = (19671.45 - 21002.77) = -1331.32 \]
# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "red") +
labs(title = "Población",
subtitle = paste("ME=", media.p, "; ds=", desv.p, "; Err muestral media=",dif.media),
caption = "Fuente propia") +
geom_vline(xintercept = media.m, col='red') +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g1 <- g1 + theme(
plot.title = element_text(color = "black", size = 10, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(muestra, aes(x = sueldo)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "green") +
geom_vline(xintercept = media.m, col='red') +
labs(title = "Muestra",
subtitle = paste("me=", media.m, "; ds.=", desv.m),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g2 <- g2 + theme(
plot.title = element_text(color = "black", size = 10, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)
Se observa que no son distribuciones normales, ni los datos de población ni los datos de la muestra se comportan como distribución normal.
Se determinan cien (100) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media [@lind2015].
muestras = as.list(NULL)
m.muestras = NULL
for (i in 1:q1) {
muestras[[i]] <- sample(x = poblacion$sueldo, size = q1, replace = FALSE)
m.muestras[i] <- mean(muestras[[i]])
}
Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.
La función t() transforma registros a columnas de un data.frame.
sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q1)
rownames(sueldos) <- paste0("M",1:q1)
tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q1-2):q1], medias.muestrales = m.muestras)
kable(tabla, caption = "Tabla de medias aritméticas de cien muestras de cien sueldos cada una")
| sueldo1 | sueldo2 | sueldo3 | … | sueldo98 | sueldo99 | sueldo100 | medias.muestrales | |
|---|---|---|---|---|---|---|---|---|
| M1 | 5946 | 27466 | 21839 | … | 20082 | 23630 | 32093 | 19407.61 |
| M2 | 21015 | 34643 | 14815 | … | 28958 | 18575 | 10369 | 20793.83 |
| M3 | 23230 | 27843 | 7678 | … | 21828 | 19779 | 32484 | 19184.54 |
| M4 | 16619 | 31898 | 16856 | … | 5128 | 15960 | 19455 | 19837.62 |
| M5 | 18204 | 29244 | 11314 | … | 22718 | 14500 | 33484 | 19001.86 |
| M6 | 32164 | 32396 | 17592 | … | 29935 | 24513 | 8172 | 19092.28 |
| M7 | 16619 | 27285 | 14896 | … | 26499 | 12023 | 14439 | 20306.05 |
| M8 | 33569 | 18929 | 8780 | … | 15006 | 30058 | 7686 | 19649.74 |
| M9 | 18914 | 16347 | 22504 | … | 20496 | 19935 | 21325 | 20355.47 |
| M10 | 22612 | 14500 | 16748 | … | 9023 | 21592 | 17635 | 19753.90 |
| M11 | 7698 | 31678 | 31770 | … | 27752 | 32972 | 11361 | 20652.36 |
| M12 | 18620 | 12367 | 21306 | … | 27858 | 33778 | 19852 | 19422.12 |
| M13 | 13534 | 10482 | 22529 | … | 27958 | 11454 | 11265 | 19447.40 |
| M14 | 11265 | 31225 | 30134 | … | 24700 | 34643 | 27674 | 20411.62 |
| M15 | 31486 | 24831 | 10015 | … | 27000 | 6618 | 19335 | 20164.59 |
| M16 | 33091 | 14797 | 32234 | … | 20073 | 28055 | 28660 | 19000.29 |
| M17 | 15960 | 16748 | 16536 | … | 19031 | 8795 | 11833 | 20295.82 |
| M18 | 22529 | 32330 | 10002 | … | 5880 | 25649 | 7863 | 21325.73 |
| M19 | 15960 | 7455 | 28055 | … | 31810 | 9182 | 25716 | 20323.06 |
| M20 | 21128 | 13851 | 10117 | … | 20349 | 22850 | 6792 | 20411.36 |
| M21 | 18929 | 27411 | 31721 | … | 20860 | 32346 | 12894 | 18940.95 |
| M22 | 12099 | 25234 | 24831 | … | 26181 | 28613 | 5720 | 19443.10 |
| M23 | 16748 | 19823 | 15871 | … | 27248 | 8298 | 14215 | 20554.03 |
| M24 | 18900 | 25865 | 7611 | … | 28724 | 25103 | 16445 | 19392.97 |
| M25 | 27284 | 33794 | 33169 | … | 8497 | 23352 | 26874 | 20180.53 |
| M26 | 21456 | 16748 | 33569 | … | 7290 | 34970 | 31675 | 20171.22 |
| M27 | 24818 | 6326 | 10117 | … | 7479 | 31518 | 24993 | 20289.68 |
| M28 | 13787 | 26615 | 29774 | … | 21430 | 26150 | 32164 | 20342.66 |
| M29 | 28958 | 32711 | 22850 | … | 6980 | 6326 | 23477 | 19118.23 |
| M30 | 27752 | 13995 | 16503 | … | 14896 | 18575 | 8304 | 21114.45 |
| M31 | 16950 | 6922 | 27678 | … | 20388 | 28617 | 28219 | 20044.37 |
| M32 | 34115 | 18728 | 10447 | … | 31690 | 10775 | 24700 | 19286.99 |
| M33 | 29205 | 10932 | 33914 | … | 7878 | 14068 | 17713 | 20836.21 |
| M34 | 11265 | 25008 | 28724 | … | 19904 | 16813 | 13663 | 18967.58 |
| M35 | 33450 | 13882 | 34435 | … | 15056 | 32396 | 5117 | 20643.57 |
| M36 | 33169 | 25085 | 29205 | … | 12422 | 34095 | 10366 | 21760.83 |
| M37 | 20423 | 10117 | 29911 | … | 14965 | 21730 | 13243 | 19882.64 |
| M38 | 21867 | 19976 | 26875 | … | 8887 | 8662 | 9182 | 18472.55 |
| M39 | 31519 | 11383 | 15555 | … | 27674 | 8967 | 21015 | 19985.06 |
| M40 | 27579 | 13343 | 24413 | … | 22221 | 7678 | 6864 | 20733.94 |
| M41 | 19755 | 34499 | 5697 | … | 11809 | 23416 | 7290 | 20219.97 |
| M42 | 25054 | 7878 | 29774 | … | 27144 | 8809 | 7698 | 19429.24 |
| M43 | 20999 | 20932 | 8298 | … | 5128 | 8855 | 26938 | 18211.22 |
| M44 | 6618 | 26699 | 10359 | … | 25502 | 15871 | 15327 | 21629.68 |
| M45 | 22251 | 14068 | 26078 | … | 5720 | 29630 | 31486 | 19977.31 |
| M46 | 33066 | 16137 | 24792 | … | 21015 | 11833 | 6416 | 19650.39 |
| M47 | 20999 | 12939 | 27904 | … | 21828 | 5697 | 34095 | 19740.96 |
| M48 | 32303 | 29935 | 16772 | … | 14941 | 5697 | 22526 | 19019.84 |
| M49 | 11833 | 29911 | 8780 | … | 14438 | 23499 | 24714 | 19733.19 |
| M50 | 19095 | 27843 | 21134 | … | 25739 | 17800 | 14334 | 20349.44 |
| M51 | 9789 | 10366 | 17378 | … | 7698 | 31486 | 26341 | 18281.51 |
| M52 | 10033 | 18900 | 28519 | … | 20576 | 8304 | 19863 | 20096.40 |
| M53 | 16291 | 14896 | 20932 | … | 19415 | 8304 | 12939 | 19577.30 |
| M54 | 33794 | 19904 | 32994 | … | 24514 | 30233 | 15645 | 20910.93 |
| M55 | 8881 | 19031 | 19095 | … | 13625 | 16137 | 18538 | 19809.39 |
| M56 | 30248 | 13567 | 14428 | … | 10365 | 7899 | 25649 | 19761.51 |
| M57 | 27600 | 10015 | 32636 | … | 30267 | 34659 | 5128 | 21500.41 |
| M58 | 5534 | 31675 | 14742 | … | 32590 | 33450 | 17237 | 18941.45 |
| M59 | 19353 | 33569 | 25690 | … | 16283 | 14742 | 29630 | 20023.13 |
| M60 | 25649 | 12031 | 29774 | … | 14905 | 5117 | 13336 | 19975.23 |
| M61 | 17453 | 5697 | 22251 | … | 11986 | 5872 | 17713 | 19555.77 |
| M62 | 34816 | 32949 | 22504 | … | 28357 | 23758 | 22030 | 21029.64 |
| M63 | 34315 | 8304 | 17586 | … | 32093 | 31980 | 6864 | 20518.32 |
| M64 | 27702 | 11314 | 28958 | … | 27678 | 19976 | 22723 | 19873.74 |
| M65 | 31675 | 34816 | 26615 | … | 29630 | 10603 | 18620 | 18433.47 |
| M66 | 8974 | 18328 | 17177 | … | 22529 | 10014 | 22423 | 18569.33 |
| M67 | 15555 | 30780 | 8304 | … | 22850 | 14334 | 11314 | 20402.07 |
| M68 | 5083 | 28863 | 19852 | … | 29328 | 24345 | 31721 | 20516.97 |
| M69 | 9733 | 21325 | 25949 | … | 17177 | 32916 | 10447 | 19603.71 |
| M70 | 33272 | 8662 | 20082 | … | 23758 | 9789 | 31810 | 21192.52 |
| M71 | 10563 | 6618 | 32346 | … | 10015 | 9023 | 33586 | 19658.01 |
| M72 | 24722 | 22911 | 11660 | … | 9068 | 33291 | 22431 | 20286.03 |
| M73 | 32484 | 18328 | 24811 | … | 27752 | 8662 | 21051 | 20641.15 |
| M74 | 23875 | 25690 | 20082 | … | 19149 | 6020 | 27904 | 19641.73 |
| M75 | 9014 | 14119 | 20999 | … | 21098 | 9004 | 14965 | 19503.73 |
| M76 | 24792 | 18467 | 27843 | … | 16779 | 27570 | 33954 | 19189.35 |
| M77 | 27600 | 17120 | 7360 | … | 8298 | 11660 | 33450 | 19647.74 |
| M78 | 11314 | 26869 | 24831 | … | 11781 | 26839 | 27941 | 21040.89 |
| M79 | 22282 | 24038 | 13995 | … | 26160 | 27144 | 6709 | 18534.06 |
| M80 | 21730 | 27752 | 6358 | … | 14815 | 27000 | 6980 | 19602.97 |
| M81 | 11713 | 6980 | 28643 | … | 29911 | 6020 | 32769 | 20977.84 |
| M82 | 13012 | 26839 | 31675 | … | 16878 | 24880 | 12517 | 20955.68 |
| M83 | 24413 | 11986 | 31225 | … | 21128 | 18265 | 27941 | 19995.49 |
| M84 | 5892 | 27065 | 22379 | … | 13567 | 18613 | 18712 | 19305.38 |
| M85 | 20999 | 11781 | 31770 | … | 16291 | 7646 | 17800 | 20141.16 |
| M86 | 7686 | 6922 | 7479 | … | 20932 | 24792 | 13756 | 18913.68 |
| M87 | 24038 | 34816 | 29490 | … | 26938 | 22359 | 26044 | 21007.05 |
| M88 | 22802 | 8009 | 8662 | … | 18738 | 30233 | 33060 | 20713.17 |
| M89 | 30582 | 11809 | 16059 | … | 14517 | 10002 | 27780 | 19979.99 |
| M90 | 8887 | 16137 | 11986 | … | 19763 | 16727 | 8298 | 19705.65 |
| M91 | 18712 | 6864 | 34659 | … | 31527 | 13851 | 10793 | 20075.36 |
| M92 | 26894 | 32711 | 10694 | … | 21839 | 28505 | 33169 | 21571.22 |
| M93 | 9004 | 19031 | 13042 | … | 26894 | 33291 | 29373 | 19579.25 |
| M94 | 20496 | 34499 | 5946 | … | 31518 | 22911 | 33794 | 20900.27 |
| M95 | 24522 | 19418 | 15164 | … | 30058 | 31693 | 21730 | 19112.64 |
| M96 | 26181 | 30728 | 28519 | … | 8780 | 14517 | 23112 | 19171.71 |
| M97 | 13161 | 32769 | 19823 | … | 18674 | 8009 | 31477 | 18401.58 |
| M98 | 21592 | 33569 | 15662 | … | 8780 | 18228 | 32357 | 21024.33 |
| M99 | 20738 | 20999 | 21537 | … | 25085 | 5848 | 10002 | 19710.23 |
| M100 | 26415 | 16347 | 23758 | … | 7646 | 8341 | 14068 | 20278.31 |
media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las muestras es de: ", media.todas.muestras)
## [1] "La media de todas las muestras es de: 19947.98"
# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "red") +
labs(title = "Población",
subtitle = paste("ME = ", media.p),
caption = "Fuente propia") +
geom_vline(xintercept = media.m, col='blue') +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g1 <- g1 + theme(
plot.title = element_text(color = "black", size = 10, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "green") +
geom_vline(xintercept = media.todas.muestras, col='red') +
labs(title = "Distribución muestral de la media CIEN",
subtitle = paste("Media =", media.todas.muestras),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g2 <- g2 + theme(
plot.title = element_text(color = "black", size = 10, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)
Se observa la diferencia de forma de las distribuciones poblacional y muestral de medias.
También existe una diferencia en el rango de las medias muestrales en comparación con el rango de la población; esta varía de 5000 a 30000, mientras que las medias muestrales varían de 17000 a 21000 en sueldos.
Se determinan mil (1000) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media [@lind2015].
muestras = as.list(NULL)
m.muestras = NULL
for (i in 1:q2) {
muestras[[i]] <- sample(x = poblacion$sueldo, size = q2, replace = TRUE)
m.muestras[i] <- mean(muestras[[i]])
}
Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.
Como son mil muestras solo se muestran las primeras cincuenta y las últimas cincuenta.
sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q2)
rownames(sueldos) <- paste0("M",1:q2)
tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q2-2):q2], medias.muestrales = m.muestras)
kable(head(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))
| sueldo1 | sueldo2 | sueldo3 | … | sueldo998 | sueldo999 | sueldo1000 | medias.muestrales | |
|---|---|---|---|---|---|---|---|---|
| M1 | 12031 | 22379 | 16291 | … | 21325 | 31690 | 31770 | 19994.70 |
| M2 | 7793 | 19785 | 22718 | … | 13814 | 16059 | 5117 | 19872.05 |
| M3 | 8974 | 21382 | 20082 | … | 19682 | 24993 | 27600 | 19901.51 |
| M4 | 19852 | 17635 | 22221 | … | 28120 | 23375 | 26341 | 20170.81 |
| M5 | 15871 | 18552 | 24522 | … | 28613 | 14517 | 33070 | 20194.61 |
| M6 | 9068 | 23352 | 16283 | … | 33569 | 13028 | 9014 | 20464.55 |
| M7 | 32185 | 20496 | 27579 | … | 22598 | 8699 | 31486 | 20104.27 |
| M8 | 10823 | 22683 | 16174 | … | 6552 | 26415 | 10541 | 20123.00 |
| M9 | 32143 | 30134 | 15591 | … | 31770 | 29935 | 23078 | 19813.98 |
| M10 | 9548 | 17074 | 23040 | … | 9068 | 29314 | 11265 | 20494.72 |
| M11 | 31800 | 22507 | 20349 | … | 13028 | 5808 | 7290 | 19824.47 |
| M12 | 30267 | 26938 | 32711 | … | 26875 | 23040 | 7646 | 20159.41 |
| M13 | 27752 | 15339 | 7191 | … | 26448 | 32711 | 14068 | 19786.25 |
| M14 | 7863 | 8699 | 13516 | … | 10117 | 9733 | 9042 | 19972.82 |
| M15 | 19439 | 17177 | 13558 | … | 14965 | 11604 | 26639 | 19709.72 |
| M16 | 5467 | 15662 | 27678 | … | 14914 | 30058 | 14439 | 19992.27 |
| M17 | 30233 | 8699 | 11265 | … | 7469 | 5127 | 11473 | 19987.42 |
| M18 | 24607 | 27600 | 8829 | … | 8497 | 15662 | 28617 | 19739.77 |
| M19 | 15960 | 30728 | 9042 | … | 19418 | 13042 | 9347 | 20355.06 |
| M20 | 22423 | 27678 | 25103 | … | 31477 | 25129 | 33107 | 20323.04 |
| M21 | 13161 | 8662 | 7479 | … | 5907 | 12422 | 31678 | 20343.07 |
| M22 | 32574 | 14905 | 17177 | … | 32994 | 12517 | 15871 | 20046.35 |
| M23 | 31287 | 26078 | 22529 | … | 18914 | 19125 | 9733 | 19901.67 |
| M24 | 5907 | 21430 | 6618 | … | 28643 | 20874 | 13343 | 19927.58 |
| M25 | 28055 | 29490 | 21537 | … | 8991 | 26296 | 5697 | 20194.80 |
| M26 | 13042 | 8304 | 10694 | … | 20613 | 28617 | 14905 | 20168.91 |
| M27 | 31486 | 26639 | 34643 | … | 27843 | 31770 | 7615 | 20345.89 |
| M28 | 33569 | 19763 | 8967 | … | 8497 | 22213 | 25368 | 20216.20 |
| M29 | 33569 | 22911 | 33272 | … | 10117 | 21015 | 19755 | 19915.20 |
| M30 | 13856 | 26869 | 27687 | … | 26617 | 21286 | 24792 | 20366.50 |
| M31 | 9444 | 32574 | 13202 | … | 6928 | 24831 | 5467 | 19778.38 |
| M32 | 31800 | 18900 | 29314 | … | 13202 | 8809 | 21430 | 19889.15 |
| M33 | 24514 | 23091 | 18914 | … | 23920 | 5880 | 14905 | 20329.55 |
| M34 | 32949 | 30575 | 16878 | … | 20576 | 26078 | 30248 | 20255.97 |
| M35 | 22379 | 9548 | 29732 | … | 26671 | 10589 | 19935 | 19805.25 |
| M36 | 9068 | 30450 | 33914 | … | 8099 | 16353 | 6928 | 20596.61 |
| M37 | 17120 | 16772 | 22598 | … | 6020 | 27065 | 18457 | 20403.46 |
| M38 | 34580 | 28643 | 29259 | … | 18738 | 22148 | 26296 | 20248.90 |
| M39 | 27570 | 13882 | 26425 | … | 18620 | 30134 | 30233 | 19920.21 |
| M40 | 7646 | 14897 | 14215 | … | 14742 | 26713 | 30248 | 20115.70 |
| M41 | 9733 | 5902 | 20496 | … | 22251 | 32636 | 6933 | 19635.41 |
| M42 | 26405 | 19779 | 10563 | … | 22718 | 32484 | 33742 | 20027.49 |
| M43 | 21098 | 5872 | 25949 | … | 10294 | 29774 | 5117 | 20212.17 |
| M44 | 14802 | 23630 | 14941 | … | 27843 | 27752 | 24993 | 19864.13 |
| M45 | 27600 | 18265 | 26869 | … | 21537 | 8341 | 29259 | 19622.10 |
| M46 | 16353 | 22742 | 16283 | … | 13567 | 14797 | 8304 | 20333.42 |
| M47 | 18738 | 10397 | 13028 | … | 29328 | 12099 | 9623 | 20130.38 |
| M48 | 32993 | 13851 | 6922 | … | 5128 | 17177 | 10775 | 20281.21 |
| M49 | 14438 | 26515 | 28219 | … | 26617 | 33586 | 23170 | 19817.89 |
| M50 | 34643 | 21456 | 19408 | … | 5848 | 31298 | 5848 | 20001.39 |
kable(tail(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))
| sueldo1 | sueldo2 | sueldo3 | … | sueldo998 | sueldo999 | sueldo1000 | medias.muestrales | |
|---|---|---|---|---|---|---|---|---|
| M951 | 16878 | 26078 | 8099 | … | 26425 | 26415 | 20349 | 19977.27 |
| M952 | 27780 | 11713 | 31626 | … | 16536 | 13923 | 31690 | 19990.21 |
| M953 | 8009 | 16813 | 11604 | … | 27284 | 30233 | 5848 | 19535.72 |
| M954 | 16353 | 5946 | 28416 | … | 32994 | 5112 | 22612 | 19828.62 |
| M955 | 27201 | 14797 | 22802 | … | 8991 | 9531 | 10932 | 20336.84 |
| M956 | 22282 | 8735 | 21880 | … | 22911 | 19125 | 25008 | 20441.04 |
| M957 | 19697 | 23758 | 12555 | … | 5720 | 28120 | 34435 | 19997.35 |
| M958 | 18345 | 24700 | 24811 | … | 22802 | 5112 | 10307 | 19805.47 |
| M959 | 34710 | 22359 | 17120 | … | 6020 | 6358 | 20576 | 20491.06 |
| M960 | 16748 | 10770 | 25716 | … | 18575 | 16059 | 8341 | 20038.70 |
| M961 | 22529 | 10002 | 21880 | … | 26044 | 14905 | 21592 | 19740.79 |
| M962 | 21537 | 8009 | 32574 | … | 34476 | 13161 | 23875 | 20135.71 |
| M963 | 27065 | 6416 | 29244 | … | 27411 | 15591 | 19439 | 19848.23 |
| M964 | 10793 | 7030 | 10148 | … | 26615 | 5808 | 33638 | 19956.54 |
| M965 | 20932 | 31519 | 32711 | … | 9013 | 17942 | 21730 | 19907.13 |
| M966 | 11473 | 6864 | 11660 | … | 33291 | 28519 | 7455 | 20104.24 |
| M967 | 16343 | 19661 | 5892 | … | 19682 | 20999 | 24513 | 19880.99 |
| M968 | 13995 | 25502 | 31518 | … | 19495 | 9068 | 28613 | 20464.04 |
| M969 | 29033 | 14797 | 8662 | … | 34659 | 24513 | 21730 | 19997.97 |
| M970 | 15327 | 33974 | 33272 | … | 22251 | 25103 | 5880 | 20285.98 |
| M971 | 27958 | 6552 | 16950 | … | 12031 | 30289 | 25716 | 20093.89 |
| M972 | 24901 | 5117 | 5183 | … | 13756 | 34970 | 22379 | 20282.94 |
| M973 | 17378 | 33638 | 32234 | … | 14068 | 19019 | 18728 | 19913.09 |
| M974 | 8881 | 5808 | 24514 | … | 10002 | 9733 | 19904 | 19685.83 |
| M975 | 28724 | 34372 | 32337 | … | 17074 | 26907 | 27570 | 20261.62 |
| M976 | 6618 | 32330 | 16813 | … | 14263 | 25716 | 10117 | 20104.37 |
| M977 | 33107 | 16343 | 34115 | … | 33776 | 19976 | 23397 | 20187.57 |
| M978 | 5848 | 15164 | 16950 | … | 10603 | 14215 | 15994 | 19911.16 |
| M979 | 15994 | 14815 | 10589 | … | 33450 | 8176 | 18506 | 20199.65 |
| M980 | 5128 | 11314 | 14439 | … | 14905 | 10823 | 15339 | 20619.74 |
| M981 | 26617 | 21880 | 16283 | … | 21098 | 22526 | 32303 | 19774.68 |
| M982 | 24195 | 12555 | 14600 | … | 11986 | 19904 | 17120 | 19916.81 |
| M983 | 27904 | 10843 | 8662 | … | 23630 | 26160 | 10365 | 20521.69 |
| M984 | 17635 | 6922 | 34372 | … | 8780 | 11473 | 28357 | 19956.49 |
| M985 | 32234 | 27561 | 27858 | … | 22507 | 23112 | 8735 | 19662.88 |
| M986 | 16059 | 16445 | 5678 | … | 27579 | 22282 | 23091 | 20425.01 |
| M987 | 19661 | 21828 | 28505 | … | 27752 | 13534 | 7290 | 19971.51 |
| M988 | 23352 | 24012 | 12939 | … | 12411 | 32396 | 31810 | 20205.34 |
| M989 | 9013 | 24937 | 19149 | … | 5946 | 23397 | 23352 | 19965.76 |
| M990 | 10932 | 7299 | 24413 | … | 21157 | 26615 | 13028 | 19961.44 |
| M991 | 13756 | 27285 | 8172 | … | 7479 | 13787 | 21914 | 19771.71 |
| M992 | 23416 | 31527 | 7878 | … | 29911 | 21128 | 18457 | 19963.67 |
| M993 | 12422 | 7360 | 11660 | … | 8855 | 19095 | 32396 | 19926.53 |
| M994 | 16291 | 13983 | 33169 | … | 19904 | 28958 | 28617 | 19946.29 |
| M995 | 7678 | 32590 | 25234 | … | 10793 | 18265 | 8099 | 19996.00 |
| M996 | 9042 | 12367 | 32916 | … | 13558 | 16343 | 8699 | 20192.24 |
| M997 | 24012 | 14914 | 6618 | … | 7455 | 13042 | 24607 | 20110.37 |
| M998 | 23758 | 9068 | 13080 | … | 18345 | 5128 | 10603 | 19387.00 |
| M999 | 23149 | 10359 | 13541 | … | 8809 | 19779 | 24811 | 20274.81 |
| M1000 | 13012 | 14119 | 29490 | … | 22598 | 21157 | 31626 | 20453.24 |
media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las ", q2, " muestras "," es de: ", media.todas.muestras)
## [1] "La media de todas las 1000 muestras es de: 19982.73"
# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "red") +
labs(title = "Población",
subtitle = paste("ME=", media.p),
caption = "Fuente propia") +
geom_vline(xintercept = media.m, col='blue') +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g1 <- g1 + theme(
plot.title = element_text(color = "black", size = 10, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "green") +
geom_vline(xintercept = media.todas.muestras, col='red') +
labs(title = "Distribución muestral de la media MIL",
subtitle = paste("Media =", media.todas.muestras),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g2 <- g2 + theme(
plot.title = element_text(color = "black", size = 10, face = "bold"),
plot.subtitle = element_text(color = "black",size=6),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)
Se observa que la media de todas las muestras se acerca a la media de la población así mismo, la distribución muestral de la media es una distribución que se parece a distribución normal con gráfica de gauss o campana.
Entre mas muestras haya, la dispersión de los datos disminuye y entre más muestras se determinen, el valor de la media de todas las muestras se acerca al valor de la media poblacional.
En este nuevo caso al igual que en los anteriores casos simulamos una población, los datos de esta son: Media de 19671 y una desviación de 8921, de todo esto tomamos una muestra como en el caso 25, de 100 trabajadores, tiene una media de 21003 y tiene un error muestra como en el caso 26 de -1331.
En otra ocasion nos dio una media de 19624 con un error muestral de 47.
En el ultimo obtuvimos una media de 19680, con solamente un error muestral de 8
Para desarrollar este caso utilizamos los casos anteriores, bueno esto a sido todo por este caso.