Objetivo

Determinar la distribución muestral de la media.

Descripción

Se simula población con sueldos de trabajadores de una Institución educativa.

Se crean datos relacionados con la población y se determinan los parámetros descriptivos.

Se crean 100 y 1000 muestras diferentes con n elementos diferentes relacionados con la población y se determinan la media aritmética de cada muestra.

Se determina la distribución muestral de la media de las cien muestras y se idnetifica que la distribución se acera a una distribución normal además de que la media de la distribución muestral se acerca a la media de la población.

Marco de referencia

Si se organizan las medias de todas las muestras posibles (por decir cien y mil) en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA es la distribución de probabilidad de todas las posibles medias de las muestras de un determinado tamaño muestral de la población. [@lind2015].

Desarrollo

Configuraciones iniciales

Librerías

library(cowplot)
## Warning: package 'cowplot' was built under R version 4.1.3
library(ggplot2)
library(knitr)
## Warning: package 'knitr' was built under R version 4.1.3

Notación normal

Para que no aparezca notación científica

options(scipen=999)

Semilla

set.seed(2021)

Variables iniciales

N <- 650 # Cantidad de datos de población
rango <- 5000:35000 # Rango 
n = 100  # Cantidad de datos de muestra
q1 = 100  # Cantidad de muestras m1, m2, m3
q2 = 1000  # Cantidad de muestras m1, m2, m3

Crear datos

Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de 650 trabajadores que laboran en una Institución educativa. El rango está entre 5000 y 35000 pesos ($) mensuales.

Población

\[ poblacion = \text{ {x | x es un trabajador de una Institución educativa; }} \therefore \\ x_1, x_2, x_3, ... ,x_{N=6500} \]

poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size =  N, replace = TRUE))
poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size =  N, replace = TRUE))

Primeros treinta observaciones de Población

head(poblacion$sueldo, 30)
##  [1]  7646 17800 19935  9402 26515 13642 24722 19697 19335 23170 30955 23636
## [13] 12555 15871 10775 13851 22742 16813  5112 14742 30582 24038 21128  5907
## [25] 30007 24472 10014 26615 25008 21828

Últimos treinta observaciones de Población

tail(poblacion$sueldo, 30)
##  [1] 24259 32260 27674 22529 13336  6448 18538 24195 22030 26875 21592 14914
## [13]  6618  7469 26938 24413 26709  5183 32993 16748 13663  6922 12411 15591
## [25] 20874  9014 27858 17942  6020 34710

Parámetros poblacionales

summary(poblacion$sueldo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5083   12526   19920   19996   27236   34970
media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)

Se tiene una media aritmética poblacional de 19996.41 con una desviación estándar de 8602.6.

\[ \mu = \frac{\sum{sueldo_x}}{N} = 19671.45 \]

Muestra

Se determina una primera muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el valor de \(x\). \[ muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100} \]

La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.

xs <- sample(x = 1:n, size =  n, replace = FALSE)
muestra <- poblacion[xs,]

Estadísticos muestrales

summary(muestra$sueldo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5112   12898   20481   19493   25890   34580
media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)

Se tiene una media aritmética de la primera muestra de 19492.81 con una desviación estándar de 8602.6.

\[ \bar{x_1} = \frac{\sum{sueldo_x}}{n} = 21002.77 \]

Error muestral

El error muestral es porque los estadísticos no son valores numéricos igual que los parámetros de la población, siempre existirá una diferencia.

media.p; media.m
## [1] 19996.41
## [1] 19492.81
desv.p; desv.m
## [1] 8602.6
## [1] 7960.58

Se determina el error muestral del estadístico media de la muestra con respecto al parámetro de la media poblacional

dif.media <- media.p - media.m
paste("El error muestral con respecto a la media es de: ", dif.media)
## [1] "El error muestral con respecto a la media es de:  503.599999999999"

\[ \text{Error muestral =} (\mu - \bar{x}) = (19671.45 - 21002.77) = -1331.32 \]

Histograma de población y muestra

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "red") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p, "; ds=", desv.p,  "; Err muestral media=",dif.media),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(muestra, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.m, col='red') +
  labs(title = "Muestra",
      subtitle = paste("me=", media.m, "; ds.=", desv.m),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que no son distribuciones normales, ni los datos de población ni los datos de la muestra se comportan como distribución normal.

Distribución muestral de la media 100 muestras.

Se determinan cien (100) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media [@lind2015].

muestras = as.list(NULL)
m.muestras = NULL
for (i in 1:q1) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q1, replace = FALSE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

Distribución de las muestras 100

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

La función t() transforma registros a columnas de un data.frame.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q1)
rownames(sueldos) <- paste0("M",1:q1)
tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q1-2):q1], medias.muestrales = m.muestras)
kable(tabla, caption = "Tabla de medias aritméticas de cien muestras de cien sueldos cada una")
Tabla de medias aritméticas de cien muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo98 sueldo99 sueldo100 medias.muestrales
M1 5946 27466 21839 20082 23630 32093 19407.61
M2 21015 34643 14815 28958 18575 10369 20793.83
M3 23230 27843 7678 21828 19779 32484 19184.54
M4 16619 31898 16856 5128 15960 19455 19837.62
M5 18204 29244 11314 22718 14500 33484 19001.86
M6 32164 32396 17592 29935 24513 8172 19092.28
M7 16619 27285 14896 26499 12023 14439 20306.05
M8 33569 18929 8780 15006 30058 7686 19649.74
M9 18914 16347 22504 20496 19935 21325 20355.47
M10 22612 14500 16748 9023 21592 17635 19753.90
M11 7698 31678 31770 27752 32972 11361 20652.36
M12 18620 12367 21306 27858 33778 19852 19422.12
M13 13534 10482 22529 27958 11454 11265 19447.40
M14 11265 31225 30134 24700 34643 27674 20411.62
M15 31486 24831 10015 27000 6618 19335 20164.59
M16 33091 14797 32234 20073 28055 28660 19000.29
M17 15960 16748 16536 19031 8795 11833 20295.82
M18 22529 32330 10002 5880 25649 7863 21325.73
M19 15960 7455 28055 31810 9182 25716 20323.06
M20 21128 13851 10117 20349 22850 6792 20411.36
M21 18929 27411 31721 20860 32346 12894 18940.95
M22 12099 25234 24831 26181 28613 5720 19443.10
M23 16748 19823 15871 27248 8298 14215 20554.03
M24 18900 25865 7611 28724 25103 16445 19392.97
M25 27284 33794 33169 8497 23352 26874 20180.53
M26 21456 16748 33569 7290 34970 31675 20171.22
M27 24818 6326 10117 7479 31518 24993 20289.68
M28 13787 26615 29774 21430 26150 32164 20342.66
M29 28958 32711 22850 6980 6326 23477 19118.23
M30 27752 13995 16503 14896 18575 8304 21114.45
M31 16950 6922 27678 20388 28617 28219 20044.37
M32 34115 18728 10447 31690 10775 24700 19286.99
M33 29205 10932 33914 7878 14068 17713 20836.21
M34 11265 25008 28724 19904 16813 13663 18967.58
M35 33450 13882 34435 15056 32396 5117 20643.57
M36 33169 25085 29205 12422 34095 10366 21760.83
M37 20423 10117 29911 14965 21730 13243 19882.64
M38 21867 19976 26875 8887 8662 9182 18472.55
M39 31519 11383 15555 27674 8967 21015 19985.06
M40 27579 13343 24413 22221 7678 6864 20733.94
M41 19755 34499 5697 11809 23416 7290 20219.97
M42 25054 7878 29774 27144 8809 7698 19429.24
M43 20999 20932 8298 5128 8855 26938 18211.22
M44 6618 26699 10359 25502 15871 15327 21629.68
M45 22251 14068 26078 5720 29630 31486 19977.31
M46 33066 16137 24792 21015 11833 6416 19650.39
M47 20999 12939 27904 21828 5697 34095 19740.96
M48 32303 29935 16772 14941 5697 22526 19019.84
M49 11833 29911 8780 14438 23499 24714 19733.19
M50 19095 27843 21134 25739 17800 14334 20349.44
M51 9789 10366 17378 7698 31486 26341 18281.51
M52 10033 18900 28519 20576 8304 19863 20096.40
M53 16291 14896 20932 19415 8304 12939 19577.30
M54 33794 19904 32994 24514 30233 15645 20910.93
M55 8881 19031 19095 13625 16137 18538 19809.39
M56 30248 13567 14428 10365 7899 25649 19761.51
M57 27600 10015 32636 30267 34659 5128 21500.41
M58 5534 31675 14742 32590 33450 17237 18941.45
M59 19353 33569 25690 16283 14742 29630 20023.13
M60 25649 12031 29774 14905 5117 13336 19975.23
M61 17453 5697 22251 11986 5872 17713 19555.77
M62 34816 32949 22504 28357 23758 22030 21029.64
M63 34315 8304 17586 32093 31980 6864 20518.32
M64 27702 11314 28958 27678 19976 22723 19873.74
M65 31675 34816 26615 29630 10603 18620 18433.47
M66 8974 18328 17177 22529 10014 22423 18569.33
M67 15555 30780 8304 22850 14334 11314 20402.07
M68 5083 28863 19852 29328 24345 31721 20516.97
M69 9733 21325 25949 17177 32916 10447 19603.71
M70 33272 8662 20082 23758 9789 31810 21192.52
M71 10563 6618 32346 10015 9023 33586 19658.01
M72 24722 22911 11660 9068 33291 22431 20286.03
M73 32484 18328 24811 27752 8662 21051 20641.15
M74 23875 25690 20082 19149 6020 27904 19641.73
M75 9014 14119 20999 21098 9004 14965 19503.73
M76 24792 18467 27843 16779 27570 33954 19189.35
M77 27600 17120 7360 8298 11660 33450 19647.74
M78 11314 26869 24831 11781 26839 27941 21040.89
M79 22282 24038 13995 26160 27144 6709 18534.06
M80 21730 27752 6358 14815 27000 6980 19602.97
M81 11713 6980 28643 29911 6020 32769 20977.84
M82 13012 26839 31675 16878 24880 12517 20955.68
M83 24413 11986 31225 21128 18265 27941 19995.49
M84 5892 27065 22379 13567 18613 18712 19305.38
M85 20999 11781 31770 16291 7646 17800 20141.16
M86 7686 6922 7479 20932 24792 13756 18913.68
M87 24038 34816 29490 26938 22359 26044 21007.05
M88 22802 8009 8662 18738 30233 33060 20713.17
M89 30582 11809 16059 14517 10002 27780 19979.99
M90 8887 16137 11986 19763 16727 8298 19705.65
M91 18712 6864 34659 31527 13851 10793 20075.36
M92 26894 32711 10694 21839 28505 33169 21571.22
M93 9004 19031 13042 26894 33291 29373 19579.25
M94 20496 34499 5946 31518 22911 33794 20900.27
M95 24522 19418 15164 30058 31693 21730 19112.64
M96 26181 30728 28519 8780 14517 23112 19171.71
M97 13161 32769 19823 18674 8009 31477 18401.58
M98 21592 33569 15662 8780 18228 32357 21024.33
M99 20738 20999 21537 25085 5848 10002 19710.23
M100 26415 16347 23758 7646 8341 14068 20278.31

Media de todas las muestras 100

media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las muestras es de: ", media.todas.muestras)
## [1] "La media de todas las muestras es de:  19947.98"

Histograma de medias muestrales CIEN

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "red") +
  labs(title = "Población",
      subtitle = paste("ME = ", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='blue') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media CIEN",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa la diferencia de forma de las distribuciones poblacional y muestral de medias.

También existe una diferencia en el rango de las medias muestrales en comparación con el rango de la población; esta varía de 5000 a 30000, mientras que las medias muestrales varían de 17000 a 21000 en sueldos.

Distribución muestral de la media 1000 muestras.

Se determinan mil (1000) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media [@lind2015].

muestras = as.list(NULL)
m.muestras = NULL
for (i in 1:q2) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q2, replace = TRUE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

Distribución de las muestras 1000

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

Como son mil muestras solo se muestran las primeras cincuenta y las últimas cincuenta.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q2)
rownames(sueldos) <- paste0("M",1:q2)
tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q2-2):q2], medias.muestrales = m.muestras)

Primeras cincuenta

kable(head(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))
Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo998 sueldo999 sueldo1000 medias.muestrales
M1 12031 22379 16291 21325 31690 31770 19994.70
M2 7793 19785 22718 13814 16059 5117 19872.05
M3 8974 21382 20082 19682 24993 27600 19901.51
M4 19852 17635 22221 28120 23375 26341 20170.81
M5 15871 18552 24522 28613 14517 33070 20194.61
M6 9068 23352 16283 33569 13028 9014 20464.55
M7 32185 20496 27579 22598 8699 31486 20104.27
M8 10823 22683 16174 6552 26415 10541 20123.00
M9 32143 30134 15591 31770 29935 23078 19813.98
M10 9548 17074 23040 9068 29314 11265 20494.72
M11 31800 22507 20349 13028 5808 7290 19824.47
M12 30267 26938 32711 26875 23040 7646 20159.41
M13 27752 15339 7191 26448 32711 14068 19786.25
M14 7863 8699 13516 10117 9733 9042 19972.82
M15 19439 17177 13558 14965 11604 26639 19709.72
M16 5467 15662 27678 14914 30058 14439 19992.27
M17 30233 8699 11265 7469 5127 11473 19987.42
M18 24607 27600 8829 8497 15662 28617 19739.77
M19 15960 30728 9042 19418 13042 9347 20355.06
M20 22423 27678 25103 31477 25129 33107 20323.04
M21 13161 8662 7479 5907 12422 31678 20343.07
M22 32574 14905 17177 32994 12517 15871 20046.35
M23 31287 26078 22529 18914 19125 9733 19901.67
M24 5907 21430 6618 28643 20874 13343 19927.58
M25 28055 29490 21537 8991 26296 5697 20194.80
M26 13042 8304 10694 20613 28617 14905 20168.91
M27 31486 26639 34643 27843 31770 7615 20345.89
M28 33569 19763 8967 8497 22213 25368 20216.20
M29 33569 22911 33272 10117 21015 19755 19915.20
M30 13856 26869 27687 26617 21286 24792 20366.50
M31 9444 32574 13202 6928 24831 5467 19778.38
M32 31800 18900 29314 13202 8809 21430 19889.15
M33 24514 23091 18914 23920 5880 14905 20329.55
M34 32949 30575 16878 20576 26078 30248 20255.97
M35 22379 9548 29732 26671 10589 19935 19805.25
M36 9068 30450 33914 8099 16353 6928 20596.61
M37 17120 16772 22598 6020 27065 18457 20403.46
M38 34580 28643 29259 18738 22148 26296 20248.90
M39 27570 13882 26425 18620 30134 30233 19920.21
M40 7646 14897 14215 14742 26713 30248 20115.70
M41 9733 5902 20496 22251 32636 6933 19635.41
M42 26405 19779 10563 22718 32484 33742 20027.49
M43 21098 5872 25949 10294 29774 5117 20212.17
M44 14802 23630 14941 27843 27752 24993 19864.13
M45 27600 18265 26869 21537 8341 29259 19622.10
M46 16353 22742 16283 13567 14797 8304 20333.42
M47 18738 10397 13028 29328 12099 9623 20130.38
M48 32993 13851 6922 5128 17177 10775 20281.21
M49 14438 26515 28219 26617 33586 23170 19817.89
M50 34643 21456 19408 5848 31298 5848 20001.39

Últimas cincuenta

kable(tail(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))
Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo998 sueldo999 sueldo1000 medias.muestrales
M951 16878 26078 8099 26425 26415 20349 19977.27
M952 27780 11713 31626 16536 13923 31690 19990.21
M953 8009 16813 11604 27284 30233 5848 19535.72
M954 16353 5946 28416 32994 5112 22612 19828.62
M955 27201 14797 22802 8991 9531 10932 20336.84
M956 22282 8735 21880 22911 19125 25008 20441.04
M957 19697 23758 12555 5720 28120 34435 19997.35
M958 18345 24700 24811 22802 5112 10307 19805.47
M959 34710 22359 17120 6020 6358 20576 20491.06
M960 16748 10770 25716 18575 16059 8341 20038.70
M961 22529 10002 21880 26044 14905 21592 19740.79
M962 21537 8009 32574 34476 13161 23875 20135.71
M963 27065 6416 29244 27411 15591 19439 19848.23
M964 10793 7030 10148 26615 5808 33638 19956.54
M965 20932 31519 32711 9013 17942 21730 19907.13
M966 11473 6864 11660 33291 28519 7455 20104.24
M967 16343 19661 5892 19682 20999 24513 19880.99
M968 13995 25502 31518 19495 9068 28613 20464.04
M969 29033 14797 8662 34659 24513 21730 19997.97
M970 15327 33974 33272 22251 25103 5880 20285.98
M971 27958 6552 16950 12031 30289 25716 20093.89
M972 24901 5117 5183 13756 34970 22379 20282.94
M973 17378 33638 32234 14068 19019 18728 19913.09
M974 8881 5808 24514 10002 9733 19904 19685.83
M975 28724 34372 32337 17074 26907 27570 20261.62
M976 6618 32330 16813 14263 25716 10117 20104.37
M977 33107 16343 34115 33776 19976 23397 20187.57
M978 5848 15164 16950 10603 14215 15994 19911.16
M979 15994 14815 10589 33450 8176 18506 20199.65
M980 5128 11314 14439 14905 10823 15339 20619.74
M981 26617 21880 16283 21098 22526 32303 19774.68
M982 24195 12555 14600 11986 19904 17120 19916.81
M983 27904 10843 8662 23630 26160 10365 20521.69
M984 17635 6922 34372 8780 11473 28357 19956.49
M985 32234 27561 27858 22507 23112 8735 19662.88
M986 16059 16445 5678 27579 22282 23091 20425.01
M987 19661 21828 28505 27752 13534 7290 19971.51
M988 23352 24012 12939 12411 32396 31810 20205.34
M989 9013 24937 19149 5946 23397 23352 19965.76
M990 10932 7299 24413 21157 26615 13028 19961.44
M991 13756 27285 8172 7479 13787 21914 19771.71
M992 23416 31527 7878 29911 21128 18457 19963.67
M993 12422 7360 11660 8855 19095 32396 19926.53
M994 16291 13983 33169 19904 28958 28617 19946.29
M995 7678 32590 25234 10793 18265 8099 19996.00
M996 9042 12367 32916 13558 16343 8699 20192.24
M997 24012 14914 6618 7455 13042 24607 20110.37
M998 23758 9068 13080 18345 5128 10603 19387.00
M999 23149 10359 13541 8809 19779 24811 20274.81
M1000 13012 14119 29490 22598 21157 31626 20453.24

Media de todas las muestras 1000

media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las ", q2, " muestras "," es de: ", media.todas.muestras)
## [1] "La media de todas las  1000  muestras   es de:  19982.73"

Histograma de medias muestrales MIL

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "red") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='blue') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media MIL",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=6),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que la media de todas las muestras se acerca a la media de la población así mismo, la distribución muestral de la media es una distribución que se parece a distribución normal con gráfica de gauss o campana.

Entre mas muestras haya, la dispersión de los datos disminuye y entre más muestras se determinen, el valor de la media de todas las muestras se acerca al valor de la media poblacional.

Interpretación

En este nuevo caso al igual que en los anteriores casos simulamos una población, los datos de esta son: Media de 19671 y una desviación de 8921, de todo esto tomamos una muestra como en el caso 25, de 100 trabajadores, tiene una media de 21003 y tiene un error muestra como en el caso 26 de -1331.

En otra ocasion nos dio una media de 19624 con un error muestral de 47.

En el ultimo obtuvimos una media de 19680, con solamente un error muestral de 8

Para desarrollar este caso utilizamos los casos anteriores, bueno esto a sido todo por este caso.

Bibliografía