Processing math: 0%
  • Objetivo
  • Descripción
  • Marco de referencia
  • Desarrollo
    • Configuraciones iniciales
      • Librerías
      • Notación normal
      • Semilla
      • Variables iniciales
    • Crear datos
      • Población
      • Primeros treinta observaciones de Población
      • Últimos treinta observaciones de Población
      • Parámetros poblacionales
    • Muestra
      • Estadísticos muestrales
    • Error muestral
    • Histograma de población y muestra
    • Distribución muestral de la media 100 muestras.
      • Distribución de las muestras 100
      • Media de todas las muestras 100
      • Histograma de medias muestrales CIEN
    • Distribución muestral de la media 1000 muestras.
      • Distribución de las muestras 1000
        • Primeras cincuenta
        • Últimas cincuenta
      • Media de todas las muestras 1000
      • Histograma de medias muestrales MIL
  • Interpretación
  • Bibliografía

Objetivo

Determinar la distribución muestral de la media.

Descripción

Se simula población con sueldos de trabajadores de una Institución educativa.

Se crean datos relacionados con la población y se determinan los parámetros descriptivos.

Se crean 100 y 1000 muestras diferentes con n elementos diferentes relacionados con la población y se determinan la media aritmética de cada muestra.

Se determina la distribución muestral de la media de las cien muestras y se idnetifica que la distribución se acera a una distribución normal además de que la media de la distribución muestral se acerca a la media de la población.

Marco de referencia

Si se organizan las medias de todas las muestras posibles (por decir cien y mil) en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA es la distribución de probabilidad de todas las posibles medias de las muestras de un determinado tamaño muestral de la población. (Lind, Marchal, and Wathen 2015).

Desarrollo

Configuraciones iniciales

Librerías

library(cowplot)
library(ggplot2)
library(knitr)

Notación normal

Para que no aparezca notación científica

options(scipen=999)

Semilla

set.seed(2021)

Variables iniciales

N <- 650 # Cantidad de datos de población
rango <- 5000:35000 # Rango 
n = 100  # Cantidad de datos de muestra
q1 = 100  # Cantidad de muestras m1, m2, m3
q2 = 1000  # Cantidad de muestras m1, m2, m3

Crear datos

Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de 650 trabajadores que laboran en una Institución educativa. El rango está entre 5000 y 35000 pesos ($) mensuales.

Población

poblacion= {x | x es un trabajador de una Institución educativa; }

poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size =  N, replace = TRUE))

Primeros treinta observaciones de Población

head(poblacion$sueldo, 30)
##  [1] 34574 23597 18741 30017 13934 18195 14203 22477 25671  6786 27117 11765
## [13]  9420 25974 21486  5360 29086  7994 14147 34841 30722 22595  9732 32010
## [25] 33461 29935 34209 25643  7148 34013

Últimos treinta observaciones de Población

tail(poblacion$sueldo, 30)
##  [1] 13663 14956  9229  6845 33487 28823  6200  6599  8829 18001 22922  7512
## [13] 10271 28728 19138 10268 29760 26310 25586 31534 11724 17153 29583 29534
## [25] 29805 12690  5076 10719 33265 29357

Parámetros poblacionales

summary(poblacion$sueldo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5052   11837   18752   19671   27605   34969
media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)

Se tiene una media aritmética poblacional de 19671.45 con una desviación estándar de 8921.12.

\mu = \frac{\sum{sueldo_x}}{N} = 19671.45

Muestra

Se determina una primera muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el valor de x. muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100}

La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.

xs <- sample(x = 1:n, size =  n, replace = FALSE)

muestra <- poblacion[xs,]

Estadísticos muestrales

summary(muestra$sueldo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5360   12406   21616   21003   29986   34969
media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)

Se tiene una media aritmética de la primera muestra de 21002.77 con una desviación estándar de 8921.12.

\bar{x_1} = \frac{\sum{sueldo_x}}{n} = 21002.77

Error muestral

El error muestral es porque los estadísticos no son valores numéricos igual que los parámetros de la población, siempre existirá una diferencia.

media.p; media.m
## [1] 19671.45
## [1] 21002.77
desv.p; desv.m
## [1] 8921.12
## [1] 9552.46

Se determina el error muestral del estadístico media de la muestra con respecto al parámetro de la media poblacional

dif.media <- media.p - media.m

paste("El error muestral con respecto a la media es de: ", dif.media)
## [1] "El error muestral con respecto a la media es de:  -1331.32"

\text{Error muestral =} (\mu - \bar{x}) = (19671.45 - 21002.77) = -1331.32

Histograma de población y muestra

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p, "; ds=", desv.p,  "; Err muestral media=",dif.media),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


g2 <- ggplot(muestra, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.m, col='red') +
  labs(title = "Muestra",
      subtitle = paste("me=", media.m, "; ds.=", desv.m),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)

g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que no son distribuciones normales, ni los datos de población ni los datos de la muestra se comportan como distribución normal.

Distribución muestral de la media 100 muestras.

Se determinan cien (100) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media (Lind, Marchal, and Wathen 2015).

muestras = as.list(NULL)
m.muestras = NULL

for (i in 1:q1) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q1, replace = FALSE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

Distribución de las muestras 100

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

La función t() transforma registros a columnas de un data.frame.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q1)
rownames(sueldos) <- paste0("M",1:q1)

tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q1-2):q1], medias.muestrales = m.muestras)
kable(tabla, caption = "Tabla de medias aritméticas de cien muestras de cien sueldos cada una")
Tabla de medias aritméticas de cien muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo98 sueldo99 sueldo100 medias.muestrales
M1 31581 29801 19738 21723 29854 33350 19270.47
M2 34921 7725 24518 20339 18762 17565 20039.20
M3 5052 17837 31258 18396 17153 27117 19767.99
M4 5391 14743 6833 10227 13531 29083 19265.46
M5 8165 15685 6559 11001 23823 8677 19656.18
M6 33027 22344 16336 16475 18339 22476 20287.99
M7 33265 16336 12800 34045 34816 17103 19732.08
M8 29917 33858 22344 10114 12619 34313 20576.04
M9 9420 21966 15867 24405 18781 12595 20408.76
M10 7163 9420 26310 10628 34837 34574 18538.48
M11 31905 6330 27571 19024 7201 7322 19769.14
M12 19767 12639 11745 17459 31410 8987 18783.05
M13 7013 33332 31905 9762 28823 25764 19419.56
M14 5316 11745 28320 14744 10996 8830 16438.29
M15 33020 29083 32556 31581 8425 5052 20342.63
M16 16314 11823 15515 9859 16848 23616 19963.01
M17 6339 17631 6946 14235 9165 27276 19289.20
M18 22053 12054 6113 8924 10316 31746 17786.43
M19 27249 19277 11062 29760 17178 11694 19429.47
M20 33279 19767 22595 33188 7163 33343 20474.66
M21 33534 11001 14956 29055 26612 13531 20186.53
M22 17837 22238 33619 6542 34209 18013 20120.90
M23 14770 18013 7367 15762 13036 17790 18793.48
M24 29935 6845 9420 31430 18800 19205 19558.20
M25 6339 18170 26647 33619 23356 16060 19618.37
M26 5052 16317 18826 32392 13969 22287 17912.26
M27 9761 27082 11823 12043 32392 5360 18394.21
M28 29583 29086 15685 30152 5391 32556 20367.14
M29 27459 17592 14536 31905 28320 5075 19489.58
M30 34461 22598 22595 27718 24815 6143 19366.61
M31 34586 20339 15855 12284 33188 7708 19414.00
M32 12129 31746 31258 32612 9420 19767 20842.76
M33 6810 27276 15997 27656 13587 33279 20930.88
M34 12122 24815 22743 15173 16744 14990 18441.43
M35 17889 15357 29412 13874 5991 11062 19717.04
M36 32010 23327 24155 19211 32556 27117 19346.55
M37 27095 17111 34342 15357 19180 27082 21284.05
M38 25881 5226 14956 5991 6143 9229 19345.56
M39 20964 7994 21207 5391 27507 24776 19434.82
M40 34107 10191 33665 27507 21560 27781 19371.51
M41 19277 24237 10888 23386 15762 8976 19095.87
M42 17889 12129 17257 15173 9229 28920 19233.17
M43 7508 19211 29801 5711 6559 31581 19404.36
M44 24286 7201 8413 23597 18781 29664 20012.77
M45 15634 22920 8316 10871 20964 27249 19505.11
M46 29534 14484 19610 8549 6552 32392 20857.70
M47 12818 7630 7044 7590 15634 30956 18860.77
M48 27004 25085 10271 33306 19024 25974 20230.91
M49 17178 11825 18800 14751 8478 18722 17553.08
M50 24518 8720 27705 17426 8413 25983 20112.83
M51 18931 31007 14100 12735 34013 24286 19096.29
M52 10888 13904 28701 17103 22589 24286 21084.78
M53 5261 25983 28851 7367 12643 11470 19322.95
M54 13663 30199 32648 14203 12619 23597 19806.90
M55 28728 18826 15997 30649 8186 33306 19813.05
M56 24518 16894 16314 23903 16080 23731 18197.85
M57 8830 31007 14586 28823 30649 8713 19439.94
M58 6064 30329 14100 23103 25213 7110 20283.65
M59 34316 33428 8029 22886 7750 9074 19189.51
M60 34381 27705 34816 6064 6599 29534 19258.06
M61 33227 7627 25464 24518 31081 27117 19672.04
M62 5052 23823 12284 27443 31081 10996 18731.47
M63 8907 6387 5239 13969 14100 22476 19206.88
M64 11765 9074 34841 8132 32927 10268 18627.74
M65 29357 12588 16291 27444 15855 7226 19716.35
M66 6821 20732 29742 22327 7305 31410 21369.69
M67 14764 6635 29917 8720 6236 31037 18723.29
M68 10240 17246 19138 7001 10613 16761 17992.96
M69 14147 27781 26165 7993 13016 18722 20462.31
M70 17837 26718 24394 25213 14956 34209 20743.52
M71 8020 6346 21989 23903 18936 18826 19257.47
M72 27517 22743 20732 21182 12615 33848 21246.33
M73 17103 8874 31184 12625 24084 16848 19292.25
M74 30419 19211 9853 29917 15997 15840 20809.92
M75 11028 10271 15762 5316 34969 25741 20281.50
M76 14203 29108 7001 15173 29749 33262 18448.43
M77 8677 25527 28780 10065 19211 24258 20822.24
M78 11394 27805 9853 10613 33265 10252 19744.31
M79 12690 7993 31007 13163 27082 12129 20062.48
M80 11001 13969 16248 13913 17426 17974 18017.24
M81 18013 24405 34342 30621 7001 29975 20523.19
M82 27517 23942 24800 6833 25213 18403 18398.96
M83 15731 22595 23772 9761 12818 26189 20459.80
M84 17257 33712 29020 17111 13587 19048 20300.15
M85 27587 19048 26601 28851 33265 8721 20948.29
M86 16024 25213 32098 11751 12643 30520 19434.82
M87 10268 34480 14536 9732 29060 18403 19919.63
M88 22980 7934 27507 28833 6226 28886 19975.87
M89 31007 6833 5991 5711 34574 23597 19435.12
M90 5075 17153 31700 28339 11001 18974 19665.72
M91 22595 29083 17790 19138 24660 16812 21358.03
M92 24815 9776 19211 25800 29086 29592 19764.38
M93 30722 27249 31549 23731 8692 10968 19937.17
M94 7508 27705 34480 23451 19974 30621 19731.28
M95 28886 22920 23823 15659 5360 22786 19645.01
M96 17159 9446 16647 32741 20524 14990 19295.04
M97 27082 33188 12735 17159 29749 18781 19993.12
M98 22327 9122 6566 34837 29108 23885 18562.97
M99 26199 7775 32392 18565 6236 17257 19308.40
M100 33350 22238 14954 5239 23731 12662 20997.02

Media de todas las muestras 100

media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las muestras es de: ", media.todas.muestras)
## [1] "La media de todas las muestras es de:  19624.16"

Histograma de medias muestrales CIEN

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME = ", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media CIEN",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)

g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa la diferencia de forma de las distribuciones poblacional y muestral de medias.

También existe una diferencia en el rango de las medias muestrales en comparación con el rango de la población; esta varía de 5000 a 30000, mientras que las medias muestrales varían de 17000 a 21000 en sueldos.

Distribución muestral de la media 1000 muestras.

Se determinan mil (1000) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media (Lind, Marchal, and Wathen 2015).

muestras = as.list(NULL)
m.muestras = NULL

for (i in 1:q2) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q2, replace = TRUE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

Distribución de las muestras 1000

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

Como son mil muestras solo se muestran las primeras cincuenta y las últimas cincuenta.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q2)
rownames(sueldos) <- paste0("M",1:q2)

tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q2-2):q2], medias.muestrales = m.muestras)

Primeras cincuenta

kable(head(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))
Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo998 sueldo999 sueldo1000 medias.muestrales
M1 33992 8721 6551 24772 27587 30303 19838.88
M2 8020 5470 28728 25764 15685 5226 19254.61
M3 25643 21854 5711 29175 34675 27427 19678.35
M4 6113 24772 14785 12625 10065 19205 19416.90
M5 19738 34209 6733 9837 21486 20732 19333.58
M6 31778 16388 21395 19024 33350 33227 19511.38
M7 9904 10435 16138 19637 22743 30125 19645.82
M8 31038 27004 22238 16868 11601 10316 19704.83
M9 31778 21395 12643 29854 9122 33279 19475.97
M10 10316 19974 8316 29592 33020 10613 19481.37
M11 27398 31062 7353 12588 34342 16719 19560.47
M12 13874 6786 17153 14743 11875 32648 19824.34
M13 24084 25464 32849 18873 33279 11503 19878.83
M14 5789 13644 32385 17631 22264 22264 19887.01
M15 6200 15997 26357 22980 24237 25597 19838.02
M16 27398 34461 8316 31184 15158 29760 19393.27
M17 7226 18936 10719 14098 11001 19974 19889.64
M18 10101 7201 7920 17889 6559 13904 19633.51
M19 16248 24286 17797 21966 11745 26310 19070.16
M20 9904 26759 5052 33700 31905 33712 19498.08
M21 23903 22989 24909 22922 10871 13663 20163.62
M22 14536 7201 20386 31700 8138 13016 19384.54
M23 12129 18219 24625 20302 5470 19033 19860.36
M24 13163 24776 31545 13969 27459 30469 20090.72
M25 19211 14956 5991 29583 29108 24258 20361.02
M26 34322 31258 13581 10628 7148 12175 19792.13
M27 22589 6256 14515 6833 26357 22598 19378.56
M28 10268 25964 31545 16719 23386 10252 19658.91
M29 25964 32927 13581 15762 34841 25970 19698.63
M30 5075 23885 27249 29664 17248 30893 19763.74
M31 6236 11001 23823 8829 27004 33534 19287.60
M32 6330 31746 31430 7322 22743 7232 19878.49
M33 13663 34816 22165 34837 7305 18195 19496.33
M34 25586 5239 6268 33992 34557 10996 19059.94
M35 18873 9732 5261 5052 14990 15659 19488.01
M36 9420 16291 21395 34586 6387 27571 19913.87
M37 27587 14536 12643 31746 21395 19138 19683.03
M38 7725 29086 25527 12639 18495 9837 19518.31
M39 15541 31410 6200 31081 13130 9229 19783.03
M40 11503 22589 8400 13076 33501 22743 19366.46
M41 6542 18762 13163 17194 21989 14147 19455.59
M42 27004 33306 5052 18981 32949 14560 20353.92
M43 24405 12054 30893 31778 23386 33487 20050.92
M44 24258 17426 32098 13581 28780 12619 19292.00
M45 32648 12588 14515 26189 10191 17257 19717.89
M46 9584 27444 11503 14956 14770 11028 19408.79
M47 10227 8907 13163 15997 7934 32949 19912.19
M48 16060 10871 22595 8720 16291 27315 19703.74
M49 29935 10628 18936 11712 24155 15178 19233.43
M50 18610 25671 9074 28793 29055 20302 19470.73

Últimas cincuenta

kable(tail(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))
Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo998 sueldo999 sueldo1000 medias.muestrales
M951 6946 34557 18722 34574 10227 30418 19639.49
M952 16719 15659 22287 18741 15158 31630 19792.95
M953 8400 7750 6346 29805 31630 30152 19732.30
M954 5360 7322 9074 7994 11872 33665 19634.40
M955 15154 8020 17426 11823 34816 11751 19458.93
M956 11028 11470 29083 7163 23103 13201 19360.10
M957 6810 33534 27611 16470 18120 11503 19907.39
M958 32949 19738 5076 33227 32612 13644 19696.23
M959 18195 28728 18741 8186 8478 21854 19720.19
M960 22536 22264 31545 11875 7201 9584 19639.92
M961 6469 20732 24258 23885 23942 6268 19816.32
M962 14560 21501 20006 21918 26502 22441 19776.61
M963 16291 9420 26373 6330 7512 34120 19296.43
M964 5076 5991 22441 21558 28833 16314 19611.95
M965 14743 7725 12175 12595 26310 19211 19378.40
M966 8132 22786 16024 23451 7508 9761 19207.22
M967 14147 12122 25881 10114 18396 18826 20105.27
M968 30419 18001 25085 29760 13581 31630 20525.55
M969 11470 30184 10366 13644 14098 34013 19676.56
M970 20386 18873 27249 8874 28793 5076 19402.17
M971 9074 18170 17459 33350 32941 11872 19569.89
M972 34675 31563 12542 21745 33027 18610 19654.14
M973 25597 31746 19048 18981 13644 28851 19804.36
M974 28555 8677 7148 31249 34841 21918 19166.79
M975 22477 8692 33487 29108 6551 7163 19527.02
M976 21918 25881 29935 17178 8987 9229 19608.86
M977 6113 11503 11549 12643 25643 28210 19585.66
M978 18873 14833 8874 29935 13587 5316 20242.28
M979 9446 8829 15997 28339 33170 18170 19614.95
M980 24084 24800 9165 16470 18170 32949 19465.73
M981 26479 29935 34586 10065 25678 27148 19296.07
M982 22595 30956 33279 18396 23356 34316 19271.73
M983 25085 32849 22743 31410 20514 9761 19352.42
M984 13163 28793 8400 25597 13036 24286 19837.48
M985 18120 11470 33332 11745 6387 26601 20055.39
M986 16317 16040 34120 27148 9706 26647 19565.58
M987 8036 18826 14833 9761 24394 29357 19978.38
M988 30520 34342 19033 7367 15634 7104 19086.51
M989 26612 33279 15685 15731 33700 15634 19690.36
M990 25643 10968 18722 12615 9769 10366 19327.54
M991 13644 5391 14744 7001 32771 17565 19844.55
M992 21501 22327 27444 15659 12175 27148 20038.88
M993 18936 14424 24625 32392 20149 31640 19815.87
M994 15154 29749 32385 21395 20006 16291 19693.39
M995 9762 18722 25881 6387 23356 6093 19780.59
M996 31351 24237 10874 29742 8029 15154 19687.04
M997 23823 24155 6532 33848 22238 23823 20043.72
M998 27095 11875 16719 16254 19211 18495 20122.98
M999 30893 25741 25983 22886 9229 22038 19917.66
M1000 12122 17282 16719 23103 6236 12542 19974.13

Media de todas las muestras 1000

media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las ", q2, " muestras "," es de: ", media.todas.muestras)
## [1] "La media de todas las  1000  muestras   es de:  19680.44"

Histograma de medias muestrales MIL

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media MIL",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)

g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=6),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que la media de todas las muestras se acerca a la media de la población así mismo, la distribución muestral de la media es una distribución que se parece a distribución normal con gráfica de gauss o campana.

Entre mas muestras haya, la dispersión de los datos disminuye y entre más muestras se determinen, el valor de la media de todas las muestras se acerca al valor de la media poblacional.

Interpretación

Pendiente …

Bibliografía

Lind, Douglas, William Marchal, and Samuel Wathen. 2015. Estadística Aplicada a Los Negocios y La Economía. Decimo Sexta. México, D.F.: McGraw-Hill.