1 Objetivo

Determinar la distribución muestral de la media.

2 Descripción

Se simula población con sueldos de trabajadores de una Institución educativa. La distribución de esta población no es normal es decir, no tiene características de ser distribución normal.

Se crean datos relacionados con la población y se determinan los parámetros descriptivos.

Se crean 100 y 1000 muestras diferentes con n elementos diferentes relacionados con la población y se determinan la media aritmética de cada muestra.

Se determina la distribución muestral de la media de las cien muestras y se identifica que la distribución se acera a una distribución normal además de que la media de la distribución muestral se acerca a la media de la población.

3 Marco de referencia

Si se organizan las medias de todas las muestras posibles (por decir cien y mil) en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA es la distribución de probabilidad de todas las posibles medias de las muestras de un determinado tamaño muestral de la población. [@lind2015].

4 Desarrollo

4.1 Configuraciones iniciales

4.1.1 Librerías

library(cowplot)
library(ggplot2)
library(knitr)

4.1.2 Notación normal

Para que no aparezca notación científica

options(scipen=999)

4.1.3 Semilla

set.seed(1417)

4.1.4 Variables iniciales

N <- 650 # Cantidad de datos de población
rango <- 5000:35000 # Rango de sueldos
n = 100  # Cantidad de datos de cada muestra
q1 = 100  # Cantidad de muestras m1, m2, m3
q2 = 1000  # Cantidad de muestras m1, m2, m3
q3 <- 10000 

4.2 Crear datos

Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de \(N=650\) trabajadores que laboran en una Institución educativa. El rango del sueldo de manera simulada está entre $5000 y $35000 pesos ($) mensuales.

4.2.1 Población

\[ poblacion = \text{ {x | x es un trabajador de una Institución educativa; }} \therefore \\ x_1, x_2, x_3, ... ,x_{N=6500} \]

poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size =  N, replace = TRUE))

4.2.2 Primeros treinta observaciones de Población

head(poblacion$sueldo, 30)
##  [1] 28016 19934  8295 18708 25987  9303 18017 16511  5448  6914 29732  9914
## [13] 34181  8941 22039 20082 26436 26937 12289 34440 23868 14174 12700 15683
## [25] 26096 26567 30553 13566 26044 18906

4.2.3 Últimos treinta observaciones de Población

tail(poblacion$sueldo, 30)
##  [1] 27393 14680 32918 23831 34582 31967  9746 28734 26384 27221  9342  8616
## [13]  9498 33286 16612  7257 31118 11599 16683 27322 31848 33644 27760 22489
## [25]  6022 13856 19182 30169 30383  6998

4.2.4 Parámetros poblacionales

summary(poblacion$sueldo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5001   12536   19658   20110   27830   34989
media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)
media.p; desv.p
## [1] 20110.35
## [1] 8850.85

Se tiene una media aritmética poblacional de 20110.35 con una desviación estándar de 8850.85.

\[ \mu = \frac{\sum{sueldo_x}}{N} = 19761.25 \]

4.3 Muestra

Se determina una primera muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el valor de \(x\).

\[ muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100} \]

La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.

xs <- sample(x = 1:N, size =  n, replace = FALSE)
muestra <- poblacion[xs,]

4.3.1 Estadísticos muestrales

summary(muestra$sueldo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5182   10650   21523   20460   29920   34901
media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)
media.m; desv.m
## [1] 20459.62
## [1] 9657.19

Se tiene una media aritmética de la primera muestra de 20459.62 con una desviación estándar de 8850.85. \[ \bar{x_1} = \frac{\sum{sueldo_x}}{n} = 20140.97 \]

4.4 Error muestral

El error muestral es porque los estadísticos no son valores numéricos igual que los parámetros de la población, siempre existirá una diferencia.

paste("Media aritméica poblacional", media.p, ";", "media muestral", media.m)
## [1] "Media aritméica poblacional 20110.35 ; media muestral 20459.62"
paste("Desviación estándar poblacional", desv.p, ";","desviación muestral", desv.m)
## [1] "Desviación estándar poblacional 8850.85 ; desviación muestral 9657.19"

Se determina el error muestral del estadístico media de la muestra con respecto al parámetro de la media poblacional

dif.media <- media.p - media.m
paste("El error muestral con respecto a la media aritmética es de: ", round(dif.media, 2))
## [1] "El error muestral con respecto a la media aritmética es de:  -349.27"

\[ \text{Error muestral =} (\mu - \bar{x}) = (19761.25 - 20140.97) =-379.72 \]

4.5 Histograma de población y muestra

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p, "; ds=", desv.p,  "; Err muestral media=",dif.media),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(muestra, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.m, col='red') +
  labs(title = "Muestra",
      subtitle = paste("me=", media.m, "; ds.=", desv.m),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que no es una distribuciones normal, ni los datos de población ni los datos de la muestra se comportan como distribución normal.

4.6 Distribución muestral de la media 100 muestras.

Se determinan cien (100) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media [@lind2015].

muestras = as.list(NULL)
m.muestras = NULL
for (i in 1:q1) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q1, replace = FALSE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

4.6.1 Distribución de las muestras 100

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

La función t() transforma registros a columnas de un data.frame.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q1)
rownames(sueldos) <- paste0("M",1:q1)
tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q1-2):q1], medias.muestrales = m.muestras)
kable(tabla, caption = "Tabla de medias aritméticas de cien muestras de cien sueldos cada una")
Tabla de medias aritméticas de cien muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo98 sueldo99 sueldo100 medias.muestrales
M1 18893 30133 20082 23451 16047 16063 20957.30
M2 16293 18208 20082 5525 13662 19118 19549.14
M3 6652 24143 22489 13133 8430 23730 20214.39
M4 27394 32843 34181 30044 23037 7131 20723.29
M5 12031 30911 17946 23121 23450 12236 19766.93
M6 6073 28016 34439 12849 14314 31848 18625.81
M7 30133 17688 33434 30044 5966 17022 19932.33
M8 29732 13226 22457 24143 8039 23795 19695.20
M9 22385 14101 23236 14560 30039 19974 19573.67
M10 33764 10374 8848 16120 24180 5338 19449.11
M11 7539 9603 22914 17531 22897 29221 20445.76
M12 34341 14225 7131 10654 14433 23967 19388.24
M13 23170 33375 29676 26384 20741 22747 19778.14
M14 21211 28389 14154 7019 16109 11074 18930.09
M15 30861 34439 8827 13662 7072 10229 19623.37
M16 19035 27600 13153 7898 24012 10648 18367.57
M17 33785 14314 33318 6611 12419 29712 19184.78
M18 27621 24571 15309 14549 12735 26625 21625.98
M19 25796 19535 23236 18622 18208 30778 20748.03
M20 15204 11599 23660 33644 15015 25350 19422.72
M21 14560 32132 19721 19890 17095 13856 20091.71
M22 7019 25907 12849 5283 26384 15509 20691.10
M23 16669 13731 34901 14549 12001 20794 22349.27
M24 12079 27393 23234 5819 26078 23660 19877.82
M25 23429 12113 27393 17174 7072 10427 18704.81
M26 28453 12113 8820 7898 28692 26044 20332.59
M27 16649 16283 7294 13192 19835 32549 19793.50
M28 34854 10182 26592 12488 30044 7739 20310.78
M29 7246 16443 9746 34571 33963 29634 18037.43
M30 22747 30039 30196 33784 33502 28822 20244.35
M31 12222 16525 26120 30389 27621 29116 19829.65
M32 18208 16120 33116 8848 8527 5962 20285.66
M33 32484 14343 27760 30873 14176 34440 20791.46
M34 11937 11599 13556 29676 10229 14709 19674.46
M35 13170 22235 19721 13662 17300 32378 19422.13
M36 15761 17174 28389 19590 9878 32865 19444.34
M37 7739 6605 32756 8827 23451 33434 20684.16
M38 22100 16683 15902 5525 22039 21161 19210.62
M39 22385 13133 6225 6885 17174 24421 19661.57
M40 5819 34186 25357 24034 29712 8186 19448.28
M41 11770 15972 29616 5966 25648 12735 19769.07
M42 19668 23795 33116 22904 23967 16649 21023.54
M43 32316 24762 29946 33794 23170 33434 20874.14
M44 10527 13029 16238 5448 33226 22414 18928.35
M45 30363 14972 24669 5283 32378 31274 19698.94
M46 7306 11628 20930 33434 26459 23843 21447.41
M47 8295 31345 22904 12203 5001 28439 20277.76
M48 33784 30044 28593 23240 16226 8658 19823.86
M49 29441 34571 8820 28855 25357 18091 20540.04
M50 7246 13856 14679 28453 33784 9498 22456.97
M51 21521 8023 22100 19668 25907 20965 20897.66
M52 33764 19835 33272 27595 27455 7246 20095.93
M53 22212 32669 10593 28337 15657 6559 20954.33
M54 26549 10720 27760 22897 7131 13662 19931.35
M55 34901 10702 15992 10648 9283 14174 21193.75
M56 16238 22897 11937 18622 14876 8039 20832.12
M57 10229 19721 12155 22385 24318 13731 20669.84
M58 23340 17983 16283 30861 32687 10229 20735.15
M59 26459 7871 9826 14320 11764 26324 20211.67
M60 31223 15761 26459 16120 31882 6043 21682.85
M61 17300 23819 29634 25796 6587 34421 20490.93
M62 23451 34439 9186 26155 7898 12698 21407.92
M63 25058 30257 31874 13856 19118 17157 19546.79
M64 33434 33507 28439 29632 26567 17983 20269.98
M65 27853 30018 26370 10182 23795 27595 20306.02
M66 23795 18598 13909 15902 31161 22212 20032.92
M67 19361 16525 13611 13218 27540 9498 20751.53
M68 10335 8220 22291 18622 21908 28593 21118.15
M69 17095 12337 32887 26585 8220 8595 19771.38
M70 26120 12849 28337 33434 23236 31103 19709.24
M71 30873 5413 12698 32918 32535 26608 20161.62
M72 23967 14472 26900 6043 9498 13170 19896.75
M73 30322 8023 6611 31761 22308 14874 20804.09
M74 14858 18513 9342 13988 11764 25343 22181.61
M75 26764 23498 9841 17946 6914 14314 21432.10
M76 32316 5081 19168 31161 15101 26932 20659.63
M77 17433 22385 7190 14709 23730 13094 19852.19
M78 30778 25058 27540 23843 32316 11764 21497.35
M79 6611 18203 26180 12600 27760 14154 18600.83
M80 13153 12101 30389 26106 26324 26567 21373.43
M81 8478 30363 10917 17095 17300 26459 19267.16
M82 10374 30383 18264 15410 23450 24140 20867.85
M83 27595 24825 27972 19118 25885 6885 19767.90
M84 8430 16283 16458 27323 30389 13464 19918.03
M85 13319 24486 12289 32783 34190 16418 20846.32
M86 8848 31849 12600 26932 13319 10335 20345.32
M87 34342 9826 13226 33786 12031 15972 19923.17
M88 32783 33272 17157 23795 16669 8723 21921.48
M89 17433 14874 32325 10827 27972 33869 20781.89
M90 16669 27323 12748 8820 22308 33784 18851.23
M91 17691 29634 18690 20634 33869 19767 20356.00
M92 14794 18776 16283 20601 33785 31308 18453.42
M93 19721 10515 20349 10917 27595 24421 20211.38
M94 7539 15333 32550 11770 13566 32378 20698.59
M95 19535 31849 12849 10182 8658 7116 20855.01
M96 19377 25058 23660 23373 27947 14343 19344.84
M97 18706 34394 16063 8220 33794 16776 21217.56
M98 6605 13566 7720 19934 8186 21219 18342.12
M99 33786 23037 9914 33272 14433 13575 19120.09
M100 16064 8102 7329 19118 7116 11592 19161.35

4.6.2 Media de todas las muestras 100

media.todas.muestras <- round(mean(tabla$medias.muestrales),4)
paste("La media de todas las muestras es de: ", media.todas.muestras)
## [1] "La media de todas las muestras es de:  20170.4744"

4.6.3 Histograma de medias muestrales CIEN

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME = ", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media CIEN",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa la diferencia de forma de las distribuciones poblacional y muestral de medias.

También existe una diferencia en el rango de las medias de la población con respecto a la media de todas las muestras. El rango del sueldo de la población es 5001, 34989, mientras que las medias muestrales de la población con respecto al sueldo varían de 18037.43, 22456.97.

En cuanto a la diferencias de las desviaciones estándar de la población y de las muestras:

sd(poblacion$sueldo)
## [1] 8850.85
sd(tabla$medias.muestrales)
## [1] 902.3388

Se reduce su rango o lo que es lo mismo la desviación disminuye de 8850.8504754 en la población a 902.338835 en las medias muestrales.

4.7 Distribución muestral de la media 1000 muestras.

¿Que pasará con mil muestras?

Se repite el proceso, ahora en lugar de ser cien ahora serán mil muestras.

Se determinan mil (1000) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media [@lind2015].

muestras = as.list(NULL)
m.muestras = NULL
for (i in 1:q2) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q2, replace = TRUE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

4.7.1 Distribución de las muestras 1000

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

Como son mil muestras solo se muestran las primeras cincuenta y las últimas cincuenta.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q2)
rownames(sueldos) <- paste0("M",1:q2)
tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q2-2):q2], medias.muestrales = m.muestras)

4.7.1.1 Primeras cincuenta

kable(head(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))
Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo998 sueldo999 sueldo1000 medias.muestrales
M1 9628 16669 23340 22212 15938 23170 19948.30
M2 13153 10515 22489 8430 30389 15204 19897.14
M3 13662 24486 5980 26324 27760 7739 20046.56
M4 26549 13988 29783 22623 16109 17433 20632.73
M5 13639 11520 23831 30861 25796 26567 20767.16
M6 8326 34701 32100 34537 17691 7990 19909.12
M7 14472 7871 34607 29675 11074 18893 19908.51
M8 30133 12236 31345 29980 23429 32484 20280.09
M9 27853 9498 13909 18078 33318 15410 20060.99
M10 23488 5966 26120 24893 31161 18264 20417.10
M11 5182 10102 33095 12849 33286 12419 20134.63
M12 9841 8186 34421 30257 25103 6885 20568.78
M13 24318 17068 31491 32783 27322 32601 20339.55
M14 25036 31836 10917 27287 26180 10374 20415.22
M15 15890 20741 26436 16649 31762 14314 20104.74
M16 20082 20741 8430 29712 14709 18706 20162.14
M17 32269 6885 13566 13731 33286 8723 19955.74
M18 20435 27393 13491 31993 22684 10374 20517.12
M19 26044 16226 24809 30196 34342 34821 20378.16
M20 25482 18598 25058 15309 24624 24624 20119.05
M21 22414 17983 33434 26358 10716 25907 19743.20
M22 29783 7765 6073 31286 5338 14472 20446.18
M23 13611 18893 25036 20435 10917 34181 20207.83
M24 30987 20794 14314 25103 23728 18208 19897.60
M25 7851 26459 5088 8220 32269 13094 19927.86
M26 22489 13137 34181 20965 13988 6707 20157.85
M27 23451 9746 25652 19739 10827 16120 20080.32
M28 19258 5650 13153 29757 22846 18017 20196.17
M29 9498 8220 27100 26549 22212 32100 20395.89
M30 26592 26567 14343 7131 9628 15938 20020.67
M31 9303 8664 13058 6707 8430 22489 19789.77
M32 16683 29221 12567 22291 33318 34523 20124.46
M33 22286 12700 32378 29634 11937 14858 20558.90
M34 22747 29632 30196 31491 12222 8401 20455.06
M35 31161 11937 26120 32843 14876 14560 19908.27
M36 21640 22212 8664 17680 25103 20634 20412.16
M37 8401 14176 16683 31223 23238 17531 20186.30
M38 12726 25052 6652 9186 12770 14174 19979.55
M39 29616 20965 23373 13662 26096 12132 20010.01
M40 22039 17068 7116 5338 31848 32132 19906.75
M41 5283 15787 27100 8723 27393 33502 19915.16
M42 20435 19118 31012 9841 27287 30169 20301.38
M43 31345 14680 28016 16669 13153 23851 20311.98
M44 29757 17688 33318 22489 34821 7322 20278.11
M45 17653 30039 8595 13271 33502 17095 20401.77
M46 28016 13319 16120 12849 18203 26044 20151.31
M47 19835 22100 34537 15787 22914 14858 20269.57
M48 15672 25839 33502 13094 18528 14560 20665.31
M49 10759 27853 24421 17569 15448 10827 19956.61
M50 27287 6662 23488 16525 16394 33375 20556.09

4.7.1.2 Últimas cincuenta

kable(tail(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))
Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
sueldo1 sueldo2 sueldo3 sueldo998 sueldo999 sueldo1000 medias.muestrales
M951 25325 9634 29712 30776 14191 34421 20268.88
M952 13988 32827 15938 19590 18622 15972 20093.08
M953 19767 10827 23451 7898 13137 7257 20383.90
M954 12155 20349 32269 31882 9155 29676 20023.02
M955 28266 16649 8941 26592 25796 12726 19989.11
M956 17983 26370 29441 30044 14433 28593 20568.21
M957 20435 34901 12203 26937 30196 10229 20148.23
M958 14154 12698 12178 33764 12474 6303 20037.42
M959 11937 32378 13988 13639 32669 27881 19944.33
M960 31776 23498 33644 23498 14154 34901 20174.83
M961 21406 10190 8186 17433 27621 14343 20244.97
M962 8401 10593 15902 26436 6611 31491 19604.54
M963 18528 13226 31491 5479 27947 12525 20091.51
M964 19168 12113 30538 13856 8341 12024 19646.99
M965 24669 30039 29912 26044 6225 30257 19821.96
M966 8295 22039 10427 9345 30044 33764 20265.54
M967 32747 30257 5081 31848 13575 31237 20369.08
M968 18260 22903 7207 16857 30383 16109 20300.55
M969 19767 30776 27600 5001 12079 23795 20589.55
M970 8848 20082 29086 28389 10527 8664 20111.13
M971 28155 29675 34989 21178 18622 29675 20406.94
M972 22291 7116 20435 22903 27322 15410 19878.60
M973 31345 15683 11628 32992 34439 13029 20218.72
M974 7381 14101 29086 23236 30367 13575 20018.02
M975 24102 29316 6998 14680 31012 19668 20471.53
M976 26618 16857 27287 8664 10182 19361 20169.89
M977 19767 19590 19182 8616 26044 5966 20288.83
M978 27760 16047 17300 23451 27968 11547 20340.66
M979 17680 17095 8664 8307 34341 32718 20046.58
M980 12488 25058 13271 34439 12567 29732 20206.26
M981 24318 21640 32918 8023 22385 31762 20251.30
M982 31694 29712 7257 18203 24893 13451 20412.76
M983 6022 30133 30861 26764 18598 27221 20119.66
M984 8482 12525 13170 20794 29676 8827 19819.87
M985 5088 27853 24762 7257 9878 30778 19992.25
M986 10102 19668 17569 34901 26436 14405 19924.16
M987 30363 18690 33718 28155 18017 9342 19687.34
M988 25717 15079 25058 23660 34814 34341 20236.42
M989 26590 11534 28855 12748 5815 32269 19702.44
M990 33502 24762 29946 12236 27216 21878 20439.24
M991 15683 6043 33375 12236 16394 31849 19903.71
M992 9509 22613 18622 14314 27760 9303 20342.90
M993 19118 5338 5035 18708 6914 16683 20127.86
M994 12178 9418 26764 12132 7322 22904 20301.70
M995 28439 14541 25357 12474 32441 34607 20106.48
M996 32918 31848 34439 16140 7539 18382 20306.84
M997 30044 34854 31694 25350 32106 28389 20492.00
M998 11840 9914 13566 23170 10654 24893 20228.82
M999 26549 9603 25839 16109 12600 28266 19988.34
M1000 32669 19647 7765 9008 19890 13271 20052.24

4.7.2 Media de todas las muestras 1000

media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las ", q2, " muestras "," es de: ", media.todas.muestras)
## [1] "La media de todas las  1000  muestras   es de:  20107.3"

4.7.3 Histograma de medias muestrales MIL

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media MIL",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=6),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que la media de todas las muestras se acerca a la media de la población así mismo, la distribución muestral de la media es una distribución que se parece a distribución normal con gráfica de gauss o campana.

Entre mas muestras haya, la dispersión de los datos disminuye y entre más muestras se determinen, el valor de la media de todas las muestras se acerca al valor de la media poblacional.

5 Interpretación

¿Cuál es el valor de la media muestral de 10000 mil muestras de 100 datos cada una?: 20107.3

¿Cuál es el error muestral de la media de todas las muestras con respeto a la media aritmética de población.? -349.27

¿Cómo se observa la gráfica de campana?

representación visual de una distribución normal, también conocida como distribución de campana o distribución gaussiana. Esta distribución es simétrica y se caracteriza por tener una forma de campana.

Aquí la solución replicando el código modificando valores en variables…

media.todas.muestras <- round(mean(m.muestras),2)
paste("La media de todas las ", q3, " muestras "," es de: ", media.todas.muestras)
## [1] "La media de todas las  10000  muestras   es de:  20107.3"