Objetivo

Determinar la distribución muestral de la media.

Descripción

Se simula población con sueldos de trabajadores de una Institución educativa.

Se crean datos relacionados con la población y se determinan los parámetros descriptivos.

Se crean 100 y 1000 muestras diferentes con n elementos diferentes relacionados con la población y se determinan la media aritmética de cada muestra.

Se determina la distribución muestral de la media de las cien muestras y se idnetifica que la distribución se acera a una distribución normal además de que la media de la distribución muestral se acerca a la media de la población.

Marco de referencia

Si se organizan las medias de todas las muestras posibles (por decir cien y mil) en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA es la distribución de probabilidad de todas las posibles medias de las muestras de un determinado tamaño muestral de la población. (Lind, Marchal, and Wathen 2015).

Desarrollo

Configuraciones iniciales

Librerías

library(cowplot)
library(ggplot2)
library(knitr)

Notación normal

Para que no aparezca notación científica

options(scipen=999)

Semilla

set.seed(2021)

Variables iniciales

N <- 650 # Cantidad de datos de población
rango <- 5000:35000 # Rango 
n = 100  # Cantidad de datos de muestra
q1 = 100  # Cantidad de muestras m1, m2, m3
q2 = 1000  # Cantidad de muestras m1, m2, m3

Crear datos

Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de 650 trabajadores que laboran en una Institución educativa. El rango está entre 5000 y 35000 pesos ($) mensuales.

Población

\[ poblacion = \text{ {x | x es un trabajador de una Institución educativa; }} \therefore \\ x_1, x_2, x_3, ... ,x_{N=6500} \]

poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size =  N, replace = TRUE))

Primeros treinta observaciones de Población

head(poblacion$sueldo, 30)

##  [1] 34574 23597 18741 30017 13934 18195 14203 22477 25671  6786 27117 11765
## [13]  9420 25974 21486  5360 29086  7994 14147 34841 30722 22595  9732 32010
## [25] 33461 29935 34209 25643  7148 34013

Últimos treinta observaciones de Población

tail(poblacion$sueldo, 30)

##  [1] 13663 14956  9229  6845 33487 28823  6200  6599  8829 18001 22922  7512
## [13] 10271 28728 19138 10268 29760 26310 25586 31534 11724 17153 29583 29534
## [25] 29805 12690  5076 10719 33265 29357

Parámetros poblacionales

summary(poblacion$sueldo)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5052   11837   18752   19671   27605   34969

media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)

Se tiene una media aritmética poblacional de 19671.45 con una desviación estándar de 8921.12.

\[ \mu = \frac{\sum{sueldo_x}}{N} = 19671.45 \]

Muestra

Se determina una primera muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el valor de $x$. \[ muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100} \]

La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.

xs <- sample(x = 1:n, size =  n, replace = FALSE)

muestra <- poblacion[xs,]

Estadísticos muestrales

summary(muestra$sueldo)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5360   12406   21616   21003   29986   34969

media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)

Se tiene una media aritmética de la primera muestra de 21002.77 con una desviación estándar de 8921.12.

\[ \bar{x_1} = \frac{\sum{sueldo_x}}{n} = 21002.77 \]

Error muestral

El error muestral es porque los estadísticos no son valores numéricos igual que los parámetros de la población, siempre existirá una diferencia.

media.p; media.m

## [1] 19671.45

## [1] 21002.77

desv.p; desv.m

## [1] 8921.12

## [1] 9552.46

Se determina el error muestral del estadístico media de la muestra con respecto al parámetro de la media poblacional

dif.media <- media.p - media.m

paste("El error muestral con respecto a la media es de: ", dif.media)

## [1] "El error muestral con respecto a la media es de:  -1331.32"

\[ \text{Error muestral =} (\mu - \bar{x}) = (19671.45 - 21002.77) = -1331.32 \]

Histograma de población y muestra

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p, "; ds=", desv.p,  "; Err muestral media=",dif.media),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


g2 <- ggplot(muestra, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.m, col='red') +
  labs(title = "Muestra",
      subtitle = paste("me=", media.m, "; ds.=", desv.m),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)

g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que no son distribuciones normales, ni los datos de población ni los datos de la muestra se comportan como distribución normal.

Distribución muestral de la media 100 muestras.

Se determinan cien (100) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media (Lind, Marchal, and Wathen 2015).

muestras = as.list(NULL)
m.muestras = NULL

for (i in 1:q1) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q1, replace = FALSE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

Distribución de las muestras 100

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

La función t() transforma registros a columnas de un data.frame.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q1)
rownames(sueldos) <- paste0("M",1:q1)

tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q1-2):q1], medias.muestrales = m.muestras)
kable(tabla, caption = "Tabla de medias aritméticas de cien muestras de cien sueldos cada una")

Tabla de medias aritméticas de cien muestras de cien sueldos cada una
	sueldo1	sueldo2	sueldo3	…	sueldo98	sueldo99	sueldo100	medias.muestrales
M1	31581	29801	19738	…	21723	29854	33350	19270.47
M2	34921	7725	24518	…	20339	18762	17565	20039.20
M3	5052	17837	31258	…	18396	17153	27117	19767.99
M4	5391	14743	6833	…	10227	13531	29083	19265.46
M5	8165	15685	6559	…	11001	23823	8677	19656.18
M6	33027	22344	16336	…	16475	18339	22476	20287.99
M7	33265	16336	12800	…	34045	34816	17103	19732.08
M8	29917	33858	22344	…	10114	12619	34313	20576.04
M9	9420	21966	15867	…	24405	18781	12595	20408.76
M10	7163	9420	26310	…	10628	34837	34574	18538.48
M11	31905	6330	27571	…	19024	7201	7322	19769.14
M12	19767	12639	11745	…	17459	31410	8987	18783.05
M13	7013	33332	31905	…	9762	28823	25764	19419.56
M14	5316	11745	28320	…	14744	10996	8830	16438.29
M15	33020	29083	32556	…	31581	8425	5052	20342.63
M16	16314	11823	15515	…	9859	16848	23616	19963.01
M17	6339	17631	6946	…	14235	9165	27276	19289.20
M18	22053	12054	6113	…	8924	10316	31746	17786.43
M19	27249	19277	11062	…	29760	17178	11694	19429.47
M20	33279	19767	22595	…	33188	7163	33343	20474.66
M21	33534	11001	14956	…	29055	26612	13531	20186.53
M22	17837	22238	33619	…	6542	34209	18013	20120.90
M23	14770	18013	7367	…	15762	13036	17790	18793.48
M24	29935	6845	9420	…	31430	18800	19205	19558.20
M25	6339	18170	26647	…	33619	23356	16060	19618.37
M26	5052	16317	18826	…	32392	13969	22287	17912.26
M27	9761	27082	11823	…	12043	32392	5360	18394.21
M28	29583	29086	15685	…	30152	5391	32556	20367.14
M29	27459	17592	14536	…	31905	28320	5075	19489.58
M30	34461	22598	22595	…	27718	24815	6143	19366.61
M31	34586	20339	15855	…	12284	33188	7708	19414.00
M32	12129	31746	31258	…	32612	9420	19767	20842.76
M33	6810	27276	15997	…	27656	13587	33279	20930.88
M34	12122	24815	22743	…	15173	16744	14990	18441.43
M35	17889	15357	29412	…	13874	5991	11062	19717.04
M36	32010	23327	24155	…	19211	32556	27117	19346.55
M37	27095	17111	34342	…	15357	19180	27082	21284.05
M38	25881	5226	14956	…	5991	6143	9229	19345.56
M39	20964	7994	21207	…	5391	27507	24776	19434.82
M40	34107	10191	33665	…	27507	21560	27781	19371.51
M41	19277	24237	10888	…	23386	15762	8976	19095.87
M42	17889	12129	17257	…	15173	9229	28920	19233.17
M43	7508	19211	29801	…	5711	6559	31581	19404.36
M44	24286	7201	8413	…	23597	18781	29664	20012.77
M45	15634	22920	8316	…	10871	20964	27249	19505.11
M46	29534	14484	19610	…	8549	6552	32392	20857.70
M47	12818	7630	7044	…	7590	15634	30956	18860.77
M48	27004	25085	10271	…	33306	19024	25974	20230.91
M49	17178	11825	18800	…	14751	8478	18722	17553.08
M50	24518	8720	27705	…	17426	8413	25983	20112.83
M51	18931	31007	14100	…	12735	34013	24286	19096.29
M52	10888	13904	28701	…	17103	22589	24286	21084.78
M53	5261	25983	28851	…	7367	12643	11470	19322.95
M54	13663	30199	32648	…	14203	12619	23597	19806.90
M55	28728	18826	15997	…	30649	8186	33306	19813.05
M56	24518	16894	16314	…	23903	16080	23731	18197.85
M57	8830	31007	14586	…	28823	30649	8713	19439.94
M58	6064	30329	14100	…	23103	25213	7110	20283.65
M59	34316	33428	8029	…	22886	7750	9074	19189.51
M60	34381	27705	34816	…	6064	6599	29534	19258.06
M61	33227	7627	25464	…	24518	31081	27117	19672.04
M62	5052	23823	12284	…	27443	31081	10996	18731.47
M63	8907	6387	5239	…	13969	14100	22476	19206.88
M64	11765	9074	34841	…	8132	32927	10268	18627.74
M65	29357	12588	16291	…	27444	15855	7226	19716.35
M66	6821	20732	29742	…	22327	7305	31410	21369.69
M67	14764	6635	29917	…	8720	6236	31037	18723.29
M68	10240	17246	19138	…	7001	10613	16761	17992.96
M69	14147	27781	26165	…	7993	13016	18722	20462.31
M70	17837	26718	24394	…	25213	14956	34209	20743.52
M71	8020	6346	21989	…	23903	18936	18826	19257.47
M72	27517	22743	20732	…	21182	12615	33848	21246.33
M73	17103	8874	31184	…	12625	24084	16848	19292.25
M74	30419	19211	9853	…	29917	15997	15840	20809.92
M75	11028	10271	15762	…	5316	34969	25741	20281.50
M76	14203	29108	7001	…	15173	29749	33262	18448.43
M77	8677	25527	28780	…	10065	19211	24258	20822.24
M78	11394	27805	9853	…	10613	33265	10252	19744.31
M79	12690	7993	31007	…	13163	27082	12129	20062.48
M80	11001	13969	16248	…	13913	17426	17974	18017.24
M81	18013	24405	34342	…	30621	7001	29975	20523.19
M82	27517	23942	24800	…	6833	25213	18403	18398.96
M83	15731	22595	23772	…	9761	12818	26189	20459.80
M84	17257	33712	29020	…	17111	13587	19048	20300.15
M85	27587	19048	26601	…	28851	33265	8721	20948.29
M86	16024	25213	32098	…	11751	12643	30520	19434.82
M87	10268	34480	14536	…	9732	29060	18403	19919.63
M88	22980	7934	27507	…	28833	6226	28886	19975.87
M89	31007	6833	5991	…	5711	34574	23597	19435.12
M90	5075	17153	31700	…	28339	11001	18974	19665.72
M91	22595	29083	17790	…	19138	24660	16812	21358.03
M92	24815	9776	19211	…	25800	29086	29592	19764.38
M93	30722	27249	31549	…	23731	8692	10968	19937.17
M94	7508	27705	34480	…	23451	19974	30621	19731.28
M95	28886	22920	23823	…	15659	5360	22786	19645.01
M96	17159	9446	16647	…	32741	20524	14990	19295.04
M97	27082	33188	12735	…	17159	29749	18781	19993.12
M98	22327	9122	6566	…	34837	29108	23885	18562.97
M99	26199	7775	32392	…	18565	6236	17257	19308.40
M100	33350	22238	14954	…	5239	23731	12662	20997.02

Media de todas las muestras 100

media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las muestras es de: ", media.todas.muestras)

## [1] "La media de todas las muestras es de:  19624.16"

Histograma de medias muestrales CIEN

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME = ", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media CIEN",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)

g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa la diferencia de forma de las distribuciones poblacional y muestral de medias.

También existe una diferencia en el rango de las medias muestrales en comparación con el rango de la población; esta varía de 5000 a 30000, mientras que las medias muestrales varían de 17000 a 21000 en sueldos.

Distribución muestral de la media 1000 muestras.

Se determinan mil (1000) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media (Lind, Marchal, and Wathen 2015).

muestras = as.list(NULL)
m.muestras = NULL

for (i in 1:q2) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q2, replace = TRUE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

Distribución de las muestras 1000

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

Como son mil muestras solo se muestran las primeras cincuenta y las últimas cincuenta.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q2)
rownames(sueldos) <- paste0("M",1:q2)

tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q2-2):q2], medias.muestrales = m.muestras)

Primeras cincuenta

kable(head(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))

Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
	sueldo1	sueldo2	sueldo3	…	sueldo998	sueldo999	sueldo1000	medias.muestrales
M1	33992	8721	6551	…	24772	27587	30303	19838.88
M2	8020	5470	28728	…	25764	15685	5226	19254.61
M3	25643	21854	5711	…	29175	34675	27427	19678.35
M4	6113	24772	14785	…	12625	10065	19205	19416.90
M5	19738	34209	6733	…	9837	21486	20732	19333.58
M6	31778	16388	21395	…	19024	33350	33227	19511.38
M7	9904	10435	16138	…	19637	22743	30125	19645.82
M8	31038	27004	22238	…	16868	11601	10316	19704.83
M9	31778	21395	12643	…	29854	9122	33279	19475.97
M10	10316	19974	8316	…	29592	33020	10613	19481.37
M11	27398	31062	7353	…	12588	34342	16719	19560.47
M12	13874	6786	17153	…	14743	11875	32648	19824.34
M13	24084	25464	32849	…	18873	33279	11503	19878.83
M14	5789	13644	32385	…	17631	22264	22264	19887.01
M15	6200	15997	26357	…	22980	24237	25597	19838.02
M16	27398	34461	8316	…	31184	15158	29760	19393.27
M17	7226	18936	10719	…	14098	11001	19974	19889.64
M18	10101	7201	7920	…	17889	6559	13904	19633.51
M19	16248	24286	17797	…	21966	11745	26310	19070.16
M20	9904	26759	5052	…	33700	31905	33712	19498.08
M21	23903	22989	24909	…	22922	10871	13663	20163.62
M22	14536	7201	20386	…	31700	8138	13016	19384.54
M23	12129	18219	24625	…	20302	5470	19033	19860.36
M24	13163	24776	31545	…	13969	27459	30469	20090.72
M25	19211	14956	5991	…	29583	29108	24258	20361.02
M26	34322	31258	13581	…	10628	7148	12175	19792.13
M27	22589	6256	14515	…	6833	26357	22598	19378.56
M28	10268	25964	31545	…	16719	23386	10252	19658.91
M29	25964	32927	13581	…	15762	34841	25970	19698.63
M30	5075	23885	27249	…	29664	17248	30893	19763.74
M31	6236	11001	23823	…	8829	27004	33534	19287.60
M32	6330	31746	31430	…	7322	22743	7232	19878.49
M33	13663	34816	22165	…	34837	7305	18195	19496.33
M34	25586	5239	6268	…	33992	34557	10996	19059.94
M35	18873	9732	5261	…	5052	14990	15659	19488.01
M36	9420	16291	21395	…	34586	6387	27571	19913.87
M37	27587	14536	12643	…	31746	21395	19138	19683.03
M38	7725	29086	25527	…	12639	18495	9837	19518.31
M39	15541	31410	6200	…	31081	13130	9229	19783.03
M40	11503	22589	8400	…	13076	33501	22743	19366.46
M41	6542	18762	13163	…	17194	21989	14147	19455.59
M42	27004	33306	5052	…	18981	32949	14560	20353.92
M43	24405	12054	30893	…	31778	23386	33487	20050.92
M44	24258	17426	32098	…	13581	28780	12619	19292.00
M45	32648	12588	14515	…	26189	10191	17257	19717.89
M46	9584	27444	11503	…	14956	14770	11028	19408.79
M47	10227	8907	13163	…	15997	7934	32949	19912.19
M48	16060	10871	22595	…	8720	16291	27315	19703.74
M49	29935	10628	18936	…	11712	24155	15178	19233.43
M50	18610	25671	9074	…	28793	29055	20302	19470.73

Últimas cincuenta

kable(tail(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))

Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
	sueldo1	sueldo2	sueldo3	…	sueldo998	sueldo999	sueldo1000	medias.muestrales
M951	6946	34557	18722	…	34574	10227	30418	19639.49
M952	16719	15659	22287	…	18741	15158	31630	19792.95
M953	8400	7750	6346	…	29805	31630	30152	19732.30
M954	5360	7322	9074	…	7994	11872	33665	19634.40
M955	15154	8020	17426	…	11823	34816	11751	19458.93
M956	11028	11470	29083	…	7163	23103	13201	19360.10
M957	6810	33534	27611	…	16470	18120	11503	19907.39
M958	32949	19738	5076	…	33227	32612	13644	19696.23
M959	18195	28728	18741	…	8186	8478	21854	19720.19
M960	22536	22264	31545	…	11875	7201	9584	19639.92
M961	6469	20732	24258	…	23885	23942	6268	19816.32
M962	14560	21501	20006	…	21918	26502	22441	19776.61
M963	16291	9420	26373	…	6330	7512	34120	19296.43
M964	5076	5991	22441	…	21558	28833	16314	19611.95
M965	14743	7725	12175	…	12595	26310	19211	19378.40
M966	8132	22786	16024	…	23451	7508	9761	19207.22
M967	14147	12122	25881	…	10114	18396	18826	20105.27
M968	30419	18001	25085	…	29760	13581	31630	20525.55
M969	11470	30184	10366	…	13644	14098	34013	19676.56
M970	20386	18873	27249	…	8874	28793	5076	19402.17
M971	9074	18170	17459	…	33350	32941	11872	19569.89
M972	34675	31563	12542	…	21745	33027	18610	19654.14
M973	25597	31746	19048	…	18981	13644	28851	19804.36
M974	28555	8677	7148	…	31249	34841	21918	19166.79
M975	22477	8692	33487	…	29108	6551	7163	19527.02
M976	21918	25881	29935	…	17178	8987	9229	19608.86
M977	6113	11503	11549	…	12643	25643	28210	19585.66
M978	18873	14833	8874	…	29935	13587	5316	20242.28
M979	9446	8829	15997	…	28339	33170	18170	19614.95
M980	24084	24800	9165	…	16470	18170	32949	19465.73
M981	26479	29935	34586	…	10065	25678	27148	19296.07
M982	22595	30956	33279	…	18396	23356	34316	19271.73
M983	25085	32849	22743	…	31410	20514	9761	19352.42
M984	13163	28793	8400	…	25597	13036	24286	19837.48
M985	18120	11470	33332	…	11745	6387	26601	20055.39
M986	16317	16040	34120	…	27148	9706	26647	19565.58
M987	8036	18826	14833	…	9761	24394	29357	19978.38
M988	30520	34342	19033	…	7367	15634	7104	19086.51
M989	26612	33279	15685	…	15731	33700	15634	19690.36
M990	25643	10968	18722	…	12615	9769	10366	19327.54
M991	13644	5391	14744	…	7001	32771	17565	19844.55
M992	21501	22327	27444	…	15659	12175	27148	20038.88
M993	18936	14424	24625	…	32392	20149	31640	19815.87
M994	15154	29749	32385	…	21395	20006	16291	19693.39
M995	9762	18722	25881	…	6387	23356	6093	19780.59
M996	31351	24237	10874	…	29742	8029	15154	19687.04
M997	23823	24155	6532	…	33848	22238	23823	20043.72
M998	27095	11875	16719	…	16254	19211	18495	20122.98
M999	30893	25741	25983	…	22886	9229	22038	19917.66
M1000	12122	17282	16719	…	23103	6236	12542	19974.13

Media de todas las muestras 1000

media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las ", q2, " muestras "," es de: ", media.todas.muestras)

## [1] "La media de todas las  1000  muestras   es de:  19680.44"

Histograma de medias muestrales MIL

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media MIL",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)

g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=6),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)


plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que la media de todas las muestras se acerca a la media de la población así mismo, la distribución muestral de la media es una distribución que se parece a distribución normal con gráfica de gauss o campana.

Entre mas muestras haya, la dispersión de los datos disminuye y entre más muestras se determinen, el valor de la media de todas las muestras se acerca al valor de la media poblacional.

Interpretación

Pendiente …

Bibliografía

Lind, Douglas, William Marchal, and Samuel Wathen. 2015. Estadística Aplicada a Los Negocios y La Economía. Decimo Sexta. México, D.F.: McGraw-Hill.

Caso 27. Distribución muestral de la media

Rubén Pizarro Gurrola

31/05/2022