Determinar el error de muestreo.
Se simula población y muestra de sueldo de trabajadores de una Institución educativa.
Se crean datos relacionados con la población y se determinan los parámetros descriptivos.
Se crean datos relacionados con muestra y se determinas los estadísticos descriptivos.
Se determina el error muestral de la media y de las desviaciones.
Se visualiza el histograma y la densidad de los ejercicios.
Las muestras se emplean para determinar características de la población. Por ejemplo, con la media de una muestra se calcula la media de la población; no obstante, como la muestra forma parte o es una porción representativa de la población, es poco probable que su media sea exactamente igual a la de la población. Asimismo, es poco factible que la desviación estándar de la muestra sea exactamente igual a la de la población; por lo tanto, se puede esperar una diferencia entre un estadístico de la muestra y el parámetro de la población correspondiente; la cual recibe el nombre de error de muestreo [@lind2015].
ERROR DE MUESTREO es la diferencia entre el estadístico de una muestra y el parámetro de la población correspondiente [@lind2015].
Por otra parte, se puede decir es la diferencia entre un valor poblacional (parámetro) y el estimado (estadístico), derivado de una muestra probabilística, que es debido al hecho de que sólo se observa una muestra de los valores, tan diferentes como una selección imperfecta, sesgos en las respuestas o su estimación, errores de observación y registro, entre otras cosas.
library(cowplot)
library(ggplot2)
Para que no aparezca notación científica
options(scipen=999)
set.seed(1411)
N <- 650 # Cantidad de datos de pobación
rango <- 5000:35000 # Rango
n = 100 # Cantidad de datos de muestra
Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de 650 trabajadores que laboran en una Institución educativa. El rango está entre $5000 y $35000 pesos mensuales.
\[ poblacion = \text{ {x | x es un trabajador de una Institución educativa; }} \therefore \\ x_1, x_2, x_3, ... ,x_{N=6500} \]
poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size = N, replace = TRUE))
head(poblacion, 30)
## x sueldo
## 1 1 27911
## 2 2 13563
## 3 3 26924
## 4 4 13147
## 5 5 33672
## 6 6 27766
## 7 7 24004
## 8 8 25273
## 9 9 19460
## 10 10 27721
## 11 11 8418
## 12 12 5103
## 13 13 10515
## 14 14 5377
## 15 15 8873
## 16 16 26581
## 17 17 11025
## 18 18 26441
## 19 19 31299
## 20 20 27645
## 21 21 17293
## 22 22 32888
## 23 23 18838
## 24 24 11926
## 25 25 32885
## 26 26 14779
## 27 27 11367
## 28 28 20881
## 29 29 29405
## 30 30 22441
tail(poblacion, 30)
## x sueldo
## 621 621 5367
## 622 622 6554
## 623 623 24570
## 624 624 24916
## 625 625 29449
## 626 626 18070
## 627 627 11110
## 628 628 33585
## 629 629 20367
## 630 630 26312
## 631 631 9634
## 632 632 9348
## 633 633 5962
## 634 634 33159
## 635 635 21225
## 636 636 5792
## 637 637 8525
## 638 638 16428
## 639 639 27403
## 640 640 6182
## 641 641 5844
## 642 642 13568
## 643 643 31791
## 644 644 32316
## 645 645 27414
## 646 646 16399
## 647 647 31054
## 648 648 32328
## 649 649 17852
## 650 650 11701
summary(poblacion$sueldo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5086 12776 19306 20005 27360 34980
minimo.p <- min(poblacion$sueldo)
maximo.p <- max(poblacion$sueldo)
media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)
El trabajador DE LA POBLACION menos gana tiene un sueldo de 5086, el que más gana recibe 34980, con una desviación estándar de 8615.9 y una media aritmética de 20005.
Se determina una muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el el valor de \(x\). \[ muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100} \]
La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.
xs <- sample(x = 1:n, size = n, replace = FALSE)
muestra <- poblacion[xs,]
head(muestra, 30)
## x sueldo
## 84 84 18158
## 89 89 16130
## 30 30 22441
## 25 25 32885
## 69 69 13519
## 43 43 32565
## 94 94 16514
## 64 64 33286
## 27 27 11367
## 49 49 13991
## 32 32 18648
## 3 3 26924
## 60 60 6669
## 70 70 5981
## 90 90 34980
## 68 68 11149
## 91 91 23836
## 75 75 34895
## 33 33 17203
## 55 55 14633
## 46 46 33649
## 81 81 9456
## 18 18 26441
## 40 40 34134
## 77 77 13029
## 13 13 10515
## 88 88 13420
## 24 24 11926
## 45 45 21823
## 78 78 6561
tail(muestra, 20)
## x sueldo
## 83 83 30772
## 21 21 17293
## 38 38 24018
## 67 67 21214
## 97 97 33291
## 11 11 8418
## 15 15 8873
## 96 96 13702
## 23 23 18838
## 72 72 34740
## 87 87 23437
## 7 7 24004
## 63 63 26785
## 50 50 23255
## 51 51 26061
## 10 10 27721
## 61 61 32814
## 8 8 25273
## 42 42 11483
## 86 86 24363
summary(muestra)
## x sueldo
## Min. : 1.00 Min. : 5103
## 1st Qu.: 25.75 1st Qu.:13118
## Median : 50.50 Median :19903
## Mean : 50.50 Mean :20289
## 3rd Qu.: 75.25 3rd Qu.:27664
## Max. :100.00 Max. :34980
summary(muestra$sueldo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5103 13118 19903 20289 27664 34980
minimo.m <- min(muestra$sueldo)
maximo.m <- max(muestra$sueldo)
media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)
El trabajador DE LA MUESTRA menos gana tiene un sueldo de 5103, el que más gana recibe 34980, con una desviación estándar de 9000.86 y una media aritmética de 20288.73.
El error muestral se da porque los valores estadísticos de la muestra son diferentes (cercanos pero diferentes) con respecto a los valores de los parámetros de la población.
media.p; media.m
## [1] 20005
## [1] 20288.73
desv.p; desv.m
## [1] 8615.9
## [1] 9000.86
dif.media <- media.p - media.m
dif.desv <- desv.p - desv.m
paste("El error muestral con respecto a la media es de: ", dif.media)
## [1] "El error muestral con respecto a la media es de: -283.73"
paste("El error muestral con respecto a la desviación es de: ", dif.desv)
## [1] "El error muestral con respecto a la desviación es de: -384.960000000001"
# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "blue") +
labs(title = "Población",
subtitle = paste("ME=", media.p, "; ds=", desv.p, "; Err muest. media=",dif.media),
caption = "Fuente propia") +
geom_vline(xintercept = media.m, col='red') +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g1 <- g1 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(muestra, aes(x = sueldo)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "green") +
geom_vline(xintercept = media.m, col='red') +
labs(title = "Muestra",
subtitle = paste("me=", media.m, "; ds.=", desv.m, "; Err. muestral de sd.=",dif.desv),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g2 <- g2 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)
Se observa que no son distribuciones normales, ni los datos de población ni los datos de la muestra se comportan como distribución normal.
Se simula una población de datos normales de un variable que contiene edades en jóvenes. Se genera una población de 650 personas y la variable aleatoria es continua con media igual a 24 y desviación estándar de 3.
N <- 650
poblacion <- rnorm(n = N, mean = 24, sd = 3)
poblacion
## [1] 23.49117 26.46120 17.87072 29.27681 25.77997 27.22205 14.89729 23.56582
## [9] 25.28127 22.75065 24.31931 27.45422 20.66900 21.62247 27.88537 18.39212
## [17] 23.68067 21.37949 26.62094 19.09618 21.82186 21.94541 21.61719 21.98671
## [25] 14.73250 29.40366 22.69871 24.60402 21.67252 26.65516 21.05268 24.01290
## [33] 25.66087 25.16220 25.51035 19.12438 23.15996 21.25741 23.99850 24.18897
## [41] 21.47534 23.65093 25.05101 22.66009 22.62344 24.16918 23.34960 19.89525
## [49] 21.02093 22.73862 21.26946 22.77117 19.53185 22.75094 24.00072 27.37922
## [57] 21.63846 20.91741 19.88604 27.25808 24.39784 27.62273 18.95837 21.30691
## [65] 21.51818 21.72696 22.73642 25.47361 24.05908 22.80918 18.81675 28.11897
## [73] 24.11023 16.07595 24.00753 22.81012 26.99717 28.56361 22.84848 21.58531
## [81] 25.01751 22.69025 26.93697 24.04722 23.20052 20.58660 20.14934 26.28645
## [89] 23.65008 21.57041 26.64518 20.13643 29.51457 19.40975 22.39944 23.59704
## [97] 27.57093 20.61630 29.06507 27.02453 24.18238 26.07627 24.23129 26.17045
## [105] 23.00837 22.44961 24.39192 19.53210 23.66304 25.95203 23.75630 24.24180
## [113] 24.02388 20.48513 24.25762 21.45976 28.55702 19.65828 27.98651 20.89162
## [121] 20.68972 24.85485 19.07294 28.81098 23.62571 20.54403 25.73921 21.52499
## [129] 27.97247 20.48956 21.52880 26.90366 26.00355 21.49006 23.97124 18.34796
## [137] 26.82298 21.33509 16.82677 24.62623 19.83965 28.98156 24.17051 20.01894
## [145] 21.20643 25.64119 24.60185 22.31753 26.59112 23.44851 25.67738 21.52350
## [153] 28.05108 22.50103 26.90462 24.63365 24.06041 25.43942 30.31811 26.33525
## [161] 24.41835 20.71642 23.33013 26.73143 23.29365 22.76224 24.60214 25.82391
## [169] 23.29290 22.91821 26.99419 20.59452 25.50971 30.52467 20.96975 24.75559
## [177] 27.69804 27.83082 26.46179 28.10593 25.12243 25.87851 22.11228 21.08145
## [185] 23.30108 25.12353 23.03877 21.91172 21.51884 23.09848 30.40324 25.40619
## [193] 29.45043 26.19881 21.45861 27.34330 20.79438 29.61337 24.57057 19.17139
## [201] 26.86833 20.54582 25.26031 26.85499 20.96038 22.15513 21.70633 23.98905
## [209] 21.95794 21.59938 26.08090 23.16532 20.82675 22.66422 16.59080 21.45578
## [217] 23.32609 19.83604 24.33498 25.39490 26.31902 23.82956 24.30318 23.75439
## [225] 23.04207 20.48742 21.00372 21.61796 28.67717 28.27902 24.94597 24.28329
## [233] 20.60389 23.45086 21.66208 22.55523 28.23596 22.41685 24.97263 20.82196
## [241] 19.88063 30.69022 24.79882 22.18483 27.75527 17.79475 22.26150 27.60564
## [249] 20.26637 20.81751 26.05124 22.57003 20.77844 21.82285 20.29677 20.18790
## [257] 23.30498 21.92535 28.58358 22.08288 23.67196 26.33111 26.11677 25.63771
## [265] 26.31111 18.96375 20.62414 26.22138 27.92991 24.72530 21.11548 27.05190
## [273] 19.16909 23.93929 19.25120 23.95101 23.03540 24.20069 28.47591 27.05196
## [281] 18.39910 23.78533 22.75624 28.02630 19.63612 28.51908 25.73380 18.59974
## [289] 27.46296 23.40007 26.13948 21.87605 24.30098 21.70355 23.20910 27.14776
## [297] 23.93894 23.23070 14.93094 16.90350 24.65732 29.31122 24.51365 24.92505
## [305] 25.34894 25.30761 22.77896 22.74292 25.87792 26.25046 28.94639 25.46588
## [313] 21.97518 24.22314 19.09448 23.43935 18.24441 23.16542 20.15551 20.85358
## [321] 18.63095 24.64020 25.60134 29.14361 25.81833 23.04622 29.66025 22.64892
## [329] 28.15847 24.14390 25.62288 27.29425 24.39190 18.60235 25.55319 21.81679
## [337] 24.48057 20.24460 21.15664 20.22316 25.54990 22.06265 27.35883 23.78892
## [345] 25.40486 21.55953 24.77812 26.53385 23.15069 26.02625 25.41725 26.78133
## [353] 28.26671 26.21039 23.25909 19.16945 26.39770 22.74574 21.22251 21.43598
## [361] 22.80037 18.78283 24.11185 20.89195 22.52077 26.88626 25.69996 24.06339
## [369] 25.54733 29.27516 24.89247 21.45994 28.64370 22.97755 25.08191 20.68397
## [377] 20.26230 22.62861 23.59968 26.19046 21.37960 24.60170 20.69457 25.58468
## [385] 20.46609 28.03893 17.29251 23.98171 24.25174 20.56535 24.57303 28.09272
## [393] 30.77986 26.99187 24.36363 24.95022 22.70336 22.35416 22.19914 22.63152
## [401] 18.94700 20.18292 18.81253 21.24359 19.36913 22.74141 24.03016 25.98125
## [409] 25.25814 23.34818 23.85203 24.10571 30.46950 17.83019 30.01147 21.91680
## [417] 24.49078 30.03048 23.08484 23.80454 19.74640 30.80139 23.84267 18.48741
## [425] 24.06223 21.30190 25.59447 26.14146 23.58755 24.31737 23.34914 22.38523
## [433] 20.08755 20.19058 24.56967 29.91329 25.94930 23.38659 22.26413 29.43959
## [441] 20.71785 30.12639 23.75766 23.33489 25.40776 21.65754 23.19968 22.08766
## [449] 19.27998 18.98886 29.27316 25.40966 20.69351 23.10292 20.84706 22.28861
## [457] 20.49166 25.31562 24.29664 26.03955 27.78763 21.11698 31.52236 18.34198
## [465] 22.09762 30.46340 24.79544 25.64381 27.55768 23.53759 23.43647 20.72464
## [473] 22.94023 20.96701 25.45018 21.93868 23.48600 23.56084 23.64760 24.57161
## [481] 28.46838 23.53605 24.69355 18.27568 22.30055 20.30031 24.25853 25.47617
## [489] 24.84042 25.50072 20.65652 25.15818 25.25841 24.70056 22.23886 24.10968
## [497] 20.13927 20.84505 19.54574 18.27494 27.34414 31.58603 20.85753 31.19258
## [505] 24.80989 20.06631 21.62025 20.83911 27.92150 25.41792 23.35085 21.29349
## [513] 28.76328 23.60679 22.85589 24.48435 27.46126 19.50374 16.82272 25.55513
## [521] 17.70947 21.05129 23.22355 21.16433 27.52407 22.35201 26.15996 24.47790
## [529] 23.79698 27.96406 15.13840 26.84616 24.31737 19.35485 15.72357 28.25237
## [537] 19.51983 27.50747 21.13070 25.34384 23.74609 27.16909 27.81330 19.34600
## [545] 28.49335 18.49184 24.64273 29.14149 24.90338 23.96511 25.43616 23.98298
## [553] 24.38401 25.58857 23.79085 22.02677 26.55291 19.24468 22.03662 22.93510
## [561] 22.92939 21.30349 25.94241 23.21598 26.27296 28.66539 18.67777 20.58939
## [569] 21.87433 18.86246 18.83678 23.39877 28.63703 20.80237 17.91579 23.15040
## [577] 29.22323 21.47213 26.37311 23.96211 19.65220 24.34374 23.62948 24.06084
## [585] 22.45448 27.49927 25.95691 27.02453 19.44661 22.56914 25.57394 21.42991
## [593] 21.95583 20.11317 22.95882 22.35875 22.35103 22.18317 20.07159 20.86235
## [601] 27.32411 20.74159 20.62128 24.83089 22.39189 23.93610 27.11020 24.95089
## [609] 24.93724 20.04489 25.68569 32.16496 27.93688 26.31392 25.12856 22.46283
## [617] 25.90759 20.14781 21.45528 22.32272 26.17243 26.77574 30.51179 20.59319
## [625] 17.07853 22.97004 19.20444 29.98231 29.63885 18.72866 20.15139 30.92410
## [633] 23.07150 20.23533 28.27830 29.10165 21.99823 28.21514 25.46311 28.24031
## [641] 25.79297 20.86046 27.79799 26.62901 28.27586 27.12241 29.85441 27.48447
## [649] 23.18722 21.88509
summary(poblacion)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 14.73 21.46 23.65 23.72 25.86 32.16
Se obtiene el parámetro de la media poblacional
media.p <- round(mean(poblacion), 2)
media.p
## [1] 23.72
Se obtiene el parámetro de la desviación estándar de la población
desv.std.p <- round(sd(poblacion), 2)
desv.std.p
## [1] 3.16
Determinar tres muestras llamadas m1, m2 y m3 cada una con el 20% de la población.
Se siembra una semilla para generar las mismas muestras cada vez que se construye el archivo markdown.
porcentaje = 0.20
n <- round(N * porcentaje)
m1 <- sample(x = poblacion, size = n, replace = FALSE)
m2 <- sample(x = poblacion, size = n, replace = FALSE)
m3 <- sample(x = poblacion, size = n, replace = FALSE)
Se visualizan las muestras
m1; m2; m3
## [1] 17.70947 19.36913 23.56582 21.08145 22.09762 24.64020 26.77574 25.66087
## [9] 19.24468 28.63703 25.05101 19.35485 20.54403 25.59447 16.82272 21.95794
## [17] 21.47213 26.62901 23.79085 27.83082 22.77896 24.70056 19.88604 20.56535
## [25] 24.31931 24.63365 27.37922 28.51908 28.27902 26.05124 21.82285 20.06631
## [33] 25.34894 25.95203 27.50747 23.80454 24.22314 20.69457 26.90462 19.65220
## [41] 21.59938 21.61719 20.62128 21.72696 27.02453 24.06339 29.66025 21.42991
## [49] 23.75439 26.53385 22.64892 25.31562 23.16542 18.83678 20.96701 25.98125
## [57] 28.27830 20.14934 24.39190 20.96975 24.60214 29.98231 28.27586 24.31737
## [65] 25.25841 23.74609 20.60389 19.54574 21.02093 22.11228 29.63885 24.64273
## [73] 21.82186 21.99823 21.58531 28.81098 19.50374 22.84848 20.48956 28.49335
## [81] 27.81330 14.93094 25.25814 24.10968 24.69355 27.96406 21.30691 23.64760
## [89] 24.93724 25.81833 26.25046 29.14361 20.71642 28.55702 20.15551 22.74574
## [97] 24.17051 26.19046 20.48742 24.89247 21.00372 30.69022 23.79698 23.78533
## [105] 24.28329 29.10165 20.66900 23.23070 20.77844 20.84706 22.38523 24.49078
## [113] 20.19058 21.45578 31.19258 21.88509 23.65093 24.20069 22.80918 19.40975
## [121] 26.22138 24.48435 23.49117 26.59112 20.59452 25.40619 25.46588 24.10571
## [129] 29.91329 24.25762
## [1] 24.30318 25.95203 29.45043 27.12241 18.72866 28.81098 23.62948 21.61796
## [9] 21.37960 28.02630 23.96511 28.24031 23.98298 21.62025 21.05129 20.48956
## [17] 22.73642 25.50072 24.90338 25.05101 23.56084 21.20643 25.40619 24.79544
## [25] 22.38523 25.40776 25.39490 22.08288 25.54733 26.03955 22.77896 30.40324
## [33] 17.07853 22.63152 22.69025 21.95583 20.13927 21.45528 24.70056 25.67738
## [41] 30.52467 22.66422 28.10593 24.49078 23.29290 24.36363 24.31737 18.81675
## [49] 26.27296 25.43616 28.27902 19.40975 24.29664 21.58531 22.56914 22.69871
## [57] 24.60170 21.00372 26.15996 23.34960 27.96406 26.99717 23.03877 25.66087
## [65] 24.39192 20.65652 24.16918 20.46609 22.35103 23.40007 23.99850 25.34384
## [73] 20.71642 25.15818 21.30691 20.85753 28.05108 27.11020 25.54990 31.52236
## [81] 27.57093 23.67196 23.82956 22.97004 23.16532 25.41725 23.35085 26.14146
## [89] 21.43598 20.79438 30.51179 21.66208 27.48447 27.46126 25.58857 20.68972
## [97] 22.26150 25.01751 22.46283 24.60214 22.81012 20.72464 26.21039 24.06223
## [105] 24.57303 24.77812 25.79297 26.78133 24.25174 20.56535 18.48741 20.61630
## [113] 21.33509 25.94930 20.11317 18.67777 19.20444 21.63846 24.95089 23.56582
## [121] 25.16220 18.60235 22.80918 21.52499 26.17243 32.16496 23.16542 22.08766
## [129] 29.14361 21.08145
## [1] 27.02453 29.85441 24.30098 21.87433 24.01290 28.24031 21.62247 20.18790
## [9] 27.88537 20.80237 23.79698 22.92939 17.91579 21.63846 19.35485 24.49078
## [17] 24.25853 22.95882 24.28329 23.93929 30.92410 22.08766 22.06265 21.22251
## [25] 18.86246 24.06339 27.34414 27.29425 25.60134 19.07294 22.32272 20.69351
## [33] 24.95022 24.72530 19.40975 23.65093 21.67252 23.07150 21.94541 26.85499
## [41] 30.01147 26.82298 21.47213 26.19881 25.41792 22.26150 23.30108 28.09272
## [49] 26.77574 24.33498 24.25174 21.13070 20.56535 28.64370 25.40619 26.15996
## [57] 22.97755 15.13840 21.49006 20.08755 23.35085 25.12353 24.24180 25.81833
## [65] 26.05124 28.66539 16.90350 26.99419 21.52350 23.59704 27.46296 25.47361
## [73] 23.97124 24.20069 18.34796 21.70355 21.20643 26.11677 18.63095 25.62288
## [81] 22.75065 24.30318 21.91172 24.38401 20.48742 24.00072 24.97263 22.38523
## [89] 26.17243 25.40966 24.41835 25.50072 20.26637 24.17051 29.27316 26.25046
## [97] 20.84706 26.31392 23.80454 25.66087 26.55291 21.05268 24.47790 25.28127
## [105] 18.83678 18.95837 21.92535 21.45578 24.79882 19.16945 24.60185 29.63885
## [113] 25.64381 24.34374 27.96406 21.91680 20.85753 23.79085 24.39190 21.70633
## [121] 23.93894 16.59080 28.63703 23.85203 26.46179 24.60214 21.30349 21.97518
## [129] 21.30190 22.44961
media.m1 <- round(mean(m1), 2)
media.m2 <- round(mean(m2), 2)
media.m3 <- round(mean(m3), 2)
media.m1; media.m2; media.m3
## [1] 23.79
## [1] 23.94
## [1] 23.67
desv.std.m1 <- round(sd(m1), 2)
desv.std.m2 <- round(sd(m2), 2)
desv.std.m3 <- round(sd(m3), 2)
desv.std.m1; desv.std.m2; desv.std.m3
## [1] 3.17
## [1] 2.92
## [1] 3
error.m1 <- round(media.p - media.m1, 2)
error.m2 <- round(media.p - media.m2, 2)
error.m3 <- round(media.p - media.m3, 2)
error.m1; error.m2; error.m3
## [1] -0.07
## [1] -0.22
## [1] 0.05
error.dsm1 <- round(desv.std.p - desv.std.m1, 4)
error.dsm2 <- round(desv.std.p - desv.std.m2, 4)
error.dsm3 <- round(desv.std.p - desv.std.m3, 4)
error.dsm1; error.dsm2; error.dsm3
## [1] -0.01
## [1] 0.24
## [1] 0.16
Se visualiza el histograma de la población y de las tres muestras en dos reglones y dos columnas.
Se transforma data.frame() los valores de la población y de las muestras para facilitar la visualización de datos con ggplot() con variable llamada edades.
poblacion <- data.frame(edades = poblacion)
muestra1 <- data.frame(edades = m1)
muestra2 <- data.frame(edades = m2)
muestra3 <- data.frame(edades = m3)
# Histograma con densidad. Población
gp <- ggplot(poblacion, aes(x = edades)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "blue", bins = 30) +
labs(title = "Población",
subtitle = paste("ME=", media.p, "; ds=", desv.std.p),
caption = "Fuente propia") +
geom_vline(xintercept = media.p, col='red') +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
gp <- gp + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 1
gm1 <- ggplot(muestra1, aes(x = edades)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "green", bins = 30) +
geom_vline(xintercept = media.m1, col='red') +
labs(title = "Muestra 1",
subtitle = paste("me=", media.m1, "; ds.=", desv.std.m1, "; Err. muestral de media.=",error.m1),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
gm1 <- gm1 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 2
gm2 <- ggplot(muestra2, aes(x = edades)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "brown", bins = 30) +
geom_vline(xintercept = media.m2, col='red') +
labs(title = "Muestra 2",
subtitle = paste("me=", media.m2, "; ds.=", desv.std.m2, "; Err. muestral de media.=",error.m2),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
gm2 <- gm2 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 3
gm3 <- ggplot(muestra3, aes(x = edades)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "orange", bins = 30) +
geom_vline(xintercept = media.m3, col='red') +
labs(title = "Muestra 3",
subtitle = paste("me=", media.m3, "; ds.=", desv.std.m3, "; Err. muestral de media.=",error.m3),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
gm3 <- gm3 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(gp, gm1, gm2, gm3, nrow = 2, ncol = 2)
En estadística, error muestral o error de estimación es el error que surge a causa de observar una muestra de la población completa.La estimación de valor de interés, como la media o el porcentaje, estará generalmente sujeta a una variación entre una muestra y otra.