A continuación se presenta el objetivo general de la práctica:
A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:
Simular La Población Y Muestra De Los Sueldos De Los Trabajadores En Una Institución Educativa.
Crear Los Datos Relacionados Con La Población.
Determinar Los Parámetros Descriptivos.
Crear Los Datos Relacionados Con La Muestra.
Determinar Los Estadísticos Descriptivos.
Determinar El Error Muestral De La Media Y De Las Desviaciones.
Visualizar Los Datos Mediante Un Histograma Y La Densidad.
Realizar la Interpretación De La Práctica Correspondiente.
La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.
Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.
Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.
La definición propia de una variables estadísticas es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):
Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores.
Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está medida en centímetros.
Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio) expresar en forma de número.
Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de variables:
Variable Cuantitativa: Son variables que se expresan numéricamente.
Variable Continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que tarda un corredor en completar los 100 metros lisos.
Variable Discreta: Toman un valor finito de valores entre un intervalo de datos. Número de helados vendidos.
Variable Cualitativa: Son variables que se expresan, por norma general, en palabras.
Variable Ordinal: Expresa diferentes niveles y orden.
Variable Nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos puede ser azul, negro, castaño, verde, etc.
El muestreo es el proceso mediante el cual se selecciona un grupo de observaciones que pertenecen a una población. Esto, con el fin de realizar un estudio estadístico.
En otras palabras, es el procedimiento mediante el cual se toman a ciertos individuos que pertenecen a una población que está siendo sujeto de un análisis.
Por otro lado, un error de muestreo se produce cuando la muestra utilizada en el estudio no es representativa de toda la población. A menudo se producen errores de muestreo y, por lo tanto, los investigadores siempre calculan un margen de error durante los resultados finales como práctica estadística.
El margen de error es la cantidad de error permitida para que un error de cálculo represente la diferencia entre la muestra y la población real.
Ahora, hay que descubrir cuáles son los cuatro principales errores de muestreo en una investigación de mercado:
Por ejemplo, imagina un estudio de investigación sobre ropa de niños. ¿Quién es la persona correcta para encuestar? Pueden ser ambos padres, sólo la madre o el niño. Los padres toman decisiones de compra, pero los niños pueden influir en su elección.
Por ejemplo, elegir un marco de muestreo de la guía telefónica puede ser un error porque la gente cambia de ciudad. Las exclusiones erróneas se producen cuando las personas prefieren eliminar sus números de la lista. Existen hogares que pueden tener más de una línea telefónica, lo que conduce a múltiples inclusiones.
Se pueden controlar los errores de selección yendo al paso extra para solicitar respuestas de toda la muestra. La planificación previa a la encuesta, los seguimientos y un diseño limpio y ordenado de la encuesta aumentarán el índice de participación de los encuestados..
Estos errores de muestreo pueden controlarse y eliminarse mediante la creación de un diseño de muestra cuidadoso, teniendo una muestra lo suficientemente grande como para reflejar a toda la población, o utilizando una muestra online para recoger las respuestas de una encuesta.
Las teorías estadísticas ayudan a los investigadores a medir la probabilidad de errores de muestreo en el tamaño de la muestra y la población.
El tamaño de la muestra de la población determina principalmente el tamaño del error de muestreo. Los tamaños de muestra más grandes tienden a encontrar una tasa de errores más baja.
En los siguientes ejercicios también se utilizan funciones de paquetes predeterminados de lenguaje de R para una mejor comprensión de la distribución binomial.
# Importación De Los Paquetes Y Librerías Necesarias Para La Realización De La Práctica
library(cowplot)
library(ggplot2)
# Acomodo Del Tipo De Notación Para El Muestro De Los Valores Obtenidos
options(scipen=999) # Notación normal
# options(scipen=1) # Notación científica
# implementación De La Semilla Aleatoria
set.seed(2023)
Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de 650 trabajadores que laboran en una Institución educativa. El rango está entre $5000 y $35000 pesos mensuales.
N <- 650 # Cantidad de datos de población
rango <- 5000:35000 # Rango
n = 100 # Cantidad de datos de muestra
\[ poblacion = \text{ {x | x es un trabajador de una Institución educativa; }} \therefore \\ x_1, x_2, x_3, ... ,x_{N=650} \]
# Determinando La Población
poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size = N, replace = TRUE))
head(poblacion, 30)
## x sueldo
## 1 1 26967
## 2 2 15670
## 3 3 30960
## 4 4 6991
## 5 5 12922
## 6 6 32929
## 7 7 12723
## 8 8 22249
## 9 9 28744
## 10 10 14756
## 11 11 16824
## 12 12 27396
## 13 13 14348
## 14 14 27599
## 15 15 30534
## 16 16 25961
## 17 17 18698
## 18 18 13398
## 19 19 33716
## 20 20 27275
## 21 21 33383
## 22 22 18956
## 23 23 13575
## 24 24 21151
## 25 25 12304
## 26 26 22910
## 27 27 11456
## 28 28 21877
## 29 29 15721
## 30 30 19703
tail(poblacion, 30)
## x sueldo
## 621 621 33095
## 622 622 9643
## 623 623 13798
## 624 624 9809
## 625 625 19307
## 626 626 29817
## 627 627 5976
## 628 628 16975
## 629 629 17985
## 630 630 8105
## 631 631 31701
## 632 632 13311
## 633 633 23904
## 634 634 28564
## 635 635 25336
## 636 636 24250
## 637 637 30863
## 638 638 29629
## 639 639 34692
## 640 640 18319
## 641 641 21720
## 642 642 12379
## 643 643 32139
## 644 644 34938
## 645 645 20862
## 646 646 14527
## 647 647 5825
## 648 648 22779
## 649 649 18248
## 650 650 9288
summary(poblacion$sueldo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5001 12924 19974 20035 27295 34987
minimo.p <- min(poblacion$sueldo)
maximo.p <- max(poblacion$sueldo)
media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)
El trabajador DE LA POBLACION menos gana tiene un sueldo de 5001, el que más gana recibe 34987, con una desviación estándar de 8476.9 y una media aritmética de 20034.84.
Se determina una muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el el valor de \(x\).
\[ muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100} \]
La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.
xs <- sample(x = 1:n, size = n, replace = FALSE)
muestra <- poblacion[xs,]
head(muestra, 30)
## x sueldo
## 9 9 28744
## 99 99 31615
## 67 67 12634
## 86 86 13607
## 47 47 34379
## 78 78 16035
## 35 35 19182
## 73 73 26908
## 66 66 17713
## 59 59 18676
## 83 83 19523
## 11 11 16824
## 98 98 21564
## 50 50 17753
## 6 6 32929
## 61 61 9267
## 55 55 30670
## 39 39 30182
## 84 84 28529
## 8 8 22249
## 90 90 21172
## 69 69 13432
## 30 30 19703
## 37 37 27301
## 18 18 13398
## 2 2 15670
## 29 29 15721
## 68 68 29287
## 58 58 25896
## 49 49 31821
tail(muestra, 20)
## x sueldo
## 1 1 26967
## 15 15 30534
## 48 48 22349
## 23 23 13575
## 32 32 18140
## 82 82 21794
## 57 57 31157
## 10 10 14756
## 36 36 30597
## 38 38 16046
## 46 46 7117
## 28 28 21877
## 34 34 17529
## 65 65 11052
## 44 44 26502
## 14 14 27599
## 87 87 20993
## 31 31 16429
## 76 76 15635
## 21 21 33383
summary(muestra)
## x sueldo
## Min. : 1.00 Min. : 6274
## 1st Qu.: 25.75 1st Qu.:15708
## Median : 50.50 Median :21368
## Mean : 50.50 Mean :21672
## 3rd Qu.: 75.25 3rd Qu.:27447
## Max. :100.00 Max. :34518
summary(muestra$sueldo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 6274 15708 21368 21672 27447 34518
minimo.m <- min(muestra$sueldo)
maximo.m <- max(muestra$sueldo)
media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)
El trabajador DE LA MUESTRA menos gana tiene un sueldo de 6274, el que más gana recibe 34518, con una desviación estándar de 7636.02 y una media aritmética de 21671.95.
El error muestral aparece porque los valores estadísticos de la muestra son diferentes (cercanos pero diferentes) con respecto a los valores de los parámetros de la población.
media.p; media.m
## [1] 20034.84
## [1] 21671.95
desv.p; desv.m
## [1] 8476.9
## [1] 7636.02
dif.media <- media.p - media.m
dif.desv <- desv.p - desv.m
paste("El error muestral con respecto a la media es de: ", dif.media)
## [1] "El error muestral con respecto a la media es de: -1637.11"
paste("El error muestral con respecto a la desviación es de: ", round(dif.desv),4)
## [1] "El error muestral con respecto a la desviación es de: 841 4"
# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "blue") +
labs(title = "Población",
subtitle = paste("ME=", media.p, "; ds=", desv.p, "; Err muest. media=",dif.media),
caption = "Fuente propia") +
geom_vline(xintercept = media.m, col='red') +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g1 <- g1 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(muestra, aes(x = sueldo)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "green") +
geom_vline(xintercept = media.m, col='red') +
labs(title = "Muestra",
subtitle = paste("me=", media.m, "; ds.=", desv.m, "; Err. muestral de sd.=",dif.desv),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
g2 <- g2 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)
Se observa que no son distribuciones normales, ni los datos de población ni los datos de la muestra se comportan como distribución normal.
Se simula una población de datos normales de un variable que contiene edades en jóvenes. Se genera una población de 650 personas y la variable aleatoria es continua con media igual a 24 y desviación estándar de 3.
N <- 650
poblacion <- round(rnorm(n = N, mean = 24, sd = 3), 0)
poblacion
## [1] 19 20 27 23 30 26 26 21 22 24 23 24 25 20 24 19 28 23 22 19 22 25 25 26 23
## [26] 22 28 27 23 23 20 23 23 23 21 28 24 30 25 26 28 24 22 28 22 24 23 26 26 24
## [51] 23 23 21 20 20 25 25 21 19 25 20 21 21 20 22 26 22 22 27 23 24 20 20 22 22
## [76] 25 20 28 21 21 26 25 24 22 28 20 25 21 25 28 16 24 22 24 27 18 25 23 23 26
## [101] 24 27 23 27 26 27 23 26 20 23 22 24 19 22 21 24 24 22 21 27 25 27 31 29 26
## [126] 29 22 28 25 22 25 21 25 24 20 22 24 23 25 24 23 28 21 25 25 24 23 28 27 23
## [151] 23 26 26 19 18 21 25 24 20 19 22 27 31 19 25 25 26 23 23 23 22 25 22 32 23
## [176] 21 23 20 26 28 24 27 24 25 27 26 25 16 18 24 22 26 27 23 24 24 21 26 19 29
## [201] 22 26 26 23 24 24 22 20 24 20 23 23 28 20 26 22 21 27 27 23 24 24 24 25 26
## [226] 22 24 28 27 23 21 21 24 25 19 23 29 26 28 23 22 22 20 28 21 26 25 19 22 24
## [251] 25 26 22 29 23 21 22 23 26 29 25 24 26 24 20 26 25 21 20 28 25 22 23 23 24
## [276] 22 27 26 30 22 22 25 24 19 24 19 23 20 22 27 18 23 26 18 28 26 24 21 26 21
## [301] 22 24 24 20 24 20 22 24 21 31 19 30 27 27 22 24 24 25 24 21 22 26 28 29 25
## [326] 26 20 23 21 23 22 24 29 29 27 24 20 18 27 19 28 22 22 21 22 24 23 28 26 26
## [351] 16 22 28 17 21 25 19 26 27 24 26 27 32 22 22 27 23 21 25 26 20 23 25 23 24
## [376] 18 25 26 21 27 24 24 27 22 24 28 22 25 22 23 22 16 22 20 24 19 29 26 27 23
## [401] 27 21 33 26 25 23 23 18 30 27 30 26 24 25 23 22 26 24 28 26 25 26 18 22 20
## [426] 22 20 26 21 30 27 23 25 23 25 27 22 24 25 22 21 22 26 20 25 20 22 27 19 22
## [451] 24 22 24 24 23 19 22 23 24 24 28 26 20 23 23 21 25 24 30 24 20 24 23 19 21
## [476] 22 21 26 24 26 27 24 26 18 26 28 27 27 22 24 24 24 24 27 23 20 22 28 23 21
## [501] 25 26 21 25 25 25 23 22 24 19 28 25 23 24 27 23 22 23 23 24 20 23 24 23 24
## [526] 23 24 27 22 23 22 25 28 22 26 29 20 22 27 24 27 15 28 23 23 27 18 25 25 22
## [551] 26 24 24 23 19 21 23 23 25 25 30 23 24 19 25 23 25 20 20 22 24 26 23 24 27
## [576] 22 20 26 26 27 21 20 22 22 22 22 26 28 23 25 22 30 23 26 19 25 23 24 25 27
## [601] 21 25 22 23 23 18 20 26 26 23 19 22 19 24 26 22 26 22 25 26 24 27 19 24 23
## [626] 21 23 24 19 23 24 25 20 27 28 21 19 24 21 23 27 28 25 26 26 22 22 25 22 23
summary(poblacion)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 15.00 22.00 24.00 23.71 26.00 33.00
Se obtiene el parámetro de la media poblacional
media.p <- round(mean(poblacion), 2)
media.p
## [1] 23.71
Se obtiene el parámetro de la desviación estándar de la población
desv.std.p <- round(sd(poblacion), 2)
desv.std.p
## [1] 2.86
Determinar tres muestras llamadas m1, m2 y m3 cada una con el 20% de la población.
Además, se siembra una semilla para generar las mismas muestras cada vez que se construye el archivo markdown.
# Implementación De La Semilla Previamente Declarada
porcentaje = 0.20
n <- round(N * porcentaje)
m1 <- sample(x = poblacion, size = n, replace = FALSE)
m2 <- sample(x = poblacion, size = n, replace = FALSE)
m3 <- sample(x = poblacion, size = n, replace = FALSE)
Se visualizan las muestras
# Visualizando Las Muestras
m1; m2; m3
## [1] 22 22 20 25 22 23 24 22 24 22 19 20 24 27 22 26 19 27 19 19 22 25 24 26 19
## [26] 19 21 22 16 19 24 28 21 26 24 22 25 18 28 26 22 23 24 20 23 24 21 25 27 24
## [51] 30 26 24 22 27 24 25 23 23 28 24 29 26 25 22 20 19 26 27 23 20 28 28 23 19
## [76] 21 22 23 22 26 24 27 26 21 27 24 26 27 24 23 25 19 23 22 28 27 32 25 23 20
## [101] 30 21 20 27 24 22 20 26 25 24 25 24 24 25 24 26 25 22 24 28 25 21 26 25 24
## [126] 25 22 27 21 20
## [1] 23 24 22 28 23 30 22 25 26 19 26 19 27 20 28 23 23 24 27 19 24 19 22 19 21
## [26] 20 22 24 28 26 25 25 22 23 23 23 23 30 26 27 27 23 21 26 24 23 23 23 24 24
## [51] 26 24 30 27 26 26 20 23 25 22 24 25 25 27 23 22 28 23 28 22 23 19 23 26 24
## [76] 24 22 23 25 22 25 23 23 26 25 31 26 28 24 24 22 30 22 24 26 19 24 23 23 23
## [101] 23 23 16 24 20 25 25 28 21 24 20 27 24 26 20 23 23 21 25 24 19 28 28 23 22
## [126] 27 27 16 27 23
## [1] 26 21 20 22 23 24 24 21 26 22 25 25 22 24 25 23 25 24 22 26 20 26 24 20 21
## [26] 21 22 24 27 24 24 23 25 26 26 21 22 26 24 25 24 24 23 22 18 24 25 24 22 19
## [51] 20 22 26 27 26 24 23 25 21 28 22 23 24 23 23 25 23 26 27 28 20 24 23 19 26
## [76] 20 27 22 24 23 21 22 28 20 22 27 25 27 28 26 25 24 22 24 23 28 27 19 21 23
## [101] 25 19 33 30 29 26 24 22 24 23 23 23 27 25 26 18 22 17 20 23 16 22 16 18 20
## [126] 27 26 22 28 26
media.m1 <- round(mean(m1), 2)
media.m2 <- round(mean(m2), 2)
media.m3 <- round(mean(m3), 2)
media.m1; media.m2; media.m3
## [1] 23.66
## [1] 23.91
## [1] 23.55
desv.std.m1 <- round(sd(m1), 2)
desv.std.m2 <- round(sd(m2), 2)
desv.std.m3 <- round(sd(m3), 2)
desv.std.m1; desv.std.m2; desv.std.m3
## [1] 2.88
## [1] 2.83
## [1] 2.87
error.m1 <- round(media.p - media.m1, 2)
error.m2 <- round(media.p - media.m2, 2)
error.m3 <- round(media.p - media.m3, 2)
error.m1; error.m2; error.m3
## [1] 0.05
## [1] -0.2
## [1] 0.16
error.dsm1 <- round(desv.std.p - desv.std.m1, 4)
error.dsm2 <- round(desv.std.p - desv.std.m2, 4)
error.dsm3 <- round(desv.std.p - desv.std.m3, 4)
error.dsm1; error.dsm2; error.dsm3
## [1] -0.02
## [1] 0.03
## [1] -0.01
Se visualiza el histograma de la población y de las tres muestras en dos reglones y dos columnas.
Se transforma data.frame() los valores de la población y de las muestras para facilitar la visualización de datos con ggplot() con variable llamada edades.
poblacion <- data.frame(edades = poblacion)
muestra1 <- data.frame(edades = m1)
muestra2 <- data.frame(edades = m2)
muestra3 <- data.frame(edades = m3)
# Histograma con densidad. Población
gp <- ggplot(poblacion, aes(x = edades)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "blue", bins = 30) +
labs(title = "Población",
subtitle = paste("ME=", media.p, "; ds=", desv.std.p),
caption = "Fuente propia") +
geom_vline(xintercept = media.p, col='red') +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
gp <- gp + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 1
gm1 <- ggplot(muestra1, aes(x = edades)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "green", bins = 30) +
geom_vline(xintercept = media.m1, col='red') +
labs(title = "Muestra 1",
subtitle = paste("me=", media.m1, "; ds.=", desv.std.m1, "; Err. muestral de media.=",error.m1),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
gm1 <- gm1 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 2
gm2 <- ggplot(muestra2, aes(x = edades)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "brown", bins = 30) +
geom_vline(xintercept = media.m2, col='red') +
labs(title = "Muestra 2",
subtitle = paste("me=", media.m2, "; ds.=", desv.std.m2, "; Err. muestral de media.=",error.m2),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
gm2 <- gm2 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 3
gm3 <- ggplot(muestra3, aes(x = edades)) +
geom_histogram(aes(y = ..density..),
colour = 1, fill = "orange", bins = 30) +
geom_vline(xintercept = media.m3, col='red') +
labs(title = "Muestra 3",
subtitle = paste("me=", media.m3, "; ds.=", desv.std.m3, "; Err. muestral de media.=",error.m3),
caption = "Fuente propia") +
geom_density(lwd = 1.2,
linetype = 2,
colour = 2)
gm3 <- gm3 + theme(
plot.title = element_text(color = "black", size = 12, face = "bold"),
plot.subtitle = element_text(color = "black",size=7),
plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(gp, gm1, gm2, gm3, nrow = 2, ncol = 2)
Una muestras que es extraída de distribuciones que no so del tipo normal es decir, no pertenecen a una distribución normal (gráfica de gauss), la muestra también no tienen características de ser distribución normal.
Las muestras que son extraídas de distribuciones normales su comportamiento es ser una distribución normal o por lo menos se acerca mucho a ser distribución normal.
El error de muestreo es la diferencia que existe entre los valores de parámetros y estadísticos.
La diferencia que existe entre las medias aritméticas de una población (parámetro) con respecto al valor de la media aritmética (estadísticos) se le conoce como error muestral de la media. En el ejemplo de las edades de los estudiantes, los errores muestrales de las medias aritméticas con respecto a la población fueron: 0.05, 0.16, 0.16.
La diferencia que existe entre las desviaciones estándar de una población (parámetro) con respecto al valor de la desviación estándar (estadísticos) se le conoce como error muestral de la desviación. En el ejemplo de las edades de los estudiantes, los errores muestrales de las desviaciones con respecto a la población fueron: -0.02, 0.03, -0.01.
El error de muestreo es la diferencia entre la estadística muestral y la estadística poblacional. El error de muestreo se produce debido a la variabilidad natural en los datos y al hecho de que no se puede medir toda la población.
El error de muestreo se puede calcular utilizando la fórmula:
Error de muestreo = (Z * σ) / √n
Donde Z es el valor crítico de la distribución normal estándar, σ es la desviación estándar de la población y n es el tamaño de la muestra.
Es importante tener en cuenta que el error de muestreo no es lo mismo que el sesgo de muestreo. El sesgo de muestreo se produce cuando la muestra no es representativa de la población. El sesgo de muestreo puede ser causado por una variedad de factores, como una muestra demasiado pequeña o una selección no aleatoria.
Levine, D. M. (2010) Estadística para administración y economía. (7ª. ed.) México : Pearson Educación.
Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13ª. ed.) México: Cengage Learning.
Montgomery, D. C. (2011). Probabilidad y estadística aplicadas a la ingeniería. (2ª. ed.) México : Limusa: Wiley.
Quezada, L. (2010). Estadística para ingenieros. México : Empresa Editora Macro.