Los Objetivos De La Práctica

* El Objetivo General De La Práctica

A continuación se presenta el objetivo general de la práctica:

  • Determinar El Error De Muestreo De Los Ejercicios Presentados

* Los Objetivos Específicos De La Práctica

A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:

  • Simular La Población Y Muestra De Los Sueldos De Los Trabajadores En Una Institución Educativa.

  • Crear Los Datos Relacionados Con La Población.

  • Determinar Los Parámetros Descriptivos.

  • Crear Los Datos Relacionados Con La Muestra.

  • Determinar Los Estadísticos Descriptivos.

  • Determinar El Error Muestral De La Media Y De Las Desviaciones.

  • Visualizar Los Datos Mediante Un Histograma Y La Densidad.

  • Realizar la Interpretación De La Práctica Correspondiente.

* Investigaciones Pertinentes

* La Probabilidad

La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.

Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.

Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.

* Las Variables Estadísticas

La definición propia de una variables estadísticas es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):

Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores.

Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está medida en centímetros.

  • También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300 dólares el último año. En este caso, la variable sería el beneficio y estaría medido en dólares. Las variables son del tipo cuantitativo (se expresan con un número)

Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio) expresar en forma de número.

  • Así, otra variable que podríamos encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa. Es decir, no se expresa con número.

* Los Tipos De Variables Estadísticas

Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de variables:

  • Variable Cuantitativa: Son variables que se expresan numéricamente.

    • Variable Continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que tarda un corredor en completar los 100 metros lisos.

    • Variable Discreta: Toman un valor finito de valores entre un intervalo de datos. Número de helados vendidos.

  • Variable Cualitativa: Son variables que se expresan, por norma general, en palabras.

    • Variable Ordinal: Expresa diferentes niveles y orden.

    • Variable Nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos puede ser azul, negro, castaño, verde, etc.

* El Error De Muestreo

El muestreo es el proceso mediante el cual se selecciona un grupo de observaciones que pertenecen a una población. Esto, con el fin de realizar un estudio estadístico.

En otras palabras, es el procedimiento mediante el cual se toman a ciertos individuos que pertenecen a una población que está siendo sujeto de un análisis.

Por otro lado, un error de muestreo se produce cuando la muestra utilizada en el estudio no es representativa de toda la población. A menudo se producen errores de muestreo y, por lo tanto, los investigadores siempre calculan un margen de error durante los resultados finales como práctica estadística.

El margen de error es la cantidad de error permitida para que un error de cálculo represente la diferencia entre la muestra y la población real.

* ¿Cuáles Son Los Errores De Muestreo Más Comunes En Los Estudios Estadísticos?

Ahora, hay que descubrir cuáles son los cuatro principales errores de muestreo en una investigación de mercado:

  • Error de especificación de la población: Un error de especificación de población ocurre cuando los investigadores no saben exactamente a quién encuestar.

Por ejemplo, imagina un estudio de investigación sobre ropa de niños. ¿Quién es la persona correcta para encuestar? Pueden ser ambos padres, sólo la madre o el niño. Los padres toman decisiones de compra, pero los niños pueden influir en su elección.

  • Error en el marco de la muestra: Los errores del marco de muestreo surgen cuando los investigadores apuntan a la subpoblación erróneamente al seleccionar la muestra.

Por ejemplo, elegir un marco de muestreo de la guía telefónica puede ser un error porque la gente cambia de ciudad. Las exclusiones erróneas se producen cuando las personas prefieren eliminar sus números de la lista. Existen hogares que pueden tener más de una línea telefónica, lo que conduce a múltiples inclusiones.

  • Error de selección: Un error de selección ocurre cuando los encuestados se auto-seleccionan para participar en el estudio. Sólo los interesados responden.

Se pueden controlar los errores de selección yendo al paso extra para solicitar respuestas de toda la muestra. La planificación previa a la encuesta, los seguimientos y un diseño limpio y ordenado de la encuesta aumentarán el índice de participación de los encuestados..

  • Errores de muestra: Los errores de muestreo se producen debido a una disparidad en la representatividad de los encuestados. Ocurre principalmente cuando el investigador no planifica su muestra cuidadosamente.

Estos errores de muestreo pueden controlarse y eliminarse mediante la creación de un diseño de muestra cuidadoso, teniendo una muestra lo suficientemente grande como para reflejar a toda la población, o utilizando una muestra online para recoger las respuestas de una encuesta.

* ¿Cómo Controlar Un Error De Muestreo?

Las teorías estadísticas ayudan a los investigadores a medir la probabilidad de errores de muestreo en el tamaño de la muestra y la población.

El tamaño de la muestra de la población determina principalmente el tamaño del error de muestreo. Los tamaños de muestra más grandes tienden a encontrar una tasa de errores más baja.

* Desarrollo Metodológico De La Práctica

En los siguientes ejercicios también se utilizan funciones de paquetes predeterminados de lenguaje de R para una mejor comprensión de la distribución binomial.

* Actividad No. 1 - Importar E Implementar Las Librerías

# Importación De Los Paquetes Y Librerías Necesarias Para La Realización De La Práctica 
library(cowplot)
library(ggplot2)

# Acomodo Del Tipo De Notación Para El Muestro De Los Valores Obtenidos 
options(scipen=999) # Notación normal
# options(scipen=1) # Notación científica

* Actividad No. 2 - Implementación De La Semilla Aleatoria

# implementación De La Semilla Aleatoria 
set.seed(2023)

* Actividad No. 3 - El Ejercicio Del Sueldo De Trabajadores De Una Institución Educativa

* Los Datos Pertinentes Para La Realización De La Práctica

Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de 650 trabajadores que laboran en una Institución educativa. El rango está entre $5000 y $35000 pesos mensuales.

N <- 650 # Cantidad de datos de población
rango <- 5000:35000 # Rango 
n = 100  # Cantidad de datos de muestra

* Determinar La Población

\[ poblacion = \text{ {x | x es un trabajador de una Institución educativa; }} \therefore \\ x_1, x_2, x_3, ... ,x_{N=650} \]

# Determinando La Población 
poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size =  N, replace = TRUE))

* Las Primeras 30 Observaciones Realizadas

head(poblacion, 30)
##     x sueldo
## 1   1  26967
## 2   2  15670
## 3   3  30960
## 4   4   6991
## 5   5  12922
## 6   6  32929
## 7   7  12723
## 8   8  22249
## 9   9  28744
## 10 10  14756
## 11 11  16824
## 12 12  27396
## 13 13  14348
## 14 14  27599
## 15 15  30534
## 16 16  25961
## 17 17  18698
## 18 18  13398
## 19 19  33716
## 20 20  27275
## 21 21  33383
## 22 22  18956
## 23 23  13575
## 24 24  21151
## 25 25  12304
## 26 26  22910
## 27 27  11456
## 28 28  21877
## 29 29  15721
## 30 30  19703

* Las Últimas 30 Observaciones Realizadas

tail(poblacion, 30)
##       x sueldo
## 621 621  33095
## 622 622   9643
## 623 623  13798
## 624 624   9809
## 625 625  19307
## 626 626  29817
## 627 627   5976
## 628 628  16975
## 629 629  17985
## 630 630   8105
## 631 631  31701
## 632 632  13311
## 633 633  23904
## 634 634  28564
## 635 635  25336
## 636 636  24250
## 637 637  30863
## 638 638  29629
## 639 639  34692
## 640 640  18319
## 641 641  21720
## 642 642  12379
## 643 643  32139
## 644 644  34938
## 645 645  20862
## 646 646  14527
## 647 647   5825
## 648 648  22779
## 649 649  18248
## 650 650   9288

* Los Parámetros Poblacionales

summary(poblacion$sueldo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5001   12924   19974   20035   27295   34987
minimo.p <- min(poblacion$sueldo)
maximo.p <- max(poblacion$sueldo)
media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)

El trabajador DE LA POBLACION menos gana tiene un sueldo de 5001, el que más gana recibe 34987, con una desviación estándar de 8476.9 y una media aritmética de 20034.84.

* La Determinación De La Muestra

Se determina una muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el el valor de \(x\).

\[ muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100} \]

La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.

xs <- sample(x = 1:n, size =  n, replace = FALSE)
muestra <- poblacion[xs,]

* Las Primeras 30 Observaciones De La Muestra

head(muestra, 30)
##     x sueldo
## 9   9  28744
## 99 99  31615
## 67 67  12634
## 86 86  13607
## 47 47  34379
## 78 78  16035
## 35 35  19182
## 73 73  26908
## 66 66  17713
## 59 59  18676
## 83 83  19523
## 11 11  16824
## 98 98  21564
## 50 50  17753
## 6   6  32929
## 61 61   9267
## 55 55  30670
## 39 39  30182
## 84 84  28529
## 8   8  22249
## 90 90  21172
## 69 69  13432
## 30 30  19703
## 37 37  27301
## 18 18  13398
## 2   2  15670
## 29 29  15721
## 68 68  29287
## 58 58  25896
## 49 49  31821

* Las Últimas 30 Observaciones De La Muestra

tail(muestra, 20)
##     x sueldo
## 1   1  26967
## 15 15  30534
## 48 48  22349
## 23 23  13575
## 32 32  18140
## 82 82  21794
## 57 57  31157
## 10 10  14756
## 36 36  30597
## 38 38  16046
## 46 46   7117
## 28 28  21877
## 34 34  17529
## 65 65  11052
## 44 44  26502
## 14 14  27599
## 87 87  20993
## 31 31  16429
## 76 76  15635
## 21 21  33383

* La Descripción De Los Datos

summary(muestra)
##        x              sueldo     
##  Min.   :  1.00   Min.   : 6274  
##  1st Qu.: 25.75   1st Qu.:15708  
##  Median : 50.50   Median :21368  
##  Mean   : 50.50   Mean   :21672  
##  3rd Qu.: 75.25   3rd Qu.:27447  
##  Max.   :100.00   Max.   :34518

* Los Estadísticos Muestrales

summary(muestra$sueldo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    6274   15708   21368   21672   27447   34518
minimo.m <- min(muestra$sueldo)
maximo.m <- max(muestra$sueldo)
media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)

El trabajador DE LA MUESTRA menos gana tiene un sueldo de 6274, el que más gana recibe 34518, con una desviación estándar de 7636.02 y una media aritmética de 21671.95.

* El Error Muestral

El error muestral aparece porque los valores estadísticos de la muestra son diferentes (cercanos pero diferentes) con respecto a los valores de los parámetros de la población.

media.p; media.m
## [1] 20034.84
## [1] 21671.95
desv.p; desv.m
## [1] 8476.9
## [1] 7636.02

* Las Diferencias Muestrales

dif.media <- media.p - media.m
dif.desv <- desv.p - desv.m
paste("El error muestral con respecto a la media es de: ", dif.media)
## [1] "El error muestral con respecto a la media es de:  -1637.11"
paste("El error muestral con respecto a la desviación es de: ", round(dif.desv),4)
## [1] "El error muestral con respecto a la desviación es de:  841 4"

* El Histograma De Población Y Muestra

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p, "; ds=", desv.p,  "; Err muest. media=",dif.media),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 12, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(muestra, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.m, col='red') +
  labs(title = "Muestra",
      subtitle = paste("me=", media.m, "; ds.=", desv.m,  "; Err. muestral de sd.=",dif.desv),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 12, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que no son distribuciones normales, ni los datos de población ni los datos de la muestra se comportan como distribución normal.

* Actividad No. 4 - El Ejercicio De Una Población Normal

* Los Datos Pertinentes Para La Realización De La Práctica

Se simula una población de datos normales de un variable que contiene edades en jóvenes. Se genera una población de 650 personas y la variable aleatoria es continua con media igual a 24 y desviación estándar de 3.

N <- 650
poblacion <- round(rnorm(n = N, mean = 24, sd = 3), 0)
poblacion
##   [1] 19 20 27 23 30 26 26 21 22 24 23 24 25 20 24 19 28 23 22 19 22 25 25 26 23
##  [26] 22 28 27 23 23 20 23 23 23 21 28 24 30 25 26 28 24 22 28 22 24 23 26 26 24
##  [51] 23 23 21 20 20 25 25 21 19 25 20 21 21 20 22 26 22 22 27 23 24 20 20 22 22
##  [76] 25 20 28 21 21 26 25 24 22 28 20 25 21 25 28 16 24 22 24 27 18 25 23 23 26
## [101] 24 27 23 27 26 27 23 26 20 23 22 24 19 22 21 24 24 22 21 27 25 27 31 29 26
## [126] 29 22 28 25 22 25 21 25 24 20 22 24 23 25 24 23 28 21 25 25 24 23 28 27 23
## [151] 23 26 26 19 18 21 25 24 20 19 22 27 31 19 25 25 26 23 23 23 22 25 22 32 23
## [176] 21 23 20 26 28 24 27 24 25 27 26 25 16 18 24 22 26 27 23 24 24 21 26 19 29
## [201] 22 26 26 23 24 24 22 20 24 20 23 23 28 20 26 22 21 27 27 23 24 24 24 25 26
## [226] 22 24 28 27 23 21 21 24 25 19 23 29 26 28 23 22 22 20 28 21 26 25 19 22 24
## [251] 25 26 22 29 23 21 22 23 26 29 25 24 26 24 20 26 25 21 20 28 25 22 23 23 24
## [276] 22 27 26 30 22 22 25 24 19 24 19 23 20 22 27 18 23 26 18 28 26 24 21 26 21
## [301] 22 24 24 20 24 20 22 24 21 31 19 30 27 27 22 24 24 25 24 21 22 26 28 29 25
## [326] 26 20 23 21 23 22 24 29 29 27 24 20 18 27 19 28 22 22 21 22 24 23 28 26 26
## [351] 16 22 28 17 21 25 19 26 27 24 26 27 32 22 22 27 23 21 25 26 20 23 25 23 24
## [376] 18 25 26 21 27 24 24 27 22 24 28 22 25 22 23 22 16 22 20 24 19 29 26 27 23
## [401] 27 21 33 26 25 23 23 18 30 27 30 26 24 25 23 22 26 24 28 26 25 26 18 22 20
## [426] 22 20 26 21 30 27 23 25 23 25 27 22 24 25 22 21 22 26 20 25 20 22 27 19 22
## [451] 24 22 24 24 23 19 22 23 24 24 28 26 20 23 23 21 25 24 30 24 20 24 23 19 21
## [476] 22 21 26 24 26 27 24 26 18 26 28 27 27 22 24 24 24 24 27 23 20 22 28 23 21
## [501] 25 26 21 25 25 25 23 22 24 19 28 25 23 24 27 23 22 23 23 24 20 23 24 23 24
## [526] 23 24 27 22 23 22 25 28 22 26 29 20 22 27 24 27 15 28 23 23 27 18 25 25 22
## [551] 26 24 24 23 19 21 23 23 25 25 30 23 24 19 25 23 25 20 20 22 24 26 23 24 27
## [576] 22 20 26 26 27 21 20 22 22 22 22 26 28 23 25 22 30 23 26 19 25 23 24 25 27
## [601] 21 25 22 23 23 18 20 26 26 23 19 22 19 24 26 22 26 22 25 26 24 27 19 24 23
## [626] 21 23 24 19 23 24 25 20 27 28 21 19 24 21 23 27 28 25 26 26 22 22 25 22 23

* Los Parámetros De La Población

summary(poblacion)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   15.00   22.00   24.00   23.71   26.00   33.00

* La Media De La Población

Se obtiene el parámetro de la media poblacional

media.p <- round(mean(poblacion), 2)
media.p
## [1] 23.71

* La Desviación Estándar De La Población

Se obtiene el parámetro de la desviación estándar de la población

desv.std.p <- round(sd(poblacion), 2)
desv.std.p
## [1] 2.86

* El Muestreo

Determinar tres muestras llamadas m1, m2 y m3 cada una con el 20% de la población.

Además, se siembra una semilla para generar las mismas muestras cada vez que se construye el archivo markdown.

# Implementación De La Semilla Previamente Declarada
porcentaje = 0.20
n <- round(N * porcentaje)
m1 <- sample(x = poblacion, size = n, replace = FALSE)
m2 <- sample(x = poblacion, size = n, replace = FALSE)
m3 <- sample(x = poblacion, size = n, replace = FALSE)

Se visualizan las muestras

# Visualizando Las Muestras
m1; m2; m3
##   [1] 22 22 20 25 22 23 24 22 24 22 19 20 24 27 22 26 19 27 19 19 22 25 24 26 19
##  [26] 19 21 22 16 19 24 28 21 26 24 22 25 18 28 26 22 23 24 20 23 24 21 25 27 24
##  [51] 30 26 24 22 27 24 25 23 23 28 24 29 26 25 22 20 19 26 27 23 20 28 28 23 19
##  [76] 21 22 23 22 26 24 27 26 21 27 24 26 27 24 23 25 19 23 22 28 27 32 25 23 20
## [101] 30 21 20 27 24 22 20 26 25 24 25 24 24 25 24 26 25 22 24 28 25 21 26 25 24
## [126] 25 22 27 21 20
##   [1] 23 24 22 28 23 30 22 25 26 19 26 19 27 20 28 23 23 24 27 19 24 19 22 19 21
##  [26] 20 22 24 28 26 25 25 22 23 23 23 23 30 26 27 27 23 21 26 24 23 23 23 24 24
##  [51] 26 24 30 27 26 26 20 23 25 22 24 25 25 27 23 22 28 23 28 22 23 19 23 26 24
##  [76] 24 22 23 25 22 25 23 23 26 25 31 26 28 24 24 22 30 22 24 26 19 24 23 23 23
## [101] 23 23 16 24 20 25 25 28 21 24 20 27 24 26 20 23 23 21 25 24 19 28 28 23 22
## [126] 27 27 16 27 23
##   [1] 26 21 20 22 23 24 24 21 26 22 25 25 22 24 25 23 25 24 22 26 20 26 24 20 21
##  [26] 21 22 24 27 24 24 23 25 26 26 21 22 26 24 25 24 24 23 22 18 24 25 24 22 19
##  [51] 20 22 26 27 26 24 23 25 21 28 22 23 24 23 23 25 23 26 27 28 20 24 23 19 26
##  [76] 20 27 22 24 23 21 22 28 20 22 27 25 27 28 26 25 24 22 24 23 28 27 19 21 23
## [101] 25 19 33 30 29 26 24 22 24 23 23 23 27 25 26 18 22 17 20 23 16 22 16 18 20
## [126] 27 26 22 28 26

* Las Medias De Las Muestras

media.m1 <- round(mean(m1), 2)
media.m2 <- round(mean(m2), 2)
media.m3 <- round(mean(m3), 2)
media.m1; media.m2; media.m3
## [1] 23.66
## [1] 23.91
## [1] 23.55

* Las Desviaciones Estándar De Las Muestras

desv.std.m1 <- round(sd(m1), 2)
desv.std.m2 <- round(sd(m2), 2)
desv.std.m3 <- round(sd(m3), 2)
desv.std.m1; desv.std.m2; desv.std.m3
## [1] 2.88
## [1] 2.83
## [1] 2.87

* Los Errores De Muestreo Conforme A Las Medias

error.m1 <- round(media.p - media.m1, 2)
error.m2 <- round(media.p - media.m2, 2)
error.m3 <- round(media.p - media.m3, 2)
error.m1; error.m2; error.m3
## [1] 0.05
## [1] -0.2
## [1] 0.16

* Los Errores De Muestreo Conforme A Las Desviaciones Estándar

error.dsm1 <- round(desv.std.p - desv.std.m1, 4)
error.dsm2 <- round(desv.std.p - desv.std.m2, 4)
error.dsm3 <- round(desv.std.p - desv.std.m3, 4)
error.dsm1; error.dsm2; error.dsm3
## [1] -0.02
## [1] 0.03
## [1] -0.01

* Los Histogramas De La Población

Se visualiza el histograma de la población y de las tres muestras en dos reglones y dos columnas.

* La Conversión De Los Datos De La Población Y De Las Muestras A data.frame

Se transforma data.frame() los valores de la población y de las muestras para facilitar la visualización de datos con ggplot() con variable llamada edades.

poblacion <- data.frame(edades = poblacion)
muestra1 <- data.frame(edades = m1)
muestra2 <- data.frame(edades = m2)
muestra3 <- data.frame(edades = m3)
# Histograma con densidad. Población
gp <- ggplot(poblacion, aes(x = edades)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue", bins = 30) +
  labs(title = "Población",
      subtitle = paste("ME=", media.p, "; ds=", desv.std.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.p, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
gp <- gp + theme(
  plot.title = element_text(color = "black", size = 12, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 1
gm1 <- ggplot(muestra1, aes(x = edades)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green", bins = 30) +
    geom_vline(xintercept = media.m1, col='red') +
  labs(title = "Muestra 1",
      subtitle = paste("me=", media.m1, "; ds.=", desv.std.m1,  "; Err. muestral de media.=",error.m1),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
gm1 <- gm1 + theme(
  plot.title = element_text(color = "black", size = 12, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 2
gm2 <- ggplot(muestra2, aes(x = edades)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "brown", bins = 30) +
    geom_vline(xintercept = media.m2, col='red') +
  labs(title = "Muestra 2",
      subtitle = paste("me=", media.m2, "; ds.=", desv.std.m2,  "; Err. muestral de media.=",error.m2),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
gm2 <- gm2 + theme(
  plot.title = element_text(color = "black", size = 12, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
# Muestra 3
gm3 <- ggplot(muestra3, aes(x = edades)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "orange", bins = 30) +
    geom_vline(xintercept = media.m3, col='red') +
  labs(title = "Muestra 3",
      subtitle = paste("me=", media.m3, "; ds.=", desv.std.m3,  "; Err. muestral de media.=",error.m3),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
gm3 <- gm3 + theme(
  plot.title = element_text(color = "black", size = 12, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(gp, gm1, gm2, gm3, nrow = 2, ncol = 2)

* Análisis Crítico De Los Datos Obtenidos

* Interpretación De La Práctica

Una muestras que es extraída de distribuciones que no so del tipo normal es decir, no pertenecen a una distribución normal (gráfica de gauss), la muestra también no tienen características de ser distribución normal.

Las muestras que son extraídas de distribuciones normales su comportamiento es ser una distribución normal o por lo menos se acerca mucho a ser distribución normal.

El error de muestreo es la diferencia que existe entre los valores de parámetros y estadísticos.

La diferencia que existe entre las medias aritméticas de una población (parámetro) con respecto al valor de la media aritmética (estadísticos) se le conoce como error muestral de la media. En el ejemplo de las edades de los estudiantes, los errores muestrales de las medias aritméticas con respecto a la población fueron: 0.05, 0.16, 0.16.

La diferencia que existe entre las desviaciones estándar de una población (parámetro) con respecto al valor de la desviación estándar (estadísticos) se le conoce como error muestral de la desviación. En el ejemplo de las edades de los estudiantes, los errores muestrales de las desviaciones con respecto a la población fueron: -0.02, 0.03, -0.01.

El error de muestreo es la diferencia entre la estadística muestral y la estadística poblacional. El error de muestreo se produce debido a la variabilidad natural en los datos y al hecho de que no se puede medir toda la población.

El error de muestreo se puede calcular utilizando la fórmula:

Error de muestreo = (Z * σ) / √n

Donde Z es el valor crítico de la distribución normal estándar, σ es la desviación estándar de la población y n es el tamaño de la muestra.

Es importante tener en cuenta que el error de muestreo no es lo mismo que el sesgo de muestreo. El sesgo de muestreo se produce cuando la muestra no es representativa de la población. El sesgo de muestreo puede ser causado por una variedad de factores, como una muestra demasiado pequeña o una selección no aleatoria.

* Referencias Bibliográficas

  • Levine, D. M. (2010) Estadística para administración y economía. (7ª. ed.) México : Pearson Educación.

  • Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13ª. ed.) México: Cengage Learning.

  • Montgomery, D. C. (2011). Probabilidad y estadística aplicadas a la ingeniería. (2ª. ed.) México : Limusa: Wiley.

  • Quezada, L. (2010). Estadística para ingenieros. México : Empresa Editora Macro.