Los Objetivos De La Práctica

* El Objetivo General De La Práctica

A continuación se presenta el objetivo general de la práctica:

Determinar La Distribución Muestral De La Media.

* Los Objetivos Específicos De La Práctica

A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:

Simular La Población Con Sueldos De Trabajadores De Una Institución Educativa.
Crear Los Datos Relacionados Con La Población
Determinar Los Parámetros Descriptivos.
Crear 100 Y 1000 Muestras Diferentes Con N Elementos Diferentes Relacionados Con La Población
Determinan La Media Aritmética De Cada Muestra.
Determinar La Distribución Muestral De La Media De Las Cien Muestras
Identificar La Distribución Se Acera A Una Distribución Normal Además De Que La Media De La Distribución Muestral Se Acerca A La Media De La Población.
Realizar la Interpretación De La Práctica Correspondiente.
Nota - La Distribución De La Población De La Práctica No Es Normal Es Decir, No Tiene Características De Ser Distribución Normal.

* Investigaciones Pertinentes

* La Probabilidad

La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.

Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.

Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.

* Las Variables Estadísticas

La definición propia de una variables estadísticas es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):

Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores.

Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está medida en centímetros.

También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300 dólares el último año. En este caso, la variable sería el beneficio y estaría medido en dólares. Las variables son del tipo cuantitativo (se expresan con un número)

Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio) expresar en forma de número.

Así, otra variable que podríamos encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa. Es decir, no se expresa con número.

* Los Tipos De Variables Estadísticas

Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de variables:

Variable Cuantitativa: Son variables que se expresan numéricamente.
- Variable Continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que tarda un corredor en completar los 100 metros lisos.
- Variable Discreta: Toman un valor finito de valores entre un intervalo de datos. Número de helados vendidos.
Variable Cualitativa: Son variables que se expresan, por norma general, en palabras.
- Variable Ordinal: Expresa diferentes niveles y orden.
- Variable Nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos puede ser azul, negro, castaño, verde, etc.

* El Muestreo Estadístico

El muestreo es el proceso mediante el cual se selecciona un grupo de observaciones que pertenecen a una población. Esto, con el fin de realizar un estudio estadístico.

En otras palabras, es el procedimiento mediante el cual se toman a ciertos individuos que pertenecen a una población que está siendo sujeto de un análisis.

Desde un punto de vista aplicado, se denomina muestreo el proceso de selección de la muestra o muestras a utilizar para la investigación. Esto supone generar una o pocas muestras. Actualmente es de interés la selección de muestras para la simulación informática de los procesos de muestreo, particularmente para la obtención de distribuciones muestrales. En estos casos el número de muestras generadas puede ser muy grande (10.000, 80.000, o más) y el procedimiento de muestreo se realiza informáticamente y con procedimientos específicos.

Desde un punto de vista teórico, el concepto de muestreo es fundamental para la Inferencia Estadística. El hecho de que las muestras no sean exactamente representativas de las poblaciones significa que las inferencias presentan cierto margen de incertidumbre. Para cuantificarlo y definir técnicas inferenciales es necesario conocer cómo se comportan los estadísticos obtenidos en las muestras, esto es, cómo son las distribuciones muestrales de los estadísticos habitualmente utilizados para la inferencia.

Las muestras singulares generadas para investigación con sujetos suelen utilizarse para obtener algunos estadísticos (Media, proporción, cuasivarianza, etc.) con los que se realiza el proceso de inferencia. En cambio, las muestras simuladas por ordenador suelen ser utilizadas para obtener distribuciones muestrales y realizar inferencia.

Esto es de interés cuando se dan circunstancias especiales que no aconsejan utilizar los procedimientos habituales.

Las distribuciones muestrales son las distribuciones de estadísticos de muestras que pertenecen a la misma población. Por ejemplo, la distribución muestral de la Media es la distribución de las Medias de muestras de un mismo tamaño extraídas de la misma población.

* Desarrollo Metodológico De La Práctica

En los siguientes ejercicios también se utilizan funciones de paquetes predeterminados de lenguaje de R para una mejor comprensión de la distribución binomial.

* Actividad No. 1 - Importar E Implementar Las Librerías

# Importación De Los Paquetes Y Librerías Necesarias Para La Realización De La Práctica 
library(cowplot)
library(ggplot2)
library(knitr)

# Acomodo Del Tipo De Notación Para El Muestro De Los Valores Obtenidos 
options(scipen=999) # Notación normal
# options(scipen=1) # Notación científica

* Actividad No. 2 - Implementación De La Semilla Aleatoria

# Implementación De La Semilla Aleatoria 
set.seed(2023)

* Actividad No. 3 - El Ejercicio Del Sueldo De Trabajadores De Una Institución Educativa

* Los Datos Pertinentes Para La Realización De La Práctica

Se simula una población de trabajadores por medio de la creación de un vector con valores que contienen sueldos mensuales en pesos mexicanos de una población de $N=650$ trabajadores que laboran en una Institución educativa. El rango del sueldo de manera simulada está entre $5000 y $35000 pesos ($) mensuales.

# Inicializando Las Variables Para El Caso 
N <- 650 # Cantidad de datos de población
rango <- 5000:35000 # Rango de sueldos
n = 100  # Cantidad de datos de cada muestra
q1 = 100  # Cantidad de muestras m1, m2, m3
q2 = 1000  # Cantidad de muestras m1, m2, m3
q3 <- 10000

* La Creación De La Población

\[ poblacion = \text{ {x | x es un trabajador de una Institución educativa; }} \therefore \\ x_1, x_2, x_3, ... ,x_{N=6500} \]

poblacion <- data.frame(x = 1:N, sueldo=sample(x = rango, size =  N, replace = TRUE))

* Las Primeras 30 Observaciónes De La Población

head(poblacion$sueldo, 30)

##  [1] 26967 15670 30960  6991 12922 32929 12723 22249 28744 14756 16824 27396
## [13] 14348 27599 30534 25961 18698 13398 33716 27275 33383 18956 13575 21151
## [25] 12304 22910 11456 21877 15721 19703

* Las Últimas 30 Observaciónes De La Población

tail(poblacion$sueldo, 30)

##  [1] 33095  9643 13798  9809 19307 29817  5976 16975 17985  8105 31701 13311
## [13] 23904 28564 25336 24250 30863 29629 34692 18319 21720 12379 32139 34938
## [25] 20862 14527  5825 22779 18248  9288

* Los Parámetros Poblacionesles

summary(poblacion$sueldo)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5001   12924   19974   20035   27295   34987

media.p <- round(mean(poblacion$sueldo),2)
desv.p <- round(sd(poblacion$sueldo),2)
media.p; desv.p

## [1] 20034.84

## [1] 8476.9

Se tiene una media aritmética poblacional de 20034.84 con una desviación estándar de 8476.9.

\[ \mu = \frac{\sum{sueldo_x}}{N} = 19761.25 \]

* Determinando La Muestra

Se determina una primera muestra de 100 trabajadores sin reemplazo que significa que no se puede repetir el trabajador el valor de $x$.

\[ muestra = \text{ {x | x es un trabajador de la población; }} \therefore \\ x_1, x_2, x_3, ... ,x_{n=100} \]

La variables xs como parte de la muestra puede ser cualquier trabajador de la población que representa a la población.

xs <- sample(x = 1:N, size =  n, replace = FALSE)
muestra <- poblacion[xs,]

* Los Estadísticos Muestrales

summary(muestra$sueldo)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5118   12872   20911   20139   27042   34155

media.m <- round(mean(muestra$sueldo),2)
desv.m <- round(sd(muestra$sueldo),2)
media.m; desv.m

## [1] 20138.73

## [1] 8473.99

Se tiene una media aritmética de la primera muestra de 20138.73 con una desviación estándar de 8476.9. \[ \bar{x_1} = \frac{\sum{sueldo_x}}{n} = 20140.97 \]

* El Error Muestral

El error muestral es porque los estadísticos no son valores numéricos igual que los parámetros de la población, siempre existirá una diferencia.

paste("Media aritméica poblacional", media.p, ";", "media muestral", media.m)

## [1] "Media aritméica poblacional 20034.84 ; media muestral 20138.73"

paste("Desviación estándar poblacional", desv.p, ";","desviación muestral", desv.m)

## [1] "Desviación estándar poblacional 8476.9 ; desviación muestral 8473.99"

Se determina el error muestral del estadístico media de la muestra con respecto al parámetro de la media poblacional

dif.media <- media.p - media.m
paste("El error muestral con respecto a la media aritmética es de: ", round(dif.media, 2))

## [1] "El error muestral con respecto a la media aritmética es de:  -103.89"

\[ \text{Error muestral =} (\mu - \bar{x}) = (19761.25 - 20140.97) =-379.72 \] ### * El Histograma De La Población Y De La Muestra

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p, "; ds=", desv.p,  "; Err muestral media=",dif.media),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(muestra, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.m, col='red') +
  labs(title = "Muestra",
      subtitle = paste("me=", media.m, "; ds.=", desv.m),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que no es una distribuciones normal, ni los datos de población ni los datos de la muestra se comportan como distribución normal.

* La Distribución Muestral De La Media De 100 Muestras.

Se determinan cien (100) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media [@lind2015].

muestras = as.list(NULL)
m.muestras = NULL
for (i in 1:q1) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q1, replace = FALSE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

* La Distribución De 100 Muestras

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

La función t() transforma registros a columnas de un data.frame.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q1)
rownames(sueldos) <- paste0("M",1:q1)
tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q1-2):q1], medias.muestrales = m.muestras)
kable(tabla, caption = "Tabla de medias aritméticas de cien muestras de cien sueldos cada una")

Tabla de medias aritméticas de cien muestras de cien sueldos cada una
	sueldo1	sueldo2	sueldo3	…	sueldo98	sueldo99	sueldo100	medias.muestrales
M1	31701	10124	8756	…	5439	24213	29869	21856.73
M2	17529	16035	5558	…	17713	31596	26047	20947.57
M3	32139	34876	21170	…	6700	9420	27509	19447.93
M4	16954	21937	24213	…	22426	8683	17320	19939.66
M5	19665	30605	21395	…	27407	28884	5976	19295.74
M6	32206	6116	18140	…	11145	33514	7849	19674.33
M7	30667	21576	13311	…	32643	10663	5160	19384.36
M8	34379	9267	23219	…	34722	8319	21395	19514.08
M9	18657	34126	13390	…	30605	22257	34302	19271.24
M10	25961	26654	33752	…	18676	10209	18698	19559.08
M11	12526	21576	34987	…	24314	20577	15865	20284.64
M12	25457	11517	18698	…	21772	11366	7786	20630.76
M13	24088	16975	6042	…	10663	22044	26455	20731.32
M14	24720	13566	24811	…	26948	21528	29000	22096.79
M15	28269	34649	25000	…	20416	21159	20862	19149.24
M16	20408	8382	9758	…	12981	24314	33166	21569.73
M17	17890	28564	22044	…	21736	18984	19307	20856.76
M18	25801	25163	27407	…	21159	22946	5425	20843.57
M19	11442	8383	27971	…	30196	5324	26776	19734.39
M20	9467	15742	15836	…	6788	33166	18749	19436.67
M21	8105	13432	27938	…	5397	5432	15321	20119.08
M22	31157	21083	30597	…	15393	19307	11100	20249.72
M23	18522	18994	34692	…	24755	24720	28884	21681.55
M24	28519	9397	5144	…	14773	25647	16854	19553.19
M25	27181	26503	34338	…	11366	27276	27061	19454.10
M26	21564	12439	23219	…	33796	33068	18908	20740.01
M27	30534	26129	12402	…	17217	16621	12379	20952.14
M28	12786	13607	5976	…	8383	15824	14360	18651.93
M29	7891	12646	25315	…	6504	32925	7281	19418.78
M30	12634	20566	5118	…	33514	27673	16429	21188.57
M31	32206	7282	12880	…	22511	26442	7866	20119.42
M32	7281	6051	24250	…	18994	5825	20827	19425.78
M33	13897	28193	21055	…	28269	29023	18365	20695.77
M34	30605	18984	15824	…	30734	28864	14552	19814.13
M35	5427	8181	17179	…	29236	21159	7027	21139.97
M36	13877	7891	29780	…	5182	26584	34492	19199.15
M37	24605	30315	13565	…	27599	15824	18248	21287.31
M38	20970	16954	30960	…	5440	27275	30667	21219.95
M39	11437	8429	30013	…	15721	27275	14410	20906.84
M40	13575	32073	34302	…	32760	33383	30935	20851.04
M41	23784	6700	21150	…	16235	28900	12174	21000.09
M42	8490	32678	19952	…	32464	33590	17961	20713.27
M43	21063	18751	33074	…	21050	24442	7995	19874.86
M44	23047	13798	16059	…	9342	13753	22910	20841.75
M45	5853	23981	16006	…	27243	23890	18875	19465.03
M46	26967	21951	16106	…	26979	18994	17227	20029.76
M47	7170	29177	28862	…	19082	29817	17713	21057.55
M48	21794	9679	13061	…	20827	30161	17320	21051.55
M49	21576	19952	12279	…	11385	26170	28744	19386.37
M50	32685	5425	17959	…	28744	20598	34834	18898.56
M51	14827	9849	6382	…	19596	17890	19082	20173.81
M52	24650	17737	28862	…	32760	9205	7866	18981.28
M53	24418	32643	8490	…	14269	32685	13676	19869.85
M54	21736	6382	20601	…	11776	13676	20759	18551.43
M55	11353	29506	25336	…	28915	14608	25799	22120.97
M56	18199	6466	18961	…	25648	8697	27864	20966.89
M57	28864	18522	11456	…	29287	7281	26975	20651.13
M58	14527	5976	16954	…	23773	9562	33068	18882.72
M59	26967	19414	9922	…	11181	11686	9562	19843.60
M60	14827	30852	11076	…	28884	9420	18657	20075.68
M61	25799	9910	23180	…	27649	30222	21543	20631.01
M62	16671	6590	21937	…	17227	18140	21395	21349.62
M63	13398	8683	30460	…	6007	8951	14608	18815.45
M64	7216	29023	31427	…	27193	19182	9420	20571.99
M65	16263	26948	14827	…	31377	21902	19822	19514.19
M66	16975	12250	23079	…	10399	18319	10345	18766.13
M67	31154	28061	5374	…	13566	13575	33074	19029.12
M68	21794	34065	30013	…	17008	27386	12575	19237.53
M69	13877	7160	8382	…	28061	19307	28564	18931.03
M70	26129	20768	5976	…	12304	19703	32073	20990.97
M71	23890	22511	10209	…	30838	11686	16621	19939.86
M72	21528	30161	25896	…	28864	5160	5118	19730.97
M73	15836	15742	30960	…	18698	28564	34785	21698.05
M74	22779	25245	29817	…	10663	13520	33896	19782.84
M75	12527	30222	5685	…	18365	8683	26292	20013.82
M76	7995	14919	18080	…	13621	16235	30667	20584.78
M77	14364	8181	19497	…	26129	28459	16975	19340.77
M78	24418	20827	14552	…	21772	15083	30476	20273.64
M79	9213	15721	13565	…	7995	17903	16235	20059.47
M80	24605	26455	20759	…	5324	5440	21931	19160.74
M81	23079	19596	16106	…	11695	28915	16621	19992.73
M82	23904	22910	31821	…	29000	11645	13061	20152.42
M83	19665	29236	17414	…	32307	8122	34987	19959.85
M84	21564	24650	20570	…	8498	13062	34783	20419.48
M85	6337	22959	15028	…	23487	19822	20598	20490.66
M86	19997	22959	16671	…	26141	28783	34338	20579.48
M87	5144	23487	8211	…	7282	12786	7160	18319.56
M88	27649	27864	18984	…	28459	23006	30355	19479.23
M89	7063	20458	13676	…	34876	17961	15089	19962.92
M90	22946	20213	5853	…	21172	28611	5425	19230.85
M91	31474	16710	12206	…	8429	12594	25336	19222.91
M92	30582	10334	19497	…	23981	31474	13002	19445.31
M93	31615	28271	6382	…	8756	20768	24213	21309.24
M94	19492	26143	14269	…	28528	12926	24901	19770.85
M95	5182	32760	26166	…	13796	8756	26503	18430.45
M96	21050	18012	23391	…	11021	31377	7282	20979.69
M97	21736	22044	22910	…	20827	26129	7063	19655.27
M98	5425	33037	25315	…	18751	11052	27243	20748.27
M99	32925	32685	30439	…	24213	15089	26073	20231.66
M100	26143	16035	6784	…	5118	26279	11807	20319.94

* La Media De Las 100 Muestras

media.todas.muestras <- round(mean(tabla$medias.muestrales),4)
paste("La media de todas las muestras es de: ", media.todas.muestras)

## [1] "La media de todas las muestras es de:  20104.5192"

* El Histograma De Todas Las Medias Muestrales (100)

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME = ", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media CIEN",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa la diferencia de forma de las distribuciones poblacional y muestral de medias.

También existe una diferencia en el rango de las medias de la población con respecto a la media de todas las muestras. El rango del sueldo de la población es 5001, 34987, mientras que las medias muestrales de la población con respecto al sueldo varían de 18319.56, 22120.97.

En cuanto a la diferencias de las desviaciones estándar de la población y de las muestras:

sd(poblacion$sueldo)

## [1] 8476.901

sd(tabla$medias.muestrales)

## [1] 863.5907

Se reduce su rango o lo que es lo mismo la desviación disminuye de 8476.9008223 en la población a 863.5906738 en las medias muestrales.

* La Distribución Muestral De La Media 1000 muestras.

¿Que pasará con mil muestras?

Se repite el proceso, ahora en lugar de ser cien ahora serán mil muestras.

Se determinan mil (1000) muestras de 100 elementos cada una, luego se organizan las medias de todas las muestras en una distribución de probabilidad, el resultado recibe el nombre de distribución muestral de la media [@lind2015].

muestras = as.list(NULL)
m.muestras = NULL
for (i in 1:q2) {
    muestras[[i]] <- sample(x = poblacion$sueldo, size = q2, replace = TRUE)
    
  m.muestras[i] <- mean(muestras[[i]])
}

* La Distribución De 1000 Muestras

Se construye una tabla de distribución de todos los sueldos de cada muestra, solo se muestran los tres primeros y los últimos tres en la columna final se observa la media de cada muestra.

Como son mil muestras solo se muestran las primeras cincuenta y las últimas cincuenta.

sueldos <- data.frame(muestras)
sueldos <- t(sueldos)
colnames(sueldos) <- paste0("sueldo",1:q2)
rownames(sueldos) <- paste0("M",1:q2)
tabla <- data.frame(sueldos[,1:3], "..."="...", sueldos[,(q2-2):q2], medias.muestrales = m.muestras)

* Mostrando Las Primeras 50 Muestras

kable(head(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))

Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
	sueldo1	sueldo2	sueldo3	…	sueldo998	sueldo999	sueldo1000	medias.muestrales
M1	12174	27844	16621	…	22257	34783	29281	19515.61
M2	8383	11852	11076	…	17008	33957	7117	20177.87
M3	26663	9849	8683	…	31483	19839	26166	20155.38
M4	26271	11908	10209	…	29299	9267	15663	20033.58
M5	30597	34649	12805	…	15321	6817	11686	19846.49
M6	26143	16975	17655	…	8498	11686	5397	19823.41
M7	19812	15663	30852	…	29647	13790	25315	20130.99
M8	33383	22349	30582	…	16138	13104	14410	20073.87
M9	21170	12926	30597	…	14756	5160	24755	19726.33
M10	29281	33716	20627	…	26967	26170	11100	20155.79
M11	8122	18856	24720	…	23358	12338	25457	20495.24
M12	12740	24605	5425	…	6382	31765	20601	19690.12
M13	15670	17195	8429	…	31615	18012	16854	20181.07
M14	5685	27181	24720	…	6504	21063	18994	19754.19
M15	23981	26502	18416	…	29478	7242	20762	19995.83
M16	27971	27938	30960	…	33072	32763	7891	20642.15
M17	5558	18961	12646	…	34619	31953	9809	19994.30
M18	12526	12279	24755	…	5425	5825	12646	19923.13
M19	13565	8122	28193	…	25457	18961	9292	19571.81
M20	25961	11686	17961	…	6042	11852	16824	19627.27
M21	28884	17737	14364	…	16006	27844	33166	19998.86
M22	26648	12926	17903	…	6337	26776	21151	20113.90
M23	5160	23196	24630	…	26414	16429	9679	20203.99
M24	26442	28900	7995	…	9594	14021	33166	19818.92
M25	14348	21736	24862	…	15873	21172	27649	20426.04
M26	29869	28611	20701	…	12174	25538	30007	20642.21
M27	8683	15434	29287	…	18926	17737	32353	19558.95
M28	11100	21845	8382	…	23487	19497	28900	20138.98
M29	17737	21083	11582	…	16860	8490	28165	20353.78
M30	22044	29881	17903	…	32464	28783	28109	19953.78
M31	28269	27599	33796	…	23883	22959	34492	20323.56
M32	25245	7027	24901	…	34785	32145	14269	19973.76
M33	13398	17655	11181	…	12646	21931	12926	20005.32
M34	12067	18698	13798	…	29023	21576	18994	20234.03
M35	5160	17753	15756	…	15028	33948	15068	19713.65
M36	6700	5490	26654	…	26948	13796	13390	20187.15
M37	11908	30734	13790	…	25336	32472	31427	20632.25
M38	25336	9540	6590	…	12805	20701	15985	20152.21
M39	33590	34783	28106	…	20210	13520	29348	19982.47
M40	23006	17217	18199	…	12575	7160	27673	19936.30
M41	26073	7786	11807	…	27275	19713	7866	20151.11
M42	13621	12295	14042	…	15083	26210	30863	20360.72
M43	11776	15836	28776	…	5825	23196	5825	20321.89
M44	33948	15028	30605	…	17809	12330	13566	20311.92
M45	28564	25245	25569	…	7702	30182	30460	19955.21
M46	26170	22349	29287	…	28528	12922	14042	20039.63
M47	8319	20566	32353	…	20762	30088	21576	19896.93
M48	28611	30355	34302	…	33072	21395	19523	19911.67
M49	6337	23006	32763	…	18365	19497	20601	20289.28
M50	25801	11776	33840	…	9679	9922	15635	20229.48

* Mostrando Las Últimas 50 Muestras

kable(tail(tabla,50), caption = paste("Tabla de medias aritméticas de ",q2," muestras de cien sueldos cada una"))

Tabla de medias aritméticas de 1000 muestras de cien sueldos cada una
	sueldo1	sueldo2	sueldo3	…	sueldo998	sueldo999	sueldo1000	medias.muestrales
M951	26787	21937	8383	…	28915	23981	30222	20329.14
M952	23981	25245	18657	…	13574	23773	18012	19878.64
M953	26053	26948	7063	…	32472	30222	33284	20225.12
M954	15670	15824	21379	…	16860	28611	20570	20246.33
M955	13798	30247	9397	…	33514	25000	32295	19861.44
M956	12250	27599	20566	…	5324	34338	8382	19813.92
M957	8951	13676	34692	…	18416	31662	17462	20075.95
M958	17163	15670	16860	…	25538	12926	17163	20078.88
M959	24250	33334	7216	…	33796	20213	13565	19963.93
M960	24862	5384	11052	…	20566	9467	19839	20255.36
M961	18549	8848	16106	…	9934	15434	22974	20189.63
M962	21063	18319	11366	…	11961	5384	27275	19915.74
M963	9594	26654	5118	…	9288	9824	32206	20138.32
M964	6382	27061	19596	…	25538	31157	33383	19648.24
M965	13432	23079	27844	…	7063	27243	26143	19844.14
M966	29961	9304	18926	…	27938	9267	28098	20178.76
M967	34834	26502	12279	…	14410	10399	6382	20366.79
M968	6590	26166	33957	…	28165	24901	13676	19770.62
M969	22983	11456	16138	…	20271	17529	10062	20090.76
M970	13908	23180	14907	…	33334	9267	17903	20423.88
M971	5246	29000	7242	…	7866	22044	8105	20172.15
M972	20416	14773	28564	…	5649	7299	5160	20143.62
M973	30460	20458	26166	…	30734	17163	26141	19199.19
M974	25315	27035	14773	…	25961	12206	30534	20176.30
M975	13566	24314	27276	…	23006	32073	30315	19605.89
M976	9679	28459	30088	…	14784	16710	23436	19929.27
M977	7891	11181	7299	…	24442	21902	5118	20197.76
M978	8756	33840	23981	…	23487	29478	18080	20214.52
M979	28564	6274	22257	…	26210	24650	32763	20589.25
M980	17195	21150	19596	…	31821	26292	12740	19831.86
M981	21444	12206	31157	…	12880	13385	28057	20161.15
M982	21564	6590	11385	…	9913	33072	5432	19418.90
M983	7281	25648	7252	…	7242	14784	16138	20149.22
M984	13062	14756	16006	…	15089	24418	24160	20490.93
M985	27306	31427	32073	…	24720	8756	17985	20011.84
M986	13873	15434	26210	…	12174	9420	23773	20094.98
M987	30667	23219	13798	…	23487	11021	11807	19866.59
M988	20701	27407	5182	…	21063	15880	16138	20253.50
M989	28528	16362	23358	…	34811	20210	9910	20021.10
M990	11874	6274	8211	…	32760	5853	13104	19877.39
M991	17163	17163	30161	…	30667	7282	26170	20140.48
M992	9910	9342	20418	…	21730	18257	22946	19707.51
M993	18080	11776	9397	…	13104	6700	33284	20007.10
M994	23180	21150	18199	…	16710	6590	20912	20182.79
M995	7160	11442	18199	…	32307	32760	16621	19976.06
M996	15028	22779	18237	…	9267	14784	20213	19852.19
M997	16458	12304	13398	…	15434	13385	7216	19702.90
M998	24862	11486	11145	…	9758	34783	14919	19729.23
M999	5649	32464	19997	…	5825	9342	28178	20198.66
M1000	10334	16954	9420	…	18013	20762	28269	20129.70

* La Media De Todas Las 1000 Muestras

media.todas.muestras <- round(mean(tabla$medias.muestrales),2)
paste("La media de todas las ", q2, " muestras "," es de: ", media.todas.muestras)

## [1] "La media de todas las  1000  muestras   es de:  20040.07"

* El Histograma De Las Medias Muestrales (1000)

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media MIL",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=6),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

Se observa que la media de todas las muestras se acerca a la media de la población así mismo, la distribución muestral de la media es una distribución que se parece a distribución normal con gráfica de gauss o campana.

Entre mas muestras haya, la dispersión de los datos disminuye y entre más muestras se determinen, el valor de la media de todas las muestras se acerca al valor de la media poblacional.

* Análisis Crítico De Los Datos Obtenidos

* Interpretación De La Práctica

La distribución muestral de la media es una distribución de probabilidad que describe la variabilidad de las medias muestrales. La distribución muestral de la media se utiliza para estimar la media poblacional a partir de una muestra aleatoria.

La distribución muestral de la media se puede calcular utilizando la fórmula:

Media muestral = μ

Donde μ es la media poblacional y n es el tamaño de la muestra.

La distribución muestral de la media se puede utilizar para calcular el error estándar de la media. El error estándar de la media es una medida de la variabilidad de las medias muestrales y se puede calcular utilizando la fórmula:

Error estándar de la media = σ / √n

Donde σ es la desviación estándar de la población y n es el tamaño de la muestra.

La distribución muestral de la media se puede utilizar para construir intervalos de confianza para la media poblacional. Un intervalo de confianza es un rango de valores que contiene el verdadero valor del parámetro con un cierto nivel de confianza.

* El Ejercicio De Práctica

¿Cuál es el valor de la media muestral de 10000 mil muestras de 100 datos cada una?: 19761.13

¿Cuál es el error muestral de la media de todas las muestras con respeto a la media aritmética de población. -0.12

¿Cómo se observa la gráfica de campana?

Histograma de medias muestrales de la muestra con DIEZ MIL observaciones

# Histograma con densidad
g1 <- ggplot(poblacion, aes(x = sueldo)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "blue") +
  labs(title = "Población",
      subtitle = paste("ME=", media.p),
              caption = "Fuente propia") +  
  
  geom_vline(xintercept = media.m, col='red') +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g1 <- g1 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=7),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
g2 <- ggplot(tabla, aes(x = medias.muestrales)) + 
  geom_histogram(aes(y = ..density..),
                 colour = 1, fill = "green") +
    geom_vline(xintercept = media.todas.muestras, col='red') +
  labs(title = "Distribución muestral de la media DIEZ MIL",
      subtitle = paste("Media =", media.todas.muestras),
              caption = "Fuente propia") +
  geom_density(lwd = 1.2,
               linetype = 2,
               colour = 2)
g2 <- g2 + theme(
  plot.title = element_text(color = "black", size = 10, face = "bold"),
  plot.subtitle = element_text(color = "black",size=6),
  plot.caption = element_text(color = "black", face = "italic", size=6)
)
plot_grid(g1, g2, nrow = 1, ncol = 2)

* Referencias Bibliográficas

Levine, D. M. (2010) Estadística para administración y economía. (7ª. ed.) México : Pearson Educación.
Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13ª. ed.) México: Cengage Learning.
Montgomery, D. C. (2011). Probabilidad y estadística aplicadas a la ingeniería. (2ª. ed.) México : Limusa: Wiley.
Quezada, L. (2010). Estadística para ingenieros. México : Empresa Editora Macro.

U6C29 - La Distribución Muestral De la Media

Cristopher Joshua Reyes Gutiérrez

2023-06-07