Ejercicio 7.1

Para la media y varianza de la variable aleatoria \(Y\) con base en una muestra de tamaño \(3\) tomada de una población conocida, asociada con lanzar al aire un dado balanceado, y donde \(Y\) denota el número de puntos observados en la cara superior en un solo tiro de un dado balanceado, se tiene que,

\[P(Y = i) = 1/ 6, \,\ i = 1, 2, . . . , 6,\] \[\mu = E(Y ) = 3.5,\] \[Var(Y) = 2.9167.\] Se usa la aplicación SampDist_discrete (en https://istats.shinyapps.io/SampDist_discrete/) para completar lo siguiente:

a)

Tomar una muestra de tamaño 3 de la población de tiros de dados.

¿Qué valor se obtuvo para la media de esta muestra?

Se obtiene la muestra \((2,2,3)\), lo que da un valor de la media muestral de \(2.33\)

¿Dónde cae este valor en el histograma?

¿El valor obtenido es igual a uno de los posibles valores asociados con un solo tiro de un dado balanceado?

No

¿Por qué sí o por qué no?

No, porque se obtiene un valor racional (para esta muestra) y el posible valor asociados con un solo tiro del dado dedbe ser un valor entero

b)

Obtener de nuevo otra muestra de tamaño 3 de una población de tiros de dados.

¿Qué valor se obtuvo para la media de esta nueva muestra?

Esta vez se obtiene la muestra \((2, 3, 4)\), dando un valor de la media muestral de \(3\).

El valor obtenido ¿es igual al valor obtenido en el inciso a?

No

¿Por qué sí o por qué no?

No necesariamente, ya que se está realizando un experimento aleatorio, donde cada cara del dado tiene una probabilidad de \(1/6\) de aparecer, por lo que los resultados pueden variar con la realización de cada tirada.

c)

Se muestrea el dado cho veces más para obtener un total de diez valores de la media muestral. Vea el histograma de estas diez medias.

¿Qué se observa?

Y1 <- matrix(sample(1:6,3,replace=TRUE),ncol=3,nrow=8)
Y1 <- matrix(c(c(2,2,3),c(2,3,4),Y1),ncol=3,nrow=10)
Y1media <- apply(Y1, 1, mean)
hist(Y1media)

En este histograma se observa un menor rango para los valores de la variable y una concentración de valores cercano a la media poblacional \(\mu=3.5\).

¿Cuántos valores diferentes para la media muestral se obtuvieron?

Se obtuvo la siguiente cantidad de valores diferentes:

length(unique(Y1media))
## [1] 4

¿Qué valores se observaron más de una vez?

Se observan los siguientes valores más de una vez:

unique(Y1media[duplicated(Y1media)])
## [1] 2.666667 4.000000

d)

Obtener o graficar \(100\) valores realizados para la media muestral, \(Y\).

¿Qué puede observar acerca de la forma del histograma de los 100 valores recabados?

Se puede observar que el histograma exhibe una forma de montículo. La media donded la media muestral está cerca de \(3.5 = \mu\).

Ejercicio 7.3

Se usa la aplicación SampDist_discrete y se toman muestras de tamaño \(n = 12\) de la población correspondiente al lanzar un dado balanceado.

a)

Tome una sola muestra de tamaño \(n = 12\), obteniendo los valores \((1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 6, 6)\), y un valor de la media muestral de \(2.83\). Se generan 9 muestras más con valores y medias muestrales correspondientes: \((1, 1, 1, 2, 2, 3, 3, 3, 5, 6, 6, 6)\), \(3.25\); \((1, 1, 2, 2, 3, 3, 4, 4, 4, 6, 6, 6)\), \(3.5\); \((1, 2, 2, 2, 4, 4, 4, 5, 5, 5, 6, 6)\); \(3.83\); \((1, 2, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6)\), \(4.08\); \((1, 1, 1, 2, 2, 3, 3, 3, 4, 5, 5, 6)\), \(3\); \((1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5)\), \(2.83\); \((1, 1, 1, 1, 2, 3, 3, 3, 4, 4, 4, 6)\), \((2.75)\); \((1, 2, 2, 2, 3, 4, 4, 5, 5, 5, 5, 6)\), \(3.67\); \((1, 1, 1, 1, 2, 3, 3, 3, 5, 5, 5, 5)\), \(2.92\).

¿Cómo se compara el histograma de valores observados de la media muestral con el histograma observado en el Ejercicio \(7.1\)(c) que estuvo basado en diez muestras cada una de tamaño 3?

El histograma tiener una forma similar al del ejercicio \(7.1\), pero este histograma tiene una dispersión menor.

b)

Obtener una gráfica de \(100\) valores (cada uno basado en una muestra de tamaño \(n = 12\)) para la media muestral \(Y\). Observar los valores para la media y la desviación estándar de los \(100\) valores (\(y_1 , y_2 , . . . , y_100\)).

i)

¿Cómo se compara el promedio de estos \(100\) valores de \(y_i \,\ , \,\ i = 1, 2, . . . , 100\) con el promedio de los \(100\) valores (con base en muestras de tamaño \(n = 3\)) que obtuvo en el Ejercicio \(7.1\)(d)?

Para el promedio con base en muestras de tamaño \(n = 12\) se obtiene el valor de \(3.44\) y para el promedio con base en muestras de tamaño \(n = 3\) se obtuvo el valor \(3.5\). Ambos resultados se parecen y están cerca del valor teórico de la distribución poblacional \(\mu = 3.5\).

ii)

Divida la desviación estándar de los \(100\) valores de \(y_i \,\ , \,\ i = 1, 2, . . . , 100\) con base en muestras de tamaño \(12\) que acaba de obtener por la desviación estándar de los \(100\) valores (con base en muestras de tamaño \(n = 3\)) que obtuvo en el Ejercicio \(7.1\). ¿Por qué espera obtener un valor cercano a \(1/ 2\)? [Sugerencia: \(V(\overline{Y}) = \sigma ^2 /n\).]

El cociente de desviaciones estándar es:

0.534/1.02
## [1] 0.5235294

Se observa que para la misma repetición de las muestras las distribuciones son similares lo que va a corde con la ley de los grandes números y notando que se están formando muestras con variables idependientes e idénticamente distribuidas, por lo que la forma en que se toman las muestras no impacta a largo plazo en la tendencia central de la información pero si en su dispersión, pues la desviación estándar se vuelve más pequeña al agrupar en muestras de mayor tamaño (\(\sigma^2/n\)).

Además como el valor teórico de la varianza poblacional de la media es igual a \(V(\overline{Y})= \sigma ^2/n\), conforme \(n\) crezca, el valor de la varianza muestral de la media, \(\overline{V}(\overline{Y})=\sigma^2/(n-1)\) se aproximará al de la población que se desconoce, por lo que al considerar la razón entre la desviación estándar muestral para muestras de tamaño \(n=12\) con la dedsviación estándar muestral para muestras de tamaño \(n=3\) se logra obtener la aproximación al cociente \(\sqrt{3/12} = 1/2\) (se elimina el factor \(\sigma^2\) conforme mejora la aproximación con \(n\) más grande).

c)

La función de densidad continua graficada sobre el histograma es la de una variable aleatoria normal con media y desviación estándar igual a la media y desviación estándar de los \(100\) valores \(y_i \,\ , \,\ i = 1, 2, . . . , 100\) graficados en el histograma. ¿Esta distribución normal parece estar razonablemente aproximada a la distribución descrita por el histograma?

La curva normal se aproxima bastante bien al histograma.