Clase 1.6
Distribución de la proporción de una muestra
Universidad Tecnológica de Bolivar
2024-01-29
En ocasiones NO estamos interesados en conocer la media \(\mu\) de una población, sino, en la proporción de individuos que satisfacen una condición dada en esa población.
\[p=\frac{X}{n}\]
donde \(X\) es el valor del número de individuos que cumplen la condición.
Como ya hemos visto anteriormente, lo usual es trabajar con muestras y no con la población. Por lo tanto, vamos a estudiar cuál es el comportamiento de la distribución de las muestras de proporciones en una población.
La distribución de la proporción de muestras, se genera de igual manera que la distribución muestral de medias; con la diferencia de que al extraer las muestras de la población se calcula el estadístico llamado proporción muestral \(\hat{p}\) (\(p\) gorro).
para cada muestra de la población, encontramos
\[\hat{p} = \frac{X_1+X_2+\dots +X_n}{n}\]
donde
Veamos a continuación dos distribuciones que dan sustento al cálculo de la estimación de la media y varianza de la distribución de proporciones muestrales, que son útiles para la resolución de problemas de probabilidad.
Supongamos una variable, que satisfaga o no una característica, entonces sabemos que esta variable tiene una probabilidad \(p\) de exito (1-p de fracaso). Esta variable tiene un comportamiento o distribución llamada distribución de Bernoulli. Más exactamente, Sea \(X\) una variable aleatoria tal que:
\[ X = \begin{cases} 0, &\text{NO presenta la característica (fracaso)}\\ 1, &\text{SI presenta la característica (éxito)} \end{cases} \] Supongamos que la probabilidad de éxito es \(p\), entoces \[X \rightarrow Bernoulli(p)\] El valor esperado (media) y la varianza de la distribución de Bernoulli son respectivamente:
\[E[X] = p \qquad y \qquad Var[X] = p(1-p)\]
Ahora, si tenemos una variable \(X\) que es igual a la suma de varias variables de tipo Bernoulli; es decir,
\[X = X_1 + X_2 + \dots + X_n\]
Entoces la distribución de la suma es de tipo Binomial(n,p). Es decir,
\[X \rightarrow Bin(n,p)\]
Note que si \(n=1\), entonces
\[Bin(1,p) = Bernoullí(p)\]
El valor esperado (media) y la varianza de la distribución de Binomial son respectivamente:
\[E[X] = np \qquad y \qquad Var[X] = np(1-p)\]
Para estimar el valor real de la proporción \(p\) de la población, seleccionamos una muestra \(X_1,X_2, \dots,X_n\) de tamaño \(n\); de tal forma que:
\[\hat{p} = \frac{X_1+X_2+\dots +X_n}{n} =\frac{Bin(n,p)}{n}\]
Ahora, usando las propiedades de \(E[X]\) y \(Var[X]\), se tiene que la media (valor esperado) y la varianza de la proporción estimada de la muestra son respectivamente
\[E[\hat{p}] = E\left[ \frac{X_1+X_2+\dots +X_n}{n} \right] = \frac{E[X_1+X_2+\dots +X_n]}{n} = \frac{n\hat{p}}{n}= \hat{p}\]
\[Var[\hat{p}] = Var\left[ \frac{X_1+X_2+\dots +X_n}{n} \right] = \frac{Var[X_1+X_2+\dots +X_n] }{n^2} = \frac{n\hat{p}(1-\hat{p})}{n^2} =\frac{\hat{p}(1-\hat{p})}{n}\]
Sea \(X\) una variable aleatoria de una población, con distribución \(Bin(n,p)\) entonces:
Si seleccionamos una muestra de tamaño \(n\), entonces la distribución de la proporción muestral \(\hat{p}\) tiene
Por el Teorema del límite central, si se extraen muestras grandes, aleatorias, y de tamaño \(n\), entonces, se tiene que:
\[Z=\frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1)\] Siempre que se cumpla siguiente condición:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55 e interprete.
Veamos que se cumplen los supuestos para la el problema; es decir,
Finalmente, estandarizando \(\hat{p}\), se tiene que:
Ahora, encontremos la probabilidad \(p(\hat{p}< 0.55)\).
\[ \begin{align*} p(\hat{p}< 0.55)&=p\left( \frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} < \frac{0.55-0.60}{\sqrt{\frac{0.60(1-0.60)}{800}}}\right)\\ &=p(Z< -2.88)=0.0019 \end{align*} \]
Por lo tanto, la probabilidad de extraer una muestra de los 800 estudiantes y que la proporción de estudiantes que fuman cigarrillos en la muestra sea menor al 55% es 0.0019.
Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 130 tenga:
De acuerdo con la Encuesta de la Comunidad Estadounidense de la Oficina del Censo de los Colombia, 87% de los Colombianos de más de 17 años de edad han obtenido un diploma de bachillerato. Supón que vamos a tomar una muestra aleatoria de 200 Colombianos en este grupo de edad y calcular qué proporción de la muestra tiene un diploma de bachillerato. ¿Cuál es la probabilidad de que la proporción de personas en la muestra con diploma de bachillerato sea menor que 85%?
Se sabe que el 40 % de las mujeres embarazadas dan a luz antes de la fecha prevista. En un hospital, han dado a luz 125 mujeres en una semana.
Un estudio realizado por una compañia de seguros de automóviles establece que una de cada cinco personas accidentadas es mujer. Si se contabilizan, por término medio, 169 accidentes cada fin de semana :