Estadística Inferencial

Clase 1.6
Distribución de la proporción de una muestra

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Distribución muestral de proporciones
    • La proporción \(p\) de una población
    • Distribución muestral de proporciones
    • Distribución de Bernoulli
    • Distribución de Binomial
    • Media y varianza de proporciones muestrales
    • Aproximando la distribución binomial a una distribución normal
    • Ejemplos
    • Ejercicios

La proporción \(p\) de una población

En ocasiones NO estamos interesados en conocer la media \(\mu\) de una población, sino, en la proporción de individuos que satisfacen una condición dada en esa población.

  • Es decir, nos intereza saber el valor del cociente del número de individuos que satisfacen una condición, dividido por el tamaño de la población. Asi:

\[p=\frac{X}{n}\]

donde \(X\) es el valor del número de individuos que cumplen la condición.

Como ya hemos visto anteriormente, lo usual es trabajar con muestras y no con la población. Por lo tanto, vamos a estudiar cuál es el comportamiento de la distribución de las muestras de proporciones en una población.

Distribución muestral de proporciones

La distribución de la proporción de muestras, se genera de igual manera que la distribución muestral de medias; con la diferencia de que al extraer las muestras de la población se calcula el estadístico llamado proporción muestral \(\hat{p}\) (\(p\) gorro).

para cada muestra de la población, encontramos

\[\hat{p} = \frac{X_1+X_2+\dots +X_n}{n}\]

donde

  • \(X_i\): es 1, si es éxito, o 0 si es fracaso.
  • \(n\): el tamaño de la muestra.

Veamos a continuación dos distribuciones que dan sustento al cálculo de la estimación de la media y varianza de la distribución de proporciones muestrales, que son útiles para la resolución de problemas de probabilidad.

Distribución de Bernoulli

Supongamos una variable, que satisfaga o no una característica, entonces sabemos que esta variable tiene una probabilidad \(p\) de exito (1-p de fracaso). Esta variable tiene un comportamiento o distribución llamada distribución de Bernoulli. Más exactamente, Sea \(X\) una variable aleatoria tal que:

\[ X = \begin{cases} 0, &\text{NO presenta la característica (fracaso)}\\ 1, &\text{SI presenta la característica (éxito)} \end{cases} \] Supongamos que la probabilidad de éxito es \(p\), entoces \[X \rightarrow Bernoulli(p)\] El valor esperado (media) y la varianza de la distribución de Bernoulli son respectivamente:

\[E[X] = p \qquad y \qquad Var[X] = p(1-p)\]

Distribución de Binomial

Ahora, si tenemos una variable \(X\) que es igual a la suma de varias variables de tipo Bernoulli; es decir,

\[X = X_1 + X_2 + \dots + X_n\]

Entoces la distribución de la suma es de tipo Binomial(n,p). Es decir,

\[X \rightarrow Bin(n,p)\]

Note que si \(n=1\), entonces

\[Bin(1,p) = Bernoullí(p)\]

El valor esperado (media) y la varianza de la distribución de Binomial son respectivamente:

\[E[X] = np \qquad y \qquad Var[X] = np(1-p)\]

Media y varianza de proporciones muestrales

Para estimar el valor real de la proporción \(p\) de la población, seleccionamos una muestra \(X_1,X_2, \dots,X_n\) de tamaño \(n\); de tal forma que:

\[\hat{p} = \frac{X_1+X_2+\dots +X_n}{n} =\frac{Bin(n,p)}{n}\]

Ahora, usando las propiedades de \(E[X]\) y \(Var[X]\), se tiene que la media (valor esperado) y la varianza de la proporción estimada de la muestra son respectivamente

\[E[\hat{p}] = E\left[ \frac{X_1+X_2+\dots +X_n}{n} \right] = \frac{E[X_1+X_2+\dots +X_n]}{n} = \frac{n\hat{p}}{n}= \hat{p}\]

\[Var[\hat{p}] = Var\left[ \frac{X_1+X_2+\dots +X_n}{n} \right] = \frac{Var[X_1+X_2+\dots +X_n] }{n^2} = \frac{n\hat{p}(1-\hat{p})}{n^2} =\frac{\hat{p}(1-\hat{p})}{n}\]

Aproximando la distribución binomial a una distribución normal

Sea \(X\) una variable aleatoria de una población, con distribución \(Bin(n,p)\) entonces:

  • La media del número de éxitos en la población es: \(\mu_p = np\)
  • Su varianza es: \(\sigma^2_p = np(1-p)\)

Si seleccionamos una muestra de tamaño \(n\), entonces la distribución de la proporción muestral \(\hat{p}\) tiene

  • Media: \(\mu_\hat{p} = n\hat{p}\)
  • Varianza: \(\sigma^2_\hat{p} = \frac{\hat{p}(1-\hat{p})}{n}\)

Por el Teorema del límite central, si se extraen muestras grandes, aleatorias, y de tamaño \(n\), entonces, se tiene que:

\[Z=\frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1)\] Siempre que se cumpla siguiente condición:

  • \(np\geqslant 5\)
  • \(n(1-p) \geqslant 5\)

Ejemplos 1

Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55 e interprete.

Solución

  • \(n=800\)número de estudiantes
  • \(p=0.60\) proporción de fumadores de la población
  • \(\hat{p}= 0.55\) proporción de fumadores en la muestra

Veamos que se cumplen los supuestos para la el problema; es decir,

  • \(np\geqslant 5 \Rightarrow 800(0.60) = 480 > 5\)
  • \(n(1-p) \geqslant 5 \Rightarrow 800(1-0.60) = 320 > 5\)

Finalmente, estandarizando \(\hat{p}\), se tiene que:

Ahora, encontremos la probabilidad \(p(\hat{p}< 0.55)\).

\[ \begin{align*} p(\hat{p}< 0.55)&=p\left( \frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} < \frac{0.55-0.60}{\sqrt{\frac{0.60(1-0.60)}{800}}}\right)\\ &=p(Z< -2.88)=0.0019 \end{align*} \]

Por lo tanto, la probabilidad de extraer una muestra de los 800 estudiantes y que la proporción de estudiantes que fuman cigarrillos en la muestra sea menor al 55% es 0.0019.

Ejemplo 2

Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 130 tenga:

  1. Más del 3% de los componentes defectuosos.
  2. Más del 1% pero menos del 5% de partes defectuosas.

Ejercicios

  1. De acuerdo con la Encuesta de la Comunidad Estadounidense de la Oficina del Censo de los Colombia, 87% de los Colombianos de más de 17 años de edad han obtenido un diploma de bachillerato. Supón que vamos a tomar una muestra aleatoria de 200 Colombianos en este grupo de edad y calcular qué proporción de la muestra tiene un diploma de bachillerato. ¿Cuál es la probabilidad de que la proporción de personas en la muestra con diploma de bachillerato sea menor que 85%?

  2. Se sabe que el 40 % de las mujeres embarazadas dan a luz antes de la fecha prevista. En un hospital, han dado a luz 125 mujeres en una semana.

    1. ¿Cuál es el número esperado de mujeres a las que se les retrasó el parto?
    2. ¿Cuál es la probabilidad de que entre 45 y 60 mujeres se les haya adelantado el parto?
  3. Un estudio realizado por una compañia de seguros de automóviles establece que una de cada cinco personas accidentadas es mujer. Si se contabilizan, por término medio, 169 accidentes cada fin de semana :

    1. ¿Cuál es la probabilidad de que, en un fin de semana, la proporción de mujeres accidentadas supere el 24%?
    2. ¿Cuál es la probabilidad de que, en un fin de semana, la proporción de hombres accidentados supere el 85%?
    3. ¿Cuál es, por término medio, el número esperado de hombres accidentados cada fin de semana?