hllinas2023

1 Distribución hipergeométrica

1.0.1 Experimento hipergeométrico

En general, un experimento hipergeométrico con parámetros \(n\), \(M\) y \(N\) está basado en las siguientes suposiciones (véase la figura 3.3, abajo):

  1. La población o conjunto donde deba hacerse el muestreo es una población finita con \(N\) elementos.

  2. Cada elemento de la población puede ser caracterizado como un éxito o un fracaso.

  3. Hay \(M\) éxitos en la población.

  4. Se elige una muestra sin reemplazo de \(n\) individuos, de tal forma que sea igualmente probable seleccionar cada subconjunto de tamaño \(n\).

1.0.2 Función de probabilidad

Sea \(X\) el número de éxitos obtenidos en una muestra escogida al azar al realizar un experimento hipergeométrico con parámetros \(n\), \(M\) y \(N\). Entonces, la probabilidad de elegir de manera exacta \(k\) éxitos en \(n\) intentos está dada por la función de probabilidad \(f\):

\[ f(k) \;=\; P(X=k)\;= \; \frac{{M\choose k}\,{N-M\choose n-k}}{{N\choose n}}, \qquad \text{donde}\quad k=0,1,2, \ldots, n \quad \text{y}\quad n\leq N \]

La correspondiente distribución de \(X\) se conoce con el nombre de distribución hipergeométrica con parámetros \(n\), \(M\) y \(N\).

El código para escribir la expresión anterior es:

$$ f(k) \;=\; P(X=k)\;= \;  \frac{{M\choose k}\,{N-M\choose n-k}}{{N\choose n}}, \qquad  \text{donde}\quad k=0,1,2, \ldots, n \quad \text{y}\quad n\leq N $$

1.0.3 Gráfica de la función de probabilidad

En las gráficas de abajo se muestran diferentes representaciones gráficas de la función de probabilidad hipergeométrica con diferentes \(n=3, 5, 10, 15, 30, 100\) y los mismos valores de \(N=200\) y \(M=60\).

1.0.4 Función de de distribución acumulada

Si \(f\) es la función de probabilidad hipergeométrica, entonces la función de distribución acumulada hipergeométrica \(F\) se calcula así:

\[F(t)\; =\; P(X\leq t) \;= \; \sum\limits_{x; \, x\leq t} f(x), \quad \text{para todo $t$ real}\]

En las gráficas de abajo se muestran diferentes representaciones gráficas de \(F\) con diferentes \(n=3, 5, 10, 15, 30, 100\) y los mismos valores de \(N=200\) y \(M=60\).

1.0.5 Esperanza y varianza

Si \(p=\frac{M}{N}\) es la proporción de éxitos en la población, entonces: \[ E(X)\;=\; np \qquad \text{y}\qquad V(X)\;= \; n p(1-p)\cdot \left(\frac{N-n}{N-1}\right)\]

El código para escribir la expresión anterior es:
$$ E(X)\;=\; np \qquad \text{y}\qquad V(X)\;= \; n p(1-p)\cdot \left(\frac{N-n}{N-1}\right)$$

2 Aproximación de la hipergeométrica a la binomial

Las distribuciones binomial e hipergeométrica coinciden cuando \(\frac{n}{N}\leq 0.05\). En este caso, el factor \(\frac{N-n}{N-1}\) se aproxima a 1 y la razón \(p= M/N\) es la proporción de los éxitos de la población. En resumen, tendríamos:

\[p\; = \; \frac{M}{N}, \qquad E(X)\;=\; np \qquad \text{y}\qquad V(X)\;= \; n p (1-p)\]

El código para escribir la expresión anterior es:
$$p\; = \, \frac{M}{N}, \qquad  E(X)\;=\; np \qquad \text{y}\qquad V(X)\;= \;  n p (1-p)$$

De manera gráfica, esta aproximación se puede visualizar así:

3 Ejemplo 1: Enunciado

Una cantidad de 75 componentes eléctricas están sujetas a control de calidad. Se encontró que 15 de las componentes estaban defectuosas y las restantes no lo estaban. Se escoge una muestra aleatoria de 5 componentes de este lote y sea \(X\) el número de componentes defectuosos escogidos en la muestra. Resuelva los siguientes incisos, siempre escribiendo los resultados hallados en términos de \(X\):

a) La probabilidad de que el número de componentes defectuosos sea igual a 3. 
b) La probabilidad de que el número de componentes defectuosos sea igual a 2.
c) La probabilidad de que el número de componentes defectuosos sea menor o igual que 3.
d) La probabilidad de que el número de componentes defectuosos sea menor o igual que 2.
e) La probabilidad de que el número de componentes defectuosos sea mayor que 3 (usando f).
f) La probabilidad de que el número de componentes defectuosos sea mayor que 3 (usando F).
g) La probabilidad de que el número de componentes defectuosos se encuentre entre 1 y 4 (ambos inclusive).
h) La probabilidad de que el número de componentes defectuosos se encuentre entre 1 y 4 (ambos no inclusive).
i) La esperanza de X, es decir, la esperanza del número de componentes defectuosos.
j) La varianza de X, es decir, la varianza del número de componentes defectuosos.
k) La desviación de X, es decir, la desviación del número de componentes defectuosos.
l) Verifique si este ejercicio se puede resolver también con la binomial. En caso afirmativo (o negativo), utilice la distribución binomial para calcular las dos  probabilidades que se piden en los incisos (m) y (n). Compare estos resultados con los hallados en los incisos (a) y (d), respectivamente.
m) La probabilidad de que el número de componentes defectuosos sea igual a 3.
n) La probabilidad de que el número de componentes defectuosos sea menor o igual que 3. 

4 Ejemplo 1: Solución

La variable \(X\) tiene distribución hipergeométrica con parámetros \(N=75\), \(M=15\) y \(n=5\).

4.0.1 Solución parte (a)

Utilizando la fórmula hipergeométrica, la probabilidad de que el número de componentes defectuosos sea igual a 3 se calcula así:

\[P(X= 3) \;= \; \frac{{15\choose 3}\,{60\choose 2}}{{75\choose 5}} = 0.0467\]

El código para escribir la expresión anterior es:
$$P(X= 3) \;= \;  \frac{{15\choose 3}\,{60\choose 2}}{{75\choose 5}} =  0.0467$$

Es decir, la probabilidad de que el número de componentes defectuosos sea igual a 3 es 0.0467.

4.0.2 Solución parte (b)

Con la función “dhyper”, la probabilidad se calcula así:

Es decir, la probabilidad de que el número de componentes defectuosos sea igual a 2 es 0.2082.

4.0.3 Solución parte (c)

Utilizando la fórmula hipergeométrica, la probabilidad de que el número de componentes defectuosos sea menor o igual que 3 se calcula así: \[\begin{eqnarray*} P(X\leq 2) &=& P(X=0) \; +\; P(X=1) \; +\; P(X=2) \; +\; P(X=3)\\ &=& \frac{{15\choose 0}\,{60\choose 3}}{{75\choose 3}} \; +\; \frac{{15\choose 1}\,{60\choose 2}}{{75\choose 3}} \; +\; \frac{{15\choose 2}\,{60\choose 1}}{{75\choose 3}} \; +\; \frac{{15\choose 3}\,{60\choose 2}}{{75\choose 5}}\\ &=& 0.9951 \end{eqnarray*}\]

El código para escribir la expresión anterior es:

\begin{eqnarray*}
  P(X\leq 2) &=& P(X=0) \; +\; P(X=1) \; +\; P(X=2) \; +\; P(X=3)\\
  &=& \frac{{15\choose 0}\,{60\choose 3}}{{75\choose 3}} \; +\; \frac{{15\choose 1}\,{60\choose 2}}{{75\choose 3}} \; +\; \frac{{15\choose 2}\,{60\choose 1}}{{75\choose 3}}  \; +\;  \frac{{15\choose 3}\,{60\choose 2}}{{75\choose 5}}\\
  &=& 0.9951
  \end{eqnarray*}

Es decir, la probabilidad de que el número de componentes defectuosos sea menor o igual que 3 es 0.9951.

4.0.4 Solución parte (d)

La probabilidad de que el número de componentes defectuosos sea menor o igual que 2 es 0.9484.

4.0.5 Solución parte (e)

Utilizando la fórmula hipergeométrica, la probabilidad de que el número de componentes defectuosos sea mayor que 3 se calcula así:

\[P(X>3) \; = \; P(X=4) \; +\; P(X=5)\; = \; 0.0049\]

El código para escribir la expresión anterior es:
$$P(X>3) \; = \; P(X=4) \; +\; P(X=5)\; = \; 0.0049$$

Es decir, la probabilidad de que el número de componentes defectuosos sea mayor que 3 es 0.0049.

4.0.6 Solución parte (f)

Por la propiedad del complemento:

\[P(X> 3) \; = \; 1\; -\; P(X \leq 3)\; = \;1\; -\;0.9951 \; = \; 0.0049\]

El código para escribir la expresión anterior es:
$$P(X> 3) \; = \; 1\; -\;  P(X \leq 3)\; = \;1\; -\;0.9951\; = \; 0.0049$$

Es decir, la probabilidad de que el número de componentes defectuosos sea menor o igual que 3 es 0.0049.

4.0.7 Solución parte (g)

La probabilidad de que el número de componentes defectuosos se encuentre entre 1 y 4 (ambos inclusive) se calcula así:

\[\begin{eqnarray*} P(1 \leq X \leq 4) &=& P(X=1, 2, 3, 4)\; = \; P(X=0, 1, 2, 3, 4)\, - \, P(X=0) \\ &=& P(X\leq 4) \, - \, P(X\leq 0) \; = \; 0.9998 \, - \, 0.03164 \; = \; 0.6834 \end{eqnarray*}\]

El código para escribir la expresión anterior es:

\begin{eqnarray*}
 P(1 \leq X \leq 4) &=&   P(X=1, 2, 3, 4)\; = \;   P(X=0, 1, 2, 3, 4)\, - \,  P(X=0) \\
 &=& P(X\leq 4) \, - \, P(X\leq 0)  \; = \; 0.9998 \, - \, 0.03164 \; = \; 0.6834
 \end{eqnarray*}

Es decir, la probabilidad de que el número de componentes defectuosos se encuentre entre 1 y 4 (ambos inclusive) es 0.6834.

4.0.8 Solución parte (h)

La probabilidad de que el número de componentes defectuosos se encuentre entre 1 y 4 (ambos no inclusive) se halla así:

\[\begin{eqnarray*} P(1 < X < 4) &=& P(X=2, 3)\; = \; P(X=0, 1, 2, 3)\, - \, P(X=0, 1) \\ &=& P(X\leq 3) \, - \, P(X\leq 1) \; = \; 0.9951 \, - \, 0.7402 \; = \; 0.2548 \end{eqnarray*}\]

El código para escribir la expresión anterior es:

\begin{eqnarray*}
 P(1 < X < 4) &=&   P(X=2, 3)\; = \;   P(X=0, 1, 2, 3)\, - \,  P(X=0, 1) \\
 &=& P(X\leq 3) \, - \, P(X\leq 1)  \; = \;  0.9951 \, - \, 0.7402 \; = \; 0.2548
 \end{eqnarray*}

Es decir, la probabilidad de que el número de componentes defectuosos se encuentre entre 1 y 4 (ambos no inclusive) es 0.2548.

4.0.9 Solución parte (i)

La proporción de artículos defectuosos en la población es \[p\;=\; \frac{M}{N}\;=\; \frac{15}{75}\;=\;0.2\]

El código para escribir la expresión anterior es:
$$p\;=\; \frac{M}{N}\;=\; \frac{15}{75}\;=\;0.2$$ 

Entonces, la esperanza de \(X\) es 1:

\[E(X) \; = \; np \; = \; (5) (0.2) \; = \; 1\]

El código para escribir la expresión anterior es:
$$E(X) \; = \; np \; = \; (5) (0.2) \; = \; 1$$

4.0.10 Solución parte (j)

Hallamos valor del factor que aparece en la fórmula de la varianza: \[\left(\frac{N-n}{N-1}\right) \; = \; \left(\frac{75-5}{75-1}\right) \; = \; 0.9459\]

El código para escribir la expresión anterior es:
$$\left(\frac{N-n}{N-1}\right) \; = \; \left(\frac{75-5}{75-1}\right) \; = \; 0.9459$$ 

Por lo tanto, la varianza de \(X\) es 1.25:

\[V(X) \; = \; np(1-p) \cdot \left(\frac{N-n}{N-1}\right) \; = \; (5) \,(0.2)\, (1-0.2)\, (0.9459) \; = \; 0.7567\]

El código para escribir la expresión anterior es:
$$V(X) \; = \; np(1-p) \cdot \left(\frac{N-n}{N-1}\right) \; = \; (5) \,(0.2)\, (1-0.2)\, (0.9459) \; = \; 0.7567$$ 

4.0.11 Solución parte (k)

La desviación es la raiz cuadrada de la varianza:

\[\sigma \; =\; \sqrt{V(X)} \; =\; \sqrt{0.7567} \; = \; 0.8699\]

El código para escribir la expresión anterior es:
$$\sigma \; =\;  \sqrt{V(X)} \; =\;  \sqrt{0.7567} \; = \; 0.8699$$

4.0.12 Solución parte (l)

Se observa que:

\[\frac{n}{N} \; = \; \frac{5}{75} \; = \; 0.067 \; > \; 0.05\]

El código para escribir la expresión anterior es:
$$\frac{n}{N} \; = \; \frac{5}{75} \; = \; 0.067 \; > \; 0.05$$

Este resultado indica que las probabilidades que se halle con la distribución binomial no serán valores correctos. Esto se puede comprobar en los incisos (m) y (n).

4.0.13 Solución parte (m)

Aplicando la distribución binomial, la probabilidad de que el número de componentes defectuosos sea igual a 3 es 0.0512.

En (a), la probabilidad hallada fue de 0.0467.

Se observa que estos dos valores no son muy aproximados. Esto es debido a que el valor de la fracción \(n/N\) no fue menor que 0.05. Ver inciso (l).

4.0.14 Solución parte (n)

Aaplicando la distribución binomial, la probabilidad de que el número de componentes defectuosos sea menor o igual que 3 es 0.9933.

En (d), la probabilidad hallada fue de 0.9484.

Se observa que estos dos valores no son muy aproximados. Esto es debido a que el valor de la fracción \(n/N\) no fue menor que 0.05. Ver inciso (l).

5 Ejemplo 2: Encuesta

5.1 Enunciado del ejemplo 2

Los resultados obtenidos al realizar una encuesta sobre la variable Sexo (a 100 estudiantes universitarios), muestran que hay 49 mujeres y 51 hombres.

Sexo Frecuencias
Femenino 49
Masculino 51

Supongamos que se seleccionan cuatro estudiantes al azar.

a) Diga qué tipo de variable es "Sexo". Explique.  
b) Determine la proporción y el porcentaje de mujeres y de hombres en la muestra y construya el diagrama de barras correspondiente.   
c) Defina dos variables aleatorias: una que represente el número de mujeres y otra, el número de hombres. Determine sus respectivas distribuciones, indicando también sus parámetros. Utilice estas informaciones para resolver los incisos que se presentan abajo, escribiendo siempre los resultados hallados en términos de estas dos variables. 
d) ¿Cuál es la probabilidad de seleccionar dos mujeres?
e) ¿Cuál es la probabilidad de seleccionar cuatro hombres? 
f) ¿Cuál es la probabilidad de seleccionar cuatro mujeres?
g) ¿Cuál es la probabilidad de seleccionar tres hombres?   
h) ¿Cuál es la probabilidad de seleccionar menos de tres mujeres?
i) ¿Cuál es la probabilidad de seleccionar al menos tres mujeres?
j) ¿Cuál es la probabilidad de que no seleccionemos hombres?
k) ¿Cuál es la probabilidad de que seleccionemos un hombre?  
l) ¿Cuál es la probabilidad de que seleccionemos dos hombres? 
m) ¿Cuál es la probabilidad de seleccionar máximo dos hombres? 
n) ¿Cuál es la probabilidad de seleccionar al menos tres hombres?
o) ¿Cuál es la probabilidad de seleccionar máximo dos mujeres? 
p) Halle la esperanza, varianza y desviación estándar del número de hombres. 
q) Halle la esperanza, varianza y desviación estándar del número de mujeres. 
r) Verifique si este ejercicio se puede resolver también con la binomial. En caso afirmativo (o negativo), utilice la distribución binomial para calcular las dos  probabilidades que se piden en los incisos (s) y (t). Compare estos resultados con los hallados en los incisos (d) y (n), respectivamente.
s) La probabilidad de seleccionar dos mujeres.
t) La probabilidad de seleccionar al menos tres hombres. 

5.2 Ejemplo 2: Solución

5.2.1 Solución parte (a)

La variable Sexo es cualitativa categórica y tiene dos niveles: Femenino y Masculino.

5.2.2 Solución parte (b)

Las proporciones de mujeres y hombres en la muestra son 0.49 y 0.51, respectivamente. En porcentajes, serían 49% y 51%, respectivamente.

El diagrama de barras:

5.2.3 Solución parte (c)

Definamos las siguientes dos variables aleatorias:

  1. \(X\) representa el número de mujeres y tiene distribución hipergeométrica con parámetros: \[N=100, \quad M=49, \quad n=4\]
  2. \(Y\) representa el número de hombres y tiene distribución hipergeométrica con parámetros: \[N=100, \quad M=51, \quad n=4\]

5.2.4 Solución parte (d)

Nos piden hallar la probabilidad de seleccionar dos mujeres. Utilizaremos combinaciones (no importa el orden) y aplicaremos probabilidad clásica.

La probabilidad de seleccionar dos mujeres es \[ P(X=2) \; = \; \frac{(1176)(1275)}{3921225} \; = \; 0.3824\]

El código para escribir la expresión anterior es:
$$ P(X=2) \; = \;  \frac{(1176)(1275)}{3921225} \; = \;  0.3824$$ 

5.2.5 Solución parte (e)

Nos piden hallar la probabilidad de seleccionar cuatro hombres. Utilizaremos combinaciones (no importa el orden) y aplicaremos probabilidad clásica.

La probabilidad de seleccionar cuatro hombres es \[P(Y=4) \; = \; \frac{(249900)(1)}{3921225} \; = \; 0.06373\]

El código para escribir la expresión anterior es:
$$ P(Y=4) \; = \;  \frac{(249900)(1)}{3921225} \; = \;  0.06373$$ 

5.2.6 Solución parte (f)

Nos piden hallar la probabilidad de seleccionar cuatro mujeres. Utilizaremos combinaciones y aplicaremos probabilidad clásica.

La probabilidad de seleccionar cuatro mujeres es \[ P(X=4)\; = \; \frac{(211876)(1)}{3921225}\; = \;0.054\]

El código para escribir la expresión anterior es:
$$ P(X=4)\; = \; \frac{(211876)(1)}{3921225}\; = \;0.054$$ 

5.2.7 Solución parte (g)

Nos piden hallar la probabilidad de seleccionar tres hombres. Utilizaremos combinaciones (no importa el orden) y aplicaremos probabilidad clásica.

La probabilidad de seleccionar cuatro hombres es \[ P(Y=3) \; = \; \frac{(20825)(49)}{3921225} \; = \; 0.26023\]

El código para escribir la expresión anterior es:
$$ P(Y=3) \; = \;  \frac{(20825)(49)}{3921225} \; = \;  0.26023$$ 

5.2.8 Solución parte (h)

Seleccionar menos de tres mujeres es equivalente a seleccionar un número menor o igual que dos mujeres. Utilizaremos combinaciones (no importa el orden) y aplicaremos probabilidad clásica.

La probabilidad de seleccionar menos de tres mujeres es:

\[\begin{eqnarray*} P(X < 3) &=& P(X \leq 2) \; = \; P(X=0) \; +\; P(X=1) \; +\; P(X=2)\\ &&\\ &=& \frac{(1)(249900) \; +\; (49)(20825) \; +\; (1176)(1275)}{3921225} \\ &&\\ &=& \frac{ 249900 \; +\; 1020425 \; +\; 1499400}{3921225} \\ &&\\ &=& \frac{2769725}{3921225}\; = \; 0.7063 \end{eqnarray*}\]

Es decir, la probabilidad de seleccionar menos de tres mujeres es 0.7063.

El código para escribir la expresión anterior es:

 \begin{eqnarray*}
 P(X < 3) &=&   P(X \leq 2) \; = \; P(X=0) \; +\;  P(X=1) \; +\;  P(X=2)\\
 &&\\
 &=& \frac{(1)(249900) \; +\; (49)(20825) \; +\; (1176)(1275)}{3921225} \\
 &&\\
 &=& \frac{ 249900 \; +\; 1020425 \; +\;  1499400}{3921225} \\
 &&\\
 &=& \frac{2769725}{3921225}\; = \; 0.7063
 \end{eqnarray*}

5.2.9 Solución parte (i)

Seleccionar al menos tres mujeres es equivalente a seleccionar tres o cuatro mujeres. Utilizaremos combinaciones (no importa el orden) y aplicaremos probabilidad clásica.

La probabilidad de seleccionar al menos tres mujeres es:

\[\begin{eqnarray*} P(X \geq 3) &=& P(X=3) \; +\; P(X=4) \; = \; \frac{(18424)(51) \; +\; (211876)(1)}{3921225} \\ &&\\ &=& \frac{ 939624 \; +\; 211876 }{3921225} \; = \; \frac{1151500}{3921225}\; = \; 0.2937 \end{eqnarray*}\]

Es decir, la probabilidad de seleccionar al menos tres mujeres es 0.2937.

El código para escribir la expresión anterior es:

\begin{eqnarray*}
P(X \geq 3) &=&  P(X=3) \; +\;  P(X=4) \; = \;  \frac{(18424)(51) \; +\; (211876)(1)}{3921225}  \\
&&\
&=& \frac{ 939624 \; +\; 211876 }{3921225}  \; = \; \frac{1151500}{3921225}\; = \; 0.2937
\end{eqnarray*}

Calcularemos esta probabilidad de otra manera. Por la propiedad del complemento, recuerde que: \[P(X \geq 3) \; = \; 1\; - \; P(X \leq 2) \; = \; 1\; - \; 0.7063 \; = \; 0.2937\]

El código para escribir la expresión anterior es:
$$ P(X \geq 3) \; = \;  1\; - \;  P(X \leq 2) \; = \;  1\; - \;  0.7063 \; = \; 0.2937$$

5.2.10 Solución parte (j)

Nos piden hallar la probabilidad de que no seleccionemos hombres. Entonces, si no se seleccionan hombres, entonces, hemos seleccionado cuatro mujeres. Por lo tanto, por la parte (f), la probabilidad de que no seleccionemos hombres es 0.0540.

\[P(Y=0) \; = \; P(X=4) \; = \; 0.0540\]

El código para escribir la expresión anterior es:
$$ P(Y=0) \; = \; P(X=4) \; = \; 0.0540$$

5.2.11 Solución parte (k)

Nos piden hallar la probabilidad de seleccionar un hombre. Utilizaremos combinaciones (no importa el orden) y aplicaremos probabilidad clásica.

La probabilidad de seleccionar un hombre es \[P(Y=1) \; = \; \frac{(51)(18424)}{3921225} \; = \; 0.2396\]

El código para escribir la expresión anterior es:
$$ P(Y=1) \; = \;  \frac{(51)(18424)}{3921225} \; = \;  0.2396$$ 

5.2.12 Solución parte (l)

Nos piden hallar la probabilidad de que seleccionemos dos hombres. Entonces, al seleccionar dos hombres, también estaremos seleccionando dos mujeres. Por lo tanto, por la parte (d), la probabilidad de que seleccionemos dos hombres es 0.3824.

\[P(Y=2) \; = \; P(X=2) \; = \; 0.3824\]

El código para escribir la expresión anterior es:
$$ P(Y=2) \; = \; P(X=2) \; = \; 0.3824$$

5.2.13 Solución parte (m)

Nos piden hallar la probabilidad de seleccionar máximo dos hombres. Para ello, solo debemos sumar las probabilidades de seleccionar 0, 1 y 2 hombres. Entonces, por las partes (j), (k) y (l), tenemos que \[P(Y \leq 2) \; = \; 0.0540 \;+\; 0.2396 \;+\; 0.3824 \; = \; 0.6760\]

El código para escribir la expresión anterior es:
$$ P(Y \leq 2) \; = \;0.0540 \;+\; 0.2396 \;+\; 0.3824  \; = \; 0.6760$$

5.2.14 Solución parte (n)

Nos piden hallar la probabilidad de seleccionar al menos tres hombres. Observe que el evento “seleccionar al menos tres hombres” es el complemento del evento “seleccionar máximo dos hombres”. Por lo tanto, por la parte (m), la probabilidad pedida es: \[P(Y\geq 3)\; = \; 1 \; -\; P(Y\leq 2) \; = \; 1 \; -\; 0.6760 \; = \; 0.3239\]

El código para escribir la expresión anterior es:
$$ P(Y\geq 3)\; = \;  1 \; -\;  P(Y\leq 2) \; = \;  1 \; -\; 0.6760 \; = \;  0.3239$$

5.2.15 Solución parte (o)

Nos piden hallar la probabilidad de seleccionar máximo dos mujeres. El evento “seleccionar máximo dos mujeres” es el complemento del evento “seleccionar al menos tres mujeres”. Y la probabilidad de este evento (“seleccionar al menos tres mujeres”) es igual a la probabilidad hallada en (i). Por lo tanto, la probabilidad pedida es: 0.7064.

\[P(X\leq 2)\; = \; 1 \; -\; P(X\geq 3) \; = \; 1 \; -\; 0.2937\; = \; 0.7063\]

El código para escribir la expresión anterior es:
$$ P(X\leq 2)\; = \;  1 \; -\;  P(X\geq 3) \; = \;  1 \; -\; 0.2937\; = \;  0.7063$$

5.2.16 Solución parte (p)

Para hallar la esperanza, varianza y desviación estándar del número de hombres, primero calculamos la proporción \(p\) de hombres en la población y valor del factor que aparece en la varianza:

\[p= \frac{M}{N}= \frac{51}{100}=0.51, \qquad \left(\frac{N-n}{N-1}\right)=\left(\frac{100-4}{100-1}\right)=0.9697\]

El código para escribir la expresión anterior es:
$$p= \frac{M}{N}= \frac{51}{100}=0.51, \qquad \left(\frac{N-n}{N-1}\right)=\left(\frac{100-4}{100-1}\right)=0.9697$$

Entonces, los valores de la esperanza, varianza y desviación estándar de \(Y\) son:

\[\begin{eqnarray*} E(Y) &=& np \; = \; (4) (0.51) \; = \; 2.04\\ V(Y) &=& np(1-p) \cdot \left(\frac{N-n}{N-1}\right) \; = \; (4) \,(0.51)\, (1-0.51)\, (0.9697) \; = \; 0.9693\\ \sigma &=& \sqrt{V(X)} \; =\; \sqrt{0.9693} \; = \; 0.9845 \end{eqnarray*}\]

\begin{eqnarray*}
E(Y) &=& np \; = \; (4) (0.51) \; = \; 2.04\\
V(Y) &=& np(1-p) \cdot \left(\frac{N-n}{N-1}\right) \; = \; (4) \,(0.51)\, (1-0.51)\, (0.9697) \; = \; 0.9693\\
\sigma &=& \sqrt{V(X)} \; =\;  \sqrt{0.9693} \; = \; 0.9845
\end{eqnarray*}

5.2.17 Solución parte (q)

Para hallar la esperanza, varianza y desviación estándar del número de mujeres, primero calculamos la proporción \(p\) de mujeres en la población y valor del factor que aparece en la varianza:

\[p= \frac{M}{N}= \frac{49}{100}=0.49, \qquad \left(\frac{N-n}{N-1}\right)=\left(\frac{100-4}{100-1}\right)=0.9697\]

El código para escribir la expresión anterior es:
$$p= \frac{M}{N}= \frac{49}{100}=0.49, \qquad \left(\frac{N-n}{N-1}\right)=\left(\frac{100-4}{100-1}\right)=0.9697$$

Entonces, los valores de la esperanza, varianza y desviación estándar de \(X\) son:

\[\begin{eqnarray*} E(X) &=& np \; = \; (4) (0.49) \; = \; 1.96\\ V(X) &=& np(1-p) \cdot \left(\frac{N-n}{N-1}\right) \; = \; (4) \,(0.49)\, (1-0.49)\, (0.9697) \; = \; 0.9693\\ \sigma &=& \sqrt{V(X)} \; =\; \sqrt{0.9693} \; = \; 0.9845 \end{eqnarray*}\]

\begin{eqnarray*}
E(X) &=& np \; = \; (4) (0.49) \; = \; 1.96\\
V(X) &=& np(1-p) \cdot \left(\frac{N-n}{N-1}\right) \; = \; (4) \,(0.49)\, (1-0.49)\, (0.9697) \; = \; 0.9693\\
\sigma &=& \sqrt{V(X)} \; =\;  \sqrt{0.9693} \; = \; 0.9845
\end{eqnarray*}

5.2.18 Solución parte (r)

Se observa que:

\[\frac{n}{N} \; = \; \frac{4}{100} \; = \; 0.04 \; < \; 0.05\]

El código para escribir la expresión anterior es:

$$ \frac{n}{N} \; = \; \frac{4}{100} \; = \; 0.04 \; < \; 0.05$$

Este resultado indica que las probabilidades que se halle con la distribución binomial serán valores muy aproximados a los hallados con las probabilidades hipergeométricas. Esto se puede comprobar en los incisos (s) y (t). En este contexto, podemos afirmar lo siguiente:

  1. \(X\) (que representa el número de mujeres) tiene distribución binomial aproximada con parámetros \(n=4\) y \(p=0.49\).

  2. \(Y\) (que representa el número de hombres) tiene distribución binomial aproximada con parámetros \(n=4\) y \(p=0.51\).

5.2.19 Solución parte (s)

Teniendo en cuenta los parámetros en el inciso (r), la probabilidad de seleccionar dos mujeres es: \[P(X=2) \; = \; {4\choose 2} (0.49)^2\, (1-0.49)^{4-2} \; = \; 0.3747\]

Es decir, aplicando la distribución binomial, la probabilidad de seleccionar dos mujeres es 0.3747.

En (d), la probabilidad hallada fue de 0.3824.

Se observa que estos dos valores son aproximados. Esto es debido a que el valor de la fracción \(n/N\) fue menor que 0.05. Ver inciso (r).

5.2.20 Solución parte (t)

Teniendo en cuenta los parámetros en el inciso (r), la probabilidad de seleccionar al menos tres hombres es: \[\begin{eqnarray*} P(Y\geq 3) &=& P(Y=3) \; + \;P(Y=4) \\ &=& {4\choose 3} (0.51)^3\, (1-0.51)^{4-3} \; +\; {4\choose 4} (0.51)^4\, (1-0.51)^{4-4} \\ &=& 0.2600 + 0.0677 \; = \; 0.3276 \end{eqnarray*}\]

Es decir, aplicando la distribución binomial, la probabilidad de seleccionar al menos tres hombres es 0.3276.

En (d), la probabilidad hallada fue de 0.324.

Se observa que estos dos valores son muy aproximados. Esto es debido a que el valor de la fracción \(n/N\) fue menor que 0.05. Ver inciso (r).

6 Ejercicios

Crear un nuevo documento R Markdown, realizando los ejercicios que se indican abajo. Interprete los resultados hallados.

  1. Repita el ejemplo 1, suponiendo que se seleccionan 6 componentes.

  2. Repita el ejemplo 1, suponiendo que se seleccionan 8 componentes.

  3. Repita el ejemplo 2, suponiendo que se seleccionan 5 estudiantes.

  4. Repita el ejemplo 2, suponiendo que se seleccionan 7 estudiantes.

  5. Un producto industrial se envía en lotes de 20 unidades. Efectuar pruebas para determinar si un artículo tiene defectos es costoso; así que el fabricante toma muestras de su producción en vez de probar el 100%. Un plan de muestreo elaborado para reducir al mínimo la cantidad de artículos defectuosos que se envían a los consumidores requiere que se muestreen 5 artículos de cada lote y el rechazo del lote completo si se encuentra más de un artículo defectuoso. Si el lote es rechazado, se prueba cada artículo del lote. Si un lote contiene 4 artículos defectuosos, ¿cuál es la probabilidad de que sea rechazado?

  6. Una empresa recibe un pedido de 1.000 artículos. Se analiza una muestra aleatoria de 15 artículos y se acepta el pedido si menos de tres resultan defectuosos. ¿Cuál es la probabilidad de aceptar un envío que contenga un 5% de artículos defectuosos?

  7. Se selecciona al azar un comité de 3 personas entre 3 matemáticos y 5 físicos.

    1. Encuentre la función de probabilidad para el número de matemáticos en el comité.
    2. Calcule la probabilidad de que en el comité haya por lo menos dos físicos.
  8. Considere solamente las observaciones que van desde la 132 hasta la 193. Supongamos que se seleccionan cinco estudiantes al azar.

    1. Defina como “datos132a193” al data frame con estas observaciones y verifique su tamaño.
    2. Defina como “Financiacion” al objeto que represente el tipo de financianción utilizado por los estudiantes para pagar sus estudios. Conviértalo en factor. Construya una tabla de frecuencias para la variable Financiación y el diagrama de barras correspondiente.
    3. Defina dos variables aleatorias: una que represente el número de estudiantes becados y otra, el número de estudiantes no becados. Determine sus respectivas distribuciones.
    4. ¿Cuál es la probabilidad de seleccionar dos becados?
    5. ¿Cuál es la probabilidad de seleccionar mínimo dos estudiantes no becados.
    6. ¿Cuál es la probabilidad de seleccionar cuatro estudiantes becados?
    7. ¿Cuál es la probabilidad de seleccionar tres estudiantes no becados?
    8. ¿Cuál es la probabilidad de seleccionar más de cuatro estudiantes becados?
    9. ¿Cuál es la probabilidad de seleccionar a lo más tres estudiantes no becados?
    10. ¿Cuál es la probabilidad de que no seleccionemos estudiantes no becados?
    11. ¿Cuál es la probabilidad de que seleccionemos un estudiante becado?
    12. ¿Cuál es la probabilidad de que seleccionemos dos estudiantes no becados?
    13. ¿Cuál es la probabilidad de seleccionar máximo dos estudiantes no becados?
    14. ¿Cuál es la probabilidad de seleccionar al menos tres estudiantes no becados?
    15. ¿Cuál es la probabilidad de seleccionar máximo dos estudiantes becados?
    16. Halle la esperanza, varianza y desviación estándar del número de estudiantes becados.
    17. Halle la esperanza, varianza y desviación estándar del número de estudiantes no becados.
    18. Verifique si este ejercicio se puede resolver también con la binomial. En caso afirmativo (o negativo), utilice la distribución binomial para calcular las dos probabilidades que se piden en los incisos (s) y (t). Compare estos resultados con los hallados en los incisos (d) y (n), respectivamente.
    19. La probabilidad de seleccionar dos becados.
    20. La probabilidad de seleccionar al menos tres estudiantes no becados.
  9. El propietario de un local comercial ha comprobado que, de 30 clientes que entran allí, 18 hacen alguna compra. Cierta tarde, entraron \(n\) personas. Halle lo que se pide en los incisos de abajo para cada uno de los siguientes tres casos: CASO 1: \(n=6\), CASO 2: \(n=7\) y CASO 3: \(n=8\). Sugerencia: defina \(X\) como el número de clientes que hicieron alguna compra y \(Y\) como el número de clientes que no hicieron compra. Utilícelas en los incisos donde sea el caso.

    1. Verifique si se puede aplicar la distribución binomial. En caso, afirmativo resuelva los incisos de abajo solamente con esta distribución, indicando los parámetros de X y Y. En caso negativo, resuélvalas con la distribución hipergeométrica (también indicando los parámetros de X y Y).
    2. La probabilidad de que todos los clientes no hicieron compra.
    3. La probabilidad de que a lo sumo 5 clientes hicieron alguna compra.
    4. La probabilidad de que menos de 3 clientes no hicieron compra.
    5. La probabilidad de que al menos 3 clientes hicieron alguna compra.
    6. La probabilidad de que más de 2 clientes no hicieron compra.
    7. La probabilidad de el número de clientes en la muestra que hicieron alguna compra esté entre 3 y 10 (ambos inclusive)
    8. La probabilidad de que el número de clientes en la muestra que no hicieron compra sea estrictamente mayor que 1 pero menor o igual a 4.
    9. La probabilidad de que el número de clientes en la muestra que hicieron alguna compra sea estrictamente menor que 3 y menor o igual a 9.
    10. La esperanza, varianza y desviación del número de clientes que no hicieron compra.
    11. La esperanza, varianza y desviación del número de clientes que hicieron alguna compra.
  10. El propietario de un local comercial ha comprobado que, de 160 clientes que entran allí, 64 hacen alguna compra. Cierta tarde, entraron \(n\) personas. Halle lo que se pide en los incisos de abajo para cada uno de los siguientes tres casos: CASO 1: \(n=6\), CASO 2: \(n=7\) y CASO 3: \(n=8\). Sugerencia: defina \(X\) como el número de clientes que hicieron alguna compra y \(Y\) como el número de clientes que no hicieron compra. Utilícelas en los incisos donde sea el caso.

    1. Verifique si se puede aplicar la distribución binomial. En caso, afirmativo resuelva los incisos de abajo solamente con esta distribución, indicando los parámetros de X y Y. En caso negativo, resuélvalas con la distribución hipergeométrica (también indicando los parámetros de X y Y).
    2. La probabilidad de que todos los clientes no hicieron compra.
    3. La probabilidad de que a lo sumo 5 clientes hicieron alguna compra.
    4. La probabilidad de que menos de 3 clientes no hicieron compra.
    5. La probabilidad de que al menos 3 clientes hicieron alguna compra.
    6. La probabilidad de que más de 2 clientes no hicieron compra.
    7. La probabilidad de el número de clientes en la muestra que hicieron alguna compra esté entre 3 y 10 (ambos inclusive)
    8. La probabilidad de que el número de clientes en la muestra que no hicieron compra sea estrictamente mayor que 1 pero menor o igual a 4.
    9. La probabilidad de que el número de clientes en la muestra que hicieron alguna compra sea estrictamente menor que 3 y menor o igual a 9.
    10. La esperanza, varianza y desviación del número de clientes que no hicieron compra.
    11. La esperanza, varianza y desviación del número de clientes que hicieron alguna compra.

7 Otros ejercicios

  1. Tener en cuenta la Bibliografía No. 1 que se referencia abajo y realizar los ejercicios que aparecen en:

    • La Sección 3.1 (página 187): Variables aleatorias.

    • La Sección 3.2 (página 197): Distribuciones de probabilidad (caso discreto).

    • La Sección 3.3 (página 210): Esperanza y varianza de una variable aleatoria discreta.

    • La Sección 3.5 (página 221): Distribución binomial.

    • La Sección 3.7 (página 241): Distribución hipergeométrica.

    • La Sección de Ejercicios Complementarios (página 252).

  2. Al hacer click aquí, usted encontrará una serie de artículos publicados en diferentes áreas de aplicación. Seleccione algunos de ellos y aplique la teoría explicada en este documento.

Bibliografía

  1. LLinás, H., Rojas, C. (2005); Estadística descriptiva y distribuciones de probabilidad. Barranquilla: Editorial Universidad del Norte.

  2. Consultar mis Notas de clase: Cap. 3 (Descriptiva).

  3. Consultar el documento RPubs :: Enlace y materiales de ayuda.

 

 
If you found any ERRORS or have SUGGESTIONS, please report them to my email. Thanks.