hllinas2023

1 Función de densidad normal

1.0.1 Definición de \(f\)

La función de densidad de la distribución normal con parámetros \(\mu\) y \(\sigma^2\) está dada por:

\[f(x)\;= \; \frac{1}{\sqrt{2 \pi \sigma^2}} \, e^{-\frac{(x-\mu)^2} {2 \sigma^2}}, \qquad \text{para todo $x$ real}\]

El código para escribir la expresión anterior es:

$$f(x)\;= \; \frac{1}{\sqrt{2 \pi \sigma^2}} \, e^{-\frac{(x-\mu)^2} {2 \sigma^2}}, \qquad \text{para todo $x$ real}$$

1.0.2 \(f\) en R

En R la función “dnorm(x, mean, sd)” nos ayuda a utilizar la densidad de la distribución normal. Aquí:

  1. \(x\) es un vector de números.

  2. “mean” es un valor del parámetro \(\mu\). Por defecto, su valor es 0.

  3. “sd” es un valor de \(\sigma\). Por defecto, su valor es 1.

2 Ejemplo 1: Gráfica de \(f\)

En el siguiente ejemplo, observamos la gráfica de la función de densidad normal para una variable aleatoria \(X\) que tiene distribución normal con parámetros \(\mu=2\) y \(\sigma=1.1\):

# Crear una sucesión de números entre -9 y 9, aumentando en 0.05.
x <- seq(-9, 9, by = 0.05)

# Suponiendo que los parámetros son: mu=2 y sigma=1.1.
y <- dnorm(x, mean = 2, sd = 1.1)

# Gráfica de la densidad normal
plot(x,y)

3 Función de distribución acumulada normal

3.0.1 Definición de \(F\)

La función de distribución acumulada normal se simboliza por \(F\) o \(\Phi\). Su definición es:

\[F(t) \; = \; \Phi(t) = P(X \leq t), \qquad \text{para todo $t$ real}\]

El código para escribir la expresión anterior es:

$$ F(t) \; = \;\Phi(t) = P(X \leq t), \qquad \text{para todo $t$ real}$$

3.0.2 \(F\) en R

En R la función pnorm(x, mean, sd) nos ayuda a utilizar esta función. Aquí, nuevamente:

  1. \(x\) es un vector de números.

  2. “mean” es un valor del parámetro \(\mu\). Por defecto, su valor es 0.

  3. “sd” es un valor de \(\sigma\). Por defecto, su valor es 1.

4 Ejemplo 2: Gráfica de \(F\)

En el siguiente ejemplo, observamos la gráfica de la función de distribución acumulada para una variable aleatoria \(X\) que tiene distribución normal con parámetros \(\mu=2\) y \(\sigma=1.1\):

# Crear una sucesión de números entre -9 y 9, aumentando en 0.05.
x <- seq(-9, 9, by = 0.05)

# Suponiendo que los parámetros son: mu=2 y sigma=1.1.
y <- pnorm(x, mean = 2, sd = 1.1)

# Gráfica de la densidad normal
plot(x,y)

5 Ejemplo 3: Cálculo de probabilidades

Con “pnorm” podemos calular probabilidades. Por ejemplo, si \(X\) tiene distribución normal con parámetros \(\mu=2\) y \(\sigma=1.1\), entonces, calcular:

a) La probabilidad de que X sea menor o igual que 3.

b) La probabilidad de que X sea mayor o igual que 3.

5.0.1 Solución parte (a)

La probabilidad de que \(X\) sea menor o igual que 3 es:

\[P(X \leq 3) \; = \; 0.8183\]

El código para escribir la expresión anterior es:

$$P(X \leq 3) \; = \; 0.8183$$
pnorm(3, mean = 2, sd = 1.1)
## [1] 0.8183489

5.0.2 Solución parte (b)

La probabilidad de que \(X\) sea mayor o igual que 3 es: \[P(X \geq 3) \; = \; 0.1817\]

El código para escribir la expresión anterior es:

$$P(X \geq 3) \; = \; 0.1817$$
pnorm(3, mean = 2, sd = 1.1, lower.tail=FALSE)
## [1] 0.1816511

Observe que, en R, se ha utilizado el argumento “lower.tail=FALSE” para calcular esta probabilidad. Además, observe también que se pudo haber calculado la propiedad del complemento para calcula esta probabilidad:

\[P(X \geq 3) \; = \; 1- P(X \leq 3) \; = \; 1- 0.8183 \; = \;0.1817\]

El código para escribir la expresión anterior es:

$$P(X \geq 3) \; = \; 1- P(X \leq 3) \; = \; 1- 0.8183 \; = \;0.1817$$

6 Propiedades de la distribución normal

6.0.1 Propiedad 1

Si \(X\) es normal con parámetros \(\mu\) y \(\sigma^2\), entonces, \[E(X)=\mu, \qquad V(X)=\sigma^2\]

El código para escribir la expresión anterior es:

$$E(X)=\mu, \qquad  V(X)=\sigma^2$$

6.0.2 Propiedad 2

Hay toda una familia de distribuciones normales. Cada distribución normal específica se distingue por \(\mu\) y \(\sigma\) (compárese con la figura 4.1).

En la figura 4.1 podemos observar que:

  1. La densidad normal es creciente para \(x<\mu\) y decreciente para \(x>\mu\). Es decir, el punto más alto de la densidad normal se obtiene cuando \(x=\mu\) (véase las figuras 4.1a,b).

  2. Las colas, es decir, los extremos o los lados de la densidad normal se prolongan al infinito en ambas direcciones y nunca tocan el eje horizontal (véase las figuras 4.1a,b).

  3. La desviación estándar \(\sigma\) determina el ancho de la curva (véase la figura 4.1b).

  4. En la figura 4.1c se ilustra el comportamiento de dos gráficas de la distribución acumulada normal para \(\sigma_1 <\sigma_2\).

6.0.3 Propiedad 3

  1. La densidad normal es simétrica con respecto a \(\mu\).

  2. La densidad normal es unimodal.

  3. La media, la mediana y la moda son todas iguales.

7 La distribución normal estándar

7.0.1 Definición

Aquella distribución normal con esperanza 0 y varianza 1. La variable aleatoria asociada se simbolizará con \(Z\).

7.0.2 Propiedades

  1. Simétrica con respecto a 0.

  2. De la figura 4.2: El área de la región I es igual al área de la región II.

7.0.3 Fórmula \(Z\)

Sea \(X\) una variable aleatoria que tiene distribución normal con parámetros \(\mu\) y \(\sigma^2\). Entonces, la siguiente variable tiene distribución normal estándar:

\[Z=\frac{X-\mu}{\sigma}\]

El código para escribir la expresión anterior es:

$$Z=\frac{X-\mu}{\sigma}$$

7.0.4 Estandarización a \(Z\)

Sea \(X\) una variable aleatoria que tiene distribución normal con parámetros \(\mu\) y \(\sigma^2\). Entonces, para todo número real \(t\), se cumple que:

\[P(X \leq t) \quad =\quad P(X\; -\; \mu \leq t\; -\; \mu) \quad = \quad P\Big(\frac{X-\mu}{\sigma} \leq \frac{t-\mu}{\sigma}\Big) \quad =\quad P\Big(Z \leq \frac{t-\mu}{\sigma}\Big)\]

El código para escribir la expresión anterior es:

$$P(X \leq t)  \quad =\quad P(X\; -\; \mu \leq   t\; -\; \mu) \quad = \quad
 P\Big(\frac{X-\mu}{\sigma} \leq \frac{t-\mu}{\sigma}\Big)    \quad =\quad  P\Big(Z \leq \frac{t-\mu}{\sigma}\Big)$$

Es decir,

\[P(X \leq t) \; =\; P\Big(Z \leq \frac{t-\mu}{\sigma}\Big)\]

El código para escribir la expresión anterior es:

$$P(X \leq t) \; =\; P\Big(Z \leq \frac{t-\mu}{\sigma}\Big)$$

8 Ejemplo 4: probabilidades con \(Z\)

Si \(X\) es una variable normal con media \(\mu=50\) y varianza \(\sigma^2=100\), calcule las siguientes probabilidades utilizando la distribución normal estándar.

a) La probabilidad de que X sea menor o igual que 40.

b) La probabilidad de que X se encuentre entre -60 y 60 (ambos inclusive).

8.0.1 Solución parte (a)

La probabilidad de que \(X\) sea menor o igual que 40 es: \[P(X\leq 40) \; =\; P\Big(Z \leq \frac{40-50}{10}\Big)\; =\; P(Z\leq -1) \; =\; 0.1587\]

El código para escribir la expresión anterior es:

$$P(X\leq 40) \; =\;  P\Big(Z \leq \frac{40-50}{10}\Big)\; =\; P(Z\leq -1) \; =\; 0.1587$$

En R se utiliza solo la función pnorm(z) para la distribución normal estándar:

z <- -1
pnorm(z)
## [1] 0.1586553

8.0.2 Solución parte (b)

La probabilidad de que \(X\) se encuentre entre -60 y 60 (ambos inclusive) es:

\[\begin{eqnarray*} P(|X| \leq 60) &=& P(-60 \leq X \leq 60)\; =\; P(X\leq 60) \; - \; P(X\leq -60) \\ &=& P\Big(Z \leq \frac{60-50}{10}\Big) \; - \; P\Big(Z \leq \frac{-60-50}{10}\Big)\\ &=& P(Z \leq 1) - P(Z\leq -11) = 0.8413 - 0 \; =\; 0.8413 \end{eqnarray*}\]

El código para escribir la expresión anterior es:

\begin{eqnarray*}
    P(|X| \leq 60) &=& P(-60 \leq X  \leq 60)\; =\;  P(X\leq 60) \; - \; P(X\leq -60) \\
     &=&  P\Big(Z \leq \frac{60-50}{10}\Big) \; - \;  P\Big(Z \leq \frac{-60-50}{10}\Big)\\
     &=& P(Z \leq 1) - P(Z\leq -11) = 0.8413  - 0 \; =\; 0.8413
\end{eqnarray*}

En R:

z1 <- 1
z2 <- -11
pnorm(z1) - pnorm(z2)
## [1] 0.8413447

9 Cuantil de una normal

9.0.1 Definición

Supongamos que \(X\) tiene distribución normal con media \(\mu\) y desviación estándar \(\sigma\). Para \(0 < \alpha < 1\), el símbolo \(x_\alpha\) es un valor cuantil de la distribución normal si cumple con la condición: \[P(X \geq x_\alpha) \;= \; \alpha\]

El código para escribir la expresión anterior es:

$$P(X \geq x_\alpha) \;= \; \alpha$$

9.0.2 En R: Cuantil para cualquier normal

En R, un valor cuantil de la distribución normal puede ser calculada con cualquiera de las dos siguientes maneras equivalentes:

  1. qnorm(\(1-\alpha\), mean, sd).

  2. qnorm(\(\alpha\), mean, sd, lower.tail = FALSE).

Aquí:

  1. \(\alpha\) es un vector de probabilidades.

  2. “mean” es un valor de la media muestral. Por defecto, su valor es 0.

  3. “sd” es la desviación estándar. Por defecto, su valor es 1.

9.0.3 En R: Cuantil para la normal estándar

En la distribución normal estándar, el cuantil puede ser calculada con cualquiera de las dos siguientes maneras equivalentes:

  1. qnorm(\(1-\alpha\))

  2. qnorm(\(\alpha\), lower.tail = FALSE).

10 Ejemplo 5: Calcular un cuantil

A manera de ejemplo, supongamos que \(X\) tiene distribución normal con media \(\mu=2\) y desviación estándar \(\sigma=1.1\). Sea \(Z\) la variable aleatoria que tiene distribución normal estándar. Hallar el valor de \(k\) tal que:

  1. \(P(X \geq k)= 0.83\).

  2. \(P(X \leq k)= 0.95\).

  3. \(P(k < X < 3.1)= 0.75\).

  4. \(P(-k < Z < k)= 0.95\).

El código para escribir la expresión anterior es:

a) $P(X \geq k)= 0.83$.
b) $P(X \leq k)= 0.95$.
c) $P(k < X < 3.1)= 0.75$.
d) $P(-k < Z < k)= 0.95$.

10.0.1 Solución parte (a)

El valor de \(k\) tal que \(P(X \geq k)= 0.83\) es \(k=0.9504\).

alfa <- 0.83
mean <- 2
sd <- 1.1
qnorm(1-alfa, mean, sd)
## [1] 0.9504182
qnorm(alfa, mean, sd, lower.tail = FALSE)
## [1] 0.9504182

10.0.2 Solución parte (b)

El valor de \(k\) tal que \(P(X \leq k)= 0.95\) es \(k=3.8093\).

alfa <- 0.95
mean <- 2
sd <- 1.1
qnorm(1-alfa, mean, sd, lower.tail = FALSE)
## [1] 3.809339
qnorm(alfa, mean, sd)
## [1] 3.809339

10.0.3 Solución parte (c)

El valor de \(k\) tal que \(P(k < X < 3.1)= 0.75\) no se puede calcular directamente, pero podemos proceder así (estandarizando y utilizando propiedades):

Sea \(t: = \frac{k-2}{1.1}\). Entonces,

\[ 0.75 \; = \; P(k < X < 3.1) \;= \; P\Big(\frac{k-2}{1.1} \; < \; Z \; < \; \frac{3.1-2}{1.1}\Big) \;= \; P(t < Z < 1) \;=\; P(Z < 1) \; - \; P(Z < t) \]

El código para escribir la expresión anterior es:

$$ 0.75 \; = \;  P(k < X < 3.1) \;= \;    P\Big(\frac{k-2}{1.1} \; < \; Z \; < \;  \frac{3.1-2}{1.1}\Big) \;= \;    P(t < Z  < 1) \;=\;   P(Z <  1) \; - \; P(Z < t) $$

En R vemos que \[P(Z < 1) =0.8413\]

El código para escribir la expresión anterior es:

$$P(Z <  1) =0.8413$$
z <- 1
pnorm(z)
## [1] 0.8413447

Por lo tanto,

\[P(Z<t) \; = \; 0.8413 \; -\; 0.75 \;= \; 0.0913\]

El código para escribir la expresión anterior es:

$$P(Z<t) \; = \; 0.8413 \; -\;  0.75 \;= \; 0.0913$$
 0.8413-0.75
## [1] 0.0913

Al utilizar R, el valor cuantil es \(t=-1.3328\).

alfa <- 0.0913
qnorm(1-alfa, lower.tail = FALSE)
## [1] -1.332792

Como \(t = \frac{k-2}{1.1}\), entonces \(-1.3328 = \frac{k-2}{1.1}\), de donde \(k=2 - (1.3328)(1.1)= 0.5339\).

2 - (1.3328)*(1.1)
## [1] 0.53392

10.0.4 Solución parte (d)

El valor de \(k\) tal que \(P(-k < Z < k)= 0.95\) no se puede calcular directamente, pero podemos proceder así (utilizando propiedades):

\[ 0.95 \; = \; P(-k < Z < k) \;= \; 1 \; - \; 2 \, P(Z \; > \; k)\]

El código para escribir la expresión anterior es:

$$ 0.95 \; = \;  P(-k < Z < k) \;= \;  1 \; - \; 2 \, P(Z \; > \;  k)$$

Es decir (despejando), \[P(Z >k) \; = \; \frac{1-0.95}{2} \; = \; 0.025\]

El código para escribir la expresión anterior es:

$$P(Z >k) \; = \; \frac{1-0.95}{2} \; = \; 0.025$$

Al utilizar R, el valor cuantil es \(k=1.96\).

alfa <- 0.025
qnorm(1-alfa)
## [1] 1.959964

11 Ejemplo 6: Enunciado (Bombillos)

Una compañía fabrica bombillos con vida media de 500 horas y desviación estándar de 100. Suponga que los tiempos de vida útil de los bombillos se distribuyen normalmente, esto es que los tiempos de vida forman una distribución normal.

a) Encuentre la probabilidad de que cierta cantidad de focos dure menos de 650 horas.

b) Calcule la probabilidad de que cierta cantidad de focos dure más de 780 horas.

c) Determine la probabilidad de que cierta cantidad de focos dure entre 650 y 780 horas (ambos inclusive).

d) Halle el valor de k tal que el 5% de los bombillos tenga un tiempo de vida mayor que  k horas? 

e) Si se eligen 10000 bombillos, ¿cuántos tuvieron un tiempo de vida entre 650 y 780 horas (ambos inclusive)?

f) Si se eligen 1200 bombillos, ¿cuál es la probabilidad de que al menos 3 duren más de 780 horas?

g) Si se eligen 20 bombillos, ¿cuál es la probabilidad de que entre 16 y 19 (ambos inclusive) duren menos de 650 horas?

h) Si se eligen 20 bombillos, ¿cuál es la probabilidad de que entre 16 y 19 (ambos inclusive) no duren menos de 650 horas?

12 Ejemplo 6: Solución

Sea \(X\) la variable aleatoria que representa el tiempo de vida útil de los focos. Entonces, \(X\) tiene distribución normal con \(\mu=500\) y \(\sigma=100\).

12.0.1 Solución parte (a)

Nos piden \(P(X< 650)\).

12.0.1.1 Sin estandarizar

\[P(X< 650) \; = \; 0.9332\]

El código para escribir la expresión anterior es:

 $$P(X< 650) \; = \; 0.9332$$

En R:

probabilidad_a <- pnorm(650, mean=500, sd=100); 
probabilidad_a
## [1] 0.9331928

12.0.1.2 Estandarizando (con \(Z\))

\[P(X< 650) \;=\; P\Big(Z< \frac{650-500}{100}\Big) \; = \; P(Z<1.5) \; = \; 0.9332\]

El código para escribir la expresión anterior es:

  $$P(X< 650) \;=\; P\Big(Z< \frac{650-500}{100}\Big) \; = \; P(Z<1.5) \; = \; 0.9332$$

En R:

probabilidad_a <- pnorm(1.5)
probabilidad_a
## [1] 0.9331928

Es decir, la probabilidad de que cierta cantidad de focos dure menos de 650 horas es aproximadamente de 0.9332.

12.0.2 Solución parte (b)

Nos piden \(P(X>780)\).

12.0.2.1 Sin estandarizar

\[P(X>780) \;=\; 0.0026\]

El código para escribir la expresión anterior es:
  $$P(X>780) \;=\; 0.0026$$
probabilidad_b <- pnorm(780, mean=500, sd=100,lower.tail=FALSE)
probabilidad_b
## [1] 0.00255513

12.0.2.2 Estandarizando (con \(Z\))

\[P(X>780) \;=\; P\Big(Z> \frac{780-500}{100}\Big) \; = \; P(Z>2.8) \; = \; 0.0026\]

El código para escribir la expresión anterior es:

  $$P(X>780) \;=\; P\Big(Z> \frac{780-500}{100}\Big) \; = \; P(Z>2.8) \; = \; 0.0026$$
probabilidad_b <- pnorm(2.8, lower.tail=FALSE)
probabilidad_b
## [1] 0.00255513

Por lo tanto, la probabilidad de que cierta cantidad de focos dure más de 780 horas es aproximadamente de 0.0026.

12.0.3 Solución parte (c)

Nos piden \(P(650 \leq X \leq 780)\).

12.0.3.1 Sin estandarizar

\[P(650 \leq X \leq 780) \; = \; P(X\leq 780) \;- \; P(X\leq 650) \; = \; 0.9975\; -\; 0.9332 \; = \; 0.0643\]

El código para escribir la expresión anterior es:

   $$P(650 \leq X \leq 780) \; = \; P(X\leq 780) \;- \; P(X\leq 650)  \; = \;   0.9975\; -\;  0.9332 \; = \; 0.0643$$

En R:

probabilidad_c <- pnorm(780, mean=500, sd=100) - pnorm(650, mean=500, sd=100)
probabilidad_c
## [1] 0.06425207
probabilidad_c <- pnorm(780, mean=500, sd=100) 
probabilidad_c
## [1] 0.9974449

12.0.3.2 Estandarizando (con \(Z\))

\[\begin{eqnarray*} P(650 \leq X \leq 780) &=& P(X\leq 780) \;- \; P(X\leq 680)\\ &= & P(Z\leq 2.8) \, - \, P(Z\leq 1.5) \;= \; 0.9975 \, - \, 0.9332 \;= \; 0.0643 \end{eqnarray*}\]

El código para escribir la expresión anterior es:

 \begin{eqnarray*}
P(650 \leq X \leq 780) &=& P(X\leq 780) \;- \; P(X\leq 680)\\
&= & P(Z\leq 2.8) \, - \, P(Z\leq 1.5) \;= \;  0.9975 \, - \, 0.9332 \;= \; 0.0643
\end{eqnarray*}

En R:

probabilidad_c <- pnorm(2.8) - pnorm(1.5);
probabilidad_c
## [1] 0.06425207

Por consiguiente, la probabilidad de que cierta cantidad de bombillos duren entre 650 y 780 horas es aproximadamente 0.0642.

12.0.4 Solución parte (d)

Debemos hallar el valor de \(k\) tal que el 5% de los bombillos tenga un tiempo de vida mayor que k horas. Es decir, hallar \(k\) tal que \[P(X >k) \;= \; 0.05\]

El código para escribir la expresión anterior es:

 $$P(X >k) \;= \; 0.05$$

En este caso, \(k=664.45\), valor calculado con R:

qnorm(1-0.05, mean=500, sd=100)
## [1] 664.4854

12.0.5 Solución parte (e)

Según el inciso (c), la probabilidad de que cierta cantidad de focos dure entre 650 y 780 horas (ambos inclusive) es \(p=0.0643\). Si se eligen \(n= 10000\) bombillos, entonces aproximadamente 643 bombillos tuvieron un tiempo de vida entre 650 y 780 horas (ambos inclusive):

\[ \text{Cantidad} \;= \; n p \;= \; (10000)(0.0643)\;= \; 642.5207 \;\approx \; 643\]

El código para escribir la expresión anterior es:

 $$ \text{Cantidad} \;= \; n p \;= \; (10000)(0.0643)\;= \; 642.5207  \;\approx \; 643$$
n <- 10000
p <- probabilidad_c
n*p
## [1] 642.5207

12.0.6 Solución parte (f)

Según el inciso (b), la probabilidad de que cierta cantidad de focos dure más de 780 horas es \(p=0.0026\). Se eligen \(n= 1200\) bombillos. Definamos como \(Y\) la variable aleatoria que representa al número de bombillos en la muestra que duran más de 780 horas. Entonces, \(Y\) tiene distribución binomial con parámetros \(n=1200\) y \(p=0.0026\).

Nos piden calcular la probabilidad de que al menos 3 duren más de 780 horas. Es decir,

\[P(Y\geq 3) \; = \; 1 \; -\; P(Y \leq 2) \; = \; 0.5917\]

El código para escribir la expresión anterior es:

 $$P(Y\geq 3) \; = \; 1 \; -\; P(Y \leq 2) \; = \; 0.5917$$
n <- 1200
p <- probabilidad_b
k <- 2
probabilidad_f <- 1 - pbinom(k, n, p)
probabilidad_f
## [1] 0.5917659

Por consiguiente, si se toma una muestra de 1200 bombillos, la probabilidad de que al menos 3 duren más de 780 horas es aproximadamente 0.5917.

12.0.7 Solución parte (g)

Según el inciso (a), la probabilidad de que cierta cantidad de focos dure menos de 650 horas es \(p=0.9332\). Se eligen \(n= 20\) bombillos. Definamos como \(W\) la variable aleatoria que representa al número de bombillos en la muestra que duran menos de 650 horas. Entonces, \(W\) tiene distribución binomial con parámetros \(n=20\) y \(p=0.9332\).

Nos piden calcular la probabilidad de que entre 16 y 19 (ambos inclusive) duren menos de 650 horas. Es decir,

\[P(16 \leq W\leq 19) \; = \; P(W \leq 19) \; -\; P(W \leq 15) \; = \; 0.7491 \;- \; 0.0088 \; = \; 0.7403\]

El código para escribir la expresión anterior es:

$$P(16 \leq W\leq 19) \; = \; P(W \leq 19) \; -\; P(W \leq 15) \; = \; 0.7491 \;- \;   0.0088 \; = \;  0.7403$$
n <- 20
p <- probabilidad_a
probabilidad_g <- pbinom(19, n, p) - pbinom(15, n, p)
probabilidad_g
## [1] 0.7403082

Por lo tanto, si se toma una muestra de 20 bombillos, la probabilidad de que entre 4 y 7 (ambos inclusive) duren menos de 650 horas es aproximadamente 0.7403.

12.0.8 Solución parte (h)

Según el inciso (a), la probabilidad de que cierta cantidad de focos dure menos de 650 horas es \(0.9332\). O sea, la probabilidad que no dure menos de ese tiempo es \[p\; = \; 1\; - \; 0.9332\; = \; 0.0668\]

El código para escribir la expresión anterior es:

$$p\; = \; 1\; - \; 0.9332\; = \; 0.0668$$ 

Se eligen \(n= 20\) bombillos. Sea \(V\) la variable que representa al número de bombillos en la muestra que no duran menos de 650 horas. Entonces, \(V\) tiene distribución binomial con parámetros \(n=20\) y \(p=0.0668\).

Nos piden calcular la probabilidad de que entre 16 y 19 (ambos inclusive) duren no menos de 650 horas. Es decir,

\[P(16 \leq V\leq 19) \; = \; P(V \leq 19) \; -\; P(V \leq 15) \; = \; 1 \;- \; 1 \; = \; 0\]

El código para escribir la expresión anterior es:

$$P(16 \leq V\leq 19) \; = \; P(V \leq 19) \; -\; P(V \leq 15) \; = \; 1 \;- \;   1 \; = \;  0$$
n <- 20
p <- 1-probabilidad_a
probabilidad_h <- pbinom(19, n, p) - pbinom(15, n, p)
probabilidad_h
## [1] 6.661338e-16

Por lo tanto, si se toma una muestra de 20 bombillos, la probabilidad de que entre 4 y 7 (ambos inclusive) NO duren menos de 650 horas es aproximadamente 0.

Observe que esta probabilidad no es el complemento de la hallada en el inciso (g), como se comprueba con R:

probabilidad_h == (1-probabilidad_g)
## [1] FALSE

13 Distribuciones binomial e hipergeométrica

El objetivo de esta sección es rrecordar ambas distribuciones, las cuales se mencionará y utilizarán más adelante. Para má detalles, puede verse las secciones 10.3 y 10.5 de https://rpubs.com/hllinas/toc.

13.0.1 Distribución binomial

  1. Supongamos que \(X\) tiene distribución binomial con parámetros \(n\) y \(p\). Entonces, la probabilidad de que se obtengan \(k\) éxitos es

\[P(X=k) \;=\; {n\choose x} p^k\, (1-p)^{n-k}, \qquad x=0,1,2, \ldots, n\]

El código para escribir la expresión anterior es:

$$P(X=k)  \;=\; {n\choose x} p^k\, (1-p)^{n-k}, \qquad x=0,1,2, \ldots, n$$
  1. La esperanza y varianza de la binomial vienen dadas por:

\[E(X)= np, \qquad V(X)= np(1-p)\]

El código para escribir la expresión anterior es:
$$E(X)= np, \qquad V(X)= np(1-p)$$
  1. Para hacer cálculos con R, podemos tener en cuenta los siguientes comentarios:
  1. El código correspondiente para calcular la función de probabilidad \(f(k)=P(X=k)\) de la variable aleatoria \(X\) es “dbinom(k, size = n, prob = p)”.

  2. El código correspondiente para calcular la función de distribución acumulada \(F(k) = P(X\leq k)\) de la variable aleatoria \(X\) es “pbinom(k, size = n, prob = p)”.

13.0.2 Distribución hipergeométrica

  1. Supongamos que \(X\) tiene distribución hipergeométrica con parámetros \(N\), \(M\) y \(n\). Entonces, la probabilidad de que se obtengan \(k\) éxitos es:

\[ P(X=k)\;= \; \frac{{M\choose k}\,{N-M\choose n-k}}{{N\choose n}}, \qquad \text{donde}\quad k=0,1,2, \ldots, n \quad \text{y}\quad n\leq N \]

El código para escribir la expresión anterior es:

$$ P(X=k)\;= \;  \frac{{M\choose k}\,{N-M\choose n-k}}{{N\choose n}}, \qquad  \text{donde}\quad k=0,1,2, \ldots, n \quad \text{y}\quad n\leq N $$
  1. Si \(p=\frac{M}{N}\) es la proporción de éxitos en la población, entonces: \[ E(X)\;=\; np \qquad \text{y}\qquad V(X)\;= \; n p(1-p)\cdot \left(\frac{N-n}{N-1}\right)\]
El código para escribir la expresión anterior es:

$$ E(X)\;=\; np \qquad \text{y}\qquad V(X)\;= \; n p(1-p)\cdot \left(\frac{N-n}{N-1}\right)$$
  1. Para hacer cálculos con R, podemos tener en cuenta los siguientes comentarios:
  1. El código correspondiente para calcular la función de probabilidad \(f(k)=P(X=k)\) de la variable aleatoria \(X\) es “dhyper(k, M, N-M, n)”.

  2. El código correspondiente para calcular la función de distribución acumulada \(F(k)=P(X\leq k)\) de la variable aleatoria \(X\) es “phyper(k, M, N-M, n)”.

13.0.3 Aproximación de la hipergeométrica a la binomial

Las distribuciones binomial e hipergeométrica coinciden cuando \(\frac{n}{N}\leq 0,05\). En este caso, el factor \(\frac{N-n}{N-1}\) se aproxima a 1 y la razón \(p= M/N\) es la proporción de los éxitos de la población. En resumen, tendríamos:

\[p\; = \; \frac{M}{N}, \qquad E(X)\;=\; np \qquad \text{y}\qquad V(X)\;= \; n p (1-p)\]

El código para escribir la expresión anterior es:

$$p\; = \, \frac{M}{N}, \qquad  E(X)\;=\; np \qquad \text{y}\qquad V(X)\;= \;  n p (1-p)$$

De manera gráfica, esta aproximación se puede visualizar así:

14 Aproximación de la binomial a la normal

  1. Sea \(q=1-p\).
  2. Consideremos un experimento binomial con parámetros \(n\) y \(p\). Supongamos que se cumple una de las dos condiciones siguientes:
  1. \(n\geq 30\)
  2. \(np\geq 5\) y \(nq\geq 5\)
El código para escribir la expresión anterior es:

(i) $n\geq 30$
(ii) $np\geq 5$ y $nq\geq 5$
  1. Entonces, la distribución binomial se puede aproximar a la distribución normal con los siguientes parámetros: \[\mu=np, \qquad \sigma^2=npq\]
El código para escribir la expresión anterior es:

$$\mu=np, \qquad     \sigma^2=npq$$
  1. Si \(X\) es una variable aleatoria que tiene distribución binomial con parámetros \(n\) y \(p\), entonces,

\[P(X\leq k) \;\approx \; P\left(Z\leq \frac{k + 0,5 - np}{\sqrt{npq}}\right)\]

El código para escribir la expresión anterior es:

$$P(X\leq k)  \;\approx \; P\left(Z\leq \frac{k + 0,5 - np}{\sqrt{npq}}\right)$$
  1. De manera gráfica, esta aproximación se puede visualizar así:

15 Aproximaciones de distribuciones discretas a la normal

En la figura de abajo se puede visualizar un resumen de algunas aproximaciones de distribuciones discretas a la distribución normal.

16 Ejemplo 7: Enunciado (control de calidad)

Un fabricante sabe por experiencia que de 17000 productos, el 4% es rechazado por defectos. Supongamos que un nuevo lote de 800 unidades va a ser inspeccionado.

a) Defina una variable que represente el número de productos rechazados y otra que número de productos no rechazados. Determine sus respectivas distribuciones, indicando también sus parámetros.
b) Verifique si la podemos aproximar la distribución hipergeómetrica a la binomial.
c) En caso que la respuesta en el inciso (b) sea afirmativa, determine la distribución discreta aproximada de cada una de las variables definidas en el inciso (a).
d) Verifique si podemos aproximar a la distribución normal.  En caso que la respuesta sea afirmativa, calcule los parámetros correspondientes. 
e) Calcule la probabilidad aproximada de que menos de 35 productos sean rechazados.
f) Calcule la probabilidad aproximada de que a lo más 760 productos no sean rechazados
g) Calcule la probabilidad aproximada de que al menos 761 productos no sean rechazados.
h) Calcule la probabilidad aproximada de que más de 45 productos sean rechazados.
i) Calcule la probabilidad aproximada de que menos de 35 o más de 45 productos sean rechazados.
j) Calcule la probabilidad aproximada de que menos de 35 y más de 45 productos sean rechazados.
k) Calcule la probabilidad aproximada de que por lo menos 766 productos no sean rechazados.
l) Calcule la probabilidad aproximada de que el número de productos no rechazados no exceda a 767.
m) Calcule la probabilidad aproximada de que entre 761 (inclusive) y 768 (no inclusive) productos no sean rechazados.

17 Ejemplo 7: Solución

17.0.1 Solución parte (a)

El enunciado nos dice que el 4% de los productos es rechazado por defectos. Por esta razón, en la población hay: \[(17000)(0.04) = 680 \; \text{rechazados}\quad \text{y} \quad (17000)(0.96) = 16320\; \text{no rechazados}\]

El código para escribir la expresión anterior es:

$$(17000)(0.04) = 680 \; \text{rechazados}\quad \text{y} \quad (17000)(0.96) = 16320\; \text{no rechazados}$$

Con base en lo anterior, definimos las siguientes dos variables aleatorias, con sus respectivos distribuciones:

  1. Sea \(X\) la variable aleatoria que representa el número de productos rechazados y tiene distribución hipergeométrica con parámetros \(N=17000\), \(M=680\) y \(n=800\).
  2. Sea Sea \(Y\) la variable aleatoria que representa el número de productos no rechazados y tiene distribución hipergeométrica con parámetros \(N=17000\), \(M=16320\) y \(n=800\).

Definamos en R, los parámetros correspondientes:

p <- 0.04    #A) Proporción de rechazados
q <- 1-p     #B) Proporción de no rechazados
N <- 17000   #C) Tamaño de la población N
Msi <- N*p   #D) Éxitos M (Número de rechazados)
Mno <- N*q   #E) Éxitos M (Número de no rechazados)
n <- 800     #F) Tamaño de la muestra n

17.0.2 Solución parte (b)

Se observa que:

\[\frac{n}{N} \; = \; \frac{800}{17000} \; = \; 0.047 \; < \; 0.05\]

El código para escribir la expresión anterior es:

$$ \frac{n}{N} \; = \; \frac{800}{17000} \; = \; 0.047 \; < \; 0.05$$
n/N
## [1] 0.04705882

O sea, podemos aplicar el teorema de aproximación de la hipergeométrica a la binomial.

17.0.3 Solución parte (c)

Como \(\frac{n}{N}= \frac{800}{17000} =0.047 \leq 0.05\), ya se explicó en el inciso (b) que podemos aplicar el teorema de aproximación de la hipergeométrica a la binomial. Entonces:

  1. \(X\) (número de productos rechazados) tiene distribución binomial aproximada con parámetros \(n=800\) y \(p=0.04\).
  2. \(Y\) (número de productos no rechazados) tiene distribución binomial aproximada con parámetros \(n=800\) y \(q=0.96\).

Definamos en R, los parámetros correspondientes:

p <- 0.04    #A) Proporción de rechazados
q <- 1-p     #B) Proporción de no rechazados
n <- 800     #C) Tamaño de la muestra n

17.0.4 Solución parte (d)

Como \(n=800 \geq 30\), entonces:

  1. \(X\) (número de productos rechazados) es aproximadamente normal con parámetros
    \[\mu=np=(800)(0.04)=32\qquad \text{y} \qquad \sigma^2=npq=(800)(0.04)(0.96)=30.72\]
El código para escribir la expresión anterior es:

$$\mu=np=(800)(0.04)=32\qquad \text{y} \qquad \sigma^2=npq=(800)(0.04)(0.96)=30.72$$
  1. \(Y\) (número de productos no rechazados) es aproximadamente normal con parámetros
    \[\mu=nq=(800)(0.96)=768\quad \text{y} \quad \sigma^2=npq=(800)(0.04)(0.96)=30.72\]
El código para escribir la expresión anterior es:

$$\mu=nq=(800)(0.96)=768\qquad \text{y} \qquad \sigma^2=npq=(800)(0.04)(0.96)=30.72$$

Observemos que también podemos aplicar la segunda condición del teorema de aproximación, puesto que se cumple \[np=(800)(0.0.4)=32 \geq 5 \qquad \text{y} \qquad nq=(800)(0.96)=768\geq 5\]

El código para escribir la expresión anterior es:

$$np=(800)(0.04)=32 \geq 5 \quad \text{y} \quad nq=(800)(0.96)=768\geq 5$$
n*p
## [1] 32
n*q
## [1] 768

Definamos en R, los parámetros correspondientes:

muSi <- n*p
muNo <- n*q
varianza <- n*p*q
sigma <- sqrt(varianza)

17.0.5 Solución parte (e)

Nos piden calcular la probabilidad aproximada de que menos de 35 productos sean rechazados: \(P(X<35)\). Aplicaremos el teorema de aproximación de la binomial a la normal, pero utilizando la variable \(X\). Es decir, consideraremos la expresión:

\[P(X\leq k) \;\approx \; P\left(Z\leq \frac{k + 0,5 - np}{\sqrt{npq}}\right)\]

El código para escribir la expresión anterior es:

$$P(X\leq k)  \;\approx \; P\left(Z\leq \frac{k + 0,5 - np}{\sqrt{npq}}\right)$$

Teniendo en cuenta los resultados encontrados en (d) con respecto a la variable \(X\), obtenemos:

\[P(X<35) \;=\; P(X\leq 34) \;\approx \;P\left(Z\leq \frac{34 + 0.5 -32}{\sqrt{30.72}}\right) \;= \; P(Z\leq 0.4511) \;= \; 0.6740 \]

El código para escribir la expresión anterior es:

$$P(X<35) \;=\;  P(X\leq 34) \;\approx \;P\left(Z\leq \frac{34 + 0.5 -32}{\sqrt{30.72}}\right) \;= \; P(Z\leq 0.4511) \;= \; 0.6740 $$

En R, esta probabilidad se puede calcular así (con la función “pnorm”):

k <- 34
n <- 800
p <- 0.04
q <- 1-p
muSi <- n*p
muNo <- n*q
mu <- muSi
sigma <- sqrt(n*p*q)
z <- (k +0.5-mu)/sigma 
probabilidad_e <- pnorm(z)
probabilidad_e
## [1] 0.674025

Por consiguiente, la probabilidad aproximada de que menos de 35 unidades sean rechazadas es de 0.6740.

17.0.6 Solución parte (f)

Nos piden calcular la probabilidad aproximada de que a lo más 760 productos no sean rechazados: \(P(Y\leq 760)\). Aplicaremos el teorema de aproximación de la binomial a la normal, pero utilizando la variable \(Y\). Es decir, consideraremos la expresión:

\[P(Y\leq k) \;\approx \; P\left(Z\leq \frac{k + 0,5 - nq}{\sqrt{npq}}\right)\]

El código para escribir la expresión anterior es:

$$P(Y\leq k)  \;\approx \; P\left(Z\leq \frac{k + 0,5 - nq}{\sqrt{npq}}\right)$$

Teniendo en cuenta los resultados encontrados en (d) con respecto a la variable \(Y\), obtenemos:

\[P(Y\leq 760) \;\approx \; P\left(Z\leq \frac{760 + 0.5 -768}{\sqrt{30.72}}\right) \;= \; P(Z\leq -1.3532) \;= \; 0.088 \]

El código para escribir la expresión anterior es:

$$P(Y\leq 760) \;\approx \; P\left(Z\leq \frac{760 + 0.5 -768}{\sqrt{30.72}}\right) \;= \; P(Z\leq -1.3532) \;= \; 0.088 $$

En R, esta probabilidad se puede calcular así (con la función “pnorm”):

k <- 760
n <- 800
p <- 0.04
q <- 1-p
muSi <- n*p
muNo <- n*q
mu <- muNo
sigma <- sqrt(n*p*q)
z <- (k +0.5-mu)/sigma 
probabilidad_f <- pnorm(z)
probabilidad_f
## [1] 0.08800151

Por consiguiente, la probabilidad aproximada de que a lo más 760 productos no sean rechazados es 0.088.

17.0.7 Solución parte (g)

Nos piden calcular la probabilidad aproximada de que al menos 761 productos no sean rechazados: \(P(Y\geq 761)\). Por la ley del complemento y el inciso (f), tenemos que:

\[P(Y \geq 761) \;= \; 1 \; - \; P(Y < 761) \;= \; 1 \; - \; P(Y \leq 760)\;= \; 1 \; - \; 0.088 \;= \; 0.912\]

El código para escribir la expresión anterior es:

$$P(Y \geq 761) \;= \; 1 \; - \; P(Y < 761) \;= \; 1 \; - \; P(Y \leq 760)\;= \; 1 \; - \; 0.088 \;= \; 0.912$$ 

En R, la probabilidad se calcula así:

probabilidad_g <- 1- probabilidad_f
probabilidad_g
## [1] 0.9119985

Por consiguiente, la probabilidad aproximada de que al menos 761 productos no sean rechazados es 0.912.

17.0.8 Solución parte (h)

Nos piden calcular la probabilidad aproximada de que más de 45 productos sean rechazados: \(P(X>45)\). Al aplicar la propiedad del complemento, tenemos:

\[P(X > 45) \;= \; 1 \; - \; P(X \leq 45)\]

El código para escribir la expresión anterior es:

$$P(X > 45) \;= \; 1 \; - \; P(X \leq 45)$$ 

Primero hallaremos \(P(X \leq 45)\). Primero, aplicaremos el teorema de aproximación de la binomial a la normal, pero utilizando la variable \(X\). Es decir, consideraremos la expresión:

\[P(X\leq k) \;\approx \; P\left(Z\leq \frac{k + 0,5 - np}{\sqrt{npq}}\right)\]

El código para escribir la expresión anterior es:

$$P(X\leq k)  \;\approx \; P\left(Z\leq \frac{k + 0,5 - np}{\sqrt{npq}}\right)$$

Teniendo en cuenta los resultados encontrados en (d) con respecto a la variable \(X\), obtenemos:

\[P(X\leq 45) \;\approx \; P\left(Z\leq \frac{45 + 0.5 -32}{\sqrt{30.72}}\right) \;= \; P(Z\leq 2.4357) \;= \; 0.9926 \]

El código para escribir la expresión anterior es:

$$P(X\leq 45) \;\approx \; P\left(Z\leq \frac{45 + 0.5 -32}{\sqrt{30.72}}\right) \;= \; P(Z\leq 2.4357) \;= \; 0.9926 $$

En R, esta probabilidad se puede calcular así (con la función “pnorm”):

k <- 45
n <- 800
p <- 0.04
q <- 1-p
muSi <- n*p
muNo <- n*q
mu <- muSi
sigma <- sqrt(n*p*q)
z <- (k +0.5-mu)/sigma 
probabilidad_h1 <- pnorm(z)
probabilidad_h1
## [1] 0.9925684

\[P(X > 45) \;= \; 1 \; - \; P(X \leq 45)\;= \; 1 \; - \; 0.9926 \;= \; 0.0074\]

El código para escribir la expresión anterior es:

$$P(X > 45) \;= \; 1 \; - \; P(X \leq 45)\;= \; 1 \; - \; 0.9926 \;= \; 0.0074$$  

En R, la probabilidad se calcula así:

probabilidad_h <- 1- probabilidad_h1
probabilidad_h
## [1] 0.007431576

Por consiguiente, la probabilidad aproximada de que más de 45 productos sean rechazados es 0.0074.

17.0.9 Solución parte (i)

Nos piden calcular la probabilidad aproximada de que menos de 35 o más de 45 productos sean rechazados: \(P(X<35) + P(X>45)\). Teniendo en cuenta los incisos (e) y (h), la probabilidad pedida es: \[P(X<35) + P(X>45) \;= \; 0.6740 \; + \; 0.0074 \; = \; 0.6816\]

El código para escribir la expresión anterior es:

$$P(X<35) + P(X>45) \;= \; 0.6740 \; + \; 0.0074  \; = \; 0.6816$$

En R, la probabilidad se calcula así:

probabilidad_i <- probabilidad_e + probabilidad_h
probabilidad_i
## [1] 0.6814566

Por lo tanto, la probabilidad aproximada de que menos de 35 o más de 45 productos sean rechazados es 0.6816.

17.0.10 Solución parte (j)

Nos piden calcular la probabilidad aproximada de que menos de 35 y más de 45 productos sean rechazados. Como los eventos “menos de 35” y “más de 45” no se pueden cumplir al mismo tiempo, entonces, la probabilidad pedida es 0. En R:

probabilidad_j <- 0
probabilidad_j
## [1] 0

17.0.11 Solución parte (k)

Nos piden calcular la probabilidad aproximada de que por lo menos 766 productos no sean rechazados: \(P(Y \geq 766)\). En la tabla de abajo se muestra la relación entre los números de artículos rechazados y no rechazados.

En ella observamos que los eventos “por lo menos 766 productos no rechazados”, “más de 765 productos rechazados” y “menos de 35 productos rechazados” equivalentes. Es decir, las probabilidades correspondientes son iguales. Por consiguiente, por el inciso (e), se tiene que:

\[P(Y\geq 766) \; = \; P(Y>765) \; = \; P(X < 35) \; = \; 0.674\]

El código para escribir la expresión anterior es:

$$P(Y\geq 766) \; = \; P(Y>765) \; = \; P(X < 35) \; = \; 0.674$$

En R: la probabilidad se calcula así:

probabilidad_k <- probabilidad_e
probabilidad_k
## [1] 0.674025

Por lo tanto, la probabilidad aproximada de que por lo menos 766 productos no sean rechazados es 0.6740.

17.0.12 Solución parte (l)

Nos piden calcular la probabilidad aproximada de que el número de productos no rechazados no exceda a 767: \(P(Y \leq 767)\). Por la propiedad del complemento y el inciso (k), tenemos:

\[P(Y \leq 767) \;= \; 1 \;- \; P(Y\geq 766)\;= \; 1 \;- \; 0.674 \;= \;0.3259 \]

El código para escribir la expresión anterior es:

$$P(Y \leq 767) \;= \; 1 \;- \; P(Y\geq 766)\;= \; 1 \;- \; 0.674 \;= \;0.3259  $$

En R:

probabilidad_l <- 1 - probabilidad_k
probabilidad_l
## [1] 0.325975

Por consiguiente, la probabilidad aproximada de que el número de productos no rechazados no exceda a 767 es 0.3259.

17.0.13 Solución parte (m)

Nos piden calcular la probabilidad aproximada de que entre 761 (inclusive) y 768 (no inclusive) productos no sean rechazados: \(P(761 \leq Y < 768)\).

Teniendo en cuenta los incisos (f) y (l), obtenemos:

\[P(761 \leq Y < 768) \;=\; P(Y \leq 767) \;-\; P(Y\leq 760) \;= \; 0.3259 - 0.0880\;= \;0.2379\]

El código para escribir la expresión anterior es:

$$P(761 \leq Y < 768) \;=\; P(Y \leq 767) \;-\; P(Y\leq 760) \;= \; 0.3259 - 0.0880\;= \;0.2379$$

En R:

probabilidad_m <- probabilidad_l - probabilidad_f
probabilidad_m
## [1] 0.2379735

18 Ejercicios

Crear un nuevo documento R Markdown, realizando los ejercicios que se indican abajo. Interprete los resultados hallados.

  1. Se ha comprobado que el tiempo que tardan los contribuyentes en diligenciar el formulario para la declaración de renta sigue una distribución normal con media 100 minutos y desviación estándar 30 minutos.

    1. ¿Cuál es la probabilidad de un contribuyente elegido al azar tarde entre 70 y 130 minutos en diligenciar este formulario?
    2. Halle el valor de k tal que el 5% de los contribuyentes tarda más de k minutos en diligenciar el formulario.
    3. Se eligen 50000 contribuyentes al azar. ¿Aproximadamente cuántos tardan más de 1 hora en diligenciar el formulario?
    4. Se eligen 7 contribuyentes al azar. ¿Cuál es la probabilidad que entre 3 y 5 de ellos tarde más de 2 horas en diligenciar el formulario?
  2. Se estima que la cantidad de dinero que gastan en gasolina los clientes de una estación de servicio sigue una distribución normal con desviación estándar de 15000 pesos.

    1. Halle el valor de la media si se ha encontrado que el 4% de los clientes gasta más de 70000 pesos.
    2. Use el valor de la media hallada en (a) para calcular la probabilidad de que un cliente elegido al azar gaste entre 35000 y 40.000 pesos.
    3. Encuentre el valor de k para que 0.10 sea la probabilidad de que un cliente elegido al azar gaste un valor que excede a la media encontrada en la parte (a) en por lo menos k unidades?
    4. Se eligen 7 clientes al azar. ¿Cuál es la probabilidad que menos de 5 de ellos gaste más de 50000 pesos?
  3. Un grupo grande de estudiantes hace un examen de economía. Las notas se distribuyen según una normal con media 3.2.

    1. Halle la desviación estándar si se sabe que la probabilidad de que un estudiante elegido al azar obtenga una nota menor que 4,5 es 0.9332.
    2. ¿Cuál es la probabilidad que un estudiante elegido al azar obtenga una nota entre 3.5 y 4.0?
    3. Halle el valor de k tal que la probabilidad de que un estudiante elegido al azar obtenga una nota mayor que k se de 0.78.
    4. Se eligen 5 clientes al azar. ¿Cuál es la probabilidad de que al menos 2 de ellos obtenga más de 2.8 en el examen?
  4. Una empresa ofrece a sus empleados un seguro de atención dental. Un estudio reciente demuestra que el costo anual por empleado tuvo una distribución normal, con media de 1280 USD y una desviación estándar de 420 USD anuales

    1. ¿Cuál es la probabilidad de que un empleado elegido al azar gaste entre 1500 y 2000 USD anuales en gastos dentales?
    2. ¿Cuánto es el costo mínimo para estar en el 10% más alto por atención dental anual?
    3. Si se eligen 8.000 empleados al azar, ¿aproximadamente cuántos gastan más de 1800 USD?
    4. Si se eligen 7 empleados al azar, ¿cuál es la probabilidad de que entre 3 (no inclusive) y 6 (inclusive) de ellos gasten entre 1800 USD y 2000 USD?
  5. Un administrador estima el costo de ejecutar determinadas labores como una variable normal con media 500000 COP y desviación estándar de 50000 COP.

    1. ¿Cuál es la probabilidad de que una labor elegida al tenga un costo entre 150000 y 200000 COP?
    2. ¿Cuánto es el costo mínimo para estar en el 15% más alto por cada labor?
    3. Se eligen al azar 30000 de estas labores (independientes). ¿Aproximadamente cuántas tienen un costo mayor que 460000 COP?
    4. Se eligen al azar 6 de estas labores (independientes), ¿cuál es la probabilidad de que entre 2 y 5 (ambos inclusive) tengan un costo entre 300000 y 460000 COP?
  6. El precio de las acciones de un banco al final de cada jornada de comercialización del año previo se rigió por una distribución normal. Suponga que durante el año hubo 240 jornadas de comercialización, que el precio medio fue de $42 por acción y la desviación estándar, de $2.25.

    1. Halle la probabilidad de que, en una jornada seleccionada al azar, el precio de las acciones sea más de $50.
    2. ¿Cuántas jornadas calcularía usted tuvo un precio por acción que osciló entre $40 y $45?
    3. ¿Cuál fue el precio de las acciones que se mantuvo más alto 25% de las jornadas?
    4. Halle la probabilidad de que en al menos 100 jornadas el precio de la acción osciló entre $25 y $45.
  7. El tiempo de vida de un neumático puede representarse mediante una distribución normal con media 35000 kilómetros y desviación estándar de 4000 kilómetros.

    1. Halle la probabilidad de que el tiempo de un neumático sea más de 30000 kilómetros.
    2. Halle el valor de k tal que la probabilidad de que el tiempo de vida de un neumático sea menor que k es 0.95.
    3. Se toma una muestra de 80000 de estos neumáticos. ¿Aproximadamente cuántos tienen un tiempo de vida superior a los 38000 kilómetros?
    4. Se toma una muestra de 5 de estos neumáticos. ¿Cuál es la probabilidad (aproximada) de que entre 1 (inclusive) y 4 (no inclusive) de ellos tengan un tiempo de vida inferior a los 40000 kilómetros?
  8. Los puntos en una prueba de aptitud se distribuyen según una normal con media 420 y desviación típica 80.

    1. Si se elige una persona al azar, ¿cuál es la probabilidad de que obtenga una puntuación entre 400 y 500?
    2. ¿Cuál es la mínima puntuación necesaria para estar entre el 10% mejor?
    3. Para una persona elegida al azar, sin hacer los cálculos, determinar en cuál de los siguientes intervalos es más probable que esté su puntuación: 400-440, 440-480.
    4. Si se eligen 5 personas al azar, ¿cuál es la probabilidad de que al menos 2 obtenga más de 500 puntos?
  9. Una determinada librería recientemente inaugurada ofrece, además de la propia consulta de libros, los servicios de cafetería. Para una próxima exposición en la Feria del libro, la empresa ha decidido solicitar a una fábrica textil la elaboración de camisetas promocionales de la librería. La fábrica textil, decide hacer camisetas de tres tallas: L, XL, XXL. Dado que todas las camisetas serán bastante anchas, lo que hará optar por una talla u otra será la altura. Para ello, la fábrica, tras realizar el estudio pertinente, concluye que las alturas de los posibles compradores potenciales seguirán una distribución normal, con media 165,4 cm. y desviación estándar 8,3 cm.

    1. Supongamos que la fábrica ya tiene los patrones hechos, y recomienda la talla L hasta 161 cm., talla XL hasta 179 cm. y talla XXL para alturas superiores. Bajo estas condiciones, ¿qué proporción de camisetas de cada tipo es razonable que se fabriquen?
    2. Supongamos, ahora, que por razones de mercado, la empresa cree conveniente fabricar el 15% de camisetas de la talla L, el 63% de la talla XL y el 22% restante de la talla XXL. ¿Cuáles serán los límites de alturas con que se tendría que diseñar cada talla?
    3. Supongamos que se escoge una muestra de 5 patrones ya hechos. ¿Cuál es la probabilidad de que al menos 2 de las camisetas fabricadas tengan una talla L hasta 163 cm.
    4. Supongamos que se escoge una muestra de 30000 patrones ya hechos. ¿Aproximadamente cuántas camisetas tienen una talla L entre 160 y 162 cm.
  10. Se supone que los resultados de un examen tienen una distribución normal con una media de 4.0 y una desviación estándar de 0.3.

    1. ¿Cuál es la probabilidad de que una persona que presenta el examen obtenga calificación mayor que 3.6?
    2. Suponga que a los estudiantes que se encuentran en el 10% de la parte superior de la distribución se le asigna una A. ¿Cuál es la calificación mínima que debe obtener un estudiante para tener una calificación de A?
    3. ¿Cuál debe ser la mínima calificación aprobatoria si el evaluador pretende que solamente el 28.1% de los estudiantes apruebe?
    4. Si 1000 estudiantes presentan el examen, ¿cuántos estudiantes tienen calificaciones que exceden por los menos en 0.5 a la calificación reprobatoria del 25% (de calificaciones inferiores)?
  11. Un abogado se traslada diariamente desde su casa (en los suburbios) a su oficina en el centro de la ciudad. En promedio, el viaje le toma 24 minutos con una desviación estándar de 3.8 minutos. Asuma que la distribución de los tiempos de traslado está normalmente distribuida.

    1. Si la oficina abre a las 9:00 a.m y él sale de su casa a las 8:45 a.m diariamente, ¿qué porcentaje de las veces llega tarde a su trabajo?
    2. Si deja su casa a las 8:35 a.m y en la oficina se sirve un café entre las 8:50 y las 9:00 a.m, ¿cuál es la probabilidad de que le sirvan el café?
    3. Encuentre el periodo por encima del cual se encuentra el 15% de los traslados más lentos.
    4. Suponga que se toma una muestra de 5 viajes que ha realizado el abogado. Si el abogado siempre sale de su casa a las 8:30 a.m, calcule la probabilidad de que en al menos 2 viajes haya llegado entre las 9:05 a.m. y 9:20 a.m.
  12. De una producción de 6000 tornillos se sabe que el 4% está defectuosos. Supongamos que se selecciona un muestra al azar de 33 tornillos.

    1. ¿Cuál es la probabilidad de que el número de tornillos no defectuosos en la muestra no exceda a 27?
    2. ¿Cuál es la probabilidad de que el número de tornillos defectuosos en la muestra sea por lo menos 18?
    3. ¿Cuál es la probabilidad de que el número de tornillos no defectuosos en la muestra sea estrictamente mayor que 2 pero menor o igual a 19?
    4. ¿Cuál es la probabilidad de que más de 25 de los tornillos esté defectuoso?
  13. Un fabricante de celulares desea controlar la calidad de su producto y rechazar cualquier lote en el que la proporción de celulares defectuosos sea demasiado alta. Con este fin, de un lote de 30.000 celulares selecciona y prueba 35. Si por lo menos 4 de éstos están defectuosos, todo el lote será rechazado. Suponga que 20% de los celulares de todo el lote está defectuoso.

    1. ¿Cuál es la probabilidad de que el lote sea rechazado?
    2. ¿Cuál es la probabilidad de que en la muestra haya entre 14 y 18 celulares defectuosos (ambos inclusive)?
    3. ¿Cuál es la probabilidad de que en la muestra haya más de 17 celulares defectuosos?
    4. ¿Qué sucedería con la probabilidad de la parte (a) si el número crítico para rechazo aumentara de 4 a 5?
  14. Una institución de beneficiencia contrata personal para que soliciten donaciones por teléfono. Después de un breve período de preparación, las personas telefonean a los potenciales donantes y se les paga una comisión. La experiencia indica que normalmente estas personas logran sólo un éxito moderado, y el 80% de 4000 de ellas deja el trabajo en las tres primeras semanas. La institución contrata 36 personas, las cuales se pueden considerar como una muestra aleatoria.

    1. ¿Cuál es la probabilidad de que menos de 22 personas dejen el trabajo en las tres primeras semanas?
    2. ¿Cuál es la probabilidad de que más de 28 personas no dejen el trabajo en las primeras tres semanas?
    3. ¿Cuál es la probabilidad de que al menos 24 personas dejen el trabajo en las tres primeras semanas?
    4. ¿Cuál es la probabilidad de que a lo más 22 o más de 26 personas no dejen el trabajo en las tres primeras semanas?
  15. Una empresa se dedica a la instalación de nuevos paquetes computacionales. Se ha comprobado que en el 15% de 2500 instalaciones es necesario volver para realizar algunas modificaciones. En una semana determinada se realizaron 35 instalaciones. Asumir independencia en los resultados de esas instalaciones.

    1. ¿Cuál es la probabilidad de que sea necesario no volver en menos de 28 casos?
    2. ¿Cuál es la probabilidad de que no sea necesario volver entre 18 y 35 (ambos inclusive) de los casos?
    3. ¿Cuál es la probabilidad de que sea necesario no volver en más de 27 casos?
    4. ¿Cuál es la probabilidad de que sea necesario volver en menos de 22 casos o más de 26 casos?
  16. Al realizar una entrevista a un grupo de personas con el fin de ingresar en un programa de televisión, se encuentra que 30% de 1500 personas no cumplen con los requisitos requeridos. Se entrevistan a 34 personas.

    1. ¿Cuál es la probabilidad de que menos de 24 cumplan con los requisitos requeridos?
    2. ¿Cuál es la probabilidad de que de 14 a 27 no cumplan con los requisitos requeridos?
    3. ¿Cuál es la probabilidad de que más de 26 cumplan con los requisitos requeridos?
    4. ¿Cuál es la probabilidad de que menos de 23 o más de 29 no cumplan con los requisitos requeridos?
  17. Una investigación en cierto país arrojó que aproximadamente 80% de 1000 personas cree el actual presidente de ese país está haciendo las cosas bien. Se seleccionan 33 personas al azar.

  1. ¿Cuál es la probabilidad de que al menos 26 no sean de esta opinión?
  2. ¿Cuál es la probabilidad de que menos de 16 sean de esta opinión?
  3. ¿Cuál es la probabilidad de que a lo más 27 no sean de esta opinión?
  4. ¿Cuál es la probabilidad de que más de 19 sean de esta opinión?
  1. Una tienda de deportes generalmente compra lotes grandes de cierta marca de balones de fútbol. Se sabe generalmente que 70% de un lote de 20.000 balones no está defectuoso. Se utiliza un método que rechaza un lote si se encuentran 4 o más unidades defectuosas en una muestra aleatoria de 35 unidades.
    1. ¿Cuál es la probabilidad de aceptar el lote?
    2. ¿Cuál es la probabilidad de que en la muestra haya menos de 27, pero más de 33 unidades no defectuosas?
    3. ¿Cuál es la probabilidad de que en la muestra a lo más 26 unidades defectuosas?
    4. ¿Qué sucedería con la probabilidad de la parte (a) si el número crítico para rechazo disminuyera de 4 a 3?
  2. Cada uno de los 9000 computadores de cierta marca ha sido devuelto a un proveedor debido al mal funcionamiento de ciertos programas bajo un determinado sistema operativo. Supongamos que el 24% de estos computadores tienen problemas con la memoria RAM y los otros tienen problemas con los ejecutables EXE. Si se examinan al azar y con reemplazo 33 de estos computadores,
    1. ¿Cuál es la probabilidad de que menos de la mitad de los computadores tengan problemas con la memoria RAM?
    2. ¿Cuál es la probabilidad de que más de 18 computadores tengan problemas con la memoria EXE?
    3. ¿Cuál es la probabilidad de que estrictamente entre 21 y 25 de los computadores tengan problemas con la memoria RAM?
    4. ¿Cuál es la probabilidad de que menos 25 o más de 27 de los computadores tengan problemas con la memoria EXE?
  3. Se embarcan ventiladores eléctricos en un lote de 7500. Antes de aceptar un lote, un inspector elige 33 de esos ventiladores y los inspecciona. Si 1 o menos de los probados está defectuoso, el lote será aceptado; si 2 o más tienen defectos, se revisará todo el lote. Suponga que en todo el lote el 20% de los ventiladores está deficiente.
    1. ¿Cuál es la probabilidad de que no se necesite un 100% de inspección?
    2. ¿Cuál es la probabilidad de que más de 22 ventiladores estén defectuosos?
    3. ¿Cuál es la probabilidad de que al menos 25 ventiladores no estén defectuosos?
    4. ¿Cuál es la probabilidad de que menos 14 o más de 26 ventiladores estén defectuosos?
  4. Una empresa recibe un pedido de 7000 artículos que contiene el 25% de artículos defectuosos. Se analiza una muestra aleatoria de 37 artículos y se acepta el pedido si menos de 2 resultan defectuosos.
    1. ¿Cuál es la probabilidad de aceptar el pedido?
    2. ¿Cuál es la probabilidad de que menos de la mitad estén defectuosos?
    3. ¿Cuál es la probabilidad de que más de la mitad no estén defectuosos?
    4. ¿Cuál es la probabilidad de que menos 23 o más de 27 de artículos no estén defectuosos?
  5. Un producto industrial se envía en lotes de 6500 unidades. Efectuar pruebas para determinar si un artículo tiene defectos es costoso; así que el fabricante toma muestras de su producción en vez de probar el 100%. Un plan de muestreo elaborado para reducir al mínimo la cantidad de artículos defectuosos que se envían a los consumidores requiere que se muestreen 38 artículos del lote y el rechazo del lote completo si se encuentra más de 3 artículos defectuosos. Si el lote es rechazado, se prueba cada artículo del lote. Suponga que el 60% de los artículos del lote no están defectuosos.
    1. ¿Cuál es la probabilidad de que no se necesite un 100% de inspección?
    2. ¿Cuál es la probabilidad de que entre 25 (no inclusive) y 28 (inclusive) artículos estén defectuosos?
    3. ¿Cuál es la probabilidad de que al menos 36 artículos no estén defectuosos?
    4. ¿Cuál es la probabilidad de que menos 23 o más de 30 de artículos no estén defectuosos?

Bibliografía

  1. LLinás, H., Rojas, C. (2005); Estadística descriptiva y distribuciones de probabilidad. Barranquilla: Editorial Universidad del Norte.

  2. Consultar mis Notas de clase: Cap. 4 (Continua).

  3. Consultar el documento RPubs :: Enlace y materiales de ayuda.