hllinas2023

1 Función de densidad normal

1.0.1 Definición de \(f\)

La función de densidad de la distribución normal con parámetros \(\mu\) y \(\sigma^2\) está dada por:

\[f(x)\;= \; \frac{1}{\sqrt{2 \pi \sigma^2}} \, e^{-\frac{(x-\mu)^2} {2 \sigma^2}}, \qquad \text{para todo $x$ real}\]

El código para escribir la expresión anterior es:

$$f(x)\;= \; \frac{1}{\sqrt{2 \pi \sigma^2}} \, e^{-\frac{(x-\mu)^2} {2 \sigma^2}}, \qquad \text{para todo $x$ real}$$

1.0.2 \(f\) en R

En R la función “dnorm(x, mean, sd)” nos ayuda a utilizar la densidad de la distribución normal. Aquí:

  1. \(x\) es un vector de números.

  2. “mean” es un valor del parámetro \(\mu\). Por defecto, su valor es 0.

  3. “sd” es un valor de \(\sigma\). Por defecto, su valor es 1.

2 Ejemplo 1: Gráfica de \(f\)

En el siguiente ejemplo, observamos la gráfica de la función de densidad normal para una variable aleatoria \(X\) que tiene distribución normal con parámetros \(\mu=2\) y \(\sigma=1.1\):

# Crear una sucesión de números entre -9 y 9, aumentando en 0.05.
x <- seq(-9, 9, by = 0.05)

# Suponiendo que los parámetros son: mu=2 y sigma=1.1.
y <- dnorm(x, mean = 2, sd = 1.1)

# Gráfica de la densidad normal
plot(x,y)

3 Función de distribución acumulada normal

3.0.1 Definición de \(F\)

La función de distribución acumulada normal se simboliza por \(F\) o \(\Phi\). Su definición es:

\[F(t) \; = \; \Phi(t) = P(X \leq t), \qquad \text{para todo $t$ real}\]

El código para escribir la expresión anterior es:

$$ F(t) \; = \;\Phi(t) = P(X \leq t), \qquad \text{para todo $t$ real}$$

3.0.2 \(F\) en R

En R la función pnorm(x, mean, sd) nos ayuda a utilizar esta función. Aquí, nuevamente:

  1. \(x\) es un vector de números.

  2. “mean” es un valor del parámetro \(\mu\). Por defecto, su valor es 0.

  3. “sd” es un valor de \(\sigma\). Por defecto, su valor es 1.

4 Ejemplo 2: Gráfica de \(F\)

En el siguiente ejemplo, observamos la gráfica de la función de distribución acumulada para una variable aleatoria \(X\) que tiene distribución normal con parámetros \(\mu=2\) y \(\sigma=1.1\):

# Crear una sucesión de números entre -9 y 9, aumentando en 0.05.
x <- seq(-9, 9, by = 0.05)

# Suponiendo que los parámetros son: mu=2 y sigma=1.1.
y <- pnorm(x, mean = 2, sd = 1.1)

# Gráfica de la densidad normal
plot(x,y)

5 Ejemplo 3: Cálculo de probabilidades

Con “pnorm” podemos calular probabilidades. Por ejemplo, si \(X\) tiene distribución normal con parámetros \(\mu=2\) y \(\sigma=1.1\), entonces, calcular:

a) La probabilidad de que X sea menor o igual que 3.

b) La probabilidad de que X sea mayor o igual que 3.

5.0.1 Solución parte (a)

La probabilidad de que \(X\) sea menor o igual que 3 es:

\[P(X \leq 3) \; = \; 0.8183\]

El código para escribir la expresión anterior es:

$$P(X \leq 3) \; = \; 0.8183$$
pnorm(3, mean = 2, sd = 1.1)
## [1] 0.8183489

5.0.2 Solución parte (b)

La probabilidad de que \(X\) sea mayor o igual que 3 es: \[P(X \geq 3) \; = \; 0.1817\]

El código para escribir la expresión anterior es:

$$P(X \geq 3) \; = \; 0.1817$$
pnorm(3, mean = 2, sd = 1.1, lower.tail=FALSE)
## [1] 0.1816511

Observe que, en R, se ha utilizado el argumento “lower.tail=FALSE” para calcular esta probabilidad. Además, observe también que se pudo haber calculado la propiedad del complemento para calcula esta probabilidad:

\[P(X \geq 3) \; = \; 1- P(X \leq 3) \; = \; 1- 0.8183 \; = \;0.1817\]

El código para escribir la expresión anterior es:

$$P(X \geq 3) \; = \; 1- P(X \leq 3) \; = \; 1- 0.8183 \; = \;0.1817$$

6 Propiedades de la distribución normal

6.0.1 Propiedad 1

Si \(X\) es normal con parámetros \(\mu\) y \(\sigma^2\), entonces, \[E(X)=\mu, \qquad V(X)=\sigma^2\]

El código para escribir la expresión anterior es:

$$E(X)=\mu, \qquad  V(X)=\sigma^2$$

6.0.2 Propiedad 2

Hay toda una familia de distribuciones normales. Cada distribución normal específica se distingue por \(\mu\) y \(\sigma\) (compárese con la figura 4.1).

En la figura 4.1 podemos observar que:

  1. La densidad normal es creciente para \(x<\mu\) y decreciente para \(x>\mu\). Es decir, el punto más alto de la densidad normal se obtiene cuando \(x=\mu\) (véase las figuras 4.1a,b).

  2. Las colas, es decir, los extremos o los lados de la densidad normal se prolongan al infinito en ambas direcciones y nunca tocan el eje horizontal (véase las figuras 4.1a,b).

  3. La desviación estándar \(\sigma\) determina el ancho de la curva (véase la figura 4.1b).

  4. En la figura 4.1c se ilustra el comportamiento de dos gráficas de la distribución acumulada normal para \(\sigma_1 <\sigma_2\).

6.0.3 Propiedad 3

  1. La densidad normal es simétrica con respecto a \(\mu\).

  2. La densidad normal es unimodal.

  3. La media, la mediana y la moda son todas iguales.

7 La distribución normal estándar

7.0.1 Definición

Aquella distribución normal con esperanza 0 y varianza 1. La variable aleatoria asociada se simbolizará con \(Z\).

7.0.2 Propiedades

  1. Simétrica con respecto a 0.

  2. De la figura 4.2: El área de la región I es igual al área de la región II.

7.0.3 Fórmula \(Z\)

Sea \(X\) una variable aleatoria que tiene distribución normal con parámetros \(\mu\) y \(\sigma^2\). Entonces, la siguiente variable tiene distribución normal estándar:

\[Z=\frac{X-\mu}{\sigma}\]

El código para escribir la expresión anterior es:
$$Z=\frac{X-\mu}{\sigma}$$

7.0.4 Estandarización a \(Z\)

Sea \(X\) una variable aleatoria que tiene distribución normal con parámetros \(\mu\) y \(\sigma^2\). Entonces, para todo número real \(t\), se cumple que:

\[P(X \leq t) \quad =\quad P(X\; -\; \mu \leq t\; -\; \mu) \quad = \quad P\Big(\frac{X-\mu}{\sigma} \leq \frac{t-\mu}{\sigma}\Big) \quad =\quad P\Big(Z \leq \frac{t-\mu}{\sigma}\Big)\]

El código para escribir la expresión anterior es:

$$P(X \leq t)  \quad =\quad P(X\; -\; \mu \leq   t\; -\; \mu) \quad = \quad
 P\Big(\frac{X-\mu}{\sigma} \leq \frac{t-\mu}{\sigma}\Big)    \quad =\quad  P\Big(Z \leq \frac{t-\mu}{\sigma}\Big)$$

Es decir,

\[P(X \leq t) \; =\; P\Big(Z \leq \frac{t-\mu}{\sigma}\Big)\]

El código para escribir la expresión anterior es:

$$P(X \leq t) \; =\; P\Big(Z \leq \frac{t-\mu}{\sigma}\Big)$$

8 Ejemplo 4: probabilidades con \(Z\)

Si \(X\) es una variable normal con media \(\mu=50\) y varianza \(\sigma^2=100\), calcule las siguientes probabilidades utilizando la distribución normal estándar.

a) La probabilidad de que X sea menor o igual que 40.

b) La probabilidad de que X se encuentre entre -60 y 60 (ambos inclusive).

8.0.1 Solución parte (a)

La probabilidad de que \(X\) sea menor o igual que 40 es: \[P(X\leq 40) \; =\; P\Big(Z \leq \frac{40-50}{10}\Big)\; =\; P(Z\leq -1) \; =\; 0.1587\]

El código para escribir la expresión anterior es:

$$P(X\leq 40) \; =\;  P\Big(Z \leq \frac{40-50}{10}\Big)\; =\; P(Z\leq -1) \; =\; 0.1587$$

En R se utiliza solo la función pnorm(z) para la distribución normal estándar:

z <- -1
pnorm(z)
## [1] 0.1586553

8.0.2 Solución parte (b)

La probabilidad de que \(X\) se encuentre entre -60 y 60 (ambos inclusive) es:

\[\begin{eqnarray*} P(|X| \leq 60) &=& P(-60 \leq X \leq 60)\; =\; P(X\leq 60) \; - \; P(X\leq -60) \\ &=& P\Big(Z \leq \frac{60-50}{10}\Big) \; - \; P\Big(Z \leq \frac{-60-50}{10}\Big)\\ &=& P(Z \leq 1) - P(Z\leq -11) = 0.8413 - 0 \; =\; 0.8413 \end{eqnarray*}\]

El código para escribir la expresión anterior es:

\begin{eqnarray*}
    P(|X| \leq 60) &=& P(-60 \leq X  \leq 60)\; =\;  P(X\leq 60) \; - \; P(X\leq -60) \\
     &=&  P\Big(Z \leq \frac{60-50}{10}\Big) \; - \;  P\Big(Z \leq \frac{-60-50}{10}\Big)\\
     &=& P(Z \leq 1) - P(Z\leq -11) = 0.8413  - 0 \; =\; 0.8413
\end{eqnarray*}

En R:

z1 <- 1
z2 <- -11
pnorm(z1) - pnorm(z2)
## [1] 0.8413447

9 Cuantil de una normal

9.0.1 Definición

Supongamos que \(X\) tiene distribución normal con media \(\mu\) y desviación estándar \(\sigma\). Para \(0 < \alpha < 1\), el símbolo \(x_\alpha\) es un valor cuantil de la distribución normal si cumple con la condición: \[P(X \geq x_\alpha) \;= \; \alpha\]

El código para escribir la expresión anterior es:

$$P(X \geq x_\alpha) \;= \; \alpha$$

9.0.2 En R: Cuantil para cualquier normal

En R, un valor cuantil de la distribución normal puede ser calculada con cualquiera de las dos siguientes maneras equivalentes:

  1. qnorm(\(1-\alpha\), mean, sd).

  2. qnorm(\(\alpha\), mean, sd, lower.tail = FALSE).

Aquí:

  1. \(\alpha\) es un vector de probabilidades.

  2. “mean” es un valor de la media muestral. Por defecto, su valor es 0.

  3. “sd” es la desviación estándar. Por defecto, su valor es 1.

9.0.3 En R: Cuantil para la normal estándar

En la distribución normal estándar, el cuantil puede ser calculada con cualquiera de las dos siguientes maneras equivalentes:

  1. qnorm(\(1-\alpha\))

  2. qnorm(\(\alpha\), lower.tail = FALSE).

10 Ejemplo 5: Calcular un cuantil

A manera de ejemplo, supongamos que \(X\) tiene distribución normal con media \(\mu=2\) y desviación estándar \(\sigma=1.1\). Sea \(Z\) la variable aleatoria que tiene distribución normal estándar. Hallar el valor de \(k\) tal que:

  1. \(P(X \geq k)= 0.83\).

  2. \(P(X \leq k)= 0.95\).

  3. \(P(k < X < 3.1)= 0.75\).

  4. \(P(-k < Z < k)= 0.95\).

El código para escribir la expresión anterior es:

a) $P(X \geq k)= 0.83$.
b) $P(X \leq k)= 0.95$.
c) $P(k < X < 3.1)= 0.75$.
d) $P(-k < Z < k)= 0.95$.

10.0.1 Solución parte (a)

El valor de \(k\) tal que \(P(X \geq k)= 0.83\) es \(k=0.9504\).

alfa <- 0.83
mean <- 2
sd <- 1.1
qnorm(1-alfa, mean, sd)
## [1] 0.9504182
qnorm(alfa, mean, sd, lower.tail = FALSE)
## [1] 0.9504182

10.0.2 Solución parte (b)

El valor de \(k\) tal que \(P(X \leq k)= 0.95\) es \(k=3.8093\).

alfa <- 0.95
mean <- 2
sd <- 1.1
qnorm(1-alfa, mean, sd, lower.tail = FALSE)
## [1] 3.809339
qnorm(alfa, mean, sd)
## [1] 3.809339

10.0.3 Solución parte (c)

El valor de \(k\) tal que \(P(k < X < 3.1)= 0.75\) no se puede calcular directamente, pero podemos proceder así (estandarizando y utilizando propiedades):

Sea \(t: = \frac{k-2}{1.1}\). Entonces,

\[ 0.75 \; = \; P(k < X < 3.1) \;= \; P\Big(\frac{k-2}{1.1} \; < \; Z \; < \; \frac{3.1-2}{1.1}\Big) \;= \; P(t < Z < 1) \;=\; P(Z < 1) \; - \; P(Z < t) \]

El código para escribir la expresión anterior es:

$$ 0.75 \; = \;  P(k < X < 3.1) \;= \;    P\Big(\frac{k-2}{1.1} \; < \; Z \; < \;  \frac{3.1-2}{1.1}\Big) \;= \;    P(t < Z  < 1) \;=\;   P(Z <  1) \; - \; P(Z < t) $$

Vemos que \[P(Z < 1) =0.8413\]

El código para escribir la expresión anterior es:
$$P(Z <  1) =0.8413$$
z <- 1
pnorm(z)
## [1] 0.8413447

Por lo tanto,

\[P(Z<t) \; = \; 0.8413 \; -\; 0.75 \;= \; 0.0913\]

El código para escribir la expresión anterior es:

$$P(Z<t) \; = \; 0.8413 \; -\;  0.75 \;= \; 0.0913$$
 0.8413-0.75
## [1] 0.0913

Al utilizar R, el valor cuantil es \(t=-1.3328\).

alfa <- 0.0913
qnorm(1-alfa, lower.tail = FALSE)
## [1] -1.332792

Como \(t = \frac{k+2}{1.1}\), entonces \(-1.3328 = \frac{k-2}{1.1}\), de donde \(k=2 - (1.3328)(1.1)= 0.5339\).

2 - (1.3328)*(1.1)
## [1] 0.53392

10.0.4 Solución parte (d)

El valor de \(k\) tal que \(P(-k < Z < k)= 0.95\) no se puede calcular directamente, pero podemos proceder así (utilizando propiedades):

\[ 0.95 \; = \; P(-k < Z < k) \;= \; 1 \; - \; 2 \, P(Z \; > \; k)\]

El código para escribir la expresión anterior es:

$$ 0.95 \; = \;  P(-k < Z < k) \;= \;  1 \; - \; 2 \, P(Z \; > \;  k)$$

Es decir (despejando), \[P(Z >k) \; = \; \frac{1-0.95}{2} \; = \; 0.025\]

El código para escribir la expresión anterior es:

$$P(Z >k) \; = \; \frac{1-0.95}{2} \; = \; 0.025$$

Al utilizar R, el valor cuantil es \(k=1.96\).

alfa <- 0.025
qnorm(1-alfa)
## [1] 1.959964

11 Ejemplo 6: Enunciado (Bombillos)

Una compañía fabrica bombillos con vida media de 500 horas y desviación estándar de 100. Suponga que los tiempos de vida útil de los bombillos se distribuyen normalmente, esto es que los tiempos de vida forman una distribución normal.

a) Encuentre la probabilidad de que cierta cantidad de focos dure menos de 650 horas.

b) Calcule la probabilidad de que cierta cantidad de focos dure más de 780 horas.

c) Determine la probabilidad de que cierta cantidad de focos dure entre 650 y 780 horas (ambos inclusive).

d) Halle el valor de k tal que el 5% de los bombillos tenga un tiempo de vida mayor que  k horas? 

e) Si se eligen 10000 bombillos, ¿cuántos tuvieron un tiempo de vida entre 650 y 780 horas (ambos inclusive)?

f) Si se eligen 1200 bombillos, ¿cuál es la probabilidad de que al menos 3 duren más de 780 horas?

g) Si se eligen 20 bombillos, ¿cuál es la probabilidad de que entre 16 y 19 (ambos inclusive) duren menos de 650 horas?

h) Si se eligen 20 bombillos, ¿cuál es la probabilidad de que entre 16 y 19 (ambos inclusive) no duren menos de 650 horas?

12 Ejemplo 6: Solución

Sea \(X\) la variable aleatoria que representa el tiempo de vida útil de los focos. Entonces, \(X\) tiene distribución normal con \(\mu=500\) y \(\sigma=100\).

12.0.1 Solución parte (a)

Nos piden \(P(X< 650)\).

12.0.1.1 Sin estandarizar

\[P(X< 650) \; = \; 0.9332\]

El código para escribir la expresión anterior es:

 $$P(X< 650) \; = \; 0.9332$$

En R:

probabilidad_a <- pnorm(650, mean=500, sd=100); 
probabilidad_a
## [1] 0.9331928

12.0.1.2 Estandarizando (con \(Z\))

\[P(X< 650) \;=\; P\Big(Z< \frac{650-500}{100}\Big) \; = \; P(Z<1.5) \; = \; 0.9332\]

El código para escribir la expresión anterior es:

  $$P(X< 650) \;=\; P\Big(Z< \frac{650-500}{100}\Big) \; = \; P(Z<1.5) \; = \; 0.9332$$

En R:

probabilidad_a <- pnorm(1.5)
probabilidad_a
## [1] 0.9331928

Es decir, la probabilidad de que cierta cantidad de focos dure menos de 650 horas es aproximadamente de 0.9332.

12.0.2 Solución parte (b)

Nos piden \(P(X>780)\).

12.0.2.1 Sin estandarizar

\[P(X>780) \;=\; 0.0026\]

El código para escribir la expresión anterior es:

  $$P(X>780) \;=\; 0.0026$$
probabilidad_b <- pnorm(780, mean=500, sd=100,lower.tail=FALSE)
probabilidad_b
## [1] 0.00255513

12.0.2.2 Estandarizando (con \(Z\))

\[P(X>780) \;=\; P\Big(Z> \frac{780-500}{100}\Big) \; = \; P(Z>2.8) \; = \; 0.0026\]

El código para escribir la expresión anterior es:

  $$P(X>780) \;=\; P\Big(Z> \frac{780-500}{100}\Big) \; = \; P(Z>2.8) \; = \; 0.0026$$
probabilidad_b <- pnorm(2.8, lower.tail=FALSE)
probabilidad_b
## [1] 0.00255513

Por lo tanto, la probabilidad de que cierta cantidad de focos dure más de 780 horas es aproximadamente de 0.0026.

12.0.3 Solución parte (c)

Nos piden \(P(650 \leq X \leq 780)\).

12.0.3.1 Sin estandarizar

\[P(650 \leq X \leq 780) \; = \; P(X\leq 780) \;- \; P(X\leq 650) \; = \; 0.9975\; -\; 0.9332 \; = \; 0.0643\]

El código para escribir la expresión anterior es:

   $$P(650 \leq X \leq 780) \; = \; P(X\leq 780) \;- \; P(X\leq 650)  \; = \;   0.9975\; -\;  0.9332 \; = \; 0.0643$$

En R:

probabilidad_c <- pnorm(780, mean=500, sd=100) - pnorm(650, mean=500, sd=100)
probabilidad_c
## [1] 0.06425207
probabilidad_c <- pnorm(780, mean=500, sd=100) 
probabilidad_c
## [1] 0.9974449

12.0.3.2 Estandarizando (con \(Z\))

\[\begin{eqnarray*} P(650 \leq X \leq 780) &=& P(X\leq 780) \;- \; P(X\leq 680)\\ &= & P(Z\leq 2.8) \, - \, P(Z\leq 1.5) \;= \; 0.9975 \, - \, 0.9332 \;= \; 0.0643 \end{eqnarray*}\]

El código para escribir la expresión anterior es:

 \begin{eqnarray*}
P(650 \leq X \leq 780) &=& P(X\leq 780) \;- \; P(X\leq 680)\\
&= & P(Z\leq 2.8) \, - \, P(Z\leq 1.5) \;= \;  0.9975 \, - \, 0.9332 \;= \; 0.0643
\end{eqnarray*}

En R:

probabilidad_c <- pnorm(2.8) - pnorm(1.5);
probabilidad_c
## [1] 0.06425207

Por consiguiente, la probabilidad de que cierta cantidad de bombillos duren entre 650 y 780 horas es aproximadamente 0.0642.

12.0.4 Solución parte (d)

Debemos hallar el valor de \(k\) tal que el 5% de los bombillos tenga un tiempo de vida mayor que k horas. Es decir, hallar \(k\) tal que \[P(X >k) \;= \; 0.05\]

El código para escribir la expresión anterior es:

 $$P(X >k) \;= \; 0.05$$

En este caso, \(k=664.45\), valor calculado con R:

qnorm(1-0.05, mean=500, sd=100)
## [1] 664.4854

12.0.5 Solución parte (e)

Según el inciso (c), la probabilidad de que cierta cantidad de focos dure entre 650 y 780 horas (ambos inclusive) es \(p=0.0643\). Si se eligen \(n= 10000\) bombillos, entonces aproximadamente 643 bombillos tuvieron un tiempo de vida entre 650 y 780 horas (ambos inclusive):

\[ \text{Cantidad} \;= \; n p \;= \; (10000)(0.0643)\;= \; 642.5207 \;\approx \; 643\]

El código para escribir la expresión anterior es:

 $$ \text{Cantidad} \;= \; n p \;= \; (10000)(0.0643)\;= \; 642.5207  \;\approx \; 643$$
n <- 10000
p <- probabilidad_c
n*p
## [1] 642.5207

12.0.6 Solución parte (f)

Según el inciso (b), la probabilidad de que cierta cantidad de focos dure más de 780 horas es \(p=0.0026\). Se eligen \(n= 1200\) bombillos. Definamos como \(Y\) la variable aleatoria que representa al número de bombillos en la muestra que duran más de 780 horas. Entonces, \(Y\) tiene distribución binomial con parámetros \(n=1200\) y \(p=0.0026\).

Nos piden calcular la probabilidad de que al menos 3 duren más de 780 horas. Es decir,

\[P(Y\geq 3) \; = \; 1 \; -\; P(Y \leq 2) \; = \; 0.5917\]

El código para escribir la expresión anterior es:

 $$P(Y\geq 3) \; = \; 1 \; -\; P(Y \leq 2) \; = \; 0.5917$$
n <- 1200
p <- probabilidad_b
k <- 2
probabilidad_f <- 1 - pbinom(k, n, p)
probabilidad_f
## [1] 0.5917659

Por consiguiente, si se toma una muestra de 1200 bombillos, la probabilidad de que al menos 3 duren más de 780 horas es aproximadamente 0.5917.

12.0.7 Solución parte (g)

Según el inciso (a), la probabilidad de que cierta cantidad de focos dure menos de 650 horas es \(p=0.9332\). Se eligen \(n= 20\) bombillos. Definamos como \(W\) la variable aleatoria que representa al número de bombillos en la muestra que duran menos de 650 horas. Entonces, \(W\) tiene distribución binomial con parámetros \(n=20\) y \(p=0.9332\).

Nos piden calcular la probabilidad de que entre 16 y 19 (ambos inclusive) duren menos de 650 horas. Es decir,

\[P(16 \leq W\leq 19) \; = \; P(W \leq 19) \; -\; P(W \leq 15) \; = \; 0.7491 \;- \; 0.0088 \; = \; 0.7403\]

El código para escribir la expresión anterior es:

$$P(16 \leq W\leq 19) \; = \; P(W \leq 19) \; -\; P(W \leq 15) \; = \; 0.7491 \;- \;   0.0088 \; = \;  0.7403$$
n <- 20
p <- probabilidad_a
probabilidad_g <- pbinom(19, n, p) - pbinom(15, n, p)
probabilidad_g
## [1] 0.7403082

Por lo tanto, si se toma una muestra de 20 bombillos, la probabilidad de que entre 4 y 7 (ambos inclusive) duren menos de 650 horas es aproximadamente 0.7403.

12.0.8 Solución parte (h)

Según el inciso (a), la probabilidad de que cierta cantidad de focos dure menos de 650 horas es \(0.9332\). O sea, la probabilidad que no dure menos de ese tiempo es \[p\; = \; 1\; - \; 0.9332\; = \; 0.0668\]

El código para escribir la expresión anterior es:

$$p\; = \; 1\; - \; 0.9332\; = \; 0.0668$$ 

Se eligen \(n= 20\) bombillos. Sea \(V\) la variable que representa al número de bombillos en la muestra que no duran menos de 650 horas. Entonces, \(V\) tiene distribución binomial con parámetros \(n=20\) y \(p=0.0668\).

Nos piden calcular la probabilidad de que entre 16 y 19 (ambos inclusive) duren no menos de 650 horas. Es decir,

\[P(16 \leq V\leq 19) \; = \; P(V \leq 19) \; -\; P(V \leq 15) \; = \; 1 \;- \; 1 \; = \; 0\]

El código para escribir la expresión anterior es:

$$P(16 \leq V\leq 19) \; = \; P(V \leq 19) \; -\; P(V \leq 15) \; = \; 1 \;- \;   1 \; = \;  0$$
n <- 20
p <- 1-probabilidad_a
probabilidad_h <- pbinom(19, n, p) - pbinom(15, n, p)
probabilidad_h
## [1] 6.661338e-16

Por lo tanto, si se toma una muestra de 20 bombillos, la probabilidad de que entre 4 y 7 (ambos inclusive) NO duren menos de 650 horas es aproximadamente 0.

Observe que esta probabilidad no es el complemento de la hallada en el inciso (g), como se comprueba con R:

probabilidad_h == (1-probabilidad_g)
## [1] FALSE

13 Ejercicios

Crear un nuevo documento R Markdown, realizando los ejercicios que se indican abajo. Interprete los resultados hallados.

  1. Se ha comprobado que el tiempo que tardan los contribuyentes en diligenciar el formulario para la declaración de renta sigue una distribución normal con media 100 minutos y desviación estándar 30 minutos.

    1. ¿Cuál es la probabilidad de un contribuyente elegido al azar tarde entre 70 y 130 minutos en diligenciar este formulario?
    2. Halle el valor de k tal que el 5% de los contribuyentes tarda más de k minutos en diligenciar el formulario.
    3. Se eligen 50000 contribuyentes al azar. ¿Aproximadamente cuántos tardan más de 1 hora en diligenciar el formulario?
    4. Se eligen 7 contribuyentes al azar. ¿Cuál es la probabilidad que entre 3 y 5 de ellos tarde más de 2 horas en diligenciar el formulario?
  2. Se estima que la cantidad de dinero que gastan en gasolina los clientes de una estación de servicio sigue una distribución normal con desviación estándar de 15000 pesos.

    1. Halle el valor de la media si se ha encontrado que el 4% de los clientes gasta más de 70000 pesos.
    2. Use el valor de la media hallada en (a) para calcular la probabilidad de que un cliente elegido al azar gaste entre 35000 y 40.000 pesos.
    3. Encuentre el valor de k para que 0.10 sea la probabilidad de que un cliente elegido al azar gaste un valor que excede a la media encontrada en la parte (a) en por lo menos k unidades?
    4. Se eligen 7 clientes al azar. ¿Cuál es la probabilidad que menos de 5 de ellos gaste más de 50000 pesos?
  3. Un grupo grande de estudiantes hace un examen de economía. Las notas se distribuyen según una normal con media 3.2.

    1. Halle la desviación estándar si se sabe que la probabilidad de que un estudiante elegido al azar obtenga una nota menor que 4,5 es 0.9332.
    2. ¿Cuál es la probabilidad que un estudiante elegido al azar obtenga una nota entre 3.5 y 4.0?
    3. Halle el valor de k tal que la probabilidad de que un estudiante elegido al azar obtenga una nota mayor que k se de 0.78.
    4. Se eligen 5 clientes al azar. ¿Cuál es la probabilidad de que al menos 2 de ellos obtenga más de 2.8 en el examen?
  4. Una empresa ofrece a sus empleados un seguro de atención dental. Un estudio reciente demuestra que el costo anual por empleado tuvo una distribución normal, con media de 1280 USD y una desviación estándar de 420 USD anuales

    1. ¿Cuál es la probabilidad de que un empleado elegido al azar gaste entre 1500 y 2000 USD anuales en gastos dentales?
    2. ¿Cuánto es el costo mínimo para estar en el 10% más alto por atención dental anual?
    3. Si se eligen 8.000 empleados al azar, ¿aproximadamente cuántos gastan más de 1800 USD?
    4. Si se eligen 7 empleados al azar, ¿cuál es la probabilidad de que entre 3 (no inclusive) y 6 (inclusive) de ellos gasten entre 1800 USD y 2000 USD?
  5. Un administrador estima el costo de ejecutar determinadas labores como una variable normal con media 500000 COP y desviación estándar de 50000 COP.

    1. ¿Cuál es la probabilidad de que una labor elegida al tenga un costo entre 150000 y 200000 COP?
    2. ¿Cuánto es el costo mínimo para estar en el 15% más alto por cada labor?
    3. Se eligen al azar 30000 de estas labores (independientes). ¿Aproximadamente cuántas tienen un costo mayor que 460000 COP?
    4. Se eligen al azar 6 de estas labores (independientes), ¿cuál es la probabilidad de que entre 2 y 5 (ambos inclusive) tengan un costo entre 300000 y 460000 COP?
  6. El precio de las acciones de un banco al final de cada jornada de comercialización del año previo se rigió por una distribución normal. Suponga que durante el año hubo 240 jornadas de comercialización, que el precio medio fue de $42 por acción y la desviación estándar, de $2.25.

    1. Halle la probabilidad de que, en una jornada seleccionada al azar, el precio de las acciones sea más de $50.
    2. ¿Cuántas jornadas calcularía usted tuvo un precio por acción que osciló entre $40 y $45? c) ¿Cuál fue el precio de las acciones que se mantuvo más alto 25% de las jornadas?
    3. Halle la probabilidad de que en al menos 100 jornadas el precio de la acción osciló entre $25 y $45.
  7. El tiempo de vida de un neumático puede representarse mediante una distribución normal con media 35000 kilómetros y desviación estándar de 4000 kilómetros.

    1. Halle la probabilidad de que el tiempo de un neumático sea más de 30000 kilómetros.
    2. Halle el valor de k tal que la probabilidad de que el tiempo de vida de un neumático sea menor que k es 0.95.
    3. Se toma una muestra de 80000 de estos neumáticos. ¿Aproximadamente cuántos tienen un tiempo de vida superior a los 38000 kilómetros?
    4. Se toma una muestra de 5 de estos neumáticos. ¿Cuál es la probabilidad (aproximada) de que entre 1 (inclusive) y 4 (no inclusive) de ellos tengan un tiempo de vida inferior a los 40000 kilómetros?
  8. Los puntos en una prueba de aptitud se distribuyen según una normal con media 420 y desviación típica 80.

    1. Si se elige una persona al azar, ¿cuál es la probabilidad de que obtenga una puntuación entre 400 y 500?
    2. ¿Cuál es la mínima puntuación necesaria para estar entre el 10% mejor?
    3. Para una persona elegida al azar, sin hacer los cálculos, determinar en cuál de los siguientes intervalos es más probable que esté su puntuación: 400-440, 440-480.
    4. Si se eligen 5 personas al azar, ¿cuál es la probabilidad de que al menos 2 obtenga más de 500 puntos?
  9. Una determinada librería recientemente inaugurada ofrece, además de la propia consulta de libros, los servicios de cafetería. Para una próxima exposición en la Feria del libro, la empresa ha decidido solicitar a una fábrica textil la elaboración de camisetas promocionales de la librería. La fábrica textil, decide hacer camisetas de tres tallas: L, XL, XXL. Dado que todas las camisetas serán bastante anchas, lo que hará optar por una talla u otra será la altura. Para ello, la fábrica, tras realizar el estudio pertinente, concluye que las alturas de los posibles compradores potenciales seguirán una distribución normal, con media 165,4 cm. y desviación estándar 8,3 cm.

    1. Supongamos que la fábrica ya tiene los patrones hechos, y recomienda la talla L hasta 161 cm., talla XL hasta 179 cm. y talla XXL para alturas superiores. Bajo estas condiciones, ¿qué proporción de camisetas de cada tipo es razonable que se fabriquen?
    2. Supongamos, ahora, que por razones de mercado, la empresa cree conveniente fabricar el 15% de camisetas de la talla L, el 63% de la talla XL y el 22% restante de la talla XXL. ¿Cuáles serán los límites de alturas con que se tendría que diseñar cada talla?
    3. Supongamos que se escoge una muestra de 5 patrones ya hechos. ¿Cuál es la probabilidad de que al menos 2 de las camisetas fabricadas tengan una talla L hasta 163 cm.
    4. Supongamos que se escoge una muestra de 30000 patrones ya hechos. ¿Aproximadamente cuántas camisetas tienen una talla L entre 160 y 162 cm.
  10. Se supone que los resultados de un examen tienen una distribución normal con una media de 4.0 y una desviación estándar de 0.3.

    1. ¿Cuál es la probabilidad de que una persona que presenta el examen obtenga calificación mayor que 3.6?
    2. Suponga que a los estudiantes que se encuentran en el 10% de la parte superior de la distribución se le asigna una A. ¿Cuál es la calificación mínima que debe obtener un estudiante para tener una calificación de A?
    3. ¿Cuál debe ser la mínima calificación aprobatoria si el evaluador pretende que solamente el 28.1% de los estudiantes apruebe?
    4. Si 1000 estudiantes presentan el examen, ¿cuántos estudiantes tienen calificaciones que exceden por los menos en 0.5 a la calificación reprobatoria del 25% (de calificaciones inferiores)?
  11. Un abogado se traslada diariamente desde su casa (en los suburbios) a su oficina en el centro de la ciudad. En promedio, el viaje le toma 24 minutos con una desviación estándar de 3.8 minutos. Asuma que la distribución de los tiempos de traslado está normalmente distribuida.

    1. Si la oficina abre a las 9:00 a.m y él sale de su casa a las 8:45 a.m diariamente, ¿qué porcentaje de las veces llega tarde a su trabajo?
    2. Si deja su casa a las 8:35 a.m y en la oficina se sirve un café entre las 8:50 y las 9:00 a.m, ¿cuál es la probabilidad de que le sirvan el café?
    3. Encuentre el periodo por encima del cual se encuentra el 15% de los traslados más lentos.
    4. Suponga que se toma una muestra de 5 viajes que ha realizado el abogado. Si el abogado siempre sale de su casa a las 8:30 a.m, calcule la probabilidad de que en al menos 2 viajes haya llegado entre las 9:05 a.m. y 9:20 a.m.

Bibliografía

  1. LLinás, H., Rojas, C. (2005); Estadística descriptiva y distribuciones de probabilidad. Barranquilla: Editorial Universidad del Norte.

  2. Consultar mis Notas de clase: Cap. 4 (Continua).

  3. Consultar el documento RPubs :: Enlace y materiales de ayuda.