ALGUNOS EJERCICIOS DE DISTRIBUCIÓN

Este documento ha sido realizado por: Leonardo Jimenez, Nicol Arias y Paula castillo:

Paula Castillo Nicol Arias Leonardo Jimenez

Probabilidad y Estadistica grupo 7

library(ggplot2)
library(flextable)
library(dplyr)
library(gt)

INTRODUCCIÓN

En este documento se realizaran algunos ejercicios de distribución normal.

Ejercicio 6.1 ### Solución 6.1 Dada una distribución continua uniforme, demuestre que a)

# Límites del intervalo
A <- 7
B <- 10

# Media teórica
mu <- (A + B) / 2
mu
## [1] 8.5
# Límites del intervalo
A <- 7
B <- 10

# Varianza teórica
varianza <- ((B - A)^2) / 12
varianza
## [1] 0.75

Ejercicio 6.7

Dada una distribución normal estándar, calcule el valor de k tal que \[ \begin{align} a)\;& P(Z > k) = 0.2946 \\ b)\;& P(Z < k) = 0.0427 \\ c)\;& P(-0.93 < Z < k) = 0.7235 \end{align} \]

\[ Sea \space z = \frac{k-\mu}{\sigma}, \space \text{Para hallar la probabilidad de }k \]

Solución 6.7

Utilizando la función normal estándar:

#a
z <- 0.54
sigma <- 1
mu <- 0
normal <- pnorm(z, mu, sigma, lower.tail = FALSE)
normal
## [1] 0.2945985

Podemos ver que cuando \(k=0.54\) en la función normal estándar obtenemos \(0.2945985\)

Utilizando la función normal estándar:

#b
z <- -1.72
sigma <- 1
mu <- 0
normal <- pnorm(z, mu, sigma, lower.tail = TRUE)
normal
## [1] 0.04271622

Podemos ver que cuando \(k=-1.72\) en la función normal estándar obtenemos \(0.04271622\)

Utilizando la función normal estándar:

#c
z <- -0.93
sigma <- 1
mu <- 0
k <- 1.28
normal <- pnorm(k, mu, sigma, lower.tail = TRUE) - pnorm(z, mu, sigma, lower.tail = TRUE)
normal
## [1] 0.7235419

Podemos ver que \(P(−0.93 < Z < k) = 0.7235\) se da cuando \(k=1.28\) en la función normal estándar, y obtenemos \(0.7235419\)

*Ejercicio 6.13

Un investigador informa que unos ratones a los que primero se les restringen drásticamente sus dietas y después se les enriquecen con vitaminas y proteínas vivirán un promedio de 40 meses. Si suponemos que la vida de tales ratones se distribuye normalmente, con una desviación estándar de 6.3 meses, calcule la probabilidad de que un ratón determinado viva: \[ \begin{align} \;& a) \text{ Más de 32 meses;} \\ \;& b) \text{ Menos de 28 meses;} \\ \;& c) \text{ Entre 37 y 49 meses.} \end{align} \]

Solución 6.13

#a
#P(Z > 32)
sigma <- 6.3
mu <- 40
k <- 32
normal <- pnorm(k, mu, sigma, lower.tail = FALSE)
normal
## [1] 0.8979294

La probabilidad de que un ratón viva más de 32 meses, es decir, \(P(Z > 32)\) es de \(0.8979294\)

#b
#P(Z < 28)
sigma <- 6.3
mu <- 40
k <- 28
normal <- pnorm(k, mu, sigma, lower.tail = TRUE)
normal
## [1] 0.02840551

La probabilidad de que un ratón viva menos de 28 meses, es decir, \(P(Z < 28)\) es de \(0.02840551\)

#c
#P(37 < Z < 49)
z <- 49
sigma <- 6.3
mu <- 40
k <- 37
normal <- pnorm(z, mu, sigma, lower.tail = TRUE) - pnorm(k, mu, sigma, lower.tail = TRUE)
normal
## [1] 0.6064669

La probabilidad de que un ratón viva entre 37 y 49 meses, es decir, \(P(37 < Z < 49)\) es de \(0.6064669\)

Ejercicio 6.19

Una empresa paga a sus empleados un salario promedio de $15.90 por hora, con una desviación estándar de $1.50. Si los salarios se distribuyen aproximadamente de forma normal y se redondean al centavo más cercano,

\[ \begin{align} \;& a) \text{¿Qué porcentaje de los trabajadores recibe salarios de entre \$13.75 y \$16.22 por hora?}\\ \;& b) \text{¿El 5% de los salarios más altos por hora de los empleados es mayor a qué cantidad?} \end{align} \]

Solución 6.19

#a
#P(37 < Z < 49)
z <- 16.22
sigma <- 1.50
mu <- 15.90
k <- 13.75
normal <- pnorm(z, mu, sigma, lower.tail = TRUE) - pnorm(k, mu, sigma, lower.tail = TRUE)
normal
## [1] 0.5085852

El porcentaje de los trabajadores que reciben entre \(\$13.75\) y \(\$16.22\), está dado por, \(P(13.75 < Z < 16.22)\) y es de %\(0.5085852\)

#b
#P(Z > k)
sigma <- 1.50
mu <- 15.90
k <- 18.367
normal <- pnorm(k, mu, sigma, lower.tail = FALSE)
normal
## [1] 0.05001929

El 5% de los salarios más altos, está dado por, \(P(Z > k)\), podemos ver que cuando \(k=18.367\) el valor se aproxima a %\(0.05001929\), es decir, los salarios empiezan desde \(k=\$18.367\)

Ejercicio 6.3

La cantidad de café diaria, en litros, que sirve una máquina que se localiza en el vestíbulo de un aeropuerto es una variable aleatoria X que tiene una distribución continua uniforme con A = 7 y B = 10. Calcule la probabilidad de que en un día determinado la cantidad de café que sirve esta máquina sea

Solución 6.3

  1. a lo sumo 8.8 litros.
#Distribución uniforme
a <- 7
b <- 10

#Probabilidad de que X ≤ 8.8
p_a <- punif(8.8, min = a, max = b)
p_a
## [1] 0.6

La probabilidad de que se sirvan a lo sumo 8.8 litros de café en un día es aproximadamente 0.6, es decir, 60%.

  1. Más de 7.4 litros, pero menos de 9.5 litros.
# Distribución uniforme
a <- 7
b <- 10

# Probabilidad de que 7.4 < X < 9.5
p_b <- punif(9.5, min = a, max = b) - punif(7.4, min = a, max = b)
p_b
## [1] 0.7

La probabilidad de que se sirvan más de 7.4 litros pero menos de 9.5 litros es aproximadamente 0.7, es decir, 70%.

  1. Al menos 8.
# Distribución uniforme
a <- 7
b <- 10

# Probabilidad de que X ≥ 8
p_c <- punif(8, min = a, max = b, lower.tail = FALSE)
p_c
## [1] 0.6666667

La probabilidad de que se sirvan al menos 8 litros de café en un día es aproximadamente 0.6667, es decir, 66.67%

Ejercicio 6.9

Dada la variable X normalmente distribuida con una media de 18 y una desviación estándar de 2.5, calcule ### Solución 6.9 a) P(X < 15);

# distribución normal
mu <- 18
sigma <- 2.5

# a) P(X < 15)
p_a <- pnorm(15, mean = mu, sd = sigma)
p_a
## [1] 0.1150697

La probabilidad de que X sea menor que 15 es aproximadamente 0.1151, es decir, 11.51%

  1. el valor de k tal que P(X < k) = 0.2236;
# distribución normal
mu <- 18
sigma <- 2.5

# b) Valor de k tal que P(X < k) = 
k_b <- qnorm(0.2236, mean = mu, sd = sigma)
k_b
## [1] 16.09977

El valor de k tal que P(X<k)=0.2236 es aproximadamente 16.14.

  1. el valor de k tal que P(X > k) = 0.1814;
# distribución normal
mu <- 18
sigma <- 2.5

# c) Valor de k tal que P(X > k) =
k_c <- qnorm(1 - 0.1814, mean = mu, sd = sigma)
k_c
## [1] 20.27511

El valor de k tal que P(X>k)=0.1814 es aproximadamente 20.11.

d ) P(17 < X < 21).

# distribución normal
mu <- 18
sigma <- 2.5

# d) P(17 < X < 21)
p_d <- pnorm(21, mean = mu, sd = sigma) - pnorm(17, mean = mu, sd = sigma)
p_d
## [1] 0.5403521

Ejercicio 6.15

Un abogado viaja todos los días de su casa en los suburbios a su ofi cina en el centro de la ciudad. El tiempo promedio para un viaje sólo de ida es de 24 minutos, con una desviación estándar de 3.8 minutos. Si se supone que la distribución de los tiempos de viaje está distribuida normalmente. a) ¿Cuál es la probabilidad de que un viaje tome al menos 1/2 hora? su casa a las 8:45 a.m., ¿qué porcentaje de las veces llegará tarde al trabajo?

Solución 6.15

# distribución normal
mu <- 24
sigma <- 3.8

# a) P(X ≥ 30)
p_a <- pnorm(30, mean = mu, sd = sigma, lower.tail = FALSE)
p_a
## [1] 0.05717406

La probabilidad de que el viaje tome al menos 30 minutos es aproximadamente 0.0918, es decir, 9.18%.

  1. Si la oficina abre a las 9:00 a.m. y él sale diario de
#distribución normal
mu <- 24
sigma <- 3.8

# b) P(X > 15)
p_b <- pnorm(15, mean = mu, sd = sigma, lower.tail = FALSE)
p_b
## [1] 0.9910679

Si el abogado sale a las 8:45 A.M. y tiene 15 minutos para llegar, la probabilidad de que llegue tarde es aproximadamente 0.9332, es decir, 93.32% de las veces.

Ejercicio 6.21 La resistencia a la tensión de cierto componente de metal se distribuye normalmente con una media de 10,000 kilogramos por centímetro cuadrado y una desviación estándar de 100 kilogramos por centímetro cuadrado. Las mediciones se redondean a los 50 kilogramos por centímetro cuadrado más cercanos.

Solución 6.21

  1. ¿Qué proporción de estos componentes excede a 10,150 kilogramos por centímetro cuadrado de resistencia a la tensión?
#distribución normal
mu <- 10000
sigma <- 100

# a) P(X > 10150)
p_a <- pnorm(10150, mean = mu, sd = sigma, lower.tail = FALSE)
p_a
## [1] 0.0668072

La proporción de componentes que excede los 10,150 kg/cm² de resistencia es aproximadamente 0.0668, es decir, 6.68%.

  1. Si las especifi caciones requieren que todos los componentes tengan una resistencia a la tensión de entre 9800 y 10,200 kilogramos por centímetro cuadrado, ¿qué proporción de piezas esperaría que se descartara?
# distribución normal
mu <- 10000
sigma <- 100

# b) P(X < 9800) + P(X > 10200)
p_b <- pnorm(9800, mean = mu, sd = sigma) + pnorm(10200, mean = mu, sd = sigma, lower.tail = FALSE)
p_b
## [1] 0.04550026

La proporción de piezas que no cumplen con las especificaciones (es decir, que se descartan) es aproximadamente 0.0456, es decir, 4.56%.

Ejercicio 6.5

6.5 Dada una distribución normal estándar, calcule el área bajo la curva que está

  1. a la izquierda de z = –1.39;

  2. a la derecha de z = 1.96;

  3. entre z = –2.16 y z = – 0.65;

d ) a la izquierda de z = 1.43;

  1. a la derecha de z = – 0.89;

f ) entre z = – 0.48 y z = 1.74.

Solución 6.5

# a) 
a <- pnorm(-1.39)

# b) 
b <- 1 - pnorm(1.96)

# c)
c <- pnorm(-0.65) - pnorm(-2.16)

# d) 
d <- pnorm(1.43)

# e) 
e <- 1 - pnorm(-0.89)

# f) 
f <- pnorm(1.74) - pnorm(-0.48)

# 3. Organizar los resultados en un data frame

tabla <- data.frame(
  Inciso = c("a", "b", "c", "d", "e", "f"),
  Descripción = c(
    "Área a la izquierda de z = -1.39",
    "Área a la derecha de z = 1.96",
    "Área entre z = -2.16 y z = -0.65",
    "Área a la izquierda de z = 1.43",
    "Área a la derecha de z = -0.89",
    "Área entre z = -0.48 y z = 1.74"
  ),
  Resultado = c(a, b, c, d, e, f)
)


tabla %>%
  gt() %>%
  fmt_number(columns = Resultado, decimals = 4) %>%   
  tab_header(
    title = "Áreas bajo la Distribución Normal Estándar",
    subtitle = "Resultados calculados con pnorm() en R"
  ) %>%
  tab_style(
    style = list(
      cell_fill(color = "#E8F0FE"),
      cell_text(weight = "bold")
    ),
    locations = cells_title(groups = "title")
  ) %>%
  tab_style(
    style = cell_fill(color = "#F6F8FC"),
    locations = cells_body()
  ) %>%
  tab_options(
    table.font.names = "times new roman",
    table.border.top.color = "#1A73E8",
    table.border.top.width = px(3),
    table.border.bottom.color = "#1A73E8",
    table.border.bottom.width = px(3),
    data_row.padding = px(8)
  )
Áreas bajo la Distribución Normal Estándar
Resultados calculados con pnorm() en R
Inciso Descripción Resultado
a Área a la izquierda de z = -1.39 0.0823
b Área a la derecha de z = 1.96 0.0250
c Área entre z = -2.16 y z = -0.65 0.2425
d Área a la izquierda de z = 1.43 0.9236
e Área a la derecha de z = -0.89 0.8133
f Área entre z = -0.48 y z = 1.74 0.6435

Ejercicio 6.11 6.11 Una máquina expendedora de bebidas gaseosas se regula para que sirva un promedio de 200 mililitros por vaso. Si la cantidad de bebida se distribuye normalmente con una desviación estándar igual a 15 mililitros,

  1. ¿qué fracción de los vasos contendrá más de 224 mililitros?

  2. ¿cuál es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?

  3. ¿cuántos vasos probablemente se derramarán si se utilizan vasos de 230 mililitros para las siguientes 1000 bebidas?

d ) ¿por debajo de qué valor obtendremos el 25% más bajo en el llenado de las bebidas?

Solucion 6.11

library(dplyr)
library(gt)

mu <- 200
sigma <- 15

resultados <- tibble(
  Inciso = c("a", "b", "c", "d"),
  Enunciado = c(
    "Fracción de vasos con más de 224 ml",
    "Probabilidad entre 191 y 209 ml",
    "Vasos que se derraman (capacidad 230 ml, 1000 bebidas)",
    "Valor bajo el cual está el 25% más bajo"
  ),
  Resultado = c(
    1 - pnorm(224, mu, sigma),
    pnorm(209, mu, sigma) - pnorm(191, mu, sigma),
    (1 - pnorm(230, mu, sigma)) * 1000,
    qnorm(0.25, mu, sigma)
  )
)

tabla_611 <- resultados %>%
  gt() %>%
  fmt_number(columns = Resultado, decimals = 4) %>%
  data_color(
    columns = Resultado,
    colors = scales::col_numeric(
      palette = c("#d0f0c0", "#2ea44f"),  
      domain = NULL
    )
  ) %>%
  tab_header(
    title = "Resultados del Problema 6.11",
    subtitle = "Distribución Normal N(200, 15)"
  )

tabla_611
Resultados del Problema 6.11
Distribución Normal N(200, 15)
Inciso Enunciado Resultado
a Fracción de vasos con más de 224 ml 0.0548
b Probabilidad entre 191 y 209 ml 0.4515
c Vasos que se derraman (capacidad 230 ml, 1000 bebidas) 22.7501
d Valor bajo el cual está el 25% más bajo 189.8827

Ejercicio 6.17 La vida promedio de cierto tipo de motor pequeño es de 10 años, con una desviación estándar de 2 años. El fabricante reemplaza gratis todos los motores que fallen dentro del periodo de garantía. Si estuviera dispuesto a reemplazar sólo 3% de los motores que fallan, ¿cuánto tiempo de garantía debería ofrecer? Suponga que la duración de un motor sigue una distribución normal

Solución 6.17

mu <- 10      # años
sigma <- 2    # años

garantia <- qnorm(0.03, mean = mu, sd = sigma)

# tabla
tabla_motor <- tibble(
  Concepto = "Tiempo de garantía (cubriendo el 3% de fallas)",
  Garantia_en_anios = garantia
) %>%
  gt() %>%
  fmt_number(columns = Garantia_en_anios, decimals = 4) %>%
  data_color(
    columns = Garantia_en_anios,
    colors = scales::col_numeric(
      palette = c("#d0e8ff", "#0057b8"),  
      domain = NULL
    )
  ) %>%
  tab_header(
    title = "Garantía Recomendada para el Motor",
    subtitle = "Distribución Normal N(10, 2)"
  )

tabla_motor
Garantía Recomendada para el Motor
Distribución Normal N(10, 2)
Concepto Garantia_en_anios
Tiempo de garantía (cubriendo el 3% de fallas) 6.2384

Ejercicio 6.23 El coefi ciente intelectual (CI) de 600 aspirantesa cierta universidad se distribuye aproximadamente de forma normal con una media de 115 y una desviación estándar de 12. Si la universidad requiere un CI de al menos 95, ¿cuántos de estos estudiantes serán rechazados con base en éste sin importar sus otras califi caciones? Tome en cuenta que el CI de los aspirantes se redondea al entero más cercano.

SoluciÓn 6.23

mu <- 115
sigma <- 12
n_aspirantes <- 600


# Probabilidad de tener CI menor a 95
p_rechazo <- pnorm(95, mu, sigma)

# Número esperado de aspirantes rechazados
rechazados <- n_aspirantes * p_rechazo

tabla_623 <- tibble(
  Concepto = c("Probabilidad de CI < 95", 
               "Número esperado de rechazados"),
  Valor = c(p_rechazo, rechazados)
) %>%
  gt() %>%
  fmt_number(columns = Valor, decimals = 4) %>% 
  data_color(
    columns = Valor,
    colors = scales::col_numeric(
      palette = c("#ffe5e5", "#b30000"),  
      domain = NULL
    )
  ) %>%
  tab_header(
    title = "Resultados del Problema 6.23",
    subtitle = "Distribución Normal del CI: N(115, 12)"
  )

tabla_623
Resultados del Problema 6.23
Distribución Normal del CI: N(115, 12)
Concepto Valor
Probabilidad de CI < 95 0.0478
Número esperado de rechazados 28.6742