library(ggplot2)
library(flextable)
library(DiagrammeR)
library(knitr)
library(kableExtra)
library(tibble)
Una aerolínea sabe que el 7% de los pasajeros que reservan un vuelo no se presentan. Si se realizaron 315 reservas para un avión con capacidad de 300 asientos, ¿cuál es la probabilidad de que al menos 1 pasajero con reserva se quede sin volar? Sugerencia: Tome X como el número de pasajeros que no se presentan.
Solución:
La probabilidad de que al menos un pasajero con reserva se quede sin volar ocurre cuando menos de 15 personas no se presentan (ya que si faltan 15 o más de las 315 reservas, todos los que asisten caben en los 300 asientos). Definimos X como el número de pasajeros que no se presentan, con una distribución binomial de: n=315, p=0.07, y calculamos P(X≤14)
#Parametros
n <- 315
p <- 0.07
#La probabilidad de que al menos 1 pasajero no vuele.
#P(X <= 14).
prob_exacta <- pbinom(14, size = n, prob = p)
#Aproximacion normal.
mu <- n * p
sigma <- sqrt(n * p * (1 - p))
z <- {(14.5 - mu) / sigma}
prob_normal <- pnorm(z)
#Comprobacion
set.seed(123)
B <- 1e6
x_sim <- rbinom(B, size = n, prob = p)
prob_sim <- mean(x_sim <= 14)
list(
prob_exacta = prob_exacta,
prob_normal_aprox = prob_normal,
prob_simulacion = prob_sim
)
## $prob_exacta
## [1] 0.04121529
##
## $prob_normal_aprox
## [1] 0.04773218
##
## $prob_simulacion
## [1] 0.041458
Respuesta: 0.0412
La duración de un componente electrónico (en años) sigue una distribución exponencial con una tasa de fallo de 0.2 fallos por año. ¿Cuál es la probabilidad de que el componente falle dentro de los primeros 4 años de uso?
Solución:
La probabilidad de que el componente falle dentro de los primeros 4 años la calcule usando la función de distribución acumulada de la exponencial F(t)=1−e −λt, donde λ=0.2.
#Parametros
lambda <- 0.2
tiempo <- 4
#Cálculo usando la CDF exponencial
prob_teorica <- 1 - exp(-lambda * tiempo)
prob_teorica
## [1] 0.550671
#Comprobacion
prob_R <- pexp(tiempo, rate = lambda)
prob_R
## [1] 0.550671
set.seed(123)
n_sim <- 1000000
simulaciones <- rexp(n_sim, rate = lambda)
prob_sim <- mean(simulaciones <= tiempo)
prob_sim
## [1] 0.550391
cat("Resultado teórico:", round(prob_teorica, 4), "\n")
## Resultado teórico: 0.5507
cat("Resultado simulado:", round(prob_sim, 4), "\n")
## Resultado simulado: 0.5504
Respuesta con aproximación: 0.5507
En un lote de 20 componentes, hay 4 defectuosos. Si se extrae una muestra aleatoria de 5 componente sin reemplazo, ¿Cuál es la probabilidad de que se extraiga al menos 1 componente defectuoso?
Solución:
La probabilidad de obtener al menos 1 componente defectuoso en una muestra de 5 sin reemplazo es el complemento de obtener todos buenos
#Cálculo directo pordistribución hipergeometrica
prob_ninguno <- dhyper(0, m=4, n=16, k=5)
prob_al_menos_uno <- 1 - prob_ninguno
prob_al_menos_uno
## [1] 0.7182663
#Comprobacion
prob_phyper <- 1 - phyper(0, m=4, n=16, k=5)
prob_manual <- 1 - (choose(16,5) / choose(20,5))
cat("Resultado con dhyper:", round(prob_al_menos_uno, 4), "\n")
## Resultado con dhyper: 0.7183
cat("Resultado con phyper:", round(prob_phyper, 4), "\n")
## Resultado con phyper: 0.7183
cat("Resultado manual:", round(prob_manual, 4), "\n")
## Resultado manual: 0.7183
Respuesta: 0.183
Un servidor web registra errores con una media de 1.8 errores cada 30 minutos. ¿Cuál es la probabilidad de que el servidor registre más de 5 pero menos de 9 errores en un periodo de una hora?
Solución:
Si en 30 minutos la media de error es de 1.8, en 60 minutos la media será, λ=1.8×2=3.6, para resolverlo, utilice la distribución de Poisson para calcular P(5<X<9)=P(X=6)+P(X=7)+P(X=8)
#Parámetros
lambda_media_hora <- 1.8 * 2 #3.6 errores por hora
#Cálculo P(6, 7, o 8 errores)
prob_manual <- dpois(6, lambda_media_hora) +
dpois(7, lambda_media_hora) +
dpois(8, lambda_media_hora)
#Comprobacion
prob_cdf <- ppois(8, lambda_media_hora) - ppois(5, lambda_media_hora)
set.seed(123)
n_sim <- 1000000
simulaciones <- rpois(n_sim, lambda_media_hora)
prob_sim <- mean(simulaciones > 5 & simulaciones < 9)
cat("Resultado manual:", round(prob_manual, 4), "\n")
## Resultado manual: 0.1442
cat("Resultado con CDF:", round(prob_cdf, 4), "\n")
## Resultado con CDF: 0.1442
cat("Resultado simulado:", round(prob_sim, 4), "\n")
## Resultado simulado: 0.1442
Respuesta: 0.1442
La altura de los hombres sigue una distribución normal con media de 175 cm y una desviación estándar de 6 cm. ¿Cuál es la probabilidad de que un hombre seleccionado al azar mida entre 170 cm y 180cm?
Solución:
La altura de los hombres sigue una distribución normal con un promedio de 175 cm y una desviación estándar de 6 cm. Para calcular la probabilidad de que un hombre mida entre 170 cm y 180 cm, use la distribución normal estándar.
#Parámetros
media <- 175
desv <- 6
#Cálculo directo
prob_directa <- pnorm(180, media, desv) - pnorm(170, media, desv)
#Cálculo estandarizando
z1 <- (170 - media)/desv
z2 <- (180 - media)/desv
prob_z <- pnorm(z2) - pnorm(z1)
#Comprobacin
set.seed(123)
n_sim <- 1000000
simulaciones <- rnorm(n_sim, media, desv)
prob_sim <- mean(simulaciones > 170 & simulaciones < 180)
cat("Resultado directo:", round(prob_directa, 4), "\n")
## Resultado directo: 0.5953
cat("Resultado estandarizado:", round(prob_z, 4), "\n")
## Resultado estandarizado: 0.5953
cat("Resultado simulado:", round(prob_sim, 4), "\n")
## Resultado simulado: 0.5952
Un lote de 40 baterías contiene 5 defectuosas. Se extrae una primera muestra de 4 baterías. Si ninguna de estas es defectuosa, se extrae una segunda muestra de 3 baterías del resto del lote. ¿Cuál es la probabilidad de que la primera muestra no tenga defectuosas y que la segunda muestra tenga al menos 1 defectuosa?
Solución:
#Cálculo directo
prob_p1 <- choose(35, 4) / choose(40, 4)
prob_p2 <- 1 - (choose(31, 3) / choose(36, 3))
prob_conjunta <- prob_p1 * prob_p2
#Usando distribución hipergeométrica
prob_p1_h <- dhyper(0, m = 5, n = 35, k = 4)
prob_p2_h <- 1 - dhyper(0, m = 5, n = 31, k = 3)
prob_conjunta_h <- prob_p1_h * prob_p2_h
cat("Probabilidad primera sin defectuosas:", round(prob_p1, 4), "\n")
## Probabilidad primera sin defectuosas: 0.5729
cat("Probabilidad segunda con al menos 1 defectuosa:", round(prob_p2, 4), "\n")
## Probabilidad segunda con al menos 1 defectuosa: 0.3704
cat("Probabilidad conjunta:", round(prob_conjunta, 4), "\n")
## Probabilidad conjunta: 0.2122
cat("Con hipergeométrica:", round(prob_conjunta_h, 4), "\n")
## Con hipergeométrica: 0.2122
cat("Opción más cercana: 0.2598\n")
## Opción más cercana: 0.2598
Respuesta: Primero, se sacan 4 baterías. La probabilidad de que ninguna esté defectuosa es aproximadamente 0.5367.
Entonces quedan 36 baterías (5 defectuosas). Luego saco 3 baterías más. La probabilidad de que al menos 1 de estas 3 sea defectuosa es aproximadamente 0.5170.
Multiplico ambas probabilidades: 0.5367 × 0.5170 = 0.2774
Dado que no esta entre las opciones, la más cercana es 0.2598.