Una fabricante de lapiceros tiene un programa de control de calidad que incluye la inspección de lapiceros recibidos para revisar que no tengan defectos. En un lote de 5 lapiceros, se seleccionan 2 al azar para inspeccionarlos. Supongamos que los lapiceros 3 y 4 son los defectuosos.
Definimos la variable aleatoria:
\(X = \text{número de lapiceros defectuosos observados entre los inspeccionados}\).
Este documento desarrolla:
# Lista de resultados (pares sin orden de 2 entre 5)
resultados <- combn(1:5, 2, simplify = FALSE)
resultados
## [[1]]
## [1] 1 2
##
## [[2]]
## [1] 1 3
##
## [[3]]
## [1] 1 4
##
## [[4]]
## [1] 1 5
##
## [[5]]
## [1] 2 3
##
## [[6]]
## [1] 2 4
##
## [[7]]
## [1] 2 5
##
## [[8]]
## [1] 3 4
##
## [[9]]
## [1] 3 5
##
## [[10]]
## [1] 4 5
La distribución de X es hipergeométrica:
- Tamaño de la población: N = 5
- Número de defectuosos: K = 2
- Número de seleccionados: n = 2
\[ P(X=k) = \frac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}}, \quad k = 0,1,2. \]
N <- 5; K <- 2; n <- 2
k_values <- 0:2
pmf <- dhyper(k_values, m = K, n = N-K, k = n)
data.frame(x = k_values, P = pmf)
## x P
## 1 0 0.3
## 2 1 0.6
## 3 2 0.1
Gráfico de la PMF:
barplot(pmf, names.arg = k_values, xlab = "x", ylab = "P(X = x)",
main = "PMF de X (hipergeométrica)")
cdf_vals <- cumsum(pmf)
data.frame(x = k_values, F = cdf_vals)
## x F
## 1 0 0.3
## 2 1 0.9
## 3 2 1.0
Gráfico de la CDF:
xx <- c(-1, 0, 1, 2)
yy <- c(0, cdf_vals)
Ffun <- stepfun(xx[-1], yy)
plot(Ffun, main = "Función de distribución acumulada F de X",
xlab = "x", ylab = "F(x)", xlim = c(-0.5, 2.5), ylim = c(0,1))
esperanza <- n * K / N
esperanza
## [1] 0.8
varianza <- n * (K/N) * (1 - K/N) * ((N - n) / (N - 1))
varianza
## [1] 0.36
Verificación con la definición de varianza:
EX <- sum(k_values * pmf)
EX2 <- sum((k_values^2) * pmf)
var_from_pmf <- EX2 - EX^2
c(Esperanza = EX, Varianza = var_from_pmf)
## Esperanza Varianza
## 0.80 0.36
Se comprobó que la variable aleatoria \(X\) sigue una distribución hipergeométrica con: