Las distribuciones de probabilidad discretas son modelos matemáticos que describen el comportamiento de variables aleatorias que toman valores en un conjunto finito o numerable.
Algunas distribuciones discretas fundamentales:
La distribución geométrica modela el número de ensayos independientes de Bernoulli necesarios para obtener el primer éxito, donde cada ensayo tiene probabilidad de éxito \(p\) constante.
Parámetros: \(p \in (0,1]\) (probabilidad de éxito)
Soporte: \(k \in \{1, 2, 3, \ldots\}\)
\[P(X = k) = (1-p)^{k-1} \cdot p\]
\[F(k) = P(X \leq k) = 1 - (1-p)^k\]
\[E[X] = \frac{1}{p}\] \[\text{V}(X) = \frac{1-p}{p^2}\]
Problema: Lanzas una moneda equilibrada hasta obtener la primera cara. ¿Cuál es la probabilidad de que necesites exactamente 3 lanzamientos? ¿Y de que necesites 5 o menos lanzamientos? ¿Cuántos lanzamientos necesitarás en promedio?
# Parámetros
p <- 0.5 # probabilidad de éxito (obtener cara)
cat("=== DISTRIBUCIÓN GEOMÉTRICA: LANZAMIENTO DE MONEDA ===\n\n")## === DISTRIBUCIÓN GEOMÉTRICA: LANZAMIENTO DE MONEDA ===
## Probabilidad de obtener cara en cada lanzamiento: p = 0.5
# Probabilidad de necesitar exactamente 3 lanzamientos para la primera cara
prob_3 <- dgeom(2, p) # dgeom usa k-1 como parámetro (2 fallas antes del éxito)
cat("P(X = 3) =", round(prob_3, 4), "=", prob_3, "\n")## P(X = 3) = 0.125 = 0.125
## Secuencia SCX (Sello-Sello-Cara)
# Probabilidad de necesitar 5 o menos lanzamientos
prob_leq_5 <- pgeom(4, p) # pgeom usa k-1 como parámetro
cat("P(X ≤ 5) =", round(prob_leq_5, 4), "=", prob_leq_5, "\n")## P(X ≤ 5) = 0.9688 = 0.96875
## La primera cara aparece en los primeros 5 lanzamientos
# Probabilidad de necesitar más de 4 lanzamientos
prob_gt_4 <- 1 - pgeom(3, p)
cat("P(X > 4) =", round(prob_gt_4, 4), "=", prob_gt_4, "\n")## P(X > 4) = 0.0625 = 0.0625
## Necesitas más de 4 lanzamientos para la primera cara
# Esperanza y varianza teóricas
esperanza <- 1/p
varianza <- (1-p)/(p^2)
cat("E[X] =", esperanza, "lanzamientos en promedio\n")## E[X] = 2 lanzamientos en promedio
## V(X) = 2
# Cálculo manual para verificar P(X = 3)
prob_manual <- (1-p)^(3-1) * p # (1-0.5)^2 * 0.5 = 0.25 * 0.5 = 0.125
cat("Verificación manual: P(X = 3) = (1-p)^2 × p = 0.5^2 × 0.5 =", prob_manual, "\n\n")## Verificación manual: P(X = 3) = (1-p)^2 × p = 0.5^2 × 0.5 = 0.125
La distribución binomial negativa modela el número de ensayos independientes de Bernoulli necesarios para obtener exactamente \(r\) éxitos, donde cada ensayo tiene probabilidad de éxito \(p\) constante. Es una generalización de la distribución geométrica (\(r=1\)).
Parámetros: \(r \in \{1, 2, 3, \ldots\}\) (número de éxitos deseados), \(p \in (0,1]\) (probabilidad de éxito)
Soporte: \(k \in \{r, r+1, r+2, \ldots\}\)
\[P(X = k) = \binom{k-1}{r-1} \cdot p^r \cdot (1-p)^{k-r}\]
\[F(k) = P(X \leq k) = \sum_{i=r}^{k} \binom{i-1}{r-1} \cdot p^r \cdot (1-p)^{i-r}\]
\[E[X] = \frac{r}{p}\] \[\text{V}(X) = \frac{r(1-p)}{p^2}\] ## Ejemplo
Problema: Se lanza un dado equilibrado repetidamente hasta obtener 3 seises. Calcular:la probabilidad de que se necesiten exactamente 5 lanzamientos para obtener 3 seises y la probabilidad de que los 3 seises aparezcan en 8 o menos lanzamientos.
# Parámetros
r <- 3 # número de éxitos deseados (3 seises)
p <- 1/6 # probabilidad de éxito por lanzamiento
cat("=== LANZAMIENTO DE DADO HASTA OBTENER 3 SEISES ===\n\n")## === LANZAMIENTO DE DADO HASTA OBTENER 3 SEISES ===
# Probabilidad de necesitar exactamente 5 lanzamientos para 3 seises
prob_5 <- dnbinom(5-r, r, p) # dnbinom usa k-r como primer parámetro
cat("P(X = 5) =", round(prob_5, 4), "\n")## P(X = 5) = 0.0193
## Interpretación: 3 seises y 2 no-seises en 5 lanzamientos
# Probabilidad de necesitar 8 o menos lanzamientos
prob_leq_8 <- pnbinom(8-r, r, p)
cat("P(X ≤ 8) =", round(prob_leq_8, 4), "\n")## P(X ≤ 8) = 0.1348
## Interpretación: Los 3 seises aparecen en los primeros 8 lanzamientos
## E[X] = 18 lanzamientos en promedio
## Casos posibles para X = 5:
## - El 5° lanzamiento debe ser seis (obligatorio)
## - En los primeros 4 lanzamientos debe haber exactamente 2 seises
## - Número de maneras de elegir 2 posiciones de 4: 6
La distribución de Poisson modela el número de eventos que ocurren en un intervalo fijo de tiempo o espacio, cuando estos eventos suceden de manera independiente y a una tasa promedio constante \(\lambda\).
Parámetros: \(\lambda > 0\) (tasa promedio de ocurrencia)
Soporte: \(k \in \{0, 1, 2, 3, \ldots\}\)
\[P(X = k) = \frac{\lambda^k \cdot e^{-\lambda}}{k!}\]
\[F(k) = P(X \leq k) = \sum_{i=0}^{k} \frac{\lambda^i \cdot e^{-\lambda}}{i!}\]
\[E[X] = \lambda\] \[\text{V}(X) = \lambda\]
Propiedad importante: En la distribución de Poisson, la media y la varianza son iguales.
Problema:Se estudia la llegada de clientes a una tienda, donde en promedio llegan 2 clientes por hora. Se asume que el número de clientes que llegan en una hora sigue una distribución de Poisson con parámetro: \[\lambda = 2\]
# Parámetros
lambda <- 2 # promedio de clientes por hora
cat("=== LLEGADA DE CLIENTES A UNA TIENDA ===\n\n")## === LLEGADA DE CLIENTES A UNA TIENDA ===
# Probabilidad de exactamente 3 clientes
prob_3 <- dpois(3, lambda)
cat("P(X = 3) =", round(prob_3, 4), "\n")## P(X = 3) = 0.1804
## Interpretación: Exactamente 3 clientes llegan en una hora
# Probabilidad de 4 o menos clientes
prob_leq_4 <- ppois(4, lambda)
cat("P(X ≤ 4) =", round(prob_leq_4, 4), "\n")## P(X ≤ 4) = 0.9473
## Interpretación: Como máximo 4 clientes en una hora
# Probabilidad de más de 2 clientes (más que el promedio)
prob_gt_2 <- 1 - ppois(2, lambda)
cat("P(X > 2) =", round(prob_gt_2, 4), "\n")## P(X > 2) = 0.3233
## Interpretación: Más clientes que el promedio
## E[X] = Var(X) = 2
## Verificación manual:
## P(X = 0) = e^(-2) = 0.1353
## P(X = 1) = 2 × e^(-2) = 0.2707
## P(X = 2) = 2^2/2! × e^(-2) = 0.2707
## P(X = 3) = 2^3/3! × e^(-2) = 0.1804
La distribución uniforme discreta asigna la misma probabilidad a cada uno de los \(n\) valores posibles en un conjunto finito. Es el modelo de “equiprobabilidad” para variables discretas.
Parámetros: \(a, b \in \mathbb{Z}\) con \(a \leq b\) (límites del soporte)
Soporte: \(k \in \{a, a+1, a+2, \ldots, b\}\)
Número de valores posibles: \(n = b - a + 1\)
\[P(X = k) = \frac{1}{n} = \frac{1}{b-a+1} \text{ para } k \in \{a, a+1, \ldots, b\}\]
\[F(k) = P(X \leq k) = \frac{k-a+1}{b-a+1} \text{ para } k \in \{a, a+1, \ldots, b\}\]
\[E[X] = \frac{a+b}{2}\] \[\text{V}(X) = \frac{(b-a+1)^2-1}{12}\]
Problema: Se lanza un dado equilibrado, donde cada una de sus caras tiene la misma probabilidad de aparecer. Determine la probabilidad de que salga un número par y encuentre la esperanza y la varianza de la variable aleatoria que representa la cara obtenida.
# Parámetros para un dado
a <- 1 # valor mínimo
b <- 6 # valor máximo
n <- b - a + 1 # número total de valores posibles
cat("=== LANZAMIENTO DE UN DADO EQUILIBRADO ===\n\n")## === LANZAMIENTO DE UN DADO EQUILIBRADO ===
# Función PMF manual
dunif_disc <- function(x, min_val, max_val) {
ifelse(x >= min_val & x <= max_val & x == round(x),
1/(max_val - min_val + 1), 0)
}
# Probabilidad de cada cara del dado
valores <- a:b
prob_individual <- 1/n
cat("Valores posibles:", paste(valores, collapse = ", "), "\n")## Valores posibles: 1, 2, 3, 4, 5, 6
## Probabilidad de cada valor: 1/ 6 = 0.1667
# Probabilidad de obtener un número par
numeros_pares <- valores[valores %% 2 == 0] # 2, 4, 6
prob_par <- length(numeros_pares) / n
cat("Números pares:", paste(numeros_pares, collapse = ", "), "\n")## Números pares: 2, 4, 6
## P(número par) = 3 / 6 = 0.5
# Esperanza y varianza
esperanza <- (a + b) / 2
varianza <- ((b - a + 1)^2 - 1) / 12
cat("E[X] =", esperanza, "(valor central)\n")## E[X] = 3.5 (valor central)
## Var(X) = 2.917
# Visualización
df_uniforme <- data.frame(
k = valores,
pmf = rep(prob_individual, n),
es_par = ifelse(valores %% 2 == 0, "Par", "Impar"),
mayor_4 = ifelse(valores > 4, "Mayor que 4", "4 o menor")
)