Distribuciones de Probabilidad Discretas

Las distribuciones de probabilidad discretas son modelos matemáticos que describen el comportamiento de variables aleatorias que toman valores en un conjunto finito o numerable.

Algunas distribuciones discretas fundamentales:

  1. Distribución Geométrica: modela el número de intentos hasta el primer éxito
  2. Distribución Binomial Negativa: generaliza la geométrica para múltiples éxitos
  3. Distribución de Poisson: aproxima eventos raros en intervalos de tiempo/espacio
  4. Distribución Uniforme Discreta: asigna probabilidad igual a todos los valores posibles

1. Distribución Geométrica

Definición y Contexto

La distribución geométrica modela el número de ensayos independientes de Bernoulli necesarios para obtener el primer éxito, donde cada ensayo tiene probabilidad de éxito \(p\) constante.

Fórmulas Matemáticas

Parámetros: \(p \in (0,1]\) (probabilidad de éxito)

Soporte: \(k \in \{1, 2, 3, \ldots\}\)

Función de Masa de Probabilidad (f)

\[P(X = k) = (1-p)^{k-1} \cdot p\]

Función de Distribución Acumulada (F)

\[F(k) = P(X \leq k) = 1 - (1-p)^k\]

Esperanza y Varianza

\[E[X] = \frac{1}{p}\] \[\text{V}(X) = \frac{1-p}{p^2}\]

Ejemplo

Problema: Lanzas una moneda equilibrada hasta obtener la primera cara. ¿Cuál es la probabilidad de que necesites exactamente 3 lanzamientos? ¿Y de que necesites 5 o menos lanzamientos? ¿Cuántos lanzamientos necesitarás en promedio?

# Parámetros
p <- 0.5  # probabilidad de éxito (obtener cara)

cat("=== DISTRIBUCIÓN GEOMÉTRICA: LANZAMIENTO DE MONEDA ===\n\n")
## === DISTRIBUCIÓN GEOMÉTRICA: LANZAMIENTO DE MONEDA ===
cat("Probabilidad de obtener cara en cada lanzamiento: p =", p, "\n\n")
## Probabilidad de obtener cara en cada lanzamiento: p = 0.5
# Probabilidad de necesitar exactamente 3 lanzamientos para la primera cara
prob_3 <- dgeom(2, p)  # dgeom usa k-1 como parámetro (2 fallas antes del éxito)
cat("P(X = 3) =", round(prob_3, 4), "=", prob_3, "\n")
## P(X = 3) = 0.125 = 0.125
cat("Secuencia SCX (Sello-Sello-Cara)\n\n")
## Secuencia SCX (Sello-Sello-Cara)
# Probabilidad de necesitar 5 o menos lanzamientos
prob_leq_5 <- pgeom(4, p)  # pgeom usa k-1 como parámetro
cat("P(X ≤ 5) =", round(prob_leq_5, 4), "=", prob_leq_5, "\n")
## P(X ≤ 5) = 0.9688 = 0.96875
cat("La primera cara aparece en los primeros 5 lanzamientos\n\n")
## La primera cara aparece en los primeros 5 lanzamientos
# Probabilidad de necesitar más de 4 lanzamientos
prob_gt_4 <- 1 - pgeom(3, p)
cat("P(X > 4) =", round(prob_gt_4, 4), "=", prob_gt_4, "\n")
## P(X > 4) = 0.0625 = 0.0625
cat("Necesitas más de 4 lanzamientos para la primera cara\n\n")
## Necesitas más de 4 lanzamientos para la primera cara
# Esperanza y varianza teóricas
esperanza <- 1/p
varianza <- (1-p)/(p^2)
cat("E[X] =", esperanza, "lanzamientos en promedio\n")
## E[X] = 2 lanzamientos en promedio
cat("V(X) =", varianza, "\n\n")
## V(X) = 2
# Cálculo manual para verificar P(X = 3)
prob_manual <- (1-p)^(3-1) * p  # (1-0.5)^2 * 0.5 = 0.25 * 0.5 = 0.125
cat("Verificación manual: P(X = 3) = (1-p)^2 × p = 0.5^2 × 0.5 =", prob_manual, "\n\n")
## Verificación manual: P(X = 3) = (1-p)^2 × p = 0.5^2 × 0.5 = 0.125
# Visualización de la distribución
k_vals <- 1:10
pmf_vals <- dgeom(k_vals-1, p)

2. Distribución Binomial Negativa

Definición y Contexto

La distribución binomial negativa modela el número de ensayos independientes de Bernoulli necesarios para obtener exactamente \(r\) éxitos, donde cada ensayo tiene probabilidad de éxito \(p\) constante. Es una generalización de la distribución geométrica (\(r=1\)).

Fórmulas Matemáticas

Parámetros: \(r \in \{1, 2, 3, \ldots\}\) (número de éxitos deseados), \(p \in (0,1]\) (probabilidad de éxito)

Soporte: \(k \in \{r, r+1, r+2, \ldots\}\)

Función de Masa de Probabilidad (PMF)

\[P(X = k) = \binom{k-1}{r-1} \cdot p^r \cdot (1-p)^{k-r}\]

Función de Distribución Acumulada (CDF)

\[F(k) = P(X \leq k) = \sum_{i=r}^{k} \binom{i-1}{r-1} \cdot p^r \cdot (1-p)^{i-r}\]

Esperanza y Varianza

\[E[X] = \frac{r}{p}\] \[\text{V}(X) = \frac{r(1-p)}{p^2}\] ## Ejemplo

Problema: Se lanza un dado equilibrado repetidamente hasta obtener 3 seises. Calcular:la probabilidad de que se necesiten exactamente 5 lanzamientos para obtener 3 seises y la probabilidad de que los 3 seises aparezcan en 8 o menos lanzamientos.

# Parámetros
r <- 3          # número de éxitos deseados (3 seises)
p <- 1/6        # probabilidad de éxito por lanzamiento

cat("=== LANZAMIENTO DE DADO HASTA OBTENER 3 SEISES ===\n\n")
## === LANZAMIENTO DE DADO HASTA OBTENER 3 SEISES ===
# Probabilidad de necesitar exactamente 5 lanzamientos para 3 seises
prob_5 <- dnbinom(5-r, r, p)  # dnbinom usa k-r como primer parámetro
cat("P(X = 5) =", round(prob_5, 4), "\n")
## P(X = 5) = 0.0193
cat("Interpretación: 3 seises y 2 no-seises en 5 lanzamientos\n\n")
## Interpretación: 3 seises y 2 no-seises en 5 lanzamientos
# Probabilidad de necesitar 8 o menos lanzamientos
prob_leq_8 <- pnbinom(8-r, r, p)
cat("P(X ≤ 8) =", round(prob_leq_8, 4), "\n")
## P(X ≤ 8) = 0.1348
cat("Interpretación: Los 3 seises aparecen en los primeros 8 lanzamientos\n\n")
## Interpretación: Los 3 seises aparecen en los primeros 8 lanzamientos
# Esperanza
esperanza <- r/p
cat("E[X] =", round(esperanza, 1), "lanzamientos en promedio\n\n")
## E[X] = 18 lanzamientos en promedio
# Casos específicos para entender mejor
cat("Casos posibles para X = 5:\n")
## Casos posibles para X = 5:
cat("- El 5° lanzamiento debe ser seis (obligatorio)\n") 
## - El 5° lanzamiento debe ser seis (obligatorio)
cat("- En los primeros 4 lanzamientos debe haber exactamente 2 seises\n")
## - En los primeros 4 lanzamientos debe haber exactamente 2 seises
cat("- Número de maneras de elegir 2 posiciones de 4:", choose(4,2), "\n\n")
## - Número de maneras de elegir 2 posiciones de 4: 6

3. Distribución de Poisson

Definición y Contexto

La distribución de Poisson modela el número de eventos que ocurren en un intervalo fijo de tiempo o espacio, cuando estos eventos suceden de manera independiente y a una tasa promedio constante \(\lambda\).

Fórmulas Matemáticas

Parámetros: \(\lambda > 0\) (tasa promedio de ocurrencia)

Soporte: \(k \in \{0, 1, 2, 3, \ldots\}\)

Función de Masa de Probabilidad (PMF)

\[P(X = k) = \frac{\lambda^k \cdot e^{-\lambda}}{k!}\]

Función de Distribución Acumulada (CDF)

\[F(k) = P(X \leq k) = \sum_{i=0}^{k} \frac{\lambda^i \cdot e^{-\lambda}}{i!}\]

Esperanza y Varianza

\[E[X] = \lambda\] \[\text{V}(X) = \lambda\]

Propiedad importante: En la distribución de Poisson, la media y la varianza son iguales.

Ejemplo

Problema:Se estudia la llegada de clientes a una tienda, donde en promedio llegan 2 clientes por hora. Se asume que el número de clientes que llegan en una hora sigue una distribución de Poisson con parámetro: \[\lambda = 2\]

# Parámetros
lambda <- 2  # promedio de clientes por hora

cat("=== LLEGADA DE CLIENTES A UNA TIENDA ===\n\n")
## === LLEGADA DE CLIENTES A UNA TIENDA ===
# Probabilidad de exactamente 3 clientes
prob_3 <- dpois(3, lambda)
cat("P(X = 3) =", round(prob_3, 4), "\n")
## P(X = 3) = 0.1804
cat("Interpretación: Exactamente 3 clientes llegan en una hora\n\n")
## Interpretación: Exactamente 3 clientes llegan en una hora
# Probabilidad de 4 o menos clientes
prob_leq_4 <- ppois(4, lambda)
cat("P(X ≤ 4) =", round(prob_leq_4, 4), "\n")
## P(X ≤ 4) = 0.9473
cat("Interpretación: Como máximo 4 clientes en una hora\n\n")
## Interpretación: Como máximo 4 clientes en una hora
# Probabilidad de más de 2 clientes (más que el promedio)
prob_gt_2 <- 1 - ppois(2, lambda)
cat("P(X > 2) =", round(prob_gt_2, 4), "\n")
## P(X > 2) = 0.3233
cat("Interpretación: Más clientes que el promedio\n\n")
## Interpretación: Más clientes que el promedio
# Esperanza y varianza (iguales en Poisson)
cat("E[X] = Var(X) =", lambda, "\n\n")
## E[X] = Var(X) = 2
# Cálculos manuales para entender
cat("Verificación manual:\n")
## Verificación manual:
cat("P(X = 0) = e^(-2) =", round(exp(-2), 4), "\n")
## P(X = 0) = e^(-2) = 0.1353
cat("P(X = 1) = 2 × e^(-2) =", round(2*exp(-2), 4), "\n")
## P(X = 1) = 2 × e^(-2) = 0.2707
cat("P(X = 2) = 2^2/2! × e^(-2) =", round((2^2/factorial(2))*exp(-2), 4), "\n")
## P(X = 2) = 2^2/2! × e^(-2) = 0.2707
cat("P(X = 3) = 2^3/3! × e^(-2) =", round((2^3/factorial(3))*exp(-2), 4), "\n\n")
## P(X = 3) = 2^3/3! × e^(-2) = 0.1804

4. Distribución Uniforme Discreta

Definición y Contexto

La distribución uniforme discreta asigna la misma probabilidad a cada uno de los \(n\) valores posibles en un conjunto finito. Es el modelo de “equiprobabilidad” para variables discretas.

Fórmulas Matemáticas

Parámetros: \(a, b \in \mathbb{Z}\) con \(a \leq b\) (límites del soporte)

Soporte: \(k \in \{a, a+1, a+2, \ldots, b\}\)

Número de valores posibles: \(n = b - a + 1\)

Función de Masa de Probabilidad (PMF)

\[P(X = k) = \frac{1}{n} = \frac{1}{b-a+1} \text{ para } k \in \{a, a+1, \ldots, b\}\]

Función de Distribución Acumulada (CDF)

\[F(k) = P(X \leq k) = \frac{k-a+1}{b-a+1} \text{ para } k \in \{a, a+1, \ldots, b\}\]

Esperanza y Varianza

\[E[X] = \frac{a+b}{2}\] \[\text{V}(X) = \frac{(b-a+1)^2-1}{12}\]

Ejemplo Aplicado

Problema: Se lanza un dado equilibrado, donde cada una de sus caras tiene la misma probabilidad de aparecer. Determine la probabilidad de que salga un número par y encuentre la esperanza y la varianza de la variable aleatoria que representa la cara obtenida.

# Parámetros para un dado
a <- 1  # valor mínimo
b <- 6  # valor máximo
n <- b - a + 1  # número total de valores posibles

cat("=== LANZAMIENTO DE UN DADO EQUILIBRADO ===\n\n")
## === LANZAMIENTO DE UN DADO EQUILIBRADO ===
# Función PMF manual
dunif_disc <- function(x, min_val, max_val) {
  ifelse(x >= min_val & x <= max_val & x == round(x), 
         1/(max_val - min_val + 1), 0)
}

# Probabilidad de cada cara del dado
valores <- a:b
prob_individual <- 1/n
cat("Valores posibles:", paste(valores, collapse = ", "), "\n")
## Valores posibles: 1, 2, 3, 4, 5, 6
cat("Probabilidad de cada valor: 1/", n, "=", round(prob_individual, 4), "\n\n")
## Probabilidad de cada valor: 1/ 6 = 0.1667
# Probabilidad de obtener un número par
numeros_pares <- valores[valores %% 2 == 0]  # 2, 4, 6
prob_par <- length(numeros_pares) / n
cat("Números pares:", paste(numeros_pares, collapse = ", "), "\n")
## Números pares: 2, 4, 6
cat("P(número par) =", length(numeros_pares), "/", n, "=", round(prob_par, 4), "\n\n")
## P(número par) = 3 / 6 = 0.5
# Esperanza y varianza
esperanza <- (a + b) / 2
varianza <- ((b - a + 1)^2 - 1) / 12
cat("E[X] =", esperanza, "(valor central)\n")
## E[X] = 3.5 (valor central)
cat("Var(X) =", round(varianza, 3), "\n\n")
## Var(X) = 2.917
# Visualización
df_uniforme <- data.frame(
  k = valores,
  pmf = rep(prob_individual, n),
  es_par = ifelse(valores %% 2 == 0, "Par", "Impar"),
  mayor_4 = ifelse(valores > 4, "Mayor que 4", "4 o menor")
)