Las distribuciones de probabilidad discretas son modelos matemáticos que permiten describir fenómenos aleatorios en los cuales la variable aleatoria toma valores enteros. Cada distribución posee una función de probabilidad (f), una función de distribución acumulada (F), así como medidas de tendencia central y dispersión, entre ellas la esperanza matemática E[X] y la varianza V[X].
En este documento se estudiarán cuatro distribuciones discretas de gran importancia en probabilidad y estadística:
Cada distribución se presentará con su fórmula de probabilidad, distribución acumulada, valor esperado, varianza, explicación de la variable aleatoria y un ejemplo práctico en R.
La distribución geométrica modela el número de ensayos hasta obtener el primer éxito en ensayos de Bernoulli independientes con probabilidad de éxito p.
Variable aleatoria:
X = número de ensayos hasta el primer éxito
Función de probabilidad (pmf):
f(x) = P(X=x) = (1-p)^(x-1) * p, x = 1,2,3,…
Función de distribución (cdf):
F(x) = P(X ≤ x) = 1 - (1-p)^x
Esperanza:
E[X] = 1/p
Varianza:
V[X] = (1-p)/p^2
p <- 0.3
x <- 1:10
prob <- dgeom(x-1, p) # en R: dgeom usa "fallos antes del éxito"
plot(x, prob, type="h", lwd=3, col="blue",
main="Distribución Geométrica", ylab="P(X=x)")
Se utiliza para modelar el número de eventos que ocurren en un intervalo de tiempo o espacio dado, con tasa λ.
Variable aleatoria:
X = número de eventos en el intervalo
Función de probabilidad:
f(x) = P(X=x) = (e^(-λ) * λ^x) / x!, x = 0,1,2,…
Función de distribución acumulada:
F(x) = P(X ≤ x) = Σ[k=0..x] (e^(-λ) * λ^k) / k!
Esperanza:
E[X] = λ
Varianza:
V[X] = λ
lambda <- 4
x <- 0:12
prob <- dpois(x, lambda)
plot(x, prob, type="h", lwd=3, col="red",
main="Distribución de Poisson", ylab="P(X=x)")
Modela el número de ensayos hasta obtener r éxitos, con probabilidad p de éxito.
Variable aleatoria:
X = número de ensayos hasta el r-ésimo éxito
Función de probabilidad:
f(x) = P(X=x) = C(x-1, r-1) * p^r * (1-p)^(x-r), x = r, r+1,…
Función de distribución:
F(x) = Σ[k=r..x] C(k-1, r-1) * p^r * (1-p)^(k-r)
Esperanza:
E[X] = r/p
Varianza:
V[X] = r(1-p)/p^2
r <- 3
p <- 0.4
x <- r:(r+15)
prob <- dnbinom(x-r, size=r, prob=p) # en R cuenta "fallos" antes de r éxitos
plot(x, prob, type="h", lwd=3, col="darkgreen",
main="Distribución Binomial Negativa", ylab="P(X=x)")
Todos los valores enteros en un intervalo tienen la misma probabilidad.
Variable aleatoria:
X = valor entero en {a, a+1, …, b}
Función de probabilidad:
f(x) = 1 / (b-a+1), x = a, a+1,…, b
Función de distribución:
F(x) = (⌊x⌋ - a + 1) / (b-a+1), a ≤ x ≤ b
Esperanza:
E[X] = (a+b)/2
Varianza:
V[X] = ((b-a+1)^2 - 1)/12
a <- 1; b <- 6 # ejemplo: dado justo
x <- a:b
prob <- rep(1/(b-a+1), length(x))
barplot(prob, names.arg=x, col="orange",
main="Distribución Uniforme Discreta", ylab="P(X=x)")
Las distribuciones discretas permiten modelar diferentes situaciones de conteo. Con R es posible calcular probabilidades y visualizar fácilmente estas distribuciones.