Introducción

En el análisis de datos y la ingeniería estadística, comprender las distribuciones de probabilidad es esencial para modelar fenómenos reales.
A lo largo de este documento exploraremos cinco distribuciones fundamentales: Lognormal, Normal (Gaussiana), Chi-cuadrado, Poisson y Exponencial.

Cada una de ellas posee propiedades únicas que permiten describir distintos tipos de variables.
Se presentarán sus fórmulas teóricas, ejemplos prácticos generados en R y representaciones gráficas que facilitan su interpretación y aplicación en la práctica.

1.Distribución Lognormal

La distribución lognormal se aplica cuando los datos son estrictamente positivos y presentan una cola alargada hacia la derecha.
Surge naturalmente cuando el logaritmo de la variable sigue una distribución normal.
Es común en contextos donde los valores crecen de forma multiplicativa, como precios, ingresos o tiempos de producción.

Fórmula:

\[ f(x; \mu, \sigma) = \frac{1}{x\sigma\sqrt{2\pi}} \exp\left(-\frac{(\ln(x) - \mu)^2}{2\sigma^2}\right), \quad x > 0 \]

Ejemplo en R:

datos_lognorm <- rlnorm(700, meanlog = 0.5, sdlog = 0.8)
par(bg = "lavenderblush")
plot(density(datos_lognorm),
     main = "Distribución Lognormal",
     xlab = "Eje X", ylab = "Eje Y",
     col = "deeppink", type = "l", lwd = 2)

interpretacion

Se observa una concentración de valores pequeños con una cola larga hacia la derecha. Esto refleja que la mayoría de los datos tienen valores bajos, pero existen algunos casos con valores mucho mayores.

2.Distribución Normal(Gaussiana)

La distribución normal, también conocida como campana de Gauss, es una de las más relevantes en estadística. Modela fenómenos donde las observaciones se agrupan alrededor de una media, con igual probabilidad de desviarse hacia la derecha o hacia la izquierda. Ejemplos clásicos incluyen las alturas humanas, los errores de medición o los rendimientos académicos.

Fórmula:

\[ f(x; \mu, \sigma) = \frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \] Ejemplo en R:

datos_norm <- rnorm(700, mean = 0, sd = 1)
par(bg = "ivory")
plot(density(datos_norm),
     main = "Distribución Normal",
     xlab = "Eje X", ylab = "Eje Y",
     col = "red", type = "l", lwd = 2,)

Interpretación:

La curva tiene forma de campana simétrica centrada en la media (50). Esto significa que la mayoría de los valores están cercanos a la media y que los valores extremos son menos frecuentes.

3.Distribución Chi-Cuadrado

La distribución chi-cuadrado se utiliza principalmente en pruebas de hipótesis y análisis estadístico inferencial. Depende de un parámetro llamado grados de libertad (k) y siempre toma valores positivos. Es común en el contexto de pruebas de independencia y ajuste de modelos.

Fórmula:

\[ f(x; k) = \frac{1}{2^{k/2}\Gamma(k/2)} x^{(k/2)-1} e^{-x/2}, \quad x > 0 \] Ejemplo en R:

datos_chi <- rchisq(700, df = 4)
par(bg="honeydew")
plot(density(datos_chi),
     main = "Distribución Chi-Cuadrado",
     xlab = "Eje X", ylab = "Eje Y",
     col = "darkgreen", type = "l", lwd = 2)

Interpretación:

Cuando los grados de libertad son bajos, la distribución es muy asimétrica. A medida que los grados de libertad aumentan, la forma se aproxima gradualmente a una distribución normal.

4.Distribución Poisson

La distribución de Poisson modela el número de veces que ocurre un evento durante un intervalo de tiempo o espacio determinado, cuando los sucesos son independientes. Por ejemplo, el número de defectos en una producción o la cantidad de clientes que llegan a una tienda por hora.

Fórmula:

\[ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots \] Ejemplo en R:

datos_pois <- rpois(700, lambda = 3)
par(bg= "aliceblue")
hist(datos_pois,
     main = "Distribución de Poisson",
     xlab = "Número de eventos (k)",
     ylab = "Frecuencia",
     col = "lightblue", border = "gray")

Interpretación:

El histograma muestra que los valores más probables se concentran cerca de λ=4, y la probabilidad disminuye para valores mucho menores o mayores.

5.Distribución Exponencial

Se emplea para describir el tiempo que transcurre entre la ocurrencia de eventos sucesivos. Por ejemplo, el tiempo entre llamadas telefónicas o entre llegadas de buses a una estación.

Fórmula:

\[ f(x; \lambda) = \lambda e^{-\lambda x}, \quad x \ge 0 \] Ejemplo en R:

datos_exp <- rexp(700, rate = 1)
par(bg = "lavender")
plot(density(datos_exp),
     main = "Distribución Exponencial",
     xlab = "Eje X (Tiempo)", ylab = "Eje Y",
     col = "purple", type = "l", lwd = 2)

Interpretación:

La función comienza con una alta probabilidad para tiempos pequeños, que disminuye exponencialmente conforme aumenta el tiempo. Esto indica que los eventos ocurren con mayor frecuencia al inicio y son menos probables a medida que pasa el tiempo.