Esta se usa cuando los datos se distribuyen de forma asimétrica, o sea, que tienden a estar más pegados a un lado que al otro. Suele aplicarse cuando las variables solo pueden tomar valores positivos y crecen rápido, como ingresos, precios, o tiempo de vida de productos. Ejemplo: Supón que estamos viendo cuánto tiempo duran las pilas recargables. Esos tiempos pueden variar bastante, pero tienden a concentrarse en valores menores y tener una “cola” hacia la derecha (tiempos más largos).
datos_lognormal <- rlnorm(100, meanlog = 0, sdlog = 1)
plot(density(datos_lognormal), main = "Distribución Lognormal", xlab = "Valores", col = "skyblue", lwd = 2)
points(density(datos_lognormal), col = "blue", pch = 16)
Es la típica “campana de Gauss”, se usa cuando los datos están distribuidos de manera más uniforme alrededor de un promedio. Es clave para cosas como calificaciones, peso de productos en producción, o alturas de personas. Ejemplo: Digamos que medimos la estatura de estudiantes en un colegio. La mayoría estarán alrededor de un promedio (digamos, 1.65m) y habrá menos estudiantes muy altos o muy bajitos, formando esa forma de campana.
normal <- rnorm(100, mean = 0, sd = 1)
plot(density(normal), main = "Distribución Normal (Gaussiana)", xlab = "Valores", col = "lightgreen", lwd = 2)
points(density(normal), col = "red", pch = 16) # Agregar puntos
La chi-cuadrado es común en pruebas estadísticas, especialmente para comparar frecuencias y ver si un resultado se ajusta a lo esperado. Ayuda mucho en investigaciones y estudios de datos categóricos. Ejemplo: Si quieres ver si la cantidad de carros que pasan por un peaje en un día sigue un patrón o se desvía de lo normal, puedes usar esta distribución para hacer esa verificación.
chi <- rchisq(100, df = 3)
plot(density(chi), main = "Distribución Chi-cuadrado", xlab = "Valores", col = "orange", lwd = 2)
points(density(chi), col = "purple", pch = 16) # Agregar puntos
Sirve para contar la cantidad de eventos que ocurren en un periodo específico, como llamadas a una línea de servicio o accidentes de tránsito en una semana. Funciona bien cuando los eventos son raros y no se agrupan. Ejemplo: Si una panadería quiere estimar cuántos clientes pueden llegar en una hora, puede usar la Poisson para ver cuántas personas pasan de forma “aleatoria” en ese lapso.
poisson <- rpois(100, lambda = 3)
plot(density(poisson), main = "Distribución Poisson", xlab = "Valores", col = "purple", lwd = 2)
points(density(poisson), col = "green", pch = 16) # Agregar puntos
Es muy útil para modelar el tiempo entre eventos que pasan al azar y de forma constante en el tiempo, como el tiempo de espera entre buses o cuánto tarda en llegar la siguiente llamada en un call center. Ejemplo: Si estás esperando el bus, y sabes que pasan en intervalos medios de 10 minutos, la distribución exponencial te puede ayudar a estimar cuánto tardará el próximo en llegar.
exponencial <- rexp(100, rate = 1)
plot(density(exponencial), main = "Distribución Exponencial", xlab = "Valores", col = "red", lwd = 2)
points(density(exponencial), col = "blue", pch = 16) # Agregar puntos