Taller Distribuciones

Distribución Lognormal

Esta se usa cuando los datos se distribuyen de forma asimétrica, o sea, que tienden a estar más pegados a un lado que al otro. Suele aplicarse cuando las variables solo pueden tomar valores positivos y crecen rápido, como ingresos, precios, o tiempo de vida de productos. Ejemplo: Supón que estamos viendo cuánto tiempo duran las pilas recargables. Esos tiempos pueden variar bastante, pero tienden a concentrarse en valores menores y tener una “cola” hacia la derecha (tiempos más largos).

datos_lognormal <- rlnorm(100, meanlog = 0, sdlog = 1)

plot(density(datos_lognormal), main = "Distribución Lognormal", xlab = "Valores", col = "skyblue", lwd = 2)
points(density(datos_lognormal), col = "blue", pch = 16)

Distribución Gaussiana

Es la típica “campana de Gauss”, se usa cuando los datos están distribuidos de manera más uniforme alrededor de un promedio. Es clave para cosas como calificaciones, peso de productos en producción, o alturas de personas. Ejemplo: Digamos que medimos la estatura de estudiantes en un colegio. La mayoría estarán alrededor de un promedio (digamos, 1.65m) y habrá menos estudiantes muy altos o muy bajitos, formando esa forma de campana.

normal <- rnorm(100, mean = 0, sd = 1)

plot(density(normal), main = "Distribución Normal (Gaussiana)", xlab = "Valores", col = "lightgreen", lwd = 2)
points(density(normal), col = "red", pch = 16)  # Agregar puntos

Distribución Chi-cuadrado

La chi-cuadrado es común en pruebas estadísticas, especialmente para comparar frecuencias y ver si un resultado se ajusta a lo esperado. Ayuda mucho en investigaciones y estudios de datos categóricos. Ejemplo: Si quieres ver si la cantidad de carros que pasan por un peaje en un día sigue un patrón o se desvía de lo normal, puedes usar esta distribución para hacer esa verificación.

chi <- rchisq(100, df = 3)

plot(density(chi), main = "Distribución Chi-cuadrado", xlab = "Valores", col = "orange", lwd = 2)
points(density(chi), col = "purple", pch = 16)  # Agregar puntos

Distribución Poisson

Sirve para contar la cantidad de eventos que ocurren en un periodo específico, como llamadas a una línea de servicio o accidentes de tránsito en una semana. Funciona bien cuando los eventos son raros y no se agrupan. Ejemplo: Si una panadería quiere estimar cuántos clientes pueden llegar en una hora, puede usar la Poisson para ver cuántas personas pasan de forma “aleatoria” en ese lapso.

poisson <- rpois(100, lambda = 3)

plot(density(poisson), main = "Distribución Poisson", xlab = "Valores", col = "purple", lwd = 2)
points(density(poisson), col = "green", pch = 16)  # Agregar puntos

Distribución Exponencial

Es muy útil para modelar el tiempo entre eventos que pasan al azar y de forma constante en el tiempo, como el tiempo de espera entre buses o cuánto tarda en llegar la siguiente llamada en un call center. Ejemplo: Si estás esperando el bus, y sabes que pasan en intervalos medios de 10 minutos, la distribución exponencial te puede ayudar a estimar cuánto tardará el próximo en llegar.

exponencial <- rexp(100, rate = 1)

plot(density(exponencial), main = "Distribución Exponencial", xlab = "Valores", col = "red", lwd = 2)
points(density(exponencial), col = "blue", pch = 16)  # Agregar puntos