1. Distribución Lognormal

La distribución lognormal se utiliza cuando el logaritmo de una variable sigue una distribución normal. Es útil para modelar datos que son siempre positivos, como precios de bienes, duraciones de tiempo, entre otros. La forma de la distribución lognormal es asimétrica hacia la derecha, con una “cola” hacia valores mayores.

Ejemplo: Supongamos que queremos modelar los ingresos mensuales de una población que tienen una media logarítmica de u = 10 y una desviación estándar logarítmica de o = 0.5 Para simular datos que sigan una distribución lognormal en R, usamos rlnorm para generar valores aleatorios.

# Parámetros de la distribución lognormal
mu <- 10    # media logarítmica
sigma <- 0.5  # desviación estándar logarítmica

# Generar 1000 valores aleatorios lognormales
ingresos <- rlnorm(1000, meanlog = mu, sdlog = sigma)

# Visualizar los datos generados
hist(ingresos, breaks = 50, main = "Distribución de Ingresos", xlab = "Ingresos", col = "skyblue", border = "white")

2. Distribución Gaussiana (Normal)

La distribución normal, también conocida como distribución gaussiana, es una de las distribuciones más importantes en estadística debido a su aplicación en el Teorema Central del Límite. Los datos que siguen esta distribución son simétricos alrededor de la media, con una forma de campana. Es común en fenómenos naturales y en mediciones de errores.

Ejemplo: La altura de las personas en una población tiende a agruparse alrededor de un valor promedio, con pocas personas siendo muy bajas o muy altas.

# Parámetros de la distribución normal
mu <- 170     # media
sigma <- 10   # desviación estándar

# Generar 1000 valores aleatorios normales
alturas <- rnorm(1000, mean = mu, sd = sigma)

# Visualizar los datos generados
hist(alturas, breaks = 30, main = "Distribución de Alturas", xlab = "Altura (cm)", col = "lightblue", border = "white")

3. Distribución Chi-Cuadrado

La distribución Chi-cuadrado se utiliza principalmente en pruebas de hipótesis, especialmente en análisis de varianzas y pruebas de independencia. Es asimétrica y depende de los grados de libertad, que determinan su forma. Se usa para modelar la suma de cuadrados de variables aleatorias independientes, cada una con una distribución normal.

Ejemplo: En un examen, si varias personas responden preguntas al azar, la suma de sus errores con respecto a las respuestas correctas puede seguir una distribución Chi-cuadrado, especialmente cuando hay un número alto de preguntas.

# Generación de datos Chi-cuadrado
chisq_data <- rchisq(1000, df = 5)#errores con 5 grados de libertad

# Gráfica
hist(chisq_data, probability = TRUE, main = "Distribución Chi-cuadrado: Suma de errores",
     xlab = "Errores acumulados", ylab = "Densidad", col = "lightpink", border = "black")
lines(density(chisq_data), col = "purple", lwd = 2)

4. Distribución Poisson

La distribución de Poisson es discreta y modela el número de eventos que ocurren en un intervalo de tiempo o espacio, dado un promedio de eventos. Es útil en situaciones donde se cuenta la cantidad de ocurrencias de un evento, como la llegada de clientes a una tienda o la cantidad de llamadas a un centro de servicio en una hora.

Ejemplo: El número de autos que pasa por un semáforo en un minuto puede modelarse con una distribución de Poisson, ya que contamos los eventos en un intervalo de tiempo fijo.

# Generación de datos Poisson
poisson_data <- rpois(1000, lambda = 3)# promedio de 3 autos por minuto

# Gráfica
barplot(table(poisson_data)/length(poisson_data), col = "orange",
        main = "Distribución Poisson: Autos en un semaforo", xlab = "Numero de autos", ylab = "Frecuencia relativa", border = "black")

5. Distribución Exponencial

La distribución exponencial es continua y modela el tiempo entre eventos en un proceso de Poisson. Es útil en estudios de vida y confiabilidad para representar el tiempo hasta el fallo de un sistema. La distribución tiene una “cola” hacia valores mayores y una alta densidad cerca de cero, indicando que el tiempo entre eventos suele ser corto.

Ejemplo: El tiempo que debes esperar hasta que llegue el próximo autobús en una parada suele seguir una distribución exponencial si los autobuses llegan de forma aleatoria.

# Generación de datos Exponenciales
exponential_data <- rexp(1000, rate = 1/10)#tiempo de espera promedio de 10 minutos

# Gráfica
hist(exponential_data, probability = TRUE, main = "Distribución Exponencial: Tiempo de espera",
     xlab = "Tiempo (min)", ylab = "Densidad", col = "lightyellow", border = "black")
lines(density(exponential_data), col = "darkgreen", lwd = 2)