1-Distribución Lognormal

La distribución lognormal es una distribución de probabilidad de una variable aleatoria cuyo logaritmo está distribuido de forma normal. Esto significa que si x es una variable aleatoria lognormal, entonces𝑌=ln(𝑋) sigue una distribución normal.

ejemplo distribucion lognormal

Una empresa fabrica bombillas y desea analizar el tiempo de vida de sus productos. Sabe que el tiempo de vida de las bombillas sigue una distribución lognormal, por lo que decide tomar una muestra de 50 bombillas con una media logarítmica (μ) de 2 y una desviación estándar logarítmica (σ) de 0.5. La empresa crea un histograma con estos datos para visualizar la distribución de los tiempos de vida de las bombillas.

# Definir los parámetros de la distribución lognormal
mu <- 2       # Media del logaritmo
sigma <- 0.5  # Desviación estándar del logaritmo
n <- 50       # Número de muestras

# Generar datos lognormales
set.seed(123)  # Fijar semilla para reproducibilidad
datos_lognorm <- rlnorm(n, meanlog = mu, sdlog = sigma)

# Crear el histograma de los datos lognormales
hist(datos_lognorm, 
     breaks = 15, 
     probability = TRUE, 
     main = "Distribución Lognormal del Tiempo de Vida de Bombillas", 
     xlab = "Tiempo de Vida (horas)", 
     ylab = "Densidad", 
     col = "lightblue", 
     border = "darkblue")

# Agregar la curva teórica de la distribución lognormal
curve(dlnorm(x, meanlog = mu, sdlog = sigma), 
      col = "red", 
      lwd = 2, 
      add = TRUE)

# Definir los parámetros de la distribución lognormal
mu <- 2       # Media del logaritmo
sigma <- 0.5  # Desviación estándar del logaritmo
n <- 50       # Número de muestras

# Generar datos lognormales
set.seed(123)  # Fijar semilla para reproducibilidad
datos_lognorm <- rlnorm(n, meanlog = mu, sdlog = sigma)

# Crear el histograma de los datos lognormales
hist(datos_lognorm, 
     breaks = 15, 
     probability = TRUE, 
     main = "Distribución Lognormal del Tiempo de Vida de Bombillas", 
     xlab = "Tiempo de Vida (horas)", 
     ylab = "Densidad", 
     col = "lightblue", 
     border = "darkblue")

# Agregar la curva teórica de la distribución lognormal
curve(dlnorm(x, meanlog = mu, sdlog = sigma), 
      col = "red", 
      lwd = 2, 
      add = TRUE)

# 2- Distribución Gaussiana (Normal)

La distribución gaussiana o normal es una de las más comunes y describe fenómenos naturales con un comportamiento simétrico alrededor de la media.

ejemplo

Un fabricante de botellas de agua realiza mediciones de la cantidad de líquido que cada botella contiene, con el objetivo de asegurar que en promedio cada botella tiene 500 ml. Tras análisis previos, sabe que las variaciones siguen una distribución normal con una media de 500 ml y una desviación estándar de 10 ml. El fabricante toma una muestra de 100 botellas y crea un histograma de los datos para verificar que cumplen con las especificaciones.

# Definir parámetros de la distribución normal
media <- 500        # Media de la cantidad de agua en ml
desviacion <- 10    # Desviación estándar en ml
n <- 100            # Número de muestras

# Generar datos de la distribución normal
set.seed(123)       # Fijar semilla para reproducibilidad
datos_normal <- rnorm(n, mean = media, sd = desviacion)

# Crear el histograma de los datos normales
hist(datos_normal, 
     breaks = 15, 
     probability = TRUE, 
     main = "Distribución Normal de Cantidad de Agua en Botellas", 
     xlab = "Cantidad de Agua (ml)", 
     ylab = "Densidad", 
     col = "lightgreen", 
     border = "darkgreen")

# Agregar la curva teórica de la distribución normal
curve(dnorm(x, mean = media, sd = desviacion), 
      col = "blue", 
      lwd = 2, 
      add = TRUE)

# 3- Distribución Chi-cuadrado

La distribución chi-cuadrado se utiliza para pruebas estadísticas de bondad de ajuste y es común en inferencia estadística.

ejemplo

Un equipo de investigadores está evaluando la variabilidad de las puntuaciones en una prueba de habilidad técnica realizada a un grupo de personas. Para modelar la variabilidad en los resultados, asumen que los datos siguen una distribución Chi-cuadrado con 4 grados de libertad. Generan una muestra de 100 puntuaciones y crean un histograma para visualizar la distribución.

# Definir el número de grados de libertad
grados_libertad <- 4
n <- 100          # Número de muestras

# Generar datos de la distribución Chi-cuadrado
set.seed(123)     # Fijar semilla para reproducibilidad
datos_chi <- rchisq(n, df = grados_libertad)

# Crear el histograma de los datos Chi-cuadrado
hist(datos_chi, 
     breaks = 15, 
     probability = TRUE, 
     main = "Distribución Chi-cuadrado con 4 Grados de Libertad", 
     xlab = "Valores", 
     ylab = "Densidad", 
     col = "lightcoral", 
     border = "darkred")

# Agregar la curva teórica de la distribución Chi-cuadrado
curve(dchisq(x, df = grados_libertad), 
      col = "blue", 
      lwd = 2, 
      add = TRUE)

# 4- Distribución Poisson

La distribución de Poisson describe eventos que ocurren de forma independiente en intervalos de tiempo fijos, como el número de llegadas a una cola.

ejemplo

Un pequeño restaurante ha notado que, en promedio, recibe 4 clientes por hora. El propietario desea modelar el número de clientes que llegan al restaurante en una hora utilizando una distribución de Poisson. Para esto, genera una muestra de 100 horas y crea un histograma para visualizar la distribución del número de clientes que llegan.

# Definir el promedio de boletos vendidos por minuto
lambda <- 5       # Tasa media
n <- 100          # Número de muestras

# Generar datos de la distribución Poisson
set.seed(123)     # Fijar semilla para reproducibilidad
datos_poisson <- rpois(n, lambda)

# Crear el histograma
hist(datos_poisson, 
     breaks = 6, 
     main = "Distribución de Poisson (λ = 5)", 
     xlab = "Número de Boletos Vendidos", 
     col = "lightblue", 
     border = "darkblue")

# 5- Distribución Exponencial

La distribución exponencial modela el tiempo entre eventos en un proceso de Poisson, como el tiempo de espera entre llegadas.

#3ejemplo

Un servicio de atención al cliente recibe llamadas en promedio cada 5 minutos. El gerente desea modelar el tiempo entre llamadas utilizando una distribución exponencial. Para ello, genera una muestra de 100 intervalos de tiempo entre llamadas y crea un histograma para visualizar la distribución de estos tiempos.

# Definir la tasa media de llegadas (lambda)
lambda <- 1 / 5    # Tasa media (1 llamada cada 5 minutos)
n <- 100            # Número de muestras

# Generar datos de la distribución exponencial
set.seed(123)       # Fijar semilla para reproducibilidad
datos_exponencial <- rexp(n, rate = lambda)

# Crear el histograma de los datos exponenciales
hist(datos_exponencial, 
     breaks = 15, 
     probability = TRUE, 
     main = "Distribución Exponencial (λ = 0.2)", 
     xlab = "Tiempo entre llamadas (minutos)", 
     ylab = "Densidad", 
     col = "lightgreen", 
     border = "darkgreen")

# Agregar la curva teórica de la distribución exponencial
curve(dexp(x, rate = lambda), 
      from = 0, 
      to = max(datos_exponencial), 
      col = "blue", 
      lwd = 2, 
      add = TRUE)