Este informe presenta una síntesis de cinco distribuciones: Lognormal, Gaussiana, Chi Cuadrado, Poisson y Exponencial. Para cada una, se proporciona una breve explicación, un ejemplo de código en R y una gráfica representativa.
La distribución lognormal es útil cuando los datos están distribuidos de manera asimétrica hacia la derecha, como el valor de ciertos activos financieros.
# Datos lognormales simulando valores de activos
lognormaldatos <- rlnorm(1000, meanlog = 2, sdlog = 0.5)
# Gráfica de la distribución con línea de promedio
hist(lognormaldatos, breaks = 30, main = "Distribución Lognormal", xlab = "Valores", ylab = "Frecuencia de Datos", col = "skyblue")
abline(v = mean(lognormaldatos), col = "red", lwd = 2, lty = 2) # Línea de promedio
La distribución normal o gaussiana es simétrica y se representa en una campana de Gauss, donde los datos se agrupan alrededor de un medio central, como suele suceder en las alturas de una población.
# Datos normales simulando alturas en cm (ejemplo realista)
gaussianadatos <- rnorm(1000, mean = 170, sd = 10)
# Gráfica de la distribución con línea de promedio
hist(gaussianadatos, breaks = 30, main = "Distribución Normal (Alturas)", xlab = "Altura (cm)", ylab = "Frecuencia de Datos", col = "lightgreen")
abline(v = mean(gaussianadatos), col = "red", lwd = 2, lty = 2) # Línea de promedio
La distribución chi-cuadrado surge al sumar los cuadrados de variables normales independientes. Su forma depende del parámetro de grados de libertad.
# Datos Chi-cuadrado simulando una prueba de chi-cuadrado de bondad de ajuste
chidatos <- rchisq(1000, df = 5)
# Gráfica de la distribución con línea de promedio
hist(chidatos, breaks = 30, main = "Distribución Chi-Cuadrado", xlab = "Valores", ylab = "Frecuencia de Datos", col = "pink")
abline(v = mean(chidatos), col = "red", lwd = 2, lty = 2) # Línea de promedio
La distribución de Poisson modela el número de eventos que ocurren en un intervalo de tiempo o espacio, bajo la suposición de independencia entre eventos, como puede ser el número de personas que llegan a una fila de banco.
# Datos Poisson simulando número de personas que llegan a una fila de banco por minuto
poissondatos <- rpois(1000, lambda = 4)
# Gráfica de la distribución con línea de promedio
hist(poissondatos, breaks = 20, main = "Distribución de Poisson (Llegadas a un banco)", xlab = "Conteos", ylab = "Frecuencia de Datos", col = "orange")
abline(v = mean(poissondatos), col = "red", lwd = 2, lty = 2) # Línea de promedio
La distribución exponencial modela el tiempo entre eventos en un proceso de Poisson, y es común para modelar tiempos de espera, como el tiempo de espera en una cola de servicio.
# Datos exponenciales simulando tiempos de espera en minutos
expodatos <- rexp(1000, rate = 0.5)
# Gráfica de la distribución con línea de promedio
hist(expodatos, breaks = 30, main = "Distribución Exponencial (Tiempo de Espera)", xlab = "Tiempo (minutos)", ylab = "Frecuencia de Datos", col = "purple")
abline(v = mean(expodatos), col = "red", lwd = 2, lty = 2) # Línea de promedio