1. Distribución Log-normal

La distribución lognormal se ha descrito como el modelo de distribución de datos de vida útil más comúnmente utilizado para muchas aplicaciones de alta tecnología. La distribución se basa en el modelo de crecimiento multiplicativo, lo que significa que en cualquier instante de tiempo, el proceso sufre un incremento aleatorio de degradación que es proporcional a su estado actual.

dlnorm(): Calcula la densidad de probabilidad para un valor específico en una distribución log-normal.

plnorm(): Calcula la probabilidad acumulada de que una variable log-normal sea menor o igual a un valor específico.

qlnorm(): Encuentra el valor log-normal que corresponde a un nivel de probabilidad acumulada dado.

rlnorm(): Genera números aleatorios que siguen una distribución log-normal.

Ejemplo:

Se tiene los tiempos de vida de 100 baterías medidos en horas. Los datos tienen una media logarítmica de 5 y una desviación estándar logarítmica de 0.5

library(ggplot2)
# Generar datos de tiempo de vida de baterías
tiempo_vida = rlnorm(100, meanlog = 5, sdlog = 0.5)
#meanlog: media logaritmica
#sdlog: desviación estándar logarítmica

# Gráfico
hist(tiempo_vida,probability=TRUE,main="Distribución log-normal",xlab="Tiempo",ylab="Densidad",col="skyblue")
lines(density(tiempo_vida),lwd=2)

2. Distribución gaussiana o normal

Es una distribución de probabilidad que se usa para describir cómo se distribuyen los datos alrededor de un valor promedio. Se representa gráficamente como una curva en forma de campana, conocida como la campana de Gauss.

En R es posible usar herramientas para realizar calculos de datos respecto a los diferentes tipos de uso de distribución normal. Los comandos son los siguientes:

1.dnorm() - Calcula la densidad en un punto dado para una distribución normal.

2.pnorm() - Calcula la probabilidad acumulada de que una variable normal sea menor o igual a un valor específico.

3.qnorm() - Calcula el cuantil para una probabilidad acumulativa determinada.

4.rnorm() - Genera números aleatorios siguiendo una distribución normal.

Ejemplo

Simulando el dato respecto al peso de 1000 personas, donde el promedio es de 70 kg con una desviación estándar de 15 kg se obtiene la siguiente ilustración.

pesos = rnorm(n=1000, mean = 80, sd = 5)
# n: número de registros generados
# mean: promedio
# sd: desviación estandar 
hist(pesos,main="Distribución de gauss",xlab="Peso",ylab="Frecuencia",col="skyblue")

3. Distribución Chi cuadrado

Es una herramienta estadística matemática que se utiliza para comprobar si existe una relación o asociación entre dos variables categóricas o para comprobar si los datos se comportan como esperamos.

Se usa principalmente para comprobar si existe una asociación entre dos variables y comparar datos observados con datos esperados.

Las funciones presentes en R son las siguientes:

dchisq(): Calcula la densidad de probabilidad de la distribución chi-cuadrado en un valor específico.

pchisq(): Calcula la probabilidad acumulada de que una variable normal sea menor o igual a un valor específico.

qchisq(): Calcula el cuantil (o valor crítico) de la distribución chi-cuadrado.

rchisq(): Genera números aleatorios siguiendo una distribución chi cuadrada.

Ejemplo

x = rchisq(n=50000, df = 5)
#n=número de registros generados
#df=grado de libertad
hist(x,main="Distribución Chi cuadrado")

4. Distribución de Poisson

La distribución de Poisson se usa para contar el número de eventos que ocurren en un intervalo fijo.

Las funciones presentes en R son las siguientes:

dpois(): Calcula la densidad de probabilidad para un valor específico.

ppois(): Calcula la probabilidad acumulada.

qpois(): calcula el cuantil (o valor crítico) de la distribución de poisson.

rpois(): Genera numeros aleatorios siguiente una distribución de poisson.

Ejemplo

Supongamos que una tienda recibe un promedio de 8 clientes por hora. Con rpois() se generan 1000 datos simulados para ilustrar la distribución

clientes <- rpois(n=1000, lambda = 8)
#n=número de registros generados
#lambda=promedio de clientes por hora
hist(clientes,main="Promedio de clientes por hora",xlab="Clientes",ylab="Frecuencia",col="skyblue")

5. Distribución Exponencial

La distribución exponencial se usa para determinar el tiempo entre eventos especificos.

Las funciones presentes en R son las siguientes:

dexp(): Calcula la densidad de probabilidad para un valor específico.

pexp(): Calcula la probabilidad acumulada de que una variable exponencial sea menor o igual a un valor específico.

qexp(): Encuentra el valor exponencial que corresponde a un nivel de probabilidad acumulada dado.

rexp(): Genera números aleatorios que siguen una distribución exponencial.

Ejemplo

Los clientes llegan a una tienda cada 15 minutos en promedio. Por medio de la distribución exponencial y simulando datos de 100 llegadas se podrá visualizar la distribución de estos tiempos.

tllegadas <- rexp(n=100,rate=1/15)
# n= número de registros simulados
# rate= tasa promedio de llegadas 
hist(tllegadas,main="Tiempo entre llegadas",xlab="Minutos",ylab="Llegadas",col="skyblue")

Distribuciones de probabilidad.

Juan Velez

2024-10-31

1. Distribución Log-normal

Ejemplo:

2. Distribución gaussiana o normal

Ejemplo

3. Distribución Chi cuadrado

Ejemplo

4. Distribución de Poisson

Ejemplo

5. Distribución Exponencial

Ejemplo