Distribución lognormal

¿Qué es la distribución lognormal?

La distribución lognormal, o distribución normal logarítmica, es una distribución de probabilidad que define una variable aleatoria cuyo logaritmo sigue una distribución normal.

Por lo tanto, si la variable X tiene una distribución normal, entonces la función exponencial x tiene una distribución lognormal.

\[ X \sim \text{Lognormal}(\mu, \sigma^2) \]

Entre la diferentes aplicaciones de la distribución lognormal, en estadística destaca el uso de esta distribución para analizar inversiones financieras y para hacer análisis de fiabilidad.

La distribución lognormal también se conoce como distribución de Tinaut, asimismo, a veces se escribe distribución log normal o distribución log-normal.

Fórmula de la distribución lognormal

La fórmula de la función de densidad de la distribución lognormal es la siguiente:

\[ \displaystyle P[X=x]=\frac{1}{\sigma \cdot x\cdot \sqrt{2 \pi}}\cdot \exp\left(-\frac{(\ln x-\mu)^2}{2\sigma^2}\right) \]

Ejemplo:

En la panadería Buga Pan se realizó un estudio para analizar los tiempos de entrega de los domicilios durante las horas de mayor demanda, especialmente entre las 5:00 p.m. y las 8:00 p.m., cuando muchas personas realizan pedidos de pan caliente, bebidas y productos de repostería.

La administración observó que la mayoría de las entregas se realizan en tiempos relativamente cortos, pero en algunos casos los domicilios tardan mucho más debido al tráfico, la lluvia o la acumulación de pedidos. Como los tiempos de entrega nunca pueden ser negativos y además presentan una fuerte asimetría hacia valores grandes.

Después de recopilar información durante varias semanas, se encontró que los tiempos de entrega seguían aproximadamente una distribución lognormal con:

Media logarítmica: \[ \mu = 2.7 \]
Desviación estándar logarítmica:
\[ \sigma= 0.45 \]

La gerencia desea conocer la densidad de probabilidad de que un pedido tenga exactamente un tiempo de entrega de 20 minutos, con el fin de analizar qué tan concentrados están los tiempos alrededor de ese valor.

Codigo:

numerador = function(x,mu,sigma){
n = exp(-(((log(x)-mu)^2)/(2*(sigma^2))))
return(n)
}

denominador = function(x,sigma){
d = x*sigma*sqrt(2*pi)
return(d)
}

lognormal = function(x,mu,sigma){

p = numerador(x,mu,sigma)/
    denominador(x,sigma)

print(p)

}

lognormal(20,2.7,0.45)

## [1] 0.03571774

dlnorm(20,2.7,0.45)

## [1] 0.03571774

Tabla:

library(kableExtra)

## Warning: package 'kableExtra' was built under R version 4.5.3

domicilios = data.frame(

  Numero_Domicilio = 1:12,

  Producto = c(
    "Pan caliente",
    "Croissant",
    "Chocolate",
    "Torta de vainilla",
    "Café",
    "Pan integral",
    "Galletas",
    "Jugo natural",
    "Pastel de pollo",
    "Pan de queso",
    "Capuchino",
    "Milhoja"
  ),

  Tiempo_Entrega = c(
    11.8,
    14.5,
    16.2,
    18.7,
    19.4,
    20.1,
    22.8,
    24.3,
    26.9,
    29.7,
    33.5,
    38.1
  )
)

kbl(
  domicilios,

  align = "c",

  caption = "Tiempos de entrega registrados en los domicilios de la panadería Buga Pan"
) %>%

kable_styling()

Tiempos de entrega registrados en los domicilios de la panadería Buga Pan
Numero_Domicilio	Producto	Tiempo_Entrega
1	Pan caliente	11.8
2	Croissant	14.5
3	Chocolate	16.2
4	Torta de vainilla	18.7
5	Café	19.4
6	Pan integral	20.1
7	Galletas	22.8
8	Jugo natural	24.3
9	Pastel de pollo	26.9
10	Pan de queso	29.7
11	Capuchino	33.5
12	Milhoja	38.1

Grafica:

mu = 2.7

sigma = 0.45
x_val = seq(1, 60, by = 0.1)
y_val = dlnorm(x_val,
               meanlog = mu,
               sdlog = sigma)

plot(x_val, y_val,
     type = "l",
     col = "blue",
     main = "Distribución Lognormal de los tiempos de entrega",

     xlab = "Tiempo de entrega (minutos)",
     ylab = "Densidad")

abline(v = 20,
       col = "green",
       lty = 2)

Distribución Normal o Gaussiana

¿Qué es la distribución normal?

La distribución normal es una distribución de probabilidad continua cuya gráfica tiene forma de campana y es simétrica respecto a su media. En estadística, la distribución normal sirve para modelizar fenómenos de características muy diferentes, por eso es tan importante esta distribución.

El símbolo de la distribución normal es la letra mayúscula N. Así pues, para indicar que una variable sigue una distribución normal se indica con la letra N y se añade entre paréntesis los valores de su media aritmética y su desviación estándar

\[ X\sim N(\mu,\sigma) \] ## Fórmula de la distribución de la distribución normal

La fórmula de la función de densidad de la distribución normal es la siguiente:

\[ \displaystyle P[X=x]=\frac1{\sigma\sqrt{2\pi}}\; e^{ - \frac{(x-\mu)^2}{2\sigma^2}} \]

Ejemplo:

En el Hospital San José se realizó un estudio para analizar los tiempos de atención de los pacientes en el área de consultas prioritarias durante las horas de mayor flujo. La administración observó que la mayoría de las consultas duraban tiempos cercanos al promedio, aunque algunas podían tardar un poco más dependiendo de la complejidad del caso y de la cantidad de pacientes en espera.

Después de varias semanas de observación, se encontró que los tiempos de atención seguían aproximadamente una distribución normal o gaussiana con:

Media:

\[ \mu = 15 \]

Desviación estándar:

\[ \sigma= 3 \]

La administración desea conocer la densidad de probabilidad cuando el tiempo de atención es:

x = 18

ya que consideran que un paciente atendido alrededor de los 18 minutos todavía se encuentra dentro de un rango operativo normal en el servicio de consultas prioritarias.

Codigo:

numerador = function(x,mu,sigma){
n = exp(-(((x-mu)^2)/(2*(sigma^2))))
return(n)

}
denominador = function(sigma){
d = sigma*sqrt(2*pi)
return(d)

}

normal = function(x,mu,sigma){
p = numerador(x,mu,sigma)/
    denominador(sigma)

print(p)

}

normal(18, 15, 3)

## [1] 0.08065691

dnorm(18, 15, 3)

## [1] 0.08065691

Tabla:

library(kableExtra)

normal_datos = data.frame(

  Numero_Paciente = 1:10,

  Motivo_Consulta = c(
    "Dolor abdominal",
    "Fiebre alta",
    "Dificultad respiratoria",
    "Migraña intensa",
    "Dolor en el pecho",
    "Deshidratación",
    "Reacción alérgica",
    "Dolor muscular",
    "Infección estomacal",
    "Mareo constante"
  ),

  Tiempo_Atencion = c(
    10,
    11,
    12,
    13,
    14,
    15,
    16,
    17,
    18,
    19
  )
)

kbl(
  normal_datos,

  align = "c",

  caption = "Tiempos de atención registrados en consultas prioritarias del Hospital San José"
) %>%

kable_styling()

Tiempos de atención registrados en consultas prioritarias del Hospital San José
Numero_Paciente	Motivo_Consulta	Tiempo_Atencion
1	Dolor abdominal	10
2	Fiebre alta	11
3	Dificultad respiratoria	12
4	Migraña intensa	13
5	Dolor en el pecho	14
6	Deshidratación	15
7	Reacción alérgica	16
8	Dolor muscular	17
9	Infección estomacal	18
10	Mareo constante	19

Grafica:

mu = 15
sigma = 3

x_val = seq(1, 30, by = 1)
y_val = dnorm(x_val,
              mean = mu,
              sd = sigma)

plot(x_val, y_val,
     type = "l",
     col = "blue",
     main = "Distribución Normal",
     xlab = "Tiempo de atención (minutos)",
     ylab = "Densidad")

abline(v = 18,
       col = "green",
       lty = 2)

Distribución chi-cuadrado

¿Qué es la distribución chi-cuadrado?

La distribución chi-cuadrado es una distribución de probabilidad cuyo símbolo es χ². En concreto, la distribución chi-cuadrado es la suma del cuadrado de k variables aleatorias independientes con distribución normal.

Así pues, la distribución chi-cuadrado tiene k grados de libertad. Por lo tanto, una distribución chi-cuadrada tiene tantos grados de libertad como la suma de los cuadrados de variables con distribución normal que representa.

\[ \displaystyle X\sim\chi^2_k \ \color{orange}{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribución chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array} \]

La distribución chi-cuadrado también se conoce como distribución de Pearson.

Fórmula de la distribución de chi-cuadrado

La función de densidad de la distribución chi-cuadrado es nula si x=0. No obstante, para valores de x mayores que 0, la función de densidad de una distribución chi-cuadrado se define mediante la siguiente fórmula:

\[\displaystyle P[X=x]= \frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}\] ## Ejemplo:

En la panadería Buga Pan se realizó un estudio para evaluar la estabilidad en los tiempos de preparación de los pedidos durante las horas de mayor demanda. La administración sospechaba que algunos días existían demasiadas variaciones en el proceso debido al aumento de clientes, retrasos en cocina y acumulación de órdenes.

Para analizar esta variabilidad, se registraron los tiempos de preparación de pedidos en diferentes estaciones de trabajo de la panadería. Los analistas dividieron el proceso en 6 categorías de preparación:

Pan caliente
Bebidas
Repostería
Sándwiches
Galletas
Tortas

Como en una distribución Chi-cuadrado los grados de libertad se calculan generalmente como:

gl = n - 1

y se trabajó con: n = 6 entonces: gl = 6 - 1 = 5

Después del análisis estadístico, la gerencia quiso estudiar específicamente qué tan probable era encontrar un nivel de variabilidad cercano a:

x = 8

ya que ese valor representaba un punto donde los retrasos comenzaban a afectar la eficiencia operativa de la panadería.

Codigo:

numerador = function(x,gl){
n = x^((gl/2)-1)*exp(-(x/2))
return(n)

}

denominador = function(gl){
d = (2^(gl/2))*gamma(gl/2)
return(d)
}



chi_cuadrado = function(x,gl){
p = numerador(x,gl)/
    denominador(gl)

print(p)

}

chi_cuadrado(8,5)

## [1] 0.05511196

dchisq(8,5)

## [1] 0.05511196

Tabla:

library(kableExtra)

chi_datos = data.frame(

  Numero_Domicilio = 1:10,

  Producto = c(
    "Pan caliente",
    "Croissant",
    "Chocolate",
    "Torta",
    "Café",
    "Galletas",
    "Pastel",
    "Capuchino",
    "Milhoja",
    "Pan integral"
  ),

  Variabilidad = c(
    1.4,
    2.1,
    2.9,
    3.8,
    4.7,
    5.5,
    8.0,
    9.2,
    10.8,
    12.5
  )
)

kbl(
  chi_datos,

  align = "c",

  caption = "Valores de variabilidad registrados en los procesos de Buga Pan"
) %>%

kable_styling()

Valores de variabilidad registrados en los procesos de Buga Pan
Numero_Domicilio	Producto	Variabilidad
1	Pan caliente	1.4
2	Croissant	2.1
3	Chocolate	2.9
4	Torta	3.8
5	Café	4.7
6	Galletas	5.5
7	Pastel	8.0
8	Capuchino	9.2
9	Milhoja	10.8
10	Pan integral	12.5

Grafica:

gl = 5

x_val = seq(0, 12, by = 1)

y_val = dchisq(x_val, df = gl)

plot(x_val, y_val,

     type = "l",

     col = "blue",

     main = "Distribución Chi-cuadrado",

     xlab = "Nivel de variabilidad",

     ylab = "Densidad")

abline(v = 8,

       col = "green",

       lty = 2)

Distribución de Poisson

¿Qué es la distribución de Poisson?

La distribución de Poisson es una distribución de probabilidad que define la probabilidad de que ocurra un determinado número de eventos durante un período de tiempo.

Es decir, la distribución de Poisson sirve para modelizar variables aleatorias que describen el número de veces que se repite un fenómeno en un intervalo de tiempo.

La distribución de Poisson tiene un parámetro característico, que se representa con la letra griega λ e indica el número de veces que se espera que ocurra el evento estudiado durante un intervalo dado.

\[ X\sim \text{Poisson}(\lambda) \]

En general, la distribución de Poisson se usa para modelizar estadísticamente sucesos cuya probabilidad de ocurrencia es muy baja. Más abajo puedes ver varios ejemplos de este tipo de distribución de probabilidad.

Fórmula de la distribución de Poisson

En una distribución de Poisson, la probabilidad de que ocurran x eventos es igual al número e elevado a -λ multiplicado por λ elevada a x y dividido por el factorial de x.

\[ P[X = x] = \frac{e^{-\lambda} \cdot \lambda^x}{x!} \]

Ejemplo:

En la universidad del valle en x materia, se está analizando que tanto demoran los estudiantes haciendo uso de cada uno de los servicios que esta presta, ya sea biblioteca, baños o cafeteria.

Un grupo de estudiantes realizó un estudio durante varias semanas en la cafeteria, este con el fin de analizar el flujo de personas una vez termindas la mayoria de clases de la jornada de la mañana. Se observó que entre las 10:00 am y las 10:05 am llegan en promedio 5 perosnas por minuto.

Dicho grupo de estudiantes, quiere saber qué tan probable es que en un minuto específico lleguen exactamente 8 personas, ya que esto puede generar filas largas y retrasos en la atención.

Codigo:

factorial = function(x){
  f = 1
  for(i in 1:x){
    f = f * i
  }
  return(f)
}

poi = function(x,lambda){
  p = (lambda^x*(exp(-lambda)))/(factorial(x))
  print(p)
}

poi(8,5)

## [1] 0.06527804

dpois(8,5)

## [1] 0.06527804

Tabla

library(kableExtra)

datos = data.frame(

  Estudiantes = 1:5,

  Producto = c(
    "Café",
    "Sandwich",
    "Pastel",
    "Croissant",
    "Sandwich"
  ),

  Hora = c(
    "10:00:05",
    "10:00:10",
    "10:00:14",
    "10:00:20",
    "10:00:28"
  )
)

kbl(
  datos,
  align = "c",
  caption = "Ventas registradas en la cafetería"
) %>%

kable_styling()

Ventas registradas en la cafetería
Estudiantes	Producto	Hora
1	Café	10:00:05
2	Sandwich	10:00:10
3	Pastel	10:00:14
4	Croissant	10:00:20
5	Sandwich	10:00:28

Grafica

lambda = 5

x_val = 0:12

y_val = dpois(x_val, lambda)

plot(x_val, y_val,
     type = "l",
     col = "blue",
     main = "Distribución de Poisson",
     xlab = "X",
     ylab = "Probabilidad")
abline (v = 8,
         col = ("green"),
         lty = 2)

Distribución exponencial

¿Qué es la distribución exponencial?

La distribución exponencial es una distribución de probabilidad continua que sirve para modelizar el tiempo de espera para la ocurrencia de un fenómeno aleatorio.

En concreto, la distribución exponencial permite describir el tiempo de espera entre dos fenómenos que siguen una distribución de Poisson. Por lo tanto, la distribución exponencial está estrechamente relacionada con la distribución de Poisson.

La distribución exponencial tiene un parámetro característico, que se representa con la letra griega λ e indica el número de veces que se espera que ocurra el evento estudiado durante un periodo de tiempo determinado.

\[ X\sim \text{Exp}(\lambda) \]

Asimismo, la distribución exponencial también se usa para modelizar el tiempo que transcurre hasta que se produce un fallo. De modo que la distribución exponencial tiene varias aplicaciones en fiabilidad y en la teoría de la supervivencia.

Fórmula de la distribución exponencial

La fórmula de la función de densidad que define el cálculo de una probabilidad de la distribución exponencial es igual a λ multiplicado por el número e elevado a menos λ por x.

\[ P[X=x]=\lambda e^{-\lambda x}\]

**Ejemplo:*

En la empresa de internet wifi alternativo se realizó un estudio para analizar el tiempo que transcurre entre las llamadas que ingresan al área de soporte técnico por fallas en el servicio de internet residencial. La empresa observó que, durante las horas de mayor congestión, algunos clientes llamaban casi inmediatamente después de otro, mientras que en otros momentos podían pasar varios minutos sin nuevas solicitudes de soporte.

Después de recopilar información durante varias semanas, los analistas determinaron que el tiempo entre llamadas seguía aproximadamente una distribución exponencial con:

\[ \lambda= 0.2 \]

donde representa la tasa promedio de llegada de llamadas al centro de soporte técnico.

La administración desea conocer la densidad de probabilidad cuando el tiempo entre llamadas es:

x = 5

ya que consideran que un intervalo de 5 minutos entre reportes de fallas representa un comportamiento frecuente dentro del sistema de atención al cliente.

Codigo:

numerador = function(x,lambda){
n = lambda*exp(-(lambda*x))

return(n)

}

exponencial = function(x,lambda){
p = numerador(x,lambda)

print(p)

}

exponencial(5,0.2)

## [1] 0.07357589

dexp(5,0.2)

## [1] 0.07357589

Tabla:

library(kableExtra)

exp_datos = data.frame(

  Numero_Llamada = 1:10,

  Motivo_Llamada = c(
    "Internet sin conexión",
    "Lentitud en navegación",
    "Router sin señal",
    "Caída total del servicio",
    "Falla en fibra óptica",
    "Intermitencia de conexión",
    "Problema con repetidor WiFi",
    "Sin acceso a plataformas",
    "Desconexión frecuente",
    "Problema de configuración"
  ),

  Tiempo_Entre_Llamadas = c(
    1,
    2,
    3,
    4,
    5,
    6,
    7,
    8,
    9,
    10
  )
)

kbl(
  exp_datos,

  align = "c",

  caption = "Tiempos entre llamadas recibidas en el soporte técnico de Wifi al Tentativo"
) %>%

kable_styling()

Tiempos entre llamadas recibidas en el soporte técnico de Wifi al Tentativo
Numero_Llamada	Motivo_Llamada	Tiempo_Entre_Llamadas
1	Internet sin conexión	1
2	Lentitud en navegación	2
3	Router sin señal	3
4	Caída total del servicio	4
5	Falla en fibra óptica	5
6	Intermitencia de conexión	6
7	Problema con repetidor WiFi	7
8	Sin acceso a plataformas	8
9	Desconexión frecuente	9
10	Problema de configuración	10

Grafica:

lambda = 0.2

x_val = seq(0, 20, by = 1)
y_val = dexp(x_val,
             rate = lambda)

plot(x_val, y_val,
     type = "l",
     col = "blue",
     main = "Distribución Exponencial",
     
     xlab = "Tiempo entre llamadas (minutos)",
     ylab = "Densidad")

abline(v = 5,
       col = "green",
       lty = 2)

Taller

Julian Carvajal

2026-05-14

Distribución lognormal

¿Qué es la distribución lognormal?

Fórmula de la distribución lognormal

Ejemplo:

Distribución Normal o Gaussiana

¿Qué es la distribución normal?

Ejemplo:

Distribución chi-cuadrado

¿Qué es la distribución chi-cuadrado?

Fórmula de la distribución de chi-cuadrado

Distribución de Poisson

¿Qué es la distribución de Poisson?

Fórmula de la distribución de Poisson

Ejemplo:

Distribución exponencial

¿Qué es la distribución exponencial?

Fórmula de la distribución exponencial

**Ejemplo:*