La distribución lognormal, o distribución normal logarítmica, es una distribución de probabilidad que define una variable aleatoria cuyo logaritmo sigue una distribución normal.
Por lo tanto, si la variable X tiene una distribución normal, entonces la función exponencial x tiene una distribución lognormal.
\[ X \sim \text{Lognormal}(\mu, \sigma^2) \]
Entre la diferentes aplicaciones de la distribución lognormal, en estadística destaca el uso de esta distribución para analizar inversiones financieras y para hacer análisis de fiabilidad.
La distribución lognormal también se conoce como distribución de Tinaut, asimismo, a veces se escribe distribución log normal o distribución log-normal.
La fórmula de la función de densidad de la distribución lognormal es la siguiente:
\[ \displaystyle P[X=x]=\frac{1}{\sigma \cdot x\cdot \sqrt{2 \pi}}\cdot \exp\left(-\frac{(\ln x-\mu)^2}{2\sigma^2}\right) \]
En la panadería Buga Pan se realizó un estudio para analizar los tiempos de entrega de los domicilios durante las horas de mayor demanda, especialmente entre las 5:00 p.m. y las 8:00 p.m., cuando muchas personas realizan pedidos de pan caliente, bebidas y productos de repostería.
La administración observó que la mayoría de las entregas se realizan en tiempos relativamente cortos, pero en algunos casos los domicilios tardan mucho más debido al tráfico, la lluvia o la acumulación de pedidos. Como los tiempos de entrega nunca pueden ser negativos y además presentan una fuerte asimetría hacia valores grandes.
Después de recopilar información durante varias semanas, se encontró que los tiempos de entrega seguían aproximadamente una distribución lognormal con:
Media logarítmica: \[ \mu = 2.7 \]
Desviación estándar logarítmica:
\[ \sigma= 0.45 \]
La gerencia desea conocer la densidad de probabilidad de que un pedido tenga exactamente un tiempo de entrega de 20 minutos, con el fin de analizar qué tan concentrados están los tiempos alrededor de ese valor.
Codigo:
numerador = function(x,mu,sigma){
n = exp(-(((log(x)-mu)^2)/(2*(sigma^2))))
return(n)
}
denominador = function(x,sigma){
d = x*sigma*sqrt(2*pi)
return(d)
}
lognormal = function(x,mu,sigma){
p = numerador(x,mu,sigma)/
denominador(x,sigma)
print(p)
}
lognormal(20,2.7,0.45)
## [1] 0.03571774
dlnorm(20,2.7,0.45)
## [1] 0.03571774
Tabla:
library(kableExtra)
## Warning: package 'kableExtra' was built under R version 4.5.3
domicilios = data.frame(
Numero_Domicilio = 1:12,
Producto = c(
"Pan caliente",
"Croissant",
"Chocolate",
"Torta de vainilla",
"Café",
"Pan integral",
"Galletas",
"Jugo natural",
"Pastel de pollo",
"Pan de queso",
"Capuchino",
"Milhoja"
),
Tiempo_Entrega = c(
11.8,
14.5,
16.2,
18.7,
19.4,
20.1,
22.8,
24.3,
26.9,
29.7,
33.5,
38.1
)
)
kbl(
domicilios,
align = "c",
caption = "Tiempos de entrega registrados en los domicilios de la panadería Buga Pan"
) %>%
kable_styling()
| Numero_Domicilio | Producto | Tiempo_Entrega |
|---|---|---|
| 1 | Pan caliente | 11.8 |
| 2 | Croissant | 14.5 |
| 3 | Chocolate | 16.2 |
| 4 | Torta de vainilla | 18.7 |
| 5 | Café | 19.4 |
| 6 | Pan integral | 20.1 |
| 7 | Galletas | 22.8 |
| 8 | Jugo natural | 24.3 |
| 9 | Pastel de pollo | 26.9 |
| 10 | Pan de queso | 29.7 |
| 11 | Capuchino | 33.5 |
| 12 | Milhoja | 38.1 |
Grafica:
mu = 2.7
sigma = 0.45
x_val = seq(1, 60, by = 0.1)
y_val = dlnorm(x_val,
meanlog = mu,
sdlog = sigma)
plot(x_val, y_val,
type = "l",
col = "blue",
main = "Distribución Lognormal de los tiempos de entrega",
xlab = "Tiempo de entrega (minutos)",
ylab = "Densidad")
abline(v = 20,
col = "green",
lty = 2)
La distribución normal es una distribución de probabilidad continua cuya gráfica tiene forma de campana y es simétrica respecto a su media. En estadística, la distribución normal sirve para modelizar fenómenos de características muy diferentes, por eso es tan importante esta distribución.
El símbolo de la distribución normal es la letra mayúscula N. Así pues, para indicar que una variable sigue una distribución normal se indica con la letra N y se añade entre paréntesis los valores de su media aritmética y su desviación estándar
\[ X\sim N(\mu,\sigma) \] ## Fórmula de la distribución de la distribución normal
La fórmula de la función de densidad de la distribución normal es la siguiente:
\[ \displaystyle P[X=x]=\frac1{\sigma\sqrt{2\pi}}\; e^{ - \frac{(x-\mu)^2}{2\sigma^2}} \]
En el Hospital San José se realizó un estudio para analizar los tiempos de atención de los pacientes en el área de consultas prioritarias durante las horas de mayor flujo. La administración observó que la mayoría de las consultas duraban tiempos cercanos al promedio, aunque algunas podían tardar un poco más dependiendo de la complejidad del caso y de la cantidad de pacientes en espera.
Después de varias semanas de observación, se encontró que los tiempos de atención seguían aproximadamente una distribución normal o gaussiana con:
\[ \mu = 15 \]
\[ \sigma= 3 \]
La administración desea conocer la densidad de probabilidad cuando el tiempo de atención es:
x = 18
ya que consideran que un paciente atendido alrededor de los 18 minutos todavía se encuentra dentro de un rango operativo normal en el servicio de consultas prioritarias.
Codigo:
numerador = function(x,mu,sigma){
n = exp(-(((x-mu)^2)/(2*(sigma^2))))
return(n)
}
denominador = function(sigma){
d = sigma*sqrt(2*pi)
return(d)
}
normal = function(x,mu,sigma){
p = numerador(x,mu,sigma)/
denominador(sigma)
print(p)
}
normal(18, 15, 3)
## [1] 0.08065691
dnorm(18, 15, 3)
## [1] 0.08065691
Tabla:
library(kableExtra)
normal_datos = data.frame(
Numero_Paciente = 1:10,
Motivo_Consulta = c(
"Dolor abdominal",
"Fiebre alta",
"Dificultad respiratoria",
"Migraña intensa",
"Dolor en el pecho",
"Deshidratación",
"Reacción alérgica",
"Dolor muscular",
"Infección estomacal",
"Mareo constante"
),
Tiempo_Atencion = c(
10,
11,
12,
13,
14,
15,
16,
17,
18,
19
)
)
kbl(
normal_datos,
align = "c",
caption = "Tiempos de atención registrados en consultas prioritarias del Hospital San José"
) %>%
kable_styling()
| Numero_Paciente | Motivo_Consulta | Tiempo_Atencion |
|---|---|---|
| 1 | Dolor abdominal | 10 |
| 2 | Fiebre alta | 11 |
| 3 | Dificultad respiratoria | 12 |
| 4 | Migraña intensa | 13 |
| 5 | Dolor en el pecho | 14 |
| 6 | Deshidratación | 15 |
| 7 | Reacción alérgica | 16 |
| 8 | Dolor muscular | 17 |
| 9 | Infección estomacal | 18 |
| 10 | Mareo constante | 19 |
Grafica:
mu = 15
sigma = 3
x_val = seq(1, 30, by = 1)
y_val = dnorm(x_val,
mean = mu,
sd = sigma)
plot(x_val, y_val,
type = "l",
col = "blue",
main = "Distribución Normal",
xlab = "Tiempo de atención (minutos)",
ylab = "Densidad")
abline(v = 18,
col = "green",
lty = 2)
La distribución chi-cuadrado es una distribución de probabilidad cuyo símbolo es χ². En concreto, la distribución chi-cuadrado es la suma del cuadrado de k variables aleatorias independientes con distribución normal.
Así pues, la distribución chi-cuadrado tiene k grados de libertad. Por lo tanto, una distribución chi-cuadrada tiene tantos grados de libertad como la suma de los cuadrados de variables con distribución normal que representa.
\[ \displaystyle X\sim\chi^2_k \ \color{orange}{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribución chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array} \]
La distribución chi-cuadrado también se conoce como distribución de Pearson.
\[\displaystyle P[X=x]= \frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}\] ## Ejemplo:
En la panadería Buga Pan se realizó un estudio para evaluar la estabilidad en los tiempos de preparación de los pedidos durante las horas de mayor demanda. La administración sospechaba que algunos días existían demasiadas variaciones en el proceso debido al aumento de clientes, retrasos en cocina y acumulación de órdenes.
Para analizar esta variabilidad, se registraron los tiempos de preparación de pedidos en diferentes estaciones de trabajo de la panadería. Los analistas dividieron el proceso en 6 categorías de preparación:
Como en una distribución Chi-cuadrado los grados de libertad se calculan generalmente como:
gl = n - 1
y se trabajó con: n = 6 entonces: gl = 6 - 1 = 5
Después del análisis estadístico, la gerencia quiso estudiar específicamente qué tan probable era encontrar un nivel de variabilidad cercano a:
x = 8
ya que ese valor representaba un punto donde los retrasos comenzaban a afectar la eficiencia operativa de la panadería.
Codigo:
numerador = function(x,gl){
n = x^((gl/2)-1)*exp(-(x/2))
return(n)
}
denominador = function(gl){
d = (2^(gl/2))*gamma(gl/2)
return(d)
}
chi_cuadrado = function(x,gl){
p = numerador(x,gl)/
denominador(gl)
print(p)
}
chi_cuadrado(8,5)
## [1] 0.05511196
dchisq(8,5)
## [1] 0.05511196
Tabla:
library(kableExtra)
chi_datos = data.frame(
Numero_Domicilio = 1:10,
Producto = c(
"Pan caliente",
"Croissant",
"Chocolate",
"Torta",
"Café",
"Galletas",
"Pastel",
"Capuchino",
"Milhoja",
"Pan integral"
),
Variabilidad = c(
1.4,
2.1,
2.9,
3.8,
4.7,
5.5,
8.0,
9.2,
10.8,
12.5
)
)
kbl(
chi_datos,
align = "c",
caption = "Valores de variabilidad registrados en los procesos de Buga Pan"
) %>%
kable_styling()
| Numero_Domicilio | Producto | Variabilidad |
|---|---|---|
| 1 | Pan caliente | 1.4 |
| 2 | Croissant | 2.1 |
| 3 | Chocolate | 2.9 |
| 4 | Torta | 3.8 |
| 5 | Café | 4.7 |
| 6 | Galletas | 5.5 |
| 7 | Pastel | 8.0 |
| 8 | Capuchino | 9.2 |
| 9 | Milhoja | 10.8 |
| 10 | Pan integral | 12.5 |
Grafica:
gl = 5
x_val = seq(0, 12, by = 1)
y_val = dchisq(x_val, df = gl)
plot(x_val, y_val,
type = "l",
col = "blue",
main = "Distribución Chi-cuadrado",
xlab = "Nivel de variabilidad",
ylab = "Densidad")
abline(v = 8,
col = "green",
lty = 2)
La distribución de Poisson es una distribución de probabilidad que define la probabilidad de que ocurra un determinado número de eventos durante un período de tiempo.
Es decir, la distribución de Poisson sirve para modelizar variables aleatorias que describen el número de veces que se repite un fenómeno en un intervalo de tiempo.
La distribución de Poisson tiene un parámetro característico, que se representa con la letra griega λ e indica el número de veces que se espera que ocurra el evento estudiado durante un intervalo dado.
\[ X\sim \text{Poisson}(\lambda) \]
En general, la distribución de Poisson se usa para modelizar estadísticamente sucesos cuya probabilidad de ocurrencia es muy baja. Más abajo puedes ver varios ejemplos de este tipo de distribución de probabilidad.
En una distribución de Poisson, la probabilidad de que ocurran x eventos es igual al número e elevado a -λ multiplicado por λ elevada a x y dividido por el factorial de x.
\[ P[X = x] = \frac{e^{-\lambda} \cdot \lambda^x}{x!} \]
En la universidad del valle en x materia, se está analizando que tanto demoran los estudiantes haciendo uso de cada uno de los servicios que esta presta, ya sea biblioteca, baños o cafeteria.
Un grupo de estudiantes realizó un estudio durante varias semanas en la cafeteria, este con el fin de analizar el flujo de personas una vez termindas la mayoria de clases de la jornada de la mañana. Se observó que entre las 10:00 am y las 10:05 am llegan en promedio 5 perosnas por minuto.
Dicho grupo de estudiantes, quiere saber qué tan probable es que en un minuto específico lleguen exactamente 8 personas, ya que esto puede generar filas largas y retrasos en la atención.
Codigo:
factorial = function(x){
f = 1
for(i in 1:x){
f = f * i
}
return(f)
}
poi = function(x,lambda){
p = (lambda^x*(exp(-lambda)))/(factorial(x))
print(p)
}
poi(8,5)
## [1] 0.06527804
dpois(8,5)
## [1] 0.06527804
Tabla
library(kableExtra)
datos = data.frame(
Estudiantes = 1:5,
Producto = c(
"Café",
"Sandwich",
"Pastel",
"Croissant",
"Sandwich"
),
Hora = c(
"10:00:05",
"10:00:10",
"10:00:14",
"10:00:20",
"10:00:28"
)
)
kbl(
datos,
align = "c",
caption = "Ventas registradas en la cafetería"
) %>%
kable_styling()
| Estudiantes | Producto | Hora |
|---|---|---|
| 1 | Café | 10:00:05 |
| 2 | Sandwich | 10:00:10 |
| 3 | Pastel | 10:00:14 |
| 4 | Croissant | 10:00:20 |
| 5 | Sandwich | 10:00:28 |
Grafica
lambda = 5
x_val = 0:12
y_val = dpois(x_val, lambda)
plot(x_val, y_val,
type = "l",
col = "blue",
main = "Distribución de Poisson",
xlab = "X",
ylab = "Probabilidad")
abline (v = 8,
col = ("green"),
lty = 2)
La distribución exponencial es una distribución de probabilidad continua que sirve para modelizar el tiempo de espera para la ocurrencia de un fenómeno aleatorio.
En concreto, la distribución exponencial permite describir el tiempo de espera entre dos fenómenos que siguen una distribución de Poisson. Por lo tanto, la distribución exponencial está estrechamente relacionada con la distribución de Poisson.
La distribución exponencial tiene un parámetro característico, que se representa con la letra griega λ e indica el número de veces que se espera que ocurra el evento estudiado durante un periodo de tiempo determinado.
\[ X\sim \text{Exp}(\lambda) \]
Asimismo, la distribución exponencial también se usa para modelizar el tiempo que transcurre hasta que se produce un fallo. De modo que la distribución exponencial tiene varias aplicaciones en fiabilidad y en la teoría de la supervivencia.
La fórmula de la función de densidad que define el cálculo de una probabilidad de la distribución exponencial es igual a λ multiplicado por el número e elevado a menos λ por x.
\[ P[X=x]=\lambda e^{-\lambda x}\]
En la empresa de internet wifi alternativo se realizó un estudio para analizar el tiempo que transcurre entre las llamadas que ingresan al área de soporte técnico por fallas en el servicio de internet residencial. La empresa observó que, durante las horas de mayor congestión, algunos clientes llamaban casi inmediatamente después de otro, mientras que en otros momentos podían pasar varios minutos sin nuevas solicitudes de soporte.
Después de recopilar información durante varias semanas, los analistas determinaron que el tiempo entre llamadas seguía aproximadamente una distribución exponencial con:
\[ \lambda= 0.2 \]
donde representa la tasa promedio de llegada de llamadas al centro de soporte técnico.
La administración desea conocer la densidad de probabilidad cuando el tiempo entre llamadas es:
x = 5
ya que consideran que un intervalo de 5 minutos entre reportes de fallas representa un comportamiento frecuente dentro del sistema de atención al cliente.
Codigo:
numerador = function(x,lambda){
n = lambda*exp(-(lambda*x))
return(n)
}
exponencial = function(x,lambda){
p = numerador(x,lambda)
print(p)
}
exponencial(5,0.2)
## [1] 0.07357589
dexp(5,0.2)
## [1] 0.07357589
Tabla:
library(kableExtra)
exp_datos = data.frame(
Numero_Llamada = 1:10,
Motivo_Llamada = c(
"Internet sin conexión",
"Lentitud en navegación",
"Router sin señal",
"Caída total del servicio",
"Falla en fibra óptica",
"Intermitencia de conexión",
"Problema con repetidor WiFi",
"Sin acceso a plataformas",
"Desconexión frecuente",
"Problema de configuración"
),
Tiempo_Entre_Llamadas = c(
1,
2,
3,
4,
5,
6,
7,
8,
9,
10
)
)
kbl(
exp_datos,
align = "c",
caption = "Tiempos entre llamadas recibidas en el soporte técnico de Wifi al Tentativo"
) %>%
kable_styling()
| Numero_Llamada | Motivo_Llamada | Tiempo_Entre_Llamadas |
|---|---|---|
| 1 | Internet sin conexión | 1 |
| 2 | Lentitud en navegación | 2 |
| 3 | Router sin señal | 3 |
| 4 | Caída total del servicio | 4 |
| 5 | Falla en fibra óptica | 5 |
| 6 | Intermitencia de conexión | 6 |
| 7 | Problema con repetidor WiFi | 7 |
| 8 | Sin acceso a plataformas | 8 |
| 9 | Desconexión frecuente | 9 |
| 10 | Problema de configuración | 10 |
Grafica:
lambda = 0.2
x_val = seq(0, 20, by = 1)
y_val = dexp(x_val,
rate = lambda)
plot(x_val, y_val,
type = "l",
col = "blue",
main = "Distribución Exponencial",
xlab = "Tiempo entre llamadas (minutos)",
ylab = "Densidad")
abline(v = 5,
col = "green",
lty = 2)