GESTIÓN DE DATOS


DISTRIBUCIONES DE PROBABILIDAD


PRESENTADO POR:
DARCY ESTEFANIA MENESES MEDINA - 202463177
BREINER SANTIAGO OMEN OMEN - 202451239


PRESENTADO A:
ING. JHON JAIRO ZULUAGA

UNIVERSIDAD DEL VALLE
SECCIONAL BUGA


FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERÍA INDUSTRIAL



GUADALAJARA DE BUGA, 14 DE MAYO DEL 2026


DISTRIBUCIONES DE PROBABILIDAD

¿QUÉ ES UNA DISTRIBUCIÓN DE PROBABILIDAD?

Una distribución de probabilidad describe cómo se distribuyen las probabilidades de los posibles valores que pueda tomar la variable aleatoria, dentro de un periodo de tiempo. A continuación, se presentan las principales distribuciones de probabilidad utilizadas en estadística y análisis de datos:

DISTRIBUCIÓN LOGNORMAL

¿Qué es la distribución lognormal?

La distribución lognormal, también conocida como distribución de Galton (en honor al estadístico Francis Galton), es un tipo de distribución de probabilidad que se utiliza ampliamente en estadística, economía, ingeniería y finanzas; cuando el logaritmo natural de la variable aleatoria sigue una distribución normal. Es útil para modelar variables que no pueden ser negativas.

En otras palabras, los datos originales no son normales, pero sus logaritmos sí lo son.

Por ejemplo si:

\[Y=ln(X)\]

se distribuye normalmente, entonces X tiene una distribución lognormal.

Características principales

Fórmula de la distribución lognormal

\[f(x;\mu, \sigma )=\frac{1}{x\sigma \sqrt{2\pi }}*e^{-\frac{(lnx-\mu)^{2} }{2\sigma ^{2}}}, x> 0\]

## Warning: package 'knitr' was built under R version 4.5.3
## Warning: package 'kableExtra' was built under R version 4.5.3
Símbolos y Significados de la Distribución Lognormal
Símbolo Significado
x Variable aleatoria continua (valores de precios siempre > 0)
μ Media de los logaritmos de los datos (escala logarítmica)
σ Desviación estándar de los logaritmos (volatilidad)
e Constante matemática base de los logaritmos naturales

Aplicaciones prácticas

La distribución lognormal se aplica en muchos campos, especialmente cuando los valores no pueden ser negativos y crecen de forma acumulativa o compuesta.

Distribución Lognormal — Contexto Comercial Local

En el comercio local colombiano las plazas de mercado, tiendas de barrio y negocios, los ingresos diarios por ventas nunca son negativos y raramente son simétricos: la mayoría de los días las ventas son moderadas, pero en quincena, fin de mes o festividades se disparan a valores muy superiores. La distribución Lognormal captura exactamente ese comportamiento asimétrico con cola larga hacia la derecha, donde unos pocos días concentran una parte desproporcionada de los ingresos totales del mes.

Importancia en el comercio

Ejemplo práctico

Imagina que eres un analista financiero que quiere estudiar el comportamiento de los precios de las acciones de una empresa tecnológica. Notas que los precios siempre son positivos y que, en lugar de cambiar en valores fijos (como +5 o -5), tienden a cambiar en proporciones (por ejemplo, +10% o -8%). Esto sugiere que los precios podrían seguir una distribución lognormal, ya que los cambios porcentuales o multiplicativos son típicos de este tipo de distribución.

library(knitr)
library(kableExtra)

precios_acciones <- data.frame(
  "Día" = 1:5,
  "Precio (X)" = c(50, 55, 53, 60, 65),
  "ln(X)" = c(3.91, 4.01, 3.97, 4.09, 4.17)
)

precios_acciones %>%
  kbl(caption = "Precios Diarios y Transformación Logarítmica", 
      align = "c") %>% 
  kable_styling(
    bootstrap_options = c("striped", "hover", "bordered", "condensed"),
    full_width = FALSE,
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE)
Precios Diarios y Transformación Logarítmica
Día Precio..X. ln.X.
1 50 3.91
2 55 4.01
3 53 3.97
4 60 4.09
5 65 4.17
library(knitr)
library(kableExtra)

df_funciones <- data.frame(
  Función = c("dlnorm()", "plnorm()", "qlnorm()", "rlnorm()"),
  Propósito = c("Densidad de probabilidad", 
                "Probabilidad acumulada", 
                "Función de cuantiles", 
                "Generación aleatoria"),
  Aplicación_Financiera = c(
    "Calcula la probabilidad relativa de que la acción alcance un precio específico.",
    "Calcula el riesgo de que el precio caiga por debajo de un umbral (ej. p < $50).",
    "Determina el precio asociado a un nivel de confianza (útil para el VaR - Value at Risk).",
    "Simula escenarios futuros de precios (Simulaciones de Monte Carlo)."
  )
)


df_funciones %>%
  kbl(caption = "Análisis Lognormal: Funciones en R Studio",
      booktabs = TRUE,
      align = "cll") %>% # Centra la primera columna, izquierda las demás
  kable_styling(bootstrap_options = c("bordered", "striped", "condensed"), 
                full_width = F, 
                position = "center") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>% 
  column_spec(2, border_right = TRUE) %>%            
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") 
Análisis Lognormal: Funciones en R Studio
Función Propósito Aplicación_Financiera
dlnorm() Densidad de probabilidad Calcula la probabilidad relativa de que la acción alcance un precio específico.
plnorm() Probabilidad acumulada Calcula el riesgo de que el precio caiga por debajo de un umbral (ej. p < $50).
qlnorm() Función de cuantiles Determina el precio asociado a un nivel de confianza (útil para el VaR - Value at Risk).
rlnorm() Generación aleatoria Simula escenarios futuros de precios (Simulaciones de Monte Carlo).

Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución lognormal, se realiza el cálculo manualmente y luego se compara con la función dlnorm() de R Studio.

x <- 60 
meanlog <- 4 
sdlog <- 0.2 

resultado_manual <- (1 / (x * sdlog * sqrt(2*pi))) *
                    exp(-((log(x) - meanlog)^2) / (2 * sdlog^2))

print(resultado_manual)
## [1] 0.02974464

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

resultado_r <- dlnorm(x, meanlog, sdlog)
print(resultado_r)
## [1] 0.02974464

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dlnorm() utiliza internamente la misma fórmula matemática de la distribución lognormal.

A partir de los datos obtenidos, se puede construir la gráfica de la distribución lognormal de los precios de las acciones:

Gráfica de distribución lognormal ejercicio de precios de las acciones

precios <- c(50, 55, 53, 60, 65)

log_precios <- log(precios)
media_log <- mean(log_precios)
desv_log <- sd(log_precios)

x <- seq(40, 80, length.out = 200)

densidad <- dlnorm(x, meanlog = media_log, sdlog = desv_log)
plot(
  x, densidad,
  type = "l",
  lwd = 2,
  col = "blue",
  main = "Distribución Lognormal de Precios de una Acción",
  xlab = "Precio (X)",
  ylab = "Densidad de probabilidad"
)

polygon(x, densidad, col = rgb(0.2, 0.6, 1, 0.3), border = NA)

points(precios, dlnorm(precios, meanlog = media_log, sdlog = desv_log),
       col = "red", pch = 19)

La gráfica de la distribución lognormal muestra una asimetría hacia la derecha, indicando que los precios altos de la acción son menos frecuentes, aunque posibles. La mayor concentración de densidad de probabilidad se encuentra entre los precios de 50 y 60 unidades monetarias, indicando que este es el rango más probable para el comportamiento de la acción.

A medida que los precios aumentan por encima de 65 o 70, la probabilidad disminuye gradualmente, formando una cola derecha larga que representa posibles incrementos grandes en el mercado financiero.

Este comportamiento confirma que la distribución lognormal es adecuada para modelar precios de acciones, ya que trabaja con valores positivos y cambios porcentuales o multiplicativos.Además, la transformación logarítmica permitió observar un comportamiento más cercano a una distribución normal, apoyando el supuesto de lognormalidad para los precios de las acciones.

Tabla de distribución lognormal ejercicio de precios de las acciones

library(knitr)
library(kableExtra)

dt <- data.frame(
  "Día" = 1:5,
  "Precio (X)" = c(50, 55, 53, 60, 65),
  "ln(X)" = c(3.91, 4.01, 3.97, 4.09, 4.17),
  "Densidad f(x)" = c(0.0395, 0.0681, 0.0609, 0.0534, 0.0229),
  "Prob. Acumulada F(x)" = c("12.42%", "40.72%", "27.68%", "72.73%", "91.57%")
)

dt %>%
  kbl(align = "c", caption = "Resultados del Análisis de Distribución Lognormal") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE,
    position = "center",
    font_size = 18
  ) %>%
  
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, border_right = TRUE) %>% 
  column_spec(3, border_right = TRUE) %>% 
  column_spec(4, border_right = TRUE)    
Resultados del Análisis de Distribución Lognormal
Día Precio..X. ln.X. Densidad.f.x. Prob..Acumulada.F.x.
1 50 3.91 0.0395 12.42%
2 55 4.01 0.0681 40.72%
3 53 3.97 0.0609 27.68%
4 60 4.09 0.0534 72.73%
5 65 4.17 0.0229 91.57%

Tabla de distribución lognormal calculada manualmente y con la función de R

Para comprobar nuevamente el funcionamiento de la distribución lognormal, se calculan las densidades de probabilidad tanto manualmente como utilizando la función dlnorm() de R Studio.

precios <- c(50, 55, 53, 60, 65)

media_log <- mean(log(precios))
desv_log <- sd(log(precios))


densidad_manual <- (1 / (precios * desv_log * sqrt(2*pi))) *
                   exp(-((log(precios) - media_log)^2) / (2 * desv_log^2))

print(densidad_manual)
## [1] 0.03953586 0.06807858 0.06094127 0.05343369 0.02294903

Posteriormente, se calculan los mismos valores utilizando la función integrada de R:

densidad_r <- dlnorm(precios,
                     meanlog = media_log,
                     sdlog = desv_log)

print(densidad_r)
## [1] 0.03953586 0.06807858 0.06094127 0.05343369 0.02294903

Finalmente, se organiza la información en una tabla comparativa:

library(knitr)
library(kableExtra)

tabla <- data.frame(
  "Precio" = precios,
  "Cálculo Manual" = round(densidad_manual, 5),
  "Función dlnorm" = round(densidad_r, 5)
)

tabla %>%
  kbl(align = "c", 
      caption = "Validación: Cálculo Manual vs. Función dlnorm()") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE, bold = TRUE, color = "#2e86c1") 
Validación: Cálculo Manual vs. Función dlnorm()
Precio Cálculo.Manual Función.dlnorm
50 0.03954 0.03954
55 0.06808 0.06808
53 0.06094 0.06094
60 0.05343 0.05343
65 0.02295 0.02295

La tabla demuestra que el rango entre 50 y 60 es el escenario más probable para la acción, alcanzando su pico de densidad en los precios 53 (0.0609) y 55 (0.0681). La asimetría positiva se confirma al llegar a 65, donde la probabilidad cae drásticamente a un mínimo de 0.0229, demostrando que los precios altos son poco frecuentes. Finalmente, la probabilidad acumulada del 91.57% a un precio de 65 indica que existe apenas un 8.43% de probabilidad estadística de que la acción supere ese valor en el mercado actual

DISTRIBUCIÓN NORMAL O GAUSSIANA

¿Qué es la distribución Normal o Gaussiana?

La distribución normal, también conocida como distribución gaussiana, es uno de los pilares fundamentales de la estadística. Su forma característica en campana simétrica refleja cómo la mayoría de los datos tienden a concentrarse alrededor de un valor medio, con una frecuencia decreciente hacia los extremos. Esta distribución es ampliamente utilizada en diversas disciplinas desde la economía y las finanzas hasta la biología y la ingeniería debido a su capacidad para modelar fenómenos naturales y procesos aleatorios.

La distribución normal describe cómo se distribuyen los datos en torno a una media (μ), con una dispersión (σ) determinada por la desviación estándar.

Matemáticamente, su función de densidad de probabilidad (FDP) está dada por la fórmula:

Fórmula de la distribución Normal o Gaussiana

\[f(x) = \frac{1}{\sigma \sqrt{2\pi}} \, e^{-\frac{1}{2}\left(\frac{x - \mu}{\sigma}\right)^2}\]

library(knitr)
library(kableExtra)

dtgaussiana <- data.frame(
  "Símbolo" = c("x", "μ", "σ", "e", "π"),
  "Significado" = c(
    "Valor de la Variable aleatoria",
    "Media o valor esperado (centro de la distribución)",
    "Desviación estándar (dispersión o variabilidad)",
    "Número o constante de Euler (≈ 2.71828)",
    "Constante matemática Pi (≈ 3.14159)"
  )
)
dtgaussiana %>%
  kbl(align = "cl", caption = "Símbolos y Significados de la Distribución Gaussiana (Normal)") %>% 
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)
Símbolos y Significados de la Distribución Gaussiana (Normal)
Símbolo Significado
x Valor de la Variable aleatoria
μ Media o valor esperado (centro de la distribución)
σ Desviación estándar (dispersión o variabilidad)
e Número o constante de Euler (≈ 2.71828)
π Constante matemática Pi (≈ 3.14159)

Esta ecuación define la curva de campana, cuyo pico se ubica en la media y cuya amplitud depende de la desviación estándar.

Propiedades clave

La distribución normal es perfectamente simétrica respecto a la media. En ella, media, mediana y moda coinciden. Esto significa que los valores tienen la misma probabilidad de situarse por encima o por debajo del promedio.

*El 68.2% de los datos se encuentra dentro de una desviación estándar (μ ± σ).

*El 95.4% dentro de dos desviaciones estándar (μ ± 2σ).

* El 99.7% dentro de tres desviaciones estándar (μ ± 3σ).

Los valores más allá de tres desviaciones estándar se consideran eventos raros o atípicos.

-Asimetría (skewness): mide la simetría de la distribución.

*En la distribución normal, la asimetría = 0.

*Asimetría negativa → cola más larga a la izquierda.

*Asimetría positiva → cola más larga a la derecha.

-Curtosis:mide el grosor de las colas.

La distribución normal tiene curtosis = 3 (mesocúrtica).

*Si > 3 = leptocúrtica (colas pesadas).

*Si < 3 = platicúrtica (colas delgadas).

El Teorema del Límite Central explica por qué la distribución normal aparece tan frecuentemente en la naturaleza y la estadística.

Establece que la media de un número grande de variables aleatorias independientes tiende a distribuirse normalmente, sin importar la forma de la distribución original.Por ello, la normalidad es la base de muchos métodos inferenciales.

Un caso particular es la distribución normal estándar, donde: μ = 0 y σ = 1

Esto permite comparar diferentes distribuciones mediante el puntaje Z, que indica cuántas desviaciones estándar está un valor respecto a la media:

Fórmula

\[ z=\frac{x-\mu }{\sigma }\]

Aplicaciones prácticas

Control de calidad:Para verificar si los productos (por ejemplo, el peso de un empaque) están dentro de los límites aceptables.

Educación: En los exámenes estandarizados, los puntajes suelen distribuirse normalmente alrededor del promedio.

Finanzas:Para modelar el comportamiento de los rendimientos de una inversión o precios de acciones.

Distribución Gussiana — Contexto de Salud

En salud, se utiliza para definir los rangos de referencia, asumiendo que los valores clínicos “estándar” son los que se encuentran en la parte más alta y central de la curva. Para analizar variables como la presión arterial, peso o talla en una población.

Importancia en la salud

Ejemplo práctico

La presión arterial sistólica (mmHg) de los adultos mayores atendidos en el Centro de Salud La Emilia de Palmira, Valle del Cauca, se distribuye normalmente con una media de 120 mmHg y una desviación estándar de 15 mmHg. Se desea calcular la densidad de probabilidad para un paciente que llega con una presión de 135 mmHg, usando la fórmula de la distribución normal.

Primero mostraremos las diferentes funciones que tiene R para calcular la probabilidad normal:

library(knitr)
library(kableExtra)

funciones_gauss <- data.frame(
  "Función_en_R" = c("dnorm()", "pnorm()", "qnorm()", "rnorm()"),
  "Propósito" = c("Densidad de probabilidad", "Probabilidad acumulada", "Cuantiles", "Simulación aleatoria"),
  "Aplicación_Salud" = c(
    "Calcula la probabilidad puntual en x = 135 mmHg.",
    "Calcula el % de pacientes por debajo de un nivel de presión.",
    "Encuentra el valor de presión para un percentil dado.",
    "Genera datos sintéticos para estudios de simulación."
  )
)

funciones_gauss %>%
  kbl(align = "cll", caption = "Análisis Normal: Funciones en R Studio") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "bordered"), 
                full_width = FALSE, font_size = 18) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)
Análisis Normal: Funciones en R Studio
Función_en_R Propósito Aplicación_Salud
dnorm() Densidad de probabilidad Calcula la probabilidad puntual en x = 135 mmHg.
pnorm() Probabilidad acumulada Calcula el % de pacientes por debajo de un nivel de presión.
qnorm() Cuantiles Encuentra el valor de presión para un percentil dado.
rnorm() Simulación aleatoria Genera datos sintéticos para estudios de simulación.

Ahora si haremos los calculos pertinentes:

Datos: μ=120, σ=15, x=135

Sustituyendo los datos en la fórmula:

\[f(135) = \frac{1}{15 \sqrt{2\pi}} \, e^{-\frac{1}{2}\left(\frac{135- 120}{15}\right)^2}= 0.01613\] Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución normal, se realiza el cálculo manualmente y luego se compara con la función dnorm() de R Studio.

Código:

densidad_manual <- function(x){
  
  mu <- 120
  sigma <- 15
  
  resultado <- (1 / (sigma * sqrt(2*pi))) *
                exp(-0.5 * ((x - mu) / sigma)^2)
  
  return(resultado)
}

resultado_manual <- densidad_manual(135)
print(resultado_manual)
## [1] 0.01613138

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

resultado_r <- dnorm(135,
                     mean = 120,
                     sd = 15)

print(resultado_r)
## [1] 0.01613138

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dnorm() utiliza internamente la misma fórmula matemática de la distribución normal.

Interpretación:Un valor de f(135) = 0.01613 indica que la presión de 135 mmHg tiene una probabilidad moderada dentro de esta población, es decir, no es un valor raro pero tampoco es el más frecuente. El valor más probable siempre es el de la media, en este caso 120 mmHg, que representa la presión normal ideal en los pacientes del Centro de Salud La Emilia de Palmira.

Tabla de distribución Gaussina de la presión arterial sistólica

library(knitr)
library(kableExtra)

mu    <- 120
sigma <- 15
x     <- 135
z     <- (x - mu) / sigma
fx    <- (1 / (sigma * sqrt(2 * pi))) * exp(-0.5 * z^2)

tabla <- data.frame(
  "Parámetro" = c("Media (μ)", "Desviación estándar (σ)", "Valor de x", 
                  "Puntuación Z", "Densidad f(x)"),
  "Valor" = c(mu, sigma, x, round(z, 2), round(fx, 4))
)
tabla %>%
  kbl(align = "cl", 
      caption = "Cálculo de la Densidad de Probabilidad Normal (x = 135 mmHg)") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  row_spec(5, bold = TRUE, color = "#001b76", background = "#ebf5fb")
Cálculo de la Densidad de Probabilidad Normal (x = 135 mmHg)
Parámetro Valor
Media (μ) 120.0000
Desviación estándar (σ) 15.0000
Valor de x 135.0000
Puntuación Z 1.0000
Densidad f(x) 0.0161

Gráfica de distribución Gaussina de la presión arterial sistólica (mmHg)

x_vals <- seq(60, 180, 0.1)
y_vals <- dnorm(x_vals, mean = mu, sd = sigma)

plot(x_vals, y_vals, type = "l", lwd = 2, col = "blue",
     main = "Gráfica Distribución Normal (μ = 120, σ = 15)",
     xlab = "Presión arterial (mmHg)", 
     ylab = "Densidad de probabilidad")

abline(v = x, col = "red", lty = 2, lwd = 2)
points(x, fx, col = "red", pch = 19, cex = 1.5)
text(x + 2, fx, labels = paste("f(135) =", round(fx, 4)), 
     col = "red", cex = 1)

En conclusión, la distribución Gaussiana o Normal describe con precisión fenómenos biológicos donde los valores se concentran alrededor de un punto central. En este ejemplo, la presión arterial de 135 mmHg está por encima de la media de 120 mmHg, con un valor z = 1.0, lo que indica que este paciente se encuentra a una desviación estándar del promedio, dentro del rango esperado pero ya en zona de prehipertensión. Esto demuestra el patrón típico de la distribución normal aplicada a salud: la mayoría de los pacientes del Centro de Salud La Emilia de Palmira presentan presiones cercanas a 120 mmHg, y a medida que los valores se alejan de ese centro, ya sea hacia hipotensión o hipertensión severa, los casos se vuelven progresivamente menos frecuentes

DISTRIBUCIÓN CHI-CUADRADO

¿Qué es la distribución Chi-Cuadrado?

La distribución Chi-cuadrado es una distribución continua que aparece cuando sumamos los cuadrados de variables normales estándar independientes.

Matemáticamente:

\[X=Z_{1}^{2}+Z_{2}^{2}+....+Z_{k}^{2}\]

Donde cada

\[Z_{i}^{2}\sim N(0,1)\]

Entonces X sigue una distribución Chi-cuadrado con k grados de libertad, denotada:

\[X\sim X^{2}(k)\]

Fórmula de distrubución Chi-Cuadrado

\[ f(x;k)=\frac{1}{2^{\frac{k}{2}}\Gamma (k/2)}x^{(k/2)-1}e^{-x/2}, x> 0\]

library(knitr)
library(kableExtra)

dt_distribucion <- data.frame(
  "Símbolo" = c("χ", "f(x; k)", "k", "Γ(k/2)"),
  "Significado" = c(
    "Variable aleatoria Chi-Cuadrado.",
    "Función de densidad de probabilidad para k grados de libertad.",
    "Grados de libertad (determina la forma de la curva).",
    "Función Gamma (extensión del factorial para números reales)."
  )
)

dt_distribucion %>% 
  kbl(align = "cl", caption = "Símbolos y Significados de la Distribución Chi-Cuadrado") %>% 
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE,)
Símbolos y Significados de la Distribución Chi-Cuadrado
Símbolo Significado
χ Variable aleatoria Chi-Cuadrado.
f(x; k) Función de densidad de probabilidad para k grados de libertad.
k Grados de libertad (determina la forma de la curva).
Γ(k/2) Función Gamma (extensión del factorial para números reales).

Características principales

library(knitr)
library(kableExtra)

tabla_chi <- data.frame(
  "Propiedad" = c("Dominio", "Media (μ)", "Varianza (σ²)", "Forma", "Usos comunes"),
  "Descripción" = c(
    "x > 0 (Solo valores positivos)",
    "k (Igual a los grados de libertad)",
    "2k (El doble de los grados de libertad)",
    "Asimétrica positiva (se normaliza al aumentar k)",
    "Pruebas de independencia, bondad de ajuste y ANOVA."
  ),
  stringsAsFactors = FALSE
)

tabla_chi %>%
  kbl(align = "cl", caption = "Propiedades de la Distribución Chi-cuadrado") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE,
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)
Propiedades de la Distribución Chi-cuadrado
Propiedad Descripción
Dominio x > 0 (Solo valores positivos)
Media (μ) k (Igual a los grados de libertad)
Varianza (σ²) 2k (El doble de los grados de libertad)
Forma Asimétrica positiva (se normaliza al aumentar k)
Usos comunes Pruebas de independencia, bondad de ajuste y ANOVA.

Aplicaciones

La distribución Chi-cuadrado es una de las más utilizadas en estadística aplicada. Algunos ejemplos de su aplicabilidad son:

Control de calidad: Se utiliza para analizar si la variabilidad en un proceso de producción sigue el patrón esperado

Medicina y biología: En estudios de genética, se usa para probar si la distribución de rasgos hereditarios (como colores de ojos o tipos de sangre) sigue las proporciones esperadas según las leyes de Mendel

Investigaciones sociales: Permite analizar si existe relación entre variables categóricas, como por ejemplo entre el nivel educativo y la preferencia de voto.

Ingeniería y análisis de riesgos: Se aplica para modelar la variabilidad de errores o residuos en mediciones experimentales.

Distribución Chi-Cuadrado — Contexto de Educación

La distribución Chi-Cuadrado es la prueba de fuego en educación para confirmar si un cambio en el aprendizaje es real o fruto del azar. Se usa para validar si variables como el método de enseñanza y el éxito académico están vinculadas, permitiendo asegurar que una mejora en las notas se debe a la estrategia pedagógica y no a una simple casualidad estadística.

Importancia en la Educación

Ejemplo práctico

Un investigador del departamento de Educación de la Universidad del Valle está analizando la variabilidad en los tiempos que tardan los estudiantes en completar un parcial de Estadística. Supone que la variable X (tiempo de evaluación estandarizado) sigue una distribución Chi-cuadrado con 4 grados de libertad. Desea conocer cuál es la densidad de probabilidad en el punto x = 3, es decir, qué tan probable es observar un valor cercano a 3 unidades de tiempo estandarizado dentro del grupo de estudiantes.

Primero mostraremos las diferentes funciones que tiene R para calcular la distribución Chi-Cuadrado:

library(knitr)
library(kableExtra)

funciones_chisq <- data.frame(
  "Función_en_R" = c("dchisq()", "pchisq()", "qchisq()", "rchisq()"),
  "Propósito" = c("Densidad de probabilidad", 
                "Probabilidad acumulada", 
                "Función de cuantiles", 
                "Generación aleatoria"),
  "Aplicación en el Artículo" = c(
    "Calcula la 'altura' de la curva para un valor de x dado.",
    "Fundamental para hallar el p-valor en pruebas de independencia.",
    "Calcula el valor crítico para determinar regiones de rechazo.",
    "Simula datos para pruebas de bondad de ajuste."
  )
)

funciones_chisq %>%
  kbl(align = "cll", caption = "Funciones de Distribución Chi-Cuadrado en R Studio") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE)
Funciones de Distribución Chi-Cuadrado en R Studio
Función_en_R Propósito Aplicación.en.el.Artículo
dchisq() Densidad de probabilidad Calcula la ‘altura’ de la curva para un valor de x dado.
pchisq() Probabilidad acumulada Fundamental para hallar el p-valor en pruebas de independencia.
qchisq() Función de cuantiles Calcula el valor crítico para determinar regiones de rechazo.
rchisq() Generación aleatoria Simula datos para pruebas de bondad de ajuste.

Ahora si haremos los calculos pertinentes:

Datos:k=4, x=3

Sustituyendo los valores en la fórmula

\[f(3;4)=\frac{1}{2^{\frac{4}{2}}\Gamma (4/2)}3^{(4/2)-1}e^{-3/2}= 0.1673\] Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución chi-cuadrado, se realiza el cálculo manualmente y luego se compara con la función dchisq() de R Studio.

Código:

densidad_chi_manual <- function(x){
  k <- 4
  resultado <- (1 / (2^(k/2) * gamma(k/2))) *
                x^((k/2)-1) *
                exp(-x/2)
  
  return(resultado)
}

resultado_manual <- densidad_chi_manual(3)

print(resultado_manual)
## [1] 0.1673476

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

resultado_r <- dchisq(3, df = 4)

print(resultado_r)
## [1] 0.1673476

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dchisq() utiliza internamente la misma fórmula matemática de la distribución Chi-cuadrado.

Un valor de f(3) = 0.1673 indica que el tiempo estandarizado de 3 unidades tiene una densidad moderada dentro del grupo, es decir, no es el más frecuente pero tampoco es un caso atípico. La mayoría de los estudiantes de Estadística en la Univalle completan el examen en tiempos cercanos a la media, y a medida que el tiempo se aleja del centro, los casos se vuelven progresivamente menos frecuentes.

Tabla de distribución de Chi-Cuadrado de cálculos de la densidad en x=3

library(knitr)
library(kableExtra)

x <- 3
k <- 4
gamma_val <- gamma(k/2)
exponencial <- exp(-x/2)
fx <- (1 / (2^(k/2) * gamma_val)) * x^((k/2)-1) * exponencial


tabla_chi <- data.frame(
  "Parámetro" = c("Valor de x", "Grados de libertad (k)", "Función Γ(k/2)", 
                  "Parte exponencial e^(-x/2)", "Densidad f(x; k)"),
  "Valor" = c(x, k, round(gamma_val, 3), round(exponencial, 4), round(fx, 4))
)

tabla_chi %>%
  kbl(align = "cl", 
      caption = "Cálculo de la Función de Densidad Chi-cuadrado (x = 3, k = 4)") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  row_spec(5, bold = TRUE, color = "#001b76", background = "#ebf5fb")
Cálculo de la Función de Densidad Chi-cuadrado (x = 3, k = 4)
Parámetro Valor
Valor de x 3.0000
Grados de libertad (k) 4.0000
Función Γ(k/2) 1.0000
Parte exponencial e^(-x/2) 0.2231
Densidad f(x; k) 0.1673

Gráfica de distribución de Chi-Cuadrado de tiempos de entrega del parcial por parte de los estudiantes

x_vals <- seq(0, 10, 0.1)
y_vals <- dchisq(x_vals, df = k)

plot(x_vals, y_vals, type = "l", lwd = 2, col = "blue",
main = paste("Distribución Chi-cuadrado con", k, "grados de libertad"),
xlab = expression(chi^2), ylab = "Densidad de probabilidad")

abline(v = x, col = "red", lty = 2, lwd = 2)
points(x, fx, col = "red", pch = 19, cex = 1.5)
text(x + 0.6, fx, labels = paste("f(3;4) =", round(fx, 4)), col = "red", cex = 1)

En conclusión, la gráfica muestra que la mayoría de los estudiantes de Estadística de la Univalle completan su evaluación en tiempos cercanos a x = 2, donde la curva alcanza su máximo. El estudiante ubicado en x = 3 con f(3) = 0.1673 representa un caso moderadamente frecuente, alguien que tardó un poco más que el promedio pero dentro de lo esperado. La cola larga hacia la derecha refleja que solo unos pocos estudiantes necesitan tiempos muy prolongados para terminar su examen, siendo estos casos cada vez más atípicos a medida que el tiempo aumenta.

DISTRIBUCIÓN DE POISSON

¿Qué es la distribución de Poisson?

La distribución de Poisson es una distribución de probabilidad discreta que modela el número de veces que ocurre un evento en un intervalo fijo de tiempo o espacio. Los eventos deben ocurrir de forma independiente, con una tasa promedio constante (λ).

Como por ejemplo:

Condiciones para aplicar la distribución de Poisson

Se puede usar esta distribución si:

1. Los eventos son independientes (uno no afecta la ocurrencia del otro).

2. Los eventos ocurren con una frecuencia promedio conocida (λ).

3. No ocurren dos eventos exactamente al mismo tiempo.

4. Se observa un intervalo fijo de tiempo o espacio.

Fórmula de distribución de Poisson

\[P(X=k)=\frac{e^{\lambda}\lambda ^{k}}{k!}\]

library(knitr)
library(kableExtra)

dt_poisson <- data.frame(
  "Símbolo" = c("P(X = k)", "λ", "e", "k!"),
  "Significado" = c(
    "Probabilidad de observar exactamente k eventos.",
    "Tasa media de ocurrencia (promedio de eventos por intervalo).",
    "Constante de Euler (base del logaritmo natural ≈ 2.71828).",
    "Factorial de k (producto de todos los enteros desde 1 hasta k)."
  )
)

dt_poisson %>%
  kbl(align = "cl", caption = "Símbolos y Significados de la Distribución de Poisson") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)
Símbolos y Significados de la Distribución de Poisson
Símbolo Significado
P(X = k) Probabilidad de observar exactamente k eventos.
λ Tasa media de ocurrencia (promedio de eventos por intervalo).
e Constante de Euler (base del logaritmo natural ≈ 2.71828).
k! Factorial de k (producto de todos los enteros desde 1 hasta k).

Propiedades importantes

library(knitr)
library(kableExtra)

propiedades_poisson <- data.frame(
  Propiedad = c("Tipo de variable", "Dominio", "Media (μ)", "Varianza (σ²)", "Forma", "Parámetro"),
  Descripción = c(
    "Discreta (conteos de eventos)",
    "k ∈ {0, 1, 2, 3, ...}",
    "λ (lambda)",
    "λ (lambda)",
    "Sesgada a la derecha (se normaliza si λ aumenta)",
    "λ (único parámetro de la distribución)"
  )
)

propiedades_poisson %>%
  kbl(align = "cl", caption = "Propiedades Clave de la Distribución de Poisson") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE,
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)
Propiedades Clave de la Distribución de Poisson
Propiedad Descripción
Tipo de variable Discreta (conteos de eventos)
Dominio k ∈ {0, 1, 2, 3, …}
Media (μ) λ (lambda)
Varianza (σ²) λ (lambda)
Forma Sesgada a la derecha (se normaliza si λ aumenta)
Parámetro λ (único parámetro de la distribución)

Aplicación en la vida real

La distribución de Poisson se utiliza ampliamente en distintos campos para modelar sucesos que ocurren aleatoriamente pero con una frecuencia promedio estable.Algunos ejemplos de aplicación práctica son:

library(knitr)
library(kableExtra)

aplicaciones_poisson <- data.frame(
  "Área" = c(
    "Salud pública",
    "Telecomunicaciones",
    "Industria",
    "Tránsito y transporte",
    "Finanzas y seguros",
    "Ciencias naturales",
    "Atención al cliente"
  ),
  "Aplicación Práctica" = c(
    "Pacientes en urgencias por hora o detección de enfermedades raras.",
    "Flujo de llamadas o mensajes recibidos en un servidor.",
    "Defectos en piezas producidas o fallos en maquinaria por semana.",
    "Vehículos en un peaje o llegada de buses a una estación.",
    "Frecuencia de reclamos de seguros o detección de fraudes.",
    "Mutaciones genéticas o avistamiento de especies en un área.",
    "Solicitudes de soporte o clientes en fila por intervalo de tiempo."
  )
)

aplicaciones_poisson %>%
  kbl(align = "cl", caption = "Aplicaciones de la Distribución de Poisson en Diversos Sectores") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE,
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE, width = "5cm") %>%
  column_spec(2, width = "12cm")
Aplicaciones de la Distribución de Poisson en Diversos Sectores
Área Aplicación.Práctica
Salud pública Pacientes en urgencias por hora o detección de enfermedades raras.
Telecomunicaciones Flujo de llamadas o mensajes recibidos en un servidor.
Industria Defectos en piezas producidas o fallos en maquinaria por semana.
Tránsito y transporte Vehículos en un peaje o llegada de buses a una estación.
Finanzas y seguros Frecuencia de reclamos de seguros o detección de fraudes.
Ciencias naturales Mutaciones genéticas o avistamiento de especies en un área.
Atención al cliente Solicitudes de soporte o clientes en fila por intervalo de tiempo.

Distribución de Poisson — Contexto de Comercio

Es el modelo matemático que predice cuántos eventos aleatorios (como la llegada de clientes o pedidos) ocurrirán en un tiempo determinado. En el comercio, es vital para la planificación táctica, ya que permite calcular cuántos empleados o productos se necesitan para cubrir la demanda esperada sin desperdiciar recursos ni perder ventas por saturación.

Importancia en el Comercio

Ejemplo Práctico

En una tienda de abarrotes del barrio El Vergel en Buga, el propietario ha registrado que en promedio llegan λ = 4 clientes por hora durante la mañana.

Primero mostraremos las diferentes funciones que tiene R para calcular la distribución poisson:

library(knitr)
library(kableExtra)

funciones_poisson <- data.frame(
  "Función_en_R" = c("dpois()", "ppois()", "qpois()", "rpois()"),
  "Propósito" = c("Probabilidad puntual", 
                "Probabilidad acumulada", 
                "Función de cuantiles", 
                "Generación aleatoria"),
  "Aplicación" = c(
    "Calcula la probabilidad de que ocurra un número exacto de eventos (k).",
    "Calcula la probabilidad de que ocurran 'k' eventos o menos.",
    "Encuentra el número de eventos necesario para alcanzar una probabilidad dada.",
    "Simula datos de conteo (ej. llegada de pacientes) para modelos predictivos."
  )
)

funciones_poisson %>%
  kbl(align = "cll", caption = "Funciones de la Distribución de Poisson en R Studio") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE)
Funciones de la Distribución de Poisson en R Studio
Función_en_R Propósito Aplicación
dpois() Probabilidad puntual Calcula la probabilidad de que ocurra un número exacto de eventos (k).
ppois() Probabilidad acumulada Calcula la probabilidad de que ocurran ‘k’ eventos o menos.
qpois() Función de cuantiles Encuentra el número de eventos necesario para alcanzar una probabilidad dada.
rpois() Generación aleatoria Simula datos de conteo (ej. llegada de pacientes) para modelos predictivos.

Ahora si haremos los calculos pertinentes:

Aplicando la fórmula:

\[P(X=6)=\frac{e^{-4}4 ^{2}}{2!}=0.1041\] Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución de Poisson, se realiza el cálculo manualmente mediante funciones creadas en R y luego se compara con la función dpois() de R Studio..

Código:

factorial_manual <- function(x) {
  f <- 1
  for(i in 1:x) {
    f <- f * i
  }
  return(f)
}

poisson_manual <- function(lambda, k) {
  p <- (exp(-lambda) * lambda^k) / factorial_manual(k)
  return(p)
}

lambda <- 4 
k      <- 6  

resultado <- poisson_manual(lambda, k)
print(resultado)
## [1] 0.1041956

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

resultado_r <- dpois(k, lambda)

print(resultado_r)
## [1] 0.1041956

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dpois() utiliza internamente la misma fórmula matemática de la distribución de Poisson.

Interpretación:Existe una probabilidad del 10.41% de que lleguen exactamente 6 clientes en una hora a la tienda del barrio El Vergel Buga, lo que representa un caso moderadamente probable dentro del comportamiento habitual del negocio.

Gráfica de distribución de Poisson de la tienda de abarrotes

lambda <- 4
x <- 0:12

probabilidades <- dpois(x, lambda)
datos <- data.frame(
  clientes = x,
  probabilidad = probabilidades
)

x_cont <- seq(0, 12, length.out = 500)
densidad_suave <- spline(x, dpois(x, lambda), xout = x_cont)$y

plot(
  x_cont, densidad_suave,
  type = "l",
  lwd = 2,
  col = "blue",
  main = "Distribución Poisson (Clientes por hora - Tienda El Jardín, Palmira)",
  xlab = "Número de clientes (X)",
  ylab = "Probabilidad P(X = x)"
)

points(datos$clientes, datos$probabilidad,
       col = "red", pch = 19)

p_x6 <- dpois(6, lambda)
points(6, p_x6, col = "darkred", pch = 19, cex = 1.5)
text(6, p_x6 + 0.015, paste0("P(X=6) = ", round(p_x6, 3)), col = "darkred")

La gráfica de la tienda del barrio El Vergel de Buga demuestra que con un promedio de 4 clientes por hora, la probabilidad de recibir exactamente 6 clientes es del 10.42%, un evento moderadamente probable pero por encima del flujo habitual. Este modelo le permite al propietario anticipar la demanda, optimizar el inventario y organizar mejor su atención al cliente en las horas de mayor afluencia.

DISTRIBUCIÓN EXPONENCIAL

¿Qué es la distribución exponencial?

La distribución exponencial es una distribución de probabilidad continua que modela el tiempo entre la ocurrencia de sucesos en un proceso que se desarrolla de forma constante, independiente y aleatoria. Es decir, describe cuánto tiempo transcurre hasta que ocurre un evento, como el fallo de una máquina, la llegada de un cliente o la duración de una llamada telefónica.

Características principales

Aplicaciones

1. Ingeniería de fiabilidad:

Modela el tiempo de vida de dispositivos electrónicos o mecánicos, ayudando a calcular el Tiempo Medio Entre Fallos (MTBF) y a planificar mantenimientos.

2. Teoría de colas:

Se usa para modelar el tiempo entre llegadas de clientes o llamadas, o el tiempo de servicio. Es clave en centros de atención, telecomunicaciones y sistemas hospitalarios.

3. Ciencias naturales y sociales:

Se aplica a fenómenos como la duración de llamadas telefónicas, el tiempo entre terremotos, la vida útil de baterías o incluso el gasto promedio en una compra.

Relación con la distribución de Poisson

La distribución Poisson y la Exponencial son complementarias:

Fórmula de la distribución Exponencial

\[f(x)=\lambda e^{-\lambda x}, x> 0\]

library(knitr)
library(kableExtra)

dt_exponencial <- data.frame(
  "Símbolo" = c("f(x)", "x", "λ (Lambda)", "e"),
  "Significado" = c(
    "Función de densidad de probabilidad.",
    "Tiempo o distancia entre eventos (variable continua x > 0).",
    "Tasa de ocurrencia (inverso del tiempo promedio).",
    "Constante de Euler (base del decaimiento exponencial ≈ 2.71828)."
  )
)

dt_exponencial %>%
  kbl(align = "cl", caption = "Símbolos y Significados de la Distribución Exponencial") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE, width = "3cm")
Símbolos y Significados de la Distribución Exponencial
Símbolo Significado
f(x) Función de densidad de probabilidad.
x Tiempo o distancia entre eventos (variable continua x > 0).
λ (Lambda) Tasa de ocurrencia (inverso del tiempo promedio).
e Constante de Euler (base del decaimiento exponencial ≈ 2.71828).

También puede escribirse como:

\[f(x)=\frac{1}{\mu }e^{-\lambda x}\]

donde μ = 1/λ representa el tiempo promedio entre sucesos.

Distribución Exponencial — Contexto de Salud

La distribución exponencial en salud es el modelo que mide el tiempo de espera hasta que ocurre un evento específico, como el intervalo entre la llegada de dos pacientes a urgencias o el tiempo que tarda un fármaco en metabolizarse. Es fundamental para la gestión hospitalaria y la epidemiología, ya que permite predecir la probabilidad de que un suceso ocurra en un periodo determinado, ayudando a dimensionar los servicios médicos para que la atención sea oportuna y los recursos no se saturen ante la incertidumbre.

Importancia en la Salud

Ejemplo práctico

En el servicio de urgencias del Hospital Universitario del Valle (HUV) en Cali, se ha registrado que en promedio llega un paciente cada 8 minutos, es decir, la tasa de llegada es λ = 1/8 = 0.125 pacientes por minuto.:

Primero mostraremos las diferentes funciones que tiene R para calcular la distribución exponencial:

library(knitr)
library(kableExtra)

funciones_exponencial <- data.frame(
  "Función_n_R" = c("dexp()", "pexp()", "qexp()", "rexp()"),
  "Propósito" = c("Densidad de probabilidad", 
                "Probabilidad acumulada", 
                "Función de cuantiles", 
                "Generación aleatoria"),
  "Aplicación" = c(
    "Calcula la 'altura' de la curva de decaimiento para un tiempo x.",
    "Calcula la probabilidad de que un evento ocurra antes de un tiempo límite.",
    "Determina el intervalo de tiempo necesario para una probabilidad dada.",
    "Simula tiempos de espera entre eventos (ej. tiempo entre clientes)."
  )
)

funciones_exponencial %>%
  kbl(align = "cll", caption = "Funciones de la Distribución Exponencial en R Studio") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE)
Funciones de la Distribución Exponencial en R Studio
Función_n_R Propósito Aplicación
dexp() Densidad de probabilidad Calcula la ‘altura’ de la curva de decaimiento para un tiempo x.
pexp() Probabilidad acumulada Calcula la probabilidad de que un evento ocurra antes de un tiempo límite.
qexp() Función de cuantiles Determina el intervalo de tiempo necesario para una probabilidad dada.
rexp() Generación aleatoria Simula tiempos de espera entre eventos (ej. tiempo entre clientes).

Ahora si haremos los calculos pertinentes:

\[f(5)=0,125e^{-0,125(5)}=0,0669\] # La probabilidad de que el tiempo supere 3 minutos es

\[P(x <= 5)=f(3)=0,125e^{-0,125(3)}=0,4647\] Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución exponencial, se realiza el cálculo manualmente mediante funciones creadas en R y luego se compara con las funciones dexp() y pexp() de R Studio.

Código:

lambda <- 1/8    
x      <- 5      

euler <- 2.718281828459045

densidad_exp <- function(lambda, x) {
  p <- lambda * euler^(-lambda * x)
  return(p)
}

prob_acum_exp <- function(lambda, x) {
  p <- 1 - euler^(-lambda * x)
  return(p)
}

resultado_densidad <- densidad_exp(lambda, x)
resultado_prob     <- prob_acum_exp(lambda, x)

print(resultado_densidad)
## [1] 0.06690768
print(resultado_prob)
## [1] 0.4647386

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

densidad_r <- dexp(x, rate = lambda)

probabilidad_r <- pexp(x, rate = lambda)

print(densidad_r)
## [1] 0.06690768
print(probabilidad_r)
## [1] 0.4647386

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que las funciones dexp() y pexp() utilizan internamente las mismas fórmulas matemáticas de la distribución exponencial.

Interpretación: Existe una probabilidad del 46.47% de que el próximo paciente llegue antes de 5 minutos, lo que indica que casi la mitad de las veces el personal de urgencias del HUV tiene menos de 5 minutos de margen antes de atender un nuevo caso.

Gráfico de distribución Exponencial del promedio llegada un paciente cada 8 minutos de servicios d urgencias del Hospital Universitario del Valle

x_vals <- seq(0, 40, length.out = 500)
y_vals <- lambda * euler^(-lambda * x_vals)

plot(
  x_vals, 
  y_vals,
  type = "l",
  lwd = 2,
  col = "blue",
  main = "Distribución Exponencial (Llegadas Urgencias HUV, Cali)",
  xlab = "Tiempo entre llegadas (minutos)",
  ylab = "Densidad de probabilidad"
)

abline(v = x, col = "red", lty = 2, lwd = 2)
points(x, resultado_densidad, col = "darkred", pch = 19, cex = 1.5)
text(x + 1, resultado_densidad + 0.003,
     paste0("f(5) = ", resultado_densidad), col = "darkred")

La gráfica muestra que en las urgencias del HUV de Cali los pacientes llegan muy seguido, especialmente en los primeros minutos. El punto marcado en 5 minutos con un valor de 0.0669 nos dice que es bastante común no esperar mucho entre un paciente y otro. La curva cae rápidamente hacia la derecha, lo que significa que es muy raro que pasen más de 20 minutos sin que llegue alguien nuevo al servicio de urgencias.

Conclusión

Las distribuciones de probabilidad permiten modelar y analizar diferentes fenómenos reales en áreas como salud, educación, finanzas, ingeniería y comercio. A través de ejemplos prácticos como precios de acciones, presión arterial, tiempos de espera, llegadas de clientes y duración de exámenes, se comprobó cómo cada distribución se adapta a distintos tipos de datos y comportamientos estadísticos.

Además, se verificó que las funciones integradas de R Studio generan los mismos resultados que las fórmulas matemáticas desarrolladas manualmente, lo que demuestra la confiabilidad de las herramientas estadísticas del software para el análisis de datos.

En R, las funciones de las distribuciones comparten una estructura común basada en las letras d, p, q y r, donde cada una cumple una función específica:

Estas funciones facilitan el análisis estadístico, la simulación de escenarios y la toma de decisiones basadas en probabilidades, convirtiendo a R Studio en una herramienta fundamental para el estudio de la estadística y la ciencia de datos.

Referencias