GESTIÓN DE DATOS

DISTRIBUCIONES DE PROBABILIDAD

PRESENTADO POR: DARCY ESTEFANIA MENESES MEDINA - 202463177 BREINER SANTIAGO OMEN OMEN - 202451239

PRESENTADO A: ING. JHON JAIRO ZULUAGA

UNIVERSIDAD DEL VALLE SECCIONAL BUGA

FACULTAD DE INGENIERÍA ESCUELA DE INGENIERÍA INDUSTRIAL

GUADALAJARA DE BUGA, 14 DE MAYO DEL 2026

DISTRIBUCIONES DE PROBABILIDAD

¿QUÉ ES UNA DISTRIBUCIÓN DE PROBABILIDAD?

Una distribución de probabilidad describe cómo se distribuyen las probabilidades de los posibles valores que pueda tomar la variable aleatoria, dentro de un periodo de tiempo. A continuación, se presentan las principales distribuciones de probabilidad utilizadas en estadística y análisis de datos:

Lognormal
Gussiana
Chi Cuadradro
Poisson
Exponencial

DISTRIBUCIÓN LOGNORMAL

¿Qué es la distribución lognormal?

La distribución lognormal, también conocida como distribución de Galton (en honor al estadístico Francis Galton), es un tipo de distribución de probabilidad que se utiliza ampliamente en estadística, economía, ingeniería y finanzas; cuando el logaritmo natural de la variable aleatoria sigue una distribución normal. Es útil para modelar variables que no pueden ser negativas.

En otras palabras, los datos originales no son normales, pero sus logaritmos sí lo son.

Por ejemplo si:

\[Y=ln(X)\]

se distribuye normalmente, entonces X tiene una distribución lognormal.

Características principales

Solo valores positivos: la distribución lognormal no puede tomar valores negativos.
Forma asimétrica: la curva está sesgada a la derecha, con una cola larga hacia los valores grandes.
Basada en la multiplicación: suele describir procesos donde los cambios son multiplicativos (por ejemplo, crecimiento porcentual o acumulado), en lugar de aditivos.
Derivada de la normal:si una variable normal se transforma mediante una función exponencial, el resultado sigue una distribución lognormal.

Fórmula de la distribución lognormal

\[f(x;\mu, \sigma )=\frac{1}{x\sigma \sqrt{2\pi }}*e^{-\frac{(lnx-\mu)^{2} }{2\sigma ^{2}}}, x> 0\]

## Warning: package 'knitr' was built under R version 4.5.3

## Warning: package 'kableExtra' was built under R version 4.5.3

Símbolos y Significados de la Distribución Lognormal
Símbolo	Significado
x	Variable aleatoria continua (valores de precios siempre > 0)
μ	Media de los logaritmos de los datos (escala logarítmica)
σ	Desviación estándar de los logaritmos (volatilidad)
e	Constante matemática base de los logaritmos naturales

Aplicaciones prácticas

La distribución lognormal se aplica en muchos campos, especialmente cuando los valores no pueden ser negativos y crecen de forma acumulativa o compuesta.

Finanzas: los precios de las acciones y los rendimientos acumulados suelen modelarse con distribuciones lognormales, ya que los precios no pueden ser negativos y crecen de forma multiplicativa.
Economía: se usa para describir distribuciones de ingresos, que tienden a tener muchos valores pequeños y pocos muy grandes.
Ingeniería y mantenimiento: modela tiempos hasta el fallo o duraciones de vida útil de componentes.
Medicina: describe variables como tiempos de recuperación, tamaños de tumores o concentraciones de fármacos.

Distribución Lognormal — Contexto Comercial Local

En el comercio local colombiano las plazas de mercado, tiendas de barrio y negocios, los ingresos diarios por ventas nunca son negativos y raramente son simétricos: la mayoría de los días las ventas son moderadas, pero en quincena, fin de mes o festividades se disparan a valores muy superiores. La distribución Lognormal captura exactamente ese comportamiento asimétrico con cola larga hacia la derecha, donde unos pocos días concentran una parte desproporcionada de los ingresos totales del mes.

Importancia en el comercio

Permite proyectar ingresos futuros de negocios pequeños y medianos con mayor precisión que la distribución normal, ya que los ingresos nunca son negativos.
Ayuda a los tenderos y comerciantes a estimar la probabilidad de alcanzar cierto nivel de ventas en un período dado.
Es usada por bancos y cooperativas para evaluar el riesgo crediticio de microempresarios, modelando la variabilidad de sus ingresos.
Permite analizar el precio de productos agrícolas como el café, el maíz o la caña de azúcar, cuyos precios fluctúan asimétricamente en los mercados locales.

Ejemplo práctico

Imagina que eres un analista financiero que quiere estudiar el comportamiento de los precios de las acciones de una empresa tecnológica. Notas que los precios siempre son positivos y que, en lugar de cambiar en valores fijos (como +5 o -5), tienden a cambiar en proporciones (por ejemplo, +10% o -8%). Esto sugiere que los precios podrían seguir una distribución lognormal, ya que los cambios porcentuales o multiplicativos son típicos de este tipo de distribución.

library(knitr)
library(kableExtra)

precios_acciones <- data.frame(
  "Día" = 1:5,
  "Precio (X)" = c(50, 55, 53, 60, 65),
  "ln(X)" = c(3.91, 4.01, 3.97, 4.09, 4.17)
)

precios_acciones %>%
  kbl(caption = "Precios Diarios y Transformación Logarítmica", 
      align = "c") %>% 
  kable_styling(
    bootstrap_options = c("striped", "hover", "bordered", "condensed"),
    full_width = FALSE,
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE)

Precios Diarios y Transformación Logarítmica
Día	Precio..X.	ln.X.
1	50	3.91
2	55	4.01
3	53	3.97
4	60	4.09
5	65	4.17

library(knitr)
library(kableExtra)

df_funciones <- data.frame(
  Función = c("dlnorm()", "plnorm()", "qlnorm()", "rlnorm()"),
  Propósito = c("Densidad de probabilidad", 
                "Probabilidad acumulada", 
                "Función de cuantiles", 
                "Generación aleatoria"),
  Aplicación_Financiera = c(
    "Calcula la probabilidad relativa de que la acción alcance un precio específico.",
    "Calcula el riesgo de que el precio caiga por debajo de un umbral (ej. p < $50).",
    "Determina el precio asociado a un nivel de confianza (útil para el VaR - Value at Risk).",
    "Simula escenarios futuros de precios (Simulaciones de Monte Carlo)."
  )
)


df_funciones %>%
  kbl(caption = "Análisis Lognormal: Funciones en R Studio",
      booktabs = TRUE,
      align = "cll") %>% # Centra la primera columna, izquierda las demás
  kable_styling(bootstrap_options = c("bordered", "striped", "condensed"), 
                full_width = F, 
                position = "center") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>% 
  column_spec(2, border_right = TRUE) %>%            
  row_spec(0, bold = TRUE, color = "white", background = "#001b76")

Análisis Lognormal: Funciones en R Studio
Función	Propósito	Aplicación_Financiera
dlnorm()	Densidad de probabilidad	Calcula la probabilidad relativa de que la acción alcance un precio específico.
plnorm()	Probabilidad acumulada	Calcula el riesgo de que el precio caiga por debajo de un umbral (ej. p < $50).
qlnorm()	Función de cuantiles	Determina el precio asociado a un nivel de confianza (útil para el VaR - Value at Risk).
rlnorm()	Generación aleatoria	Simula escenarios futuros de precios (Simulaciones de Monte Carlo).

Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución lognormal, se realiza el cálculo manualmente y luego se compara con la función `dlnorm()` de R Studio.

x <- 60 
meanlog <- 4 
sdlog <- 0.2 

resultado_manual <- (1 / (x * sdlog * sqrt(2*pi))) *
                    exp(-((log(x) - meanlog)^2) / (2 * sdlog^2))

print(resultado_manual)

## [1] 0.02974464

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

resultado_r <- dlnorm(x, meanlog, sdlog)
print(resultado_r)

## [1] 0.02974464

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dlnorm() utiliza internamente la misma fórmula matemática de la distribución lognormal.

A partir de los datos obtenidos, se puede construir la gráfica de la distribución lognormal de los precios de las acciones:

Gráfica de distribución lognormal ejercicio de precios de las acciones

precios <- c(50, 55, 53, 60, 65)

log_precios <- log(precios)
media_log <- mean(log_precios)
desv_log <- sd(log_precios)

x <- seq(40, 80, length.out = 200)

densidad <- dlnorm(x, meanlog = media_log, sdlog = desv_log)
plot(
  x, densidad,
  type = "l",
  lwd = 2,
  col = "blue",
  main = "Distribución Lognormal de Precios de una Acción",
  xlab = "Precio (X)",
  ylab = "Densidad de probabilidad"
)

polygon(x, densidad, col = rgb(0.2, 0.6, 1, 0.3), border = NA)

points(precios, dlnorm(precios, meanlog = media_log, sdlog = desv_log),
       col = "red", pch = 19)

La gráfica de la distribución lognormal muestra una asimetría hacia la derecha, indicando que los precios altos de la acción son menos frecuentes, aunque posibles. La mayor concentración de densidad de probabilidad se encuentra entre los precios de 50 y 60 unidades monetarias, indicando que este es el rango más probable para el comportamiento de la acción.

A medida que los precios aumentan por encima de 65 o 70, la probabilidad disminuye gradualmente, formando una cola derecha larga que representa posibles incrementos grandes en el mercado financiero.

Este comportamiento confirma que la distribución lognormal es adecuada para modelar precios de acciones, ya que trabaja con valores positivos y cambios porcentuales o multiplicativos.Además, la transformación logarítmica permitió observar un comportamiento más cercano a una distribución normal, apoyando el supuesto de lognormalidad para los precios de las acciones.

Tabla de distribución lognormal ejercicio de precios de las acciones

library(knitr)
library(kableExtra)

dt <- data.frame(
  "Día" = 1:5,
  "Precio (X)" = c(50, 55, 53, 60, 65),
  "ln(X)" = c(3.91, 4.01, 3.97, 4.09, 4.17),
  "Densidad f(x)" = c(0.0395, 0.0681, 0.0609, 0.0534, 0.0229),
  "Prob. Acumulada F(x)" = c("12.42%", "40.72%", "27.68%", "72.73%", "91.57%")
)

dt %>%
  kbl(align = "c", caption = "Resultados del Análisis de Distribución Lognormal") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE,
    position = "center",
    font_size = 18
  ) %>%
  
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, border_right = TRUE) %>% 
  column_spec(3, border_right = TRUE) %>% 
  column_spec(4, border_right = TRUE)

Resultados del Análisis de Distribución Lognormal
Día	Precio..X.	ln.X.	Densidad.f.x.	Prob..Acumulada.F.x.
1	50	3.91	0.0395	12.42%
2	55	4.01	0.0681	40.72%
3	53	3.97	0.0609	27.68%
4	60	4.09	0.0534	72.73%
5	65	4.17	0.0229	91.57%

Tabla de distribución lognormal calculada manualmente y con la función de R

Para comprobar nuevamente el funcionamiento de la distribución lognormal, se calculan las densidades de probabilidad tanto manualmente como utilizando la función dlnorm() de R Studio.

precios <- c(50, 55, 53, 60, 65)

media_log <- mean(log(precios))
desv_log <- sd(log(precios))


densidad_manual <- (1 / (precios * desv_log * sqrt(2*pi))) *
                   exp(-((log(precios) - media_log)^2) / (2 * desv_log^2))

print(densidad_manual)

## [1] 0.03953586 0.06807858 0.06094127 0.05343369 0.02294903

Posteriormente, se calculan los mismos valores utilizando la función integrada de R:

densidad_r <- dlnorm(precios,
                     meanlog = media_log,
                     sdlog = desv_log)

print(densidad_r)

## [1] 0.03953586 0.06807858 0.06094127 0.05343369 0.02294903

Finalmente, se organiza la información en una tabla comparativa:

library(knitr)
library(kableExtra)

tabla <- data.frame(
  "Precio" = precios,
  "Cálculo Manual" = round(densidad_manual, 5),
  "Función dlnorm" = round(densidad_r, 5)
)

tabla %>%
  kbl(align = "c", 
      caption = "Validación: Cálculo Manual vs. Función dlnorm()") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE, bold = TRUE, color = "#2e86c1")

Validación: Cálculo Manual vs. Función dlnorm()
Precio	Cálculo.Manual	Función.dlnorm
50	0.03954	0.03954
55	0.06808	0.06808
53	0.06094	0.06094
60	0.05343	0.05343
65	0.02295	0.02295

La tabla demuestra que el rango entre 50 y 60 es el escenario más probable para la acción, alcanzando su pico de densidad en los precios 53 (0.0609) y 55 (0.0681). La asimetría positiva se confirma al llegar a 65, donde la probabilidad cae drásticamente a un mínimo de 0.0229, demostrando que los precios altos son poco frecuentes. Finalmente, la probabilidad acumulada del 91.57% a un precio de 65 indica que existe apenas un 8.43% de probabilidad estadística de que la acción supere ese valor en el mercado actual

DISTRIBUCIÓN NORMAL O GAUSSIANA

¿Qué es la distribución Normal o Gaussiana?

La distribución normal, también conocida como distribución gaussiana, es uno de los pilares fundamentales de la estadística. Su forma característica en campana simétrica refleja cómo la mayoría de los datos tienden a concentrarse alrededor de un valor medio, con una frecuencia decreciente hacia los extremos. Esta distribución es ampliamente utilizada en diversas disciplinas desde la economía y las finanzas hasta la biología y la ingeniería debido a su capacidad para modelar fenómenos naturales y procesos aleatorios.

La distribución normal describe cómo se distribuyen los datos en torno a una media (μ), con una dispersión (σ) determinada por la desviación estándar.

Matemáticamente, su función de densidad de probabilidad (FDP) está dada por la fórmula:

Fórmula de la distribución Normal o Gaussiana

\[f(x) = \frac{1}{\sigma \sqrt{2\pi}} \, e^{-\frac{1}{2}\left(\frac{x - \mu}{\sigma}\right)^2}\]

library(knitr)
library(kableExtra)

dtgaussiana <- data.frame(
  "Símbolo" = c("x", "μ", "σ", "e", "π"),
  "Significado" = c(
    "Valor de la Variable aleatoria",
    "Media o valor esperado (centro de la distribución)",
    "Desviación estándar (dispersión o variabilidad)",
    "Número o constante de Euler (≈ 2.71828)",
    "Constante matemática Pi (≈ 3.14159)"
  )
)
dtgaussiana %>%
  kbl(align = "cl", caption = "Símbolos y Significados de la Distribución Gaussiana (Normal)") %>% 
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)

Símbolos y Significados de la Distribución Gaussiana (Normal)
Símbolo	Significado
x	Valor de la Variable aleatoria
μ	Media o valor esperado (centro de la distribución)
σ	Desviación estándar (dispersión o variabilidad)
e	Número o constante de Euler (≈ 2.71828)
π	Constante matemática Pi (≈ 3.14159)

Esta ecuación define la curva de campana, cuyo pico se ubica en la media y cuya amplitud depende de la desviación estándar.

Propiedades clave

Simetría

La distribución normal es perfectamente simétrica respecto a la media. En ella, media, mediana y moda coinciden. Esto significa que los valores tienen la misma probabilidad de situarse por encima o por debajo del promedio.

Regla empírica o del 68-95-99.7

*El 68.2% de los datos se encuentra dentro de una desviación estándar (μ ± σ).

*El 95.4% dentro de dos desviaciones estándar (μ ± 2σ).

* El 99.7% dentro de tres desviaciones estándar (μ ± 3σ).

Los valores más allá de tres desviaciones estándar se consideran eventos raros o atípicos.

Asimetría y curtosis

-Asimetría (skewness): mide la simetría de la distribución.

*En la distribución normal, la asimetría = 0.

*Asimetría negativa → cola más larga a la izquierda.

*Asimetría positiva → cola más larga a la derecha.

-Curtosis:mide el grosor de las colas.

La distribución normal tiene curtosis = 3 (mesocúrtica).

*Si > 3 = leptocúrtica (colas pesadas).

*Si < 3 = platicúrtica (colas delgadas).

Teorema del Límite Central (TLC)

El Teorema del Límite Central explica por qué la distribución normal aparece tan frecuentemente en la naturaleza y la estadística.

Establece que la media de un número grande de variables aleatorias independientes tiende a distribuirse normalmente, sin importar la forma de la distribución original.Por ello, la normalidad es la base de muchos métodos inferenciales.

Un caso particular es la distribución normal estándar, donde: μ = 0 y σ = 1

Esto permite comparar diferentes distribuciones mediante el puntaje Z, que indica cuántas desviaciones estándar está un valor respecto a la media:

Fórmula

\[ z=\frac{x-\mu }{\sigma }\]

Aplicaciones prácticas

Control de calidad:Para verificar si los productos (por ejemplo, el peso de un empaque) están dentro de los límites aceptables.

Educación: En los exámenes estandarizados, los puntajes suelen distribuirse normalmente alrededor del promedio.

Finanzas:Para modelar el comportamiento de los rendimientos de una inversión o precios de acciones.

Distribución Gussiana — Contexto de Salud

En salud, se utiliza para definir los rangos de referencia, asumiendo que los valores clínicos “estándar” son los que se encuentran en la parte más alta y central de la curva. Para analizar variables como la presión arterial, peso o talla en una población.

Importancia en la salud

Define la normalidad: Establece los límites de los exámenes de laboratorio (glucosa, hemoglobina) basados en el promedio del 95% de la población sana.
Diagnóstico rápido: Permite identificar pacientes en riesgo cuando sus valores caen en los extremos (colas) de la curva.
Valida tratamientos: Es la herramienta clave para probar si un medicamento funciona al comparar las curvas de mejora entre grupos.

Ejemplo práctico

La presión arterial sistólica (mmHg) de los adultos mayores atendidos en el Centro de Salud La Emilia de Palmira, Valle del Cauca, se distribuye normalmente con una media de 120 mmHg y una desviación estándar de 15 mmHg. Se desea calcular la densidad de probabilidad para un paciente que llega con una presión de 135 mmHg, usando la fórmula de la distribución normal.

Primero mostraremos las diferentes funciones que tiene R para calcular la probabilidad normal:

library(knitr)
library(kableExtra)

funciones_gauss <- data.frame(
  "Función_en_R" = c("dnorm()", "pnorm()", "qnorm()", "rnorm()"),
  "Propósito" = c("Densidad de probabilidad", "Probabilidad acumulada", "Cuantiles", "Simulación aleatoria"),
  "Aplicación_Salud" = c(
    "Calcula la probabilidad puntual en x = 135 mmHg.",
    "Calcula el % de pacientes por debajo de un nivel de presión.",
    "Encuentra el valor de presión para un percentil dado.",
    "Genera datos sintéticos para estudios de simulación."
  )
)

funciones_gauss %>%
  kbl(align = "cll", caption = "Análisis Normal: Funciones en R Studio") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "bordered"), 
                full_width = FALSE, font_size = 18) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)

Análisis Normal: Funciones en R Studio
Función_en_R	Propósito	Aplicación_Salud
dnorm()	Densidad de probabilidad	Calcula la probabilidad puntual en x = 135 mmHg.
pnorm()	Probabilidad acumulada	Calcula el % de pacientes por debajo de un nivel de presión.
qnorm()	Cuantiles	Encuentra el valor de presión para un percentil dado.
rnorm()	Simulación aleatoria	Genera datos sintéticos para estudios de simulación.

Ahora si haremos los calculos pertinentes:

Datos: μ=120, σ=15, x=135

Sustituyendo los datos en la fórmula:

\[f(135) = \frac{1}{15 \sqrt{2\pi}} \, e^{-\frac{1}{2}\left(\frac{135- 120}{15}\right)^2}= 0.01613\] Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución normal, se realiza el cálculo manualmente y luego se compara con la función `dnorm()` de R Studio.

Código:

densidad_manual <- function(x){
  
  mu <- 120
  sigma <- 15
  
  resultado <- (1 / (sigma * sqrt(2*pi))) *
                exp(-0.5 * ((x - mu) / sigma)^2)
  
  return(resultado)
}

resultado_manual <- densidad_manual(135)
print(resultado_manual)

## [1] 0.01613138

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

resultado_r <- dnorm(135,
                     mean = 120,
                     sd = 15)

print(resultado_r)

## [1] 0.01613138

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dnorm() utiliza internamente la misma fórmula matemática de la distribución normal.

Interpretación:Un valor de f(135) = 0.01613 indica que la presión de 135 mmHg tiene una probabilidad moderada dentro de esta población, es decir, no es un valor raro pero tampoco es el más frecuente. El valor más probable siempre es el de la media, en este caso 120 mmHg, que representa la presión normal ideal en los pacientes del Centro de Salud La Emilia de Palmira.

Tabla de distribución Gaussina de la presión arterial sistólica

library(knitr)
library(kableExtra)

mu    <- 120
sigma <- 15
x     <- 135
z     <- (x - mu) / sigma
fx    <- (1 / (sigma * sqrt(2 * pi))) * exp(-0.5 * z^2)

tabla <- data.frame(
  "Parámetro" = c("Media (μ)", "Desviación estándar (σ)", "Valor de x", 
                  "Puntuación Z", "Densidad f(x)"),
  "Valor" = c(mu, sigma, x, round(z, 2), round(fx, 4))
)
tabla %>%
  kbl(align = "cl", 
      caption = "Cálculo de la Densidad de Probabilidad Normal (x = 135 mmHg)") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  row_spec(5, bold = TRUE, color = "#001b76", background = "#ebf5fb")

Cálculo de la Densidad de Probabilidad Normal (x = 135 mmHg)
Parámetro	Valor
Media (μ)	120.0000
Desviación estándar (σ)	15.0000
Valor de x	135.0000
Puntuación Z	1.0000
Densidad f(x)	0.0161

Gráfica de distribución Gaussina de la presión arterial sistólica (mmHg)

x_vals <- seq(60, 180, 0.1)
y_vals <- dnorm(x_vals, mean = mu, sd = sigma)

plot(x_vals, y_vals, type = "l", lwd = 2, col = "blue",
     main = "Gráfica Distribución Normal (μ = 120, σ = 15)",
     xlab = "Presión arterial (mmHg)", 
     ylab = "Densidad de probabilidad")

abline(v = x, col = "red", lty = 2, lwd = 2)
points(x, fx, col = "red", pch = 19, cex = 1.5)
text(x + 2, fx, labels = paste("f(135) =", round(fx, 4)), 
     col = "red", cex = 1)

En conclusión, la distribución Gaussiana o Normal describe con precisión fenómenos biológicos donde los valores se concentran alrededor de un punto central. En este ejemplo, la presión arterial de 135 mmHg está por encima de la media de 120 mmHg, con un valor z = 1.0, lo que indica que este paciente se encuentra a una desviación estándar del promedio, dentro del rango esperado pero ya en zona de prehipertensión. Esto demuestra el patrón típico de la distribución normal aplicada a salud: la mayoría de los pacientes del Centro de Salud La Emilia de Palmira presentan presiones cercanas a 120 mmHg, y a medida que los valores se alejan de ese centro, ya sea hacia hipotensión o hipertensión severa, los casos se vuelven progresivamente menos frecuentes

DISTRIBUCIÓN CHI-CUADRADO

¿Qué es la distribución Chi-Cuadrado?

La distribución Chi-cuadrado es una distribución continua que aparece cuando sumamos los cuadrados de variables normales estándar independientes.

Matemáticamente:

\[X=Z_{1}^{2}+Z_{2}^{2}+....+Z_{k}^{2}\]

Donde cada

\[Z_{i}^{2}\sim N(0,1)\]

Entonces X sigue una distribución Chi-cuadrado con k grados de libertad, denotada:

\[X\sim X^{2}(k)\]

Fórmula de distrubución Chi-Cuadrado

\[ f(x;k)=\frac{1}{2^{\frac{k}{2}}\Gamma (k/2)}x^{(k/2)-1}e^{-x/2}, x> 0\]

library(knitr)
library(kableExtra)

dt_distribucion <- data.frame(
  "Símbolo" = c("χ", "f(x; k)", "k", "Γ(k/2)"),
  "Significado" = c(
    "Variable aleatoria Chi-Cuadrado.",
    "Función de densidad de probabilidad para k grados de libertad.",
    "Grados de libertad (determina la forma de la curva).",
    "Función Gamma (extensión del factorial para números reales)."
  )
)

dt_distribucion %>% 
  kbl(align = "cl", caption = "Símbolos y Significados de la Distribución Chi-Cuadrado") %>% 
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE,)

Símbolos y Significados de la Distribución Chi-Cuadrado
Símbolo	Significado
χ	Variable aleatoria Chi-Cuadrado.
f(x; k)	Función de densidad de probabilidad para k grados de libertad.
k	Grados de libertad (determina la forma de la curva).
Γ(k/2)	Función Gamma (extensión del factorial para números reales).

Γ(n)=(n−1)! si n es entero.
e^−x/2 = es el término exponencial de decaimiento.
2^k/2 = es una constante de normalización para asegurar que el área bajo la curva sea 1.

Características principales

library(knitr)
library(kableExtra)

tabla_chi <- data.frame(
  "Propiedad" = c("Dominio", "Media (μ)", "Varianza (σ²)", "Forma", "Usos comunes"),
  "Descripción" = c(
    "x > 0 (Solo valores positivos)",
    "k (Igual a los grados de libertad)",
    "2k (El doble de los grados de libertad)",
    "Asimétrica positiva (se normaliza al aumentar k)",
    "Pruebas de independencia, bondad de ajuste y ANOVA."
  ),
  stringsAsFactors = FALSE
)

tabla_chi %>%
  kbl(align = "cl", caption = "Propiedades de la Distribución Chi-cuadrado") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE,
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)

Propiedades de la Distribución Chi-cuadrado
Propiedad	Descripción
Dominio	x > 0 (Solo valores positivos)
Media (μ)	k (Igual a los grados de libertad)
Varianza (σ²)	2k (El doble de los grados de libertad)
Forma	Asimétrica positiva (se normaliza al aumentar k)
Usos comunes	Pruebas de independencia, bondad de ajuste y ANOVA.

Aplicaciones

La distribución Chi-cuadrado es una de las más utilizadas en estadística aplicada. Algunos ejemplos de su aplicabilidad son:

Control de calidad: Se utiliza para analizar si la variabilidad en un proceso de producción sigue el patrón esperado

Medicina y biología: En estudios de genética, se usa para probar si la distribución de rasgos hereditarios (como colores de ojos o tipos de sangre) sigue las proporciones esperadas según las leyes de Mendel

Investigaciones sociales: Permite analizar si existe relación entre variables categóricas, como por ejemplo entre el nivel educativo y la preferencia de voto.

Ingeniería y análisis de riesgos: Se aplica para modelar la variabilidad de errores o residuos en mediciones experimentales.

Distribución Chi-Cuadrado — Contexto de Educación

La distribución Chi-Cuadrado es la prueba de fuego en educación para confirmar si un cambio en el aprendizaje es real o fruto del azar. Se usa para validar si variables como el método de enseñanza y el éxito académico están vinculadas, permitiendo asegurar que una mejora en las notas se debe a la estrategia pedagógica y no a una simple casualidad estadística.

Importancia en la Educación

Valida métodos: Confirma si una nueva estrategia de enseñanza realmente mejora las notas o si fue solo suerte.
Prueba independencia: Detecta si factores como el estrato o el género influyen en la deserción escolar.
Mide el impacto:¨ Permite saber si el uso de tecnología en clase marca una diferencia real frente al método tradicional.
Ajusta expectativas: Verifica si las calificaciones obtenidas coinciden con la distribución que el docente esperaba.

Ejemplo práctico

Un investigador del departamento de Educación de la Universidad del Valle está analizando la variabilidad en los tiempos que tardan los estudiantes en completar un parcial de Estadística. Supone que la variable X (tiempo de evaluación estandarizado) sigue una distribución Chi-cuadrado con 4 grados de libertad. Desea conocer cuál es la densidad de probabilidad en el punto x = 3, es decir, qué tan probable es observar un valor cercano a 3 unidades de tiempo estandarizado dentro del grupo de estudiantes.

Primero mostraremos las diferentes funciones que tiene R para calcular la distribución Chi-Cuadrado:

library(knitr)
library(kableExtra)

funciones_chisq <- data.frame(
  "Función_en_R" = c("dchisq()", "pchisq()", "qchisq()", "rchisq()"),
  "Propósito" = c("Densidad de probabilidad", 
                "Probabilidad acumulada", 
                "Función de cuantiles", 
                "Generación aleatoria"),
  "Aplicación en el Artículo" = c(
    "Calcula la 'altura' de la curva para un valor de x dado.",
    "Fundamental para hallar el p-valor en pruebas de independencia.",
    "Calcula el valor crítico para determinar regiones de rechazo.",
    "Simula datos para pruebas de bondad de ajuste."
  )
)

funciones_chisq %>%
  kbl(align = "cll", caption = "Funciones de Distribución Chi-Cuadrado en R Studio") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE)

Funciones de Distribución Chi-Cuadrado en R Studio
Función_en_R	Propósito	Aplicación.en.el.Artículo
dchisq()	Densidad de probabilidad	Calcula la ‘altura’ de la curva para un valor de x dado.
pchisq()	Probabilidad acumulada	Fundamental para hallar el p-valor en pruebas de independencia.
qchisq()	Función de cuantiles	Calcula el valor crítico para determinar regiones de rechazo.
rchisq()	Generación aleatoria	Simula datos para pruebas de bondad de ajuste.

Ahora si haremos los calculos pertinentes:

Datos:k=4, x=3

Sustituyendo los valores en la fórmula

\[f(3;4)=\frac{1}{2^{\frac{4}{2}}\Gamma (4/2)}3^{(4/2)-1}e^{-3/2}= 0.1673\] Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución chi-cuadrado, se realiza el cálculo manualmente y luego se compara con la función `dchisq()` de R Studio.

Código:

densidad_chi_manual <- function(x){
  k <- 4
  resultado <- (1 / (2^(k/2) * gamma(k/2))) *
                x^((k/2)-1) *
                exp(-x/2)
  
  return(resultado)
}

resultado_manual <- densidad_chi_manual(3)

print(resultado_manual)

## [1] 0.1673476

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

resultado_r <- dchisq(3, df = 4)

print(resultado_r)

## [1] 0.1673476

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dchisq() utiliza internamente la misma fórmula matemática de la distribución Chi-cuadrado.

Un valor de f(3) = 0.1673 indica que el tiempo estandarizado de 3 unidades tiene una densidad moderada dentro del grupo, es decir, no es el más frecuente pero tampoco es un caso atípico. La mayoría de los estudiantes de Estadística en la Univalle completan el examen en tiempos cercanos a la media, y a medida que el tiempo se aleja del centro, los casos se vuelven progresivamente menos frecuentes.

Tabla de distribución de Chi-Cuadrado de cálculos de la densidad en x=3

library(knitr)
library(kableExtra)

x <- 3
k <- 4
gamma_val <- gamma(k/2)
exponencial <- exp(-x/2)
fx <- (1 / (2^(k/2) * gamma_val)) * x^((k/2)-1) * exponencial


tabla_chi <- data.frame(
  "Parámetro" = c("Valor de x", "Grados de libertad (k)", "Función Γ(k/2)", 
                  "Parte exponencial e^(-x/2)", "Densidad f(x; k)"),
  "Valor" = c(x, k, round(gamma_val, 3), round(exponencial, 4), round(fx, 4))
)

tabla_chi %>%
  kbl(align = "cl", 
      caption = "Cálculo de la Función de Densidad Chi-cuadrado (x = 3, k = 4)") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  row_spec(5, bold = TRUE, color = "#001b76", background = "#ebf5fb")

Cálculo de la Función de Densidad Chi-cuadrado (x = 3, k = 4)
Parámetro	Valor
Valor de x	3.0000
Grados de libertad (k)	4.0000
Función Γ(k/2)	1.0000
Parte exponencial e^(-x/2)	0.2231
Densidad f(x; k)	0.1673

Gráfica de distribución de Chi-Cuadrado de tiempos de entrega del parcial por parte de los estudiantes

x_vals <- seq(0, 10, 0.1)
y_vals <- dchisq(x_vals, df = k)

plot(x_vals, y_vals, type = "l", lwd = 2, col = "blue",
main = paste("Distribución Chi-cuadrado con", k, "grados de libertad"),
xlab = expression(chi^2), ylab = "Densidad de probabilidad")

abline(v = x, col = "red", lty = 2, lwd = 2)
points(x, fx, col = "red", pch = 19, cex = 1.5)
text(x + 0.6, fx, labels = paste("f(3;4) =", round(fx, 4)), col = "red", cex = 1)

En conclusión, la gráfica muestra que la mayoría de los estudiantes de Estadística de la Univalle completan su evaluación en tiempos cercanos a x = 2, donde la curva alcanza su máximo. El estudiante ubicado en x = 3 con f(3) = 0.1673 representa un caso moderadamente frecuente, alguien que tardó un poco más que el promedio pero dentro de lo esperado. La cola larga hacia la derecha refleja que solo unos pocos estudiantes necesitan tiempos muy prolongados para terminar su examen, siendo estos casos cada vez más atípicos a medida que el tiempo aumenta.

DISTRIBUCIÓN DE POISSON

¿Qué es la distribución de Poisson?

La distribución de Poisson es una distribución de probabilidad discreta que modela el número de veces que ocurre un evento en un intervalo fijo de tiempo o espacio. Los eventos deben ocurrir de forma independiente, con una tasa promedio constante (λ).

Como por ejemplo:

El número de llamadas que llegan a un centro de atención en una hora.
El número de accidentes diarios en una carretera.
El número de correos que recibe una persona por día.

Condiciones para aplicar la distribución de Poisson

Se puede usar esta distribución si:

1. Los eventos son independientes (uno no afecta la ocurrencia del otro).

2. Los eventos ocurren con una frecuencia promedio conocida (λ).

3. No ocurren dos eventos exactamente al mismo tiempo.

4. Se observa un intervalo fijo de tiempo o espacio.

Fórmula de distribución de Poisson

\[P(X=k)=\frac{e^{\lambda}\lambda ^{k}}{k!}\]

library(knitr)
library(kableExtra)

dt_poisson <- data.frame(
  "Símbolo" = c("P(X = k)", "λ", "e", "k!"),
  "Significado" = c(
    "Probabilidad de observar exactamente k eventos.",
    "Tasa media de ocurrencia (promedio de eventos por intervalo).",
    "Constante de Euler (base del logaritmo natural ≈ 2.71828).",
    "Factorial de k (producto de todos los enteros desde 1 hasta k)."
  )
)

dt_poisson %>%
  kbl(align = "cl", caption = "Símbolos y Significados de la Distribución de Poisson") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)

Símbolos y Significados de la Distribución de Poisson
Símbolo	Significado
P(X = k)	Probabilidad de observar exactamente k eventos.
λ	Tasa media de ocurrencia (promedio de eventos por intervalo).
e	Constante de Euler (base del logaritmo natural ≈ 2.71828).
k!	Factorial de k (producto de todos los enteros desde 1 hasta k).

Propiedades importantes

library(knitr)
library(kableExtra)

propiedades_poisson <- data.frame(
  Propiedad = c("Tipo de variable", "Dominio", "Media (μ)", "Varianza (σ²)", "Forma", "Parámetro"),
  Descripción = c(
    "Discreta (conteos de eventos)",
    "k ∈ {0, 1, 2, 3, ...}",
    "λ (lambda)",
    "λ (lambda)",
    "Sesgada a la derecha (se normaliza si λ aumenta)",
    "λ (único parámetro de la distribución)"
  )
)

propiedades_poisson %>%
  kbl(align = "cl", caption = "Propiedades Clave de la Distribución de Poisson") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE,
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE)

Propiedades Clave de la Distribución de Poisson
Propiedad	Descripción
Tipo de variable	Discreta (conteos de eventos)
Dominio	k ∈ {0, 1, 2, 3, …}
Media (μ)	λ (lambda)
Varianza (σ²)	λ (lambda)
Forma	Sesgada a la derecha (se normaliza si λ aumenta)
Parámetro	λ (único parámetro de la distribución)

Aplicación en la vida real

La distribución de Poisson se utiliza ampliamente en distintos campos para modelar sucesos que ocurren aleatoriamente pero con una frecuencia promedio estable.Algunos ejemplos de aplicación práctica son:

library(knitr)
library(kableExtra)

aplicaciones_poisson <- data.frame(
  "Área" = c(
    "Salud pública",
    "Telecomunicaciones",
    "Industria",
    "Tránsito y transporte",
    "Finanzas y seguros",
    "Ciencias naturales",
    "Atención al cliente"
  ),
  "Aplicación Práctica" = c(
    "Pacientes en urgencias por hora o detección de enfermedades raras.",
    "Flujo de llamadas o mensajes recibidos en un servidor.",
    "Defectos en piezas producidas o fallos en maquinaria por semana.",
    "Vehículos en un peaje o llegada de buses a una estación.",
    "Frecuencia de reclamos de seguros o detección de fraudes.",
    "Mutaciones genéticas o avistamiento de especies en un área.",
    "Solicitudes de soporte o clientes en fila por intervalo de tiempo."
  )
)

aplicaciones_poisson %>%
  kbl(align = "cl", caption = "Aplicaciones de la Distribución de Poisson en Diversos Sectores") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE,
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE, width = "5cm") %>%
  column_spec(2, width = "12cm")

Aplicaciones de la Distribución de Poisson en Diversos Sectores
Área	Aplicación.Práctica
Salud pública	Pacientes en urgencias por hora o detección de enfermedades raras.
Telecomunicaciones	Flujo de llamadas o mensajes recibidos en un servidor.
Industria	Defectos en piezas producidas o fallos en maquinaria por semana.
Tránsito y transporte	Vehículos en un peaje o llegada de buses a una estación.
Finanzas y seguros	Frecuencia de reclamos de seguros o detección de fraudes.
Ciencias naturales	Mutaciones genéticas o avistamiento de especies en un área.
Atención al cliente	Solicitudes de soporte o clientes en fila por intervalo de tiempo.

Distribución de Poisson — Contexto de Comercio

Es el modelo matemático que predice cuántos eventos aleatorios (como la llegada de clientes o pedidos) ocurrirán en un tiempo determinado. En el comercio, es vital para la planificación táctica, ya que permite calcular cuántos empleados o productos se necesitan para cubrir la demanda esperada sin desperdiciar recursos ni perder ventas por saturación.

Importancia en el Comercio

Optimiza el personal: Predice las horas pico de llegada de clientes para asignar cajeros o vendedores sin desperdiciar dinero en horas muertas.
Controla el inventario: Calcula cuántos productos deben estar en estante para cubrir pedidos aleatorios y evitar el desabastecimiento.
Gestiona colas: Permite diseñar sistemas de espera eficientes para que el cliente no abandone la tienda por lentitud en el servicio.
Previene riesgos: Ayuda a estimar la frecuencia de fallos en entregas o devoluciones, permitiendo reaccionar antes de que afecten las ganancias.

Ejemplo Práctico

En una tienda de abarrotes del barrio El Vergel en Buga, el propietario ha registrado que en promedio llegan λ = 4 clientes por hora durante la mañana.

En promedio, λ = 4 clientes arriban a la tienda por hora.
Se desea conocer la probabilidad de que lleguen exactamente 6 clientes en una hora determinada.

Primero mostraremos las diferentes funciones que tiene R para calcular la distribución poisson:

library(knitr)
library(kableExtra)

funciones_poisson <- data.frame(
  "Función_en_R" = c("dpois()", "ppois()", "qpois()", "rpois()"),
  "Propósito" = c("Probabilidad puntual", 
                "Probabilidad acumulada", 
                "Función de cuantiles", 
                "Generación aleatoria"),
  "Aplicación" = c(
    "Calcula la probabilidad de que ocurra un número exacto de eventos (k).",
    "Calcula la probabilidad de que ocurran 'k' eventos o menos.",
    "Encuentra el número de eventos necesario para alcanzar una probabilidad dada.",
    "Simula datos de conteo (ej. llegada de pacientes) para modelos predictivos."
  )
)

funciones_poisson %>%
  kbl(align = "cll", caption = "Funciones de la Distribución de Poisson en R Studio") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE)

Funciones de la Distribución de Poisson en R Studio
Función_en_R	Propósito	Aplicación
dpois()	Probabilidad puntual	Calcula la probabilidad de que ocurra un número exacto de eventos (k).
ppois()	Probabilidad acumulada	Calcula la probabilidad de que ocurran ‘k’ eventos o menos.
qpois()	Función de cuantiles	Encuentra el número de eventos necesario para alcanzar una probabilidad dada.
rpois()	Generación aleatoria	Simula datos de conteo (ej. llegada de pacientes) para modelos predictivos.

Ahora si haremos los calculos pertinentes:

Aplicando la fórmula:

\[P(X=6)=\frac{e^{-4}4 ^{2}}{2!}=0.1041\] Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución de Poisson, se realiza el cálculo manualmente mediante funciones creadas en R y luego se compara con la función `dpois()` de R Studio..

Código:

factorial_manual <- function(x) {
  f <- 1
  for(i in 1:x) {
    f <- f * i
  }
  return(f)
}

poisson_manual <- function(lambda, k) {
  p <- (exp(-lambda) * lambda^k) / factorial_manual(k)
  return(p)
}

lambda <- 4 
k      <- 6  

resultado <- poisson_manual(lambda, k)
print(resultado)

## [1] 0.1041956

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

resultado_r <- dpois(k, lambda)

print(resultado_r)

## [1] 0.1041956

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dpois() utiliza internamente la misma fórmula matemática de la distribución de Poisson.

Interpretación:Existe una probabilidad del 10.41% de que lleguen exactamente 6 clientes en una hora a la tienda del barrio El Vergel Buga, lo que representa un caso moderadamente probable dentro del comportamiento habitual del negocio.

Gráfica de distribución de Poisson de la tienda de abarrotes

lambda <- 4
x <- 0:12

probabilidades <- dpois(x, lambda)
datos <- data.frame(
  clientes = x,
  probabilidad = probabilidades
)

x_cont <- seq(0, 12, length.out = 500)
densidad_suave <- spline(x, dpois(x, lambda), xout = x_cont)$y

plot(
  x_cont, densidad_suave,
  type = "l",
  lwd = 2,
  col = "blue",
  main = "Distribución Poisson (Clientes por hora - Tienda El Jardín, Palmira)",
  xlab = "Número de clientes (X)",
  ylab = "Probabilidad P(X = x)"
)

points(datos$clientes, datos$probabilidad,
       col = "red", pch = 19)

p_x6 <- dpois(6, lambda)
points(6, p_x6, col = "darkred", pch = 19, cex = 1.5)
text(6, p_x6 + 0.015, paste0("P(X=6) = ", round(p_x6, 3)), col = "darkred")

La gráfica de la tienda del barrio El Vergel de Buga demuestra que con un promedio de 4 clientes por hora, la probabilidad de recibir exactamente 6 clientes es del 10.42%, un evento moderadamente probable pero por encima del flujo habitual. Este modelo le permite al propietario anticipar la demanda, optimizar el inventario y organizar mejor su atención al cliente en las horas de mayor afluencia.

DISTRIBUCIÓN EXPONENCIAL

¿Qué es la distribución exponencial?

La distribución exponencial es una distribución de probabilidad continua que modela el tiempo entre la ocurrencia de sucesos en un proceso que se desarrolla de forma constante, independiente y aleatoria. Es decir, describe cuánto tiempo transcurre hasta que ocurre un evento, como el fallo de una máquina, la llegada de un cliente o la duración de una llamada telefónica.

Características principales

Propiedad sin memoria: Es la característica más distintiva. La probabilidad de que ocurra un suceso no depende del tiempo que ya haya pasado. Por ejemplo, si una bombilla ha durado 1.000 horas, la probabilidad de que dure 100 horas más es la misma que si fuera nueva.
Tasa de riesgo constante: La probabilidad de que ocurra un evento en un pequeño intervalo de tiempo siempre es la misma, sin importar cuánto haya transcurrido.
Variable continua: La variable aleatoria X puede tomar cualquier valor real positivo, representando tiempos o duraciones.

Aplicaciones

1. Ingeniería de fiabilidad:

Modela el tiempo de vida de dispositivos electrónicos o mecánicos, ayudando a calcular el Tiempo Medio Entre Fallos (MTBF) y a planificar mantenimientos.

2. Teoría de colas:

Se usa para modelar el tiempo entre llegadas de clientes o llamadas, o el tiempo de servicio. Es clave en centros de atención, telecomunicaciones y sistemas hospitalarios.

3. Ciencias naturales y sociales:

Se aplica a fenómenos como la duración de llamadas telefónicas, el tiempo entre terremotos, la vida útil de baterías o incluso el gasto promedio en una compra.

Relación con la distribución de Poisson

La distribución Poisson y la Exponencial son complementarias:

La Poisson modela el número de eventos que ocurren en un intervalo de tiempo fijo (variable discreta).
La Exponencial modela el tiempo entre eventos (variable continua).

Fórmula de la distribución Exponencial

\[f(x)=\lambda e^{-\lambda x}, x> 0\]

library(knitr)
library(kableExtra)

dt_exponencial <- data.frame(
  "Símbolo" = c("f(x)", "x", "λ (Lambda)", "e"),
  "Significado" = c(
    "Función de densidad de probabilidad.",
    "Tiempo o distancia entre eventos (variable continua x > 0).",
    "Tasa de ocurrencia (inverso del tiempo promedio).",
    "Constante de Euler (base del decaimiento exponencial ≈ 2.71828)."
  )
)

dt_exponencial %>%
  kbl(align = "cl", caption = "Símbolos y Significados de la Distribución Exponencial") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    position = "center",
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE, width = "3cm")

Símbolos y Significados de la Distribución Exponencial
Símbolo	Significado
f(x)	Función de densidad de probabilidad.
x	Tiempo o distancia entre eventos (variable continua x > 0).
λ (Lambda)	Tasa de ocurrencia (inverso del tiempo promedio).
e	Constante de Euler (base del decaimiento exponencial ≈ 2.71828).

También puede escribirse como:

\[f(x)=\frac{1}{\mu }e^{-\lambda x}\]

donde μ = 1/λ representa el tiempo promedio entre sucesos.

Distribución Exponencial — Contexto de Salud

La distribución exponencial en salud es el modelo que mide el tiempo de espera hasta que ocurre un evento específico, como el intervalo entre la llegada de dos pacientes a urgencias o el tiempo que tarda un fármaco en metabolizarse. Es fundamental para la gestión hospitalaria y la epidemiología, ya que permite predecir la probabilidad de que un suceso ocurra en un periodo determinado, ayudando a dimensionar los servicios médicos para que la atención sea oportuna y los recursos no se saturen ante la incertidumbre.

Importancia en la Salud

Reduce tiempos de espera: Permite modelar el tiempo entre la llegada de pacientes a urgencias para organizar turnos y evitar el colapso del servicio.
Gestión de órganos y trasplantes: Estima cuánto tiempo pasará hasta que aparezca un donante compatible, ayudando a priorizar listas de espera.
Farmacología: Mide la velocidad de descomposición de un medicamento en el cuerpo, crucial para determinar cada cuánto tiempo se debe administrar una dosis.
Epidemiología: Ayuda a calcular el intervalo de tiempo entre nuevos contagios durante un brote, permitiendo predecir la velocidad de propagación de una enfermedad.

Ejemplo práctico

En el servicio de urgencias del Hospital Universitario del Valle (HUV) en Cali, se ha registrado que en promedio llega un paciente cada 8 minutos, es decir, la tasa de llegada es λ = 1/8 = 0.125 pacientes por minuto.:

Primero mostraremos las diferentes funciones que tiene R para calcular la distribución exponencial:

library(knitr)
library(kableExtra)

funciones_exponencial <- data.frame(
  "Función_n_R" = c("dexp()", "pexp()", "qexp()", "rexp()"),
  "Propósito" = c("Densidad de probabilidad", 
                "Probabilidad acumulada", 
                "Función de cuantiles", 
                "Generación aleatoria"),
  "Aplicación" = c(
    "Calcula la 'altura' de la curva de decaimiento para un tiempo x.",
    "Calcula la probabilidad de que un evento ocurra antes de un tiempo límite.",
    "Determina el intervalo de tiempo necesario para una probabilidad dada.",
    "Simula tiempos de espera entre eventos (ej. tiempo entre clientes)."
  )
)

funciones_exponencial %>%
  kbl(align = "cll", caption = "Funciones de la Distribución Exponencial en R Studio") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "bordered"),
    full_width = FALSE, 
    font_size = 18
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#001b76") %>%
  column_spec(1, bold = TRUE, border_right = TRUE) %>%
  column_spec(2, border_right = TRUE)

Funciones de la Distribución Exponencial en R Studio
Función_n_R	Propósito	Aplicación
dexp()	Densidad de probabilidad	Calcula la ‘altura’ de la curva de decaimiento para un tiempo x.
pexp()	Probabilidad acumulada	Calcula la probabilidad de que un evento ocurra antes de un tiempo límite.
qexp()	Función de cuantiles	Determina el intervalo de tiempo necesario para una probabilidad dada.
rexp()	Generación aleatoria	Simula tiempos de espera entre eventos (ej. tiempo entre clientes).

Ahora si haremos los calculos pertinentes:

En promedio, el tiempo entre llegadas es de 8 minutos
Se desea conocer la probabilidad de que el próximo paciente llegue antes de 5 minutos.
Esto implica que:

\[f(5)=0,125e^{-0,125(5)}=0,0669\] # La probabilidad de que el tiempo supere 3 minutos es

\[P(x <= 5)=f(3)=0,125e^{-0,125(3)}=0,4647\] Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución exponencial, se realiza el cálculo manualmente mediante funciones creadas en R y luego se compara con las funciones `dexp()` y `pexp()` de R Studio.

Código:

lambda <- 1/8    
x      <- 5      

euler <- 2.718281828459045

densidad_exp <- function(lambda, x) {
  p <- lambda * euler^(-lambda * x)
  return(p)
}

prob_acum_exp <- function(lambda, x) {
  p <- 1 - euler^(-lambda * x)
  return(p)
}

resultado_densidad <- densidad_exp(lambda, x)
resultado_prob     <- prob_acum_exp(lambda, x)

print(resultado_densidad)

## [1] 0.06690768

print(resultado_prob)

## [1] 0.4647386

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

densidad_r <- dexp(x, rate = lambda)

probabilidad_r <- pexp(x, rate = lambda)

print(densidad_r)

## [1] 0.06690768

print(probabilidad_r)

## [1] 0.4647386

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que las funciones dexp() y pexp() utilizan internamente las mismas fórmulas matemáticas de la distribución exponencial.

Interpretación: Existe una probabilidad del 46.47% de que el próximo paciente llegue antes de 5 minutos, lo que indica que casi la mitad de las veces el personal de urgencias del HUV tiene menos de 5 minutos de margen antes de atender un nuevo caso.

Gráfico de distribución Exponencial del promedio llegada un paciente cada 8 minutos de servicios d urgencias del Hospital Universitario del Valle

x_vals <- seq(0, 40, length.out = 500)
y_vals <- lambda * euler^(-lambda * x_vals)

plot(
  x_vals, 
  y_vals,
  type = "l",
  lwd = 2,
  col = "blue",
  main = "Distribución Exponencial (Llegadas Urgencias HUV, Cali)",
  xlab = "Tiempo entre llegadas (minutos)",
  ylab = "Densidad de probabilidad"
)

abline(v = x, col = "red", lty = 2, lwd = 2)
points(x, resultado_densidad, col = "darkred", pch = 19, cex = 1.5)
text(x + 1, resultado_densidad + 0.003,
     paste0("f(5) = ", resultado_densidad), col = "darkred")

La gráfica muestra que en las urgencias del HUV de Cali los pacientes llegan muy seguido, especialmente en los primeros minutos. El punto marcado en 5 minutos con un valor de 0.0669 nos dice que es bastante común no esperar mucho entre un paciente y otro. La curva cae rápidamente hacia la derecha, lo que significa que es muy raro que pasen más de 20 minutos sin que llegue alguien nuevo al servicio de urgencias.

Conclusión

Las distribuciones de probabilidad permiten modelar y analizar diferentes fenómenos reales en áreas como salud, educación, finanzas, ingeniería y comercio. A través de ejemplos prácticos como precios de acciones, presión arterial, tiempos de espera, llegadas de clientes y duración de exámenes, se comprobó cómo cada distribución se adapta a distintos tipos de datos y comportamientos estadísticos.

Además, se verificó que las funciones integradas de R Studio generan los mismos resultados que las fórmulas matemáticas desarrolladas manualmente, lo que demuestra la confiabilidad de las herramientas estadísticas del software para el análisis de datos.

En R, las funciones de las distribuciones comparten una estructura común basada en las letras `d`, `p`, `q` y `r`, donde cada una cumple una función específica:

d → calcula la densidad de probabilidad o probabilidad puntual.

Ejemplos: dnorm(), dpois(), dexp(), dchisq().
p → calcula la probabilidad acumulada.

Ejemplos: pnorm(), ppois(), pexp(), pchisq().
q → calcula cuantiles o valores críticos asociados a probabilidades.

Ejemplos: qnorm(), qpois(), qexp(), qchisq().
r → genera valores aleatorios siguiendo una distribución específica.

Ejemplos: rnorm(), rpois(), rexp(), rchisq().

Estas funciones facilitan el análisis estadístico, la simulación de escenarios y la toma de decisiones basadas en probabilidades, convirtiendo a R Studio en una herramienta fundamental para el estudio de la estadística y la ciencia de datos.

Referencias

Vélez Duque, J. D. (s.f.). R123. RPubs. Recuperado de https://rpubs.com/JDVelezDuque/R123
Consellería de Sanidade & Servizo Galego de Saúde. (s.f.). 13- Distribucións de probabilidade. Sergas. Recuperado de https://www.sergas.gal/Saude-publica/Epidat-4-1–13–Distribuci%C3%B3ns-de-probabilidade
Corporate Finance Institute. (s.f.). Lognormal distribution. CFI. Recuperado de https://corporatefinanceinstitute.com/resources/data-science/lognormal-distribution/
DataCamp. (s.f.). Distribución gaussiana: guía completa. DataCamp. Recuperado de https://www.datacamp.com/es/tutorial/gaussian-distribution
CHR Ingeniería. (s.f.). Distribución chi-cuadrado. CHR Ingeniería. Recuperado de https://www.chreinvent.com/recursos/distribuci%C3%B3n-chi-cuadrado
OpenStax. (s.f.). 5.3 La distribución exponencial. Introducción a la estadística empresarial. OpenStax. Recuperado de https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-empresarial/pages/5-3-la-distribucion-exponencial

DISTRIBUCIONES

Darcy Estefania Meneses Meidna - 202463177 y Breiner Santiago Omen Omen - 202451239

14 de mayo del 2026

DISTRIBUCIONES DE PROBABILIDAD

¿QUÉ ES UNA DISTRIBUCIÓN DE PROBABILIDAD?

Lognormal

Gussiana

Chi Cuadradro

Poisson

Exponencial

DISTRIBUCIÓN LOGNORMAL

¿Qué es la distribución lognormal?

En otras palabras, los datos originales no son normales, pero sus logaritmos sí lo son.

Por ejemplo si:

se distribuye normalmente, entonces X tiene una distribución lognormal.

Características principales

Solo valores positivos: la distribución lognormal no puede tomar valores negativos.

Forma asimétrica: la curva está sesgada a la derecha, con una cola larga hacia los valores grandes.

Basada en la multiplicación: suele describir procesos donde los cambios son multiplicativos (por ejemplo, crecimiento porcentual o acumulado), en lugar de aditivos.

Derivada de la normal:si una variable normal se transforma mediante una función exponencial, el resultado sigue una distribución lognormal.

Fórmula de la distribución lognormal

Aplicaciones prácticas

La distribución lognormal se aplica en muchos campos, especialmente cuando los valores no pueden ser negativos y crecen de forma acumulativa o compuesta.

Finanzas: los precios de las acciones y los rendimientos acumulados suelen modelarse con distribuciones lognormales, ya que los precios no pueden ser negativos y crecen de forma multiplicativa.

Economía: se usa para describir distribuciones de ingresos, que tienden a tener muchos valores pequeños y pocos muy grandes.

Ingeniería y mantenimiento: modela tiempos hasta el fallo o duraciones de vida útil de componentes.

Medicina: describe variables como tiempos de recuperación, tamaños de tumores o concentraciones de fármacos.

Distribución Lognormal — Contexto Comercial Local

Importancia en el comercio

Permite proyectar ingresos futuros de negocios pequeños y medianos con mayor precisión que la distribución normal, ya que los ingresos nunca son negativos.

Ayuda a los tenderos y comerciantes a estimar la probabilidad de alcanzar cierto nivel de ventas en un período dado.

Es usada por bancos y cooperativas para evaluar el riesgo crediticio de microempresarios, modelando la variabilidad de sus ingresos.

Permite analizar el precio de productos agrícolas como el café, el maíz o la caña de azúcar, cuyos precios fluctúan asimétricamente en los mercados locales.

Ejemplo práctico

Comparación entre la fórmula manual y la función de R

Para verificar el funcionamiento de la distribución lognormal, se realiza el cálculo manualmente y luego se compara con la función dlnorm() de R Studio.

Posteriormente, se utiliza la función integrada de R para obtener el mismo resultado:

Al comparar ambos resultados, se observa que son prácticamente iguales, debido a que la función dlnorm() utiliza internamente la misma fórmula matemática de la distribución lognormal.

A partir de los datos obtenidos, se puede construir la gráfica de la distribución lognormal de los precios de las acciones:

Gráfica de distribución lognormal ejercicio de precios de las acciones

A medida que los precios aumentan por encima de 65 o 70, la probabilidad disminuye gradualmente, formando una cola derecha larga que representa posibles incrementos grandes en el mercado financiero.

Tabla de distribución lognormal ejercicio de precios de las acciones

Tabla de distribución lognormal calculada manualmente y con la función de R

DISTRIBUCIÓN NORMAL O GAUSSIANA

¿Qué es la distribución Normal o Gaussiana?

La distribución normal describe cómo se distribuyen los datos en torno a una media (μ), con una dispersión (σ) determinada por la desviación estándar.

Matemáticamente, su función de densidad de probabilidad (FDP) está dada por la fórmula:

Fórmula de la distribución Normal o Gaussiana

Esta ecuación define la curva de campana, cuyo pico se ubica en la media y cuya amplitud depende de la desviación estándar.

Propiedades clave

Simetría

La distribución normal es perfectamente simétrica respecto a la media. En ella, media, mediana y moda coinciden. Esto significa que los valores tienen la misma probabilidad de situarse por encima o por debajo del promedio.

Regla empírica o del 68-95-99.7

*El 68.2% de los datos se encuentra dentro de una desviación estándar (μ ± σ).

*El 95.4% dentro de dos desviaciones estándar (μ ± 2σ).

* El 99.7% dentro de tres desviaciones estándar (μ ± 3σ).

Los valores más allá de tres desviaciones estándar se consideran eventos raros o atípicos.

Asimetría y curtosis

-Asimetría (skewness): mide la simetría de la distribución.

*En la distribución normal, la asimetría = 0.

*Asimetría negativa → cola más larga a la izquierda.

*Asimetría positiva → cola más larga a la derecha.

-Curtosis:mide el grosor de las colas.

La distribución normal tiene curtosis = 3 (mesocúrtica).

*Si > 3 = leptocúrtica (colas pesadas).

*Si < 3 = platicúrtica (colas delgadas).

Teorema del Límite Central (TLC)

El Teorema del Límite Central explica por qué la distribución normal aparece tan frecuentemente en la naturaleza y la estadística.

Establece que la media de un número grande de variables aleatorias independientes tiende a distribuirse normalmente, sin importar la forma de la distribución original.Por ello, la normalidad es la base de muchos métodos inferenciales.

Un caso particular es la distribución normal estándar, donde: μ = 0 y σ = 1

Esto permite comparar diferentes distribuciones mediante el puntaje Z, que indica cuántas desviaciones estándar está un valor respecto a la media:

Fórmula

Aplicaciones prácticas

Control de calidad:Para verificar si los productos (por ejemplo, el peso de un empaque) están dentro de los límites aceptables.

Educación: En los exámenes estandarizados, los puntajes suelen distribuirse normalmente alrededor del promedio.

Finanzas:Para modelar el comportamiento de los rendimientos de una inversión o precios de acciones.

Distribución Gussiana — Contexto de Salud

En salud, se utiliza para definir los rangos de referencia, asumiendo que los valores clínicos “estándar” son los que se encuentran en la parte más alta y central de la curva. Para analizar variables como la presión arterial, peso o talla en una población.

Importancia en la salud

Define la normalidad: Establece los límites de los exámenes de laboratorio (glucosa, hemoglobina) basados en el promedio del 95% de la población sana.

Para verificar el funcionamiento de la distribución lognormal, se realiza el cálculo manualmente y luego se compara con la función `dlnorm()` de R Studio.

Para verificar el funcionamiento de la distribución normal, se realiza el cálculo manualmente y luego se compara con la función `dnorm()` de R Studio.

Para verificar el funcionamiento de la distribución chi-cuadrado, se realiza el cálculo manualmente y luego se compara con la función `dchisq()` de R Studio.