El estudio de las distribuciones de probabilidad constituye un pilar fundamental en la estadística, ya que permite modelar y comprender el comportamiento de variables aleatorias en distintos contextos aplicados. En particular, las distribuciones continuas de probabilidad se utilizan para describir fenómenos en los que las variables pueden tomar un número infinito de valores dentro de un intervalo de los números reales, como ocurre con el tiempo, la temperatura, el peso o el ingreso.
A diferencia de las distribuciones discretas, en las distribuciones continuas la probabilidad no se asigna a valores puntuales, sino a intervalos, lo que conduce al uso de funciones de densidad y herramientas del cálculo integral para su análisis. Este enfoque permite interpretar las probabilidades como áreas bajo una curva, facilitando una comprensión más profunda de la variabilidad y el comportamiento de los datos.
En esta sección se presentan los conceptos fundamentales asociados a las variables aleatorias continuas, incluyendo la función de densidad de probabilidad, la función de distribución acumulada y el cálculo de probabilidades en intervalos. Asimismo, se estudia la distribución normal, una de las más importantes en estadística, debido a su amplia aplicabilidad en fenómenos naturales, procesos industriales y modelos económicos.
El objetivo es que el estudiante desarrolle habilidades para interpretar, visualizar y calcular probabilidades asociadas a variables continuas utilizando herramientas computacionales en R, estableciendo así una base sólida para el análisis inferencial y el modelamiento estadístico.
Se ha dicho que una variable es discreta cuando los resultados del experimento corresponden a valores enteros. En contraste, cuando los resultados pueden tomar valores decimales, se dice que la variable es continua o real.
Se dice que una variable aleatoria \(X\) es continua si su conjunto de posibles valores corresponde a un intervalo (finito o infinito) de los números reales.
Una función \(f(x)\) es una función de densidad de probabilidad de una variable aleatoria continua \(X\) si cumple:
\(f(x) \geq 0\), para todo \(x \in \mathbb{R}\)
\[\int_{-\infty}^{\infty} f(x)\,dx = 1\]
\[P(a < X < b) = \int_a^b f(x)\,dx\]
La probabilidad se interpreta como el área bajo la curva de la función de densidad en el intervalo considerado.
Además, para variables continuas se cumple que:
\[ P(X = x) = 0\]
Visualización de probabilidad como área
curve(dnorm(x, mean = 0, sd = 1), from = -4, to = 4,
main = "Área bajo la curva normal",
ylab = "Densidad", xlab = "x")
x <- seq(-1, 1, length = 100)
y <- dnorm(x)
polygon(c(-1, x, 1), c(0, y, 0), col = "lightblue")La función de distribución acumulada (FDA) de una variable aleatoria continua \(X\) se define como:
\[F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t)\,dt\]
donde \(f(x)\) es la función de densidad de probabilidad de \(X\).
Interpretación
La función \(F(x)\) representa la probabilidad acumulada hasta un valor \(x\), es decir, el área bajo la curva de la función de densidad desde \(-\infty\) hasta \(x\).
Propiedades
\(F(x)\) es una función no decreciente
\(0 \leq F(x) \leq 1\)
\(\lim_{x \to -\infty} F(x) = 0\)
\(\lim_{x \to \infty} F(x) = 1\)
Si \(X\) es continua, entonces:
\[P(a < X \leq b) = F(b) - F(a)\]
Relación con la función de densidad
Si \(F(x)\) es derivable, entonces:
\[f(x) = \frac{d}{dx}F(x)\]
Visualización: Cálculo de probabilidades como área acumulada
# Parámetros
mu <- 0
sigma <- 1
# Valores
x <- seq(-4, 4, length = 1000)
y <- dnorm(x, mu, sigma)
# Valor de referencia
x0 <- 1
# Gráfica
plot(x, y, type = "l", lwd = 2,
main = "Función de distribución acumulada (área)",
xlab = "x", ylab = "Densidad")
# Área acumulada hasta x0
x_fill <- seq(-4, x0, length = 200)
y_fill <- dnorm(x_fill, mu, sigma)
polygon(c(-4, x_fill, x0),
c(0, y_fill, 0),
col = "lightblue")
# Línea vertical
abline(v = x0, col = "red", lwd = 2)
# Texto en la gráfica
text(x0, 0.2, labels = "F(x) = P(X ≤ x)", pos = 4)\[X \sim U(a,b)\]
\[f(x) = \begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{en otro caso} \end{cases}\]
Uso: Modela situaciones donde todos los valores en un intervalo son igualmente probables (ej: selección aleatoria en un rango).
curve(dunif(x, 0, 1), from = -1, to = 2,
main = "Distribución Uniforme U(0,1)",
ylab = "Densidad", xlab = "x")\[X \sim \text{Exp}(\lambda)\]
\[f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases}\]
Uso: Modela tiempos de espera entre eventos (fallas de sistemas, tiempos de servicio).
curve(dexp(x, rate = 1), from = 0, to = 5,
main = "Distribución Exponencial (λ = 1)",
ylab = "Densidad", xlab = "x")\[X \sim N(\mu, \sigma^2)\]
\[f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right)\]
Uso: Modela fenómenos naturales, errores de medición, variables económicas.
curve(dnorm(x, mean = 0, sd = 1), from = -4, to = 4,
main = "Distribución Normal N(0,1)",
ylab = "Densidad", xlab = "x")\[X \sim \text{Gamma}(\alpha, \beta)\]
\[f(x) = \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha - 1} e^{-\beta x}, \quad x > 0\]
Uso: Modela tiempos de vida acumulados, procesos de espera múltiples.
curve(dgamma(x, shape = 2, rate = 1), from = 0, to = 10,
main = "Distribución Gamma (α = 2, β = 1)",
ylab = "Densidad", xlab = "x")\[X \sim \text{Beta}(\alpha, \beta)\]
\[f(x) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)} x^{\alpha - 1}(1-x)^{\beta - 1}, \quad 0 < x < 1\]
Uso: Modela proporciones y probabilidades (muy usada en estadística bayesiana).
curve(dbeta(x, shape1 = 2, shape2 = 5), from = 0, to = 1,
main = "Distribución Beta (α = 2, β = 5)",
ylab = "Densidad", xlab = "x")Interpretación general
Cada función de densidad:
Describe la forma de la distribución de una variable aleatoria
Permite calcular probabilidades mediante integración
Está caracterizada por parámetros que determinan su forma, ubicación y dispersión
La distribución normal, también conocida como distribución gaussiana, es uno de los modelos probabilísticos más importantes en estadística debido a su amplia aplicabilidad en diversos contextos empíricos. Esta distribución permite modelar adecuadamente fenómenos reales tales como los salarios, el peso corporal, las mediciones físicas y múltiples variables de carácter económico y social.
Una de las principales razones de su relevancia teórica y práctica se fundamenta en el Teorema Central del Límite, el cual establece que, bajo condiciones generales, la distribución de las medias muestrales de muestras aleatorias independientes tiende a aproximarse a una distribución normal, independientemente de la distribución original de la población, siempre que el tamaño muestral sea suficientemente grande.
Sea \(X_1, X_2, \dots, X_n\) una muestra aleatoria de variables independientes e idénticamente distribuidas, con media \(\mu\) y varianza finita \(\sigma^2\).
Definimos la media muestral como:
\[ \bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i\]
Entonces, el Teorema Central del Límite establece que la variable aleatoria estandarizada:
\[Z_n = \frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}}\]
converge en distribución a una normal estándar cuando \(n \to \infty\), es decir:
\[Z_n \xrightarrow{d} N(0,1)\]
o equivalentemente,
\[\frac{\sum_{i=1}^{n} X_i - n\mu}{\sigma \sqrt{n}} \xrightarrow{d} N(0,1)\]
Sea \(X\) una variable aleatoria continua con distribución normal, con parámetros \(\mu \in \mathbb{R}\) y \(\sigma^2 > 0\), denotada por:
\[X \sim N(\mu, \sigma^2)\]
La función de densidad de probabilidad de \(X\) está dada por:
\[f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \, \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right), \quad x \in \mathbb{R}\]
donde:
\(\mu\): parámetro de localización, correspondiente a la media de la distribución.
\(\sigma^2\): parámetro de escala, correspondiente a la varianza de la distribución.
\(\sigma = \sqrt{\sigma^2}\): desviación estándar.
Observaciones
La función de densidad es no negativa y está definida para todo \(x \in \mathbb{R}\).
El área total bajo la curva satisface:
\[\int_{-\infty}^{\infty} f(x)\,dx = 1\]
La distribución es completamente determinada por los parámetros \(\mu\) y \(\sigma^2\).
La forma de la función depende de \(\sigma^2\) (dispersión) y su ubicación en el eje real está determinada por \(\mu\).
Sea \(X\) una variable aleatoria continua con distribución normal, denotada por
\(X \sim N(\mu, \sigma^2)\), donde \(\mu \in \mathbb{R}\) representa la media y \(\sigma^2 > 0\) la varianza.
Bajo este supuesto, se cumplen las siguientes propiedades fundamentales:
\[E(X) = \mu\]
\[ \operatorname{Var}(X) = \sigma^2 \]
La función de densidad de la distribución normal es simétrica respecto a la media \(\mu\). Es decir,
\[ f(\mu - x) = f(\mu + x), \quad \forall x \in \mathbb{R} \]
La gráfica de la función de densidad tiene forma de campana (campana de Gauss), es unimodal y presenta colas asintóticas al eje horizontal.
En una distribución normal se cumple aproximadamente que:
\(P(|X - \mu| < \sigma) \approx 0.68\)
\(P(|X - \mu| < 2\sigma) \approx 0.95\)
\(P(|X - \mu| < 3\sigma) \approx 0.997\)
Estas proporciones describen la concentración de los datos alrededor de la media.
# Parámetros
mu <- 0
sigma <- 1
# Secuencia de valores
x <- seq(-4, 4, length = 1000)
y <- dnorm(x, mean = mu, sd = sigma)
# Gráfica base (sin eje X automático)
plot(x, y, type = "l", lwd = 2,
main = "Regla Empírica (Distribución Normal)",
xlab = "Intervalos en términos de σ",
ylab = "Densidad",
xaxt = "n") # quitamos eje X por defecto
# Definir posiciones del eje X
ticks <- mu + sigma * (-3:3)
# Etiquetas personalizadas
labels <- c("-3σ", "-2σ", "-1σ", "μ", "+1σ", "+2σ", "+3σ")
# Agregar eje X personalizado
axis(1, at = ticks, labels = labels)
# Área 1 sigma (68%)
x1 <- seq(mu - sigma, mu + sigma, length = 100)
y1 <- dnorm(x1, mu, sigma)
polygon(c(mu - sigma, x1, mu + sigma),
c(0, y1, 0), col = "lightblue")
# Área 2 sigma (95%)
x2 <- seq(mu - 2*sigma, mu + 2*sigma, length = 100)
y2 <- dnorm(x2, mu, sigma)
polygon(c(mu - 2*sigma, x2, mu + 2*sigma),
c(0, y2, 0), col = rgb(0, 1, 0, 0.2))
# Área 3 sigma (99.7%)
x3 <- seq(mu - 3*sigma, mu + 3*sigma, length = 100)
y3 <- dnorm(x3, mu, sigma)
polygon(c(mu - 3*sigma, x3, mu + 3*sigma),
c(0, y3, 0), col = rgb(1, 0, 0, 0.1))
# Líneas verticales
abline(v = mu, lwd = 2)
abline(v = mu + c(-1,1)*sigma, lty = 2)
abline(v = mu + c(-2,2)*sigma, lty = 3)
abline(v = mu + c(-3,3)*sigma, lty = 4)
# Leyenda
legend("topright",
legend = c("68%", "95%", "99.7%"),
fill = c("lightblue", rgb(0,1,0,0.2), rgb(1,0,0,0.1)))curve(dnorm(x, 0, 1), from = -4, to = 4, col = "blue",
main = "Distribuciones normales", ylab = "Densidad")
curve(dnorm(x, 2, 1), add = TRUE, col = "red")
curve(dnorm(x, 0, 2), add = TRUE, col = "green")
legend("topright", legend = c("N(0,1)", "N(2,1)", "N(0,2)"),
col = c("blue", "red", "green"), lty = 1)La distribución normal estándar es un caso particular de la distribución normal en el cual la media es cero y la varianza es uno. Se denota por:
\[Z \sim N(0,1)\]
Estandarización de una variable normal
Sea \(X \sim N(\mu, \sigma^2)\). Entonces, la transformación lineal:
\[Z = \frac{X - \mu}{\sigma}\]
define una nueva variable aleatoria \(Z\) que sigue una distribución normal estándar, es decir:
\[Z \sim N(0,1)\]
Interpretación de la estandarización
El proceso de estandarización consiste en:
Centrar la variable: \(X - \mu\) (restar la media)
Escalar la variable: dividir por la desviación estándar \(\sigma\)
Esto permite expresar cualquier valor de \(X\) en términos de su distancia relativa respecto a la media, medida en unidades de desviación estándar.
Utilidad de la normal estándar
La estandarización es fundamental porque:
Permite comparar valores provenientes de diferentes distribuciones normales.
Facilita el cálculo de probabilidades utilizando tablas de la normal estándar o funciones computacionales.
Simplifica el análisis estadístico al trabajar con una única distribución de referencia.
Las ventas diarias de una empresa se distribuyen normalmente con media \(\mu = 3.5\) millones de pesos y desviación estándar \(\sigma = 1.1\) millones.
Es decir:
\[X \sim N(3.5, 1.1^2)\]
Se estandariza:
\[Z = \frac{4 - 3.5}{1.1} = 0.45\]
\[P(X \leq 4) = P(Z \leq 0.45)\]
Consultando la tabla de la normal estándar:
\[P(Z \leq 0.45) \approx 0.6736\]
Respuesta:
La probabilidad de que en un día se vendan 4 o menos millones es aproximadamente 0.6736 (67.36%).
mu <- 3.5
sigma <- 1.1
x <- seq(mu - 4*sigma, mu + 4*sigma, length = 1000)
y <- dnorm(x, mu, sigma)
#grafica
plot(x, y, type = "l", lwd = 2,
main = "P(X ≤ 4)",
xlab = "Ventas (millones)", ylab = "Densidad")
x_fill <- seq(min(x), 4, length = 300)
y_fill <- dnorm(x_fill, mu, sigma)
polygon(c(min(x), x_fill, 4),
c(0, y_fill, 0),
col = "lightblue")
abline(v = 4, col = "red", lwd = 2)En R:
## [1] 0.6752819
\[Z = \frac{2.8 - 3.5}{1.1} = -0.64\]
\[P(X \leq 2.8) = P(Z \leq -0.64)\]
\[P(Z \leq -0.64) \approx 0.2611\]
Gráfica del área bajo la curva
plot(x, y, type = "l", lwd = 2,
main = "P(X ≤ 2.8)",
xlab = "Ventas (millones)", ylab = "Densidad")
x_fill <- seq(min(x), 2.8, length = 300)
y_fill <- dnorm(x_fill, mu, sigma)
polygon(c(min(x), x_fill, 2.8),
c(0, y_fill, 0),
col = "lightgreen")
abline(v = 2.8, col = "red", lwd = 2)En R:
## [1] 0.2622697
Respuesta: La probabilidad es aproximadamente 0.2611 (26.11%).
\[Z = \frac{3.8 - 3.5}{1.1} = 0.27\]
\[P(X \geq 3.8) = 1 - P(X \leq 3.8)\]
\[P(X \geq 3.8) = 1 - P(Z \leq 0.27)\]
\[P(Z \leq 0.27) \approx 0.6064\]
\[P(X \geq 3.8) = 1 - 0.6064 = 0.3936\]
Respuesta: La probabilidad es aproximadamente 0.3936 (39.36%).
Gráfica del área bajo la curva
plot(x, y, type = "l", lwd = 2,
main = "P(X ≥ 3.8)",
xlab = "Ventas (millones)", ylab = "Densidad")
x_fill <- seq(3.8, max(x), length = 300)
y_fill <- dnorm(x_fill, mu, sigma)
polygon(c(3.8, x_fill, max(x)),
c(0, y_fill, 0),
col = "lightcoral")
abline(v = 3.8, col = "red", lwd = 2)
En R:
## [1] 0.3925314
\[P(3 \leq X \leq 4) = P(X \leq 4) - P(X \leq 3)\]
Estandarizando:
\[Z_1 = \frac{3 - 3.5}{1.1} = -0.45, \quad Z_2 = 0.45\] \[P(3 \leq X \leq 4) = P(Z \leq 0.45) - P(Z \leq -0.45)\] \[= 0.6736 - 0.3264 = 0.3472\]
Respuesta: La probabilidad es aproximadamente 0.3472 (34.72%).
Gráfica del área bajo la curva
plot(x, y, type = "l", lwd = 2,
main = "P(3 ≤ X ≤ 4)",
xlab = "Ventas (millones)", ylab = "Densidad")
x_fill <- seq(3, 4, length = 300)
y_fill <- dnorm(x_fill, mu, sigma)
polygon(c(3, x_fill, 4),
c(0, y_fill, 0),
col = "lightyellow")
abline(v = c(3, 4), col = "red", lwd = 2)En R:
## [1] 0.3505637
Una empresa produce bombillas cuya duración sigue una distribución normal con media \(\mu = 1200\) horas y desviación estándar \(\sigma = 250\) horas.
Es decir:
\[X \sim N(1200, 250^2)\]
¿Cuál es la probabilidad de que dure entre 900 y 1300 horas?
¿Cuál es el percentil 90 de la duración?
Si una bombilla tiene una duración de \(1800\) horas, ¿en qué percentil se encuentra dentro de la distribución?
Estandarizando:
\[Z_1 = \frac{900 - 1200}{250} = -1.2, \quad Z_2 = \frac{1300 - 1200}{250} = 0.4\] \[P(900 \leq X \leq 1300) = P(-1.2 \leq Z \leq 0.4)\] \[= P(Z \leq 0.4) - P(Z \leq -1.2)\] \[= 0.6554 - 0.1151 = 0.5403\]
Respuesta:
La probabilidad es aproximadamente 0.5403 (54.03%).
En R:
## [1] 0.5403521
Gráfica
#parámetros
mu <- 1200
sigma <- 250
x <- seq(mu - 4*sigma, mu + 4*sigma, length = 1000)
y <- dnorm(x, mu, sigma)
#grafico
plot(x, y, type = "l", lwd = 2,
main = "P(900 ≤ X ≤ 1300)",
xlab = "Duración bombillas(horas)", ylab = "Densidad")
x_fill <- seq(900, 1300, length = 300)
y_fill <- dnorm(x_fill, mu, sigma)
polygon(c(900, x_fill, 1300),
c(0, y_fill, 0),
col = "lightgray")
abline(v = c(900, 1300), col = "red", lwd = 2)Se desea encontrar el valor \(x\) tal que:
\[P(X \leq x) = 0.90\]
Esto significa que buscamos el percentil 90, es decir, el valor por debajo del cual se encuentra el 90% de las observaciones.
Paso 1: Estandarización
Dado que \(X \sim N(\mu, \sigma^2)\), transformamos la variable a la normal estándar:
\[Z = \frac{X - \mu}{\sigma}\]
Entonces: \[P(X \leq x) = P\left(Z \leq \frac{x - \mu}{\sigma}\right)\]
Paso 2: Uso de la tabla de la normal estándar
Buscamos el valor \(z\) tal que:
\[P(Z \leq z) = 0.90\]
De la tabla de la normal estándar (o usando software), se obtiene:
\[z_{0.90} \approx 1.28\]
Este valor indica que el 90% del área bajo la curva normal estándar se encuentra a la izquierda de \(z = 1.28\).
Paso 3: Transformación inversa
Despejamos \(x\) a partir de la transformación:
\[z = \frac{x - \mu}{\sigma}\]
\[x = \mu + z\sigma\]
Sustituyendo los valores:
\[x = 1200 + (1.28)(250)\] \[x = 1200 + 320 = 1520\]
Interpretación
El valor \(x = 1520\) horas corresponde al percentil 90 de la distribución. Esto implica que:
El 90% de las bombillas dura menos de 1520 horas
El 10% restante dura más de 1520 horas
Verificación en R
## [1] 1520.388
Gráfica
# Parámetros
mu <- 1200
sigma <- 250
# Secuencia de valores
x <- seq(mu - 4*sigma, mu + 4*sigma, length = 1000)
y <- dnorm(x, mu, sigma)
# Percentil 90
x0 <- qnorm(0.90, mean = mu, sd = sigma)
# Gráfica
plot(x, y, type = "l", lwd = 2,
main = "Percentil 90 - Distribución Normal",
xlab = "Duración (horas)", ylab = "Densidad")
# Área acumulada (90%)
x_fill <- seq(min(x), x0, length = 300)
y_fill <- dnorm(x_fill, mu, sigma)
polygon(c(min(x), x_fill, x0),
c(0, y_fill, 0),
col = "lightgreen")
# Línea del percentil
abline(v = x0, col = "red", lwd = 2)
# Texto en la gráfica
text(x0, max(y)*0.8, labels = "P 90 ≈ 1520", pos = 4)Es decir, determine la probabilidad:
\[P(X \leq 1800)\]
Se desea calcular el percentil correspondiente a una bombilla con duración de \(1800\) horas, es decir:
\[P(X \leq 1800)\]
donde:
\[X \sim N(1200, 250^2)\]
Paso 1: Estandarización
\[Z = \frac{X - \mu}{\sigma}\]
\[Z = \frac{1800 - 1200}{250} = \frac{600}{250} = 2.4\]
Paso 2: Cálculo de la probabilidad
\[P(X \leq 1800) = P(Z \leq 2.4)\]
Consultando la tabla de la normal estándar (o usando software):
\[P(Z \leq 2.4) \approx 0.9918\]
Paso 3: Interpretación
El valor obtenido corresponde al percentil 99.18, lo que significa que:
Aproximadamente el 99.18% de las bombillas dura menos de 1800 horas
Solo el 0.82% supera este valor
Verificación en R
## [1] 0.9918025
# Parámetros
mu <- 1200
sigma <- 250
# Secuencia de valores
x <- seq(mu - 4*sigma, mu + 4*sigma, length = 1000)
y <- dnorm(x, mu, sigma)
# Valor de interés
x0 <- 1800
# Gráfica
plot(x, y, type = "l", lwd = 2,
main = "Percentil asociado a X = 1800 horas",
xlab = "Duración (horas)", ylab = "Densidad")
# Área acumulada
x_fill <- seq(min(x), x0, length = 400)
y_fill <- dnorm(x_fill, mu, sigma)
polygon(c(min(x), x_fill, x0),
c(0, y_fill, 0),
col = "lightyellow")
# Línea vertical
abline(v = x0, col = "red", lwd = 2)
# Texto
text(x0, max(y)*0.7, labels = "P ≈ 0.9918", pos = 4)Tabla de distribucion Normal Estándar
Tabla de la distribución normal estándar
Newbold, P., Carlson, W. L., & Thorne, B. M. (2008).
Estadística para Administración y Economía.
Madrid: Pearson Educación.
Wackerly, D. D., Mendenhall III, W., & Scheaffer, R. L.
(2008).
Estadística Matemática con Aplicaciones.
México: Cengage Learning.
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K.
(2007).
Probabilidad y Estadística para Ingeniería y Ciencias (6ª
ed.).
México: Pearson Educación.