Distribuciones de Variables Aleatorias Discretas

Distribución Binomial

La distribución binomial es una distribución de probabilidad discreta que describe el número de éxitos en una secuencia de n ensayos independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un experimento binomial se caracteriza por:

Realizarse n ensayos independientes entre sí.
Cada ensayo tiene dos posibles resultados: éxito o fracaso.
La probabilidad de éxito p es constante en todos los ensayos.
La probabilidad de fracaso q = 1 - p es constante en todos los ensayos.
La variable aleatoria de interés es el número de éxitos en los n ensayos.

La función de probabilidad de la distribución binomial es:

\[P(X = x) = \binom{k}{x} p^x q^{k - x}\]

donde:

\(k\) es el número total de ensayos.
\(x\) es el número de éxitos.
\(p\) es la probabilidad de éxito en un ensayo.
\(q = 1 - p\) es la probabilidad de fracaso en un ensayo.
\(\binom{k}{x}\) es el coeficiente binomial, el cual se calcula como: \[\binom{k}{x} = \frac{k!}{x!(k-x)!}\]

La función de distribución acumulada de la distribución binomial es:

\[F(x) = P(X \leq x) = \sum_{i = 0}^{x} \binom{k}{i} p^i q^{k - i}\]

# Función de probabilidad de la distribución binomial
px <- dbinom(3, size = 10, prob = 0.5)
# escribir el resultado con un mensaje
cat("La probabilidad de obtener exactamente 3 éxitos en 10 ensayos con una probabilidad de éxito de 0.5 es:", px, "\n")

## La probabilidad de obtener exactamente 3 éxitos en 10 ensayos con una probabilidad de éxito de 0.5 es: 0.1171875

cat("\n")

# Función de distribución acumulada de la distribución binomial
psx <- pbinom(3, size = 10, prob = 0.5)
# escribir el resultado con un mensaje
cat("La probabilidad de obtener 3 o menos éxitos en 10 ensayos con una probabilidad de éxito de 0.5 es:", psx, "\n")

## La probabilidad de obtener 3 o menos éxitos en 10 ensayos con una probabilidad de éxito de 0.5 es: 0.171875

# Gráfico de la función de probabilidad de la distribución binomial con ggplot2
library(ggplot2)

## Warning: package 'ggplot2' was built under R version 4.5.2

df <- data.frame(x = 0:10, y = dbinom(0:10, size = 10, prob = 0.5))
ggplot(df, aes(x = x, y = y)) +
  geom_point() +
  geom_line() +
  scale_x_continuous(breaks = 0:10) +  # <-- enteros en el eje x
  labs(
    title = "Función de Probabilidad de la Distribución Binomial",
    x = "Número de Éxitos",
    y = "Probabilidad"
  )

# Gráfico de la función de distribución acumulada de la distribución binomial con ggplot2
# números enteros en el eje x
df <- data.frame(x = 0:10, y = pbinom(0:10, size = 10, prob = 0.5))
ggplot(df, aes(x = x, y = y)) +
  geom_point() +
  geom_line() +
  scale_x_continuous(breaks = 0:10) +  # <-- enteros en el eje x
  labs(
    title = "Función de Distribución Acumulada de la Distribución Binomial",
    x = "Número de Éxitos",
    y = "Probabilidad"
  )

Ejemplo de Aplicación de la Distribución Binomial

La probabilidad de que una mujer activa sexualmente y sin uso de método anticonceptivo quede embarazada en un año es del 20%. Si 10 mujeres activas sexualmente son seleccionadas al azar, ¿cuál es la probabilidad de que exactamente 5 queden embarazadas en un año?

# Función de probabilidad de la distribución binomial
dbinom(5, size = 10, prob = 0.2)

## [1] 0.02642412

cat("La probabilidad de que exactamente 5 mujeres queden embarazadas en un año es:", dbinom(5, size = 10, prob = 0.2), "\n")

## La probabilidad de que exactamente 5 mujeres queden embarazadas en un año es: 0.02642412

La probabilidad de que una mujer activa sexualmente y con uso de método anticonceptivo quede embarazada en un año es del 1%. Si 10 mujeres activas sexualmente son seleccionadas al azar, ¿cuál es la probabilidad de que exactamente 5 queden embarazadas en un año?

# Función de probabilidad de la distribución binomial
dbinom(5, size = 10, prob = 0.01)

## [1] 2.396495e-08

cat("La probabilidad de que exactamente 5 mujeres queden embarazadas en un año es:", dbinom(5, size = 10, prob = 0.01), "\n")

## La probabilidad de que exactamente 5 mujeres queden embarazadas en un año es: 2.396495e-08

EJERCICIO 1 De acuerdo a “Planned Parenthood” (2018), cuando se usan anticonceptivos orales de manera típica (con algunos errores comunes en su uso), su efectividad es 91% anual, es decir que la probabilidad para una mujer de quedar embarazada, si está activa sexualmente, es de 0.09 en un año. Cuando se usan de manera ideal la efectividad es del 99%. Calcule lo siguiente:

Probabilidad de quedar embarazada al menos una vez en 3 años, con un uso típico del anticonceptivo oral.
Probabilidad de quedar embarazada al menos una vez en 3 años, con un uso ideal del anticonceptivo oral.

# Función de probabilidad de la distribución binomial
tipico <- 1 - pbinom(0, size = 3, prob = 0.09)
ideal <- 1 - pbinom(0, size = 3, prob = 0.01)

# añadir % al resultado
cat("Probabilidad de quedar embarazada al menos una vez en 3 años con uso típico:", sprintf("%.1f%%", tipico * 100), "\n")

## Probabilidad de quedar embarazada al menos una vez en 3 años con uso típico: 24.6%

cat("\n")

cat("Probabilidad de quedar embarazada al menos una vez en 3 años con uso típico:", sprintf("%.1f%%", ideal * 100), "\n")

## Probabilidad de quedar embarazada al menos una vez en 3 años con uso típico: 3.0%

EJERCICIO 2. La fibrosis cística (FC) es un desorden hereditario, caracterizado por acumulación de mucosidad en los pulmones. El gen que la determina es uno autosómico recesivo, por lo tanto si dos portadores heterocigotos tienen hijos, el riesgo de producir un bebé homocigoto con FC es 0.25, según la genética mendeliana.

¿Cuál será la probabilidad de que en una pareja portadora con tres hijo/as haya uno, dos o tres afectados por FC?

# Función de probabilidad de la distribución binomial
fc3 <- dbinom(1:3, size = 3, prob = 0.25)

# imprimir resultados con un mensaje
cat("Probabilidad de que haya 1 afectado por FC en una pareja portadora con tres hijos/as:", sprintf("%.2f%%", fc3[1] * 100), "\n")

## Probabilidad de que haya 1 afectado por FC en una pareja portadora con tres hijos/as: 42.19%

cat("\n")

cat("Probabilidad de que haya 2 afectados por FC en una pareja portadora con tres hijos/as:", sprintf("%.2f%%", fc3[2] * 100), "\n")

## Probabilidad de que haya 2 afectados por FC en una pareja portadora con tres hijos/as: 14.06%

cat("\n")

cat("Probabilidad de que haya 3 afectados por FC en una pareja portadora con tres hijos/as:", sprintf("%.2f%%", fc3[3] * 100), "\n")

## Probabilidad de que haya 3 afectados por FC en una pareja portadora con tres hijos/as: 1.56%

¿Cuál será la probabilidad de que en una pareja portadora con tres hijo/as haya al menos un afectado por FC?

# Función de probabilidad de la distribución binomial
fc321 <- 1 - pbinom(0, size = 3, prob = 0.25)

# imprimir resultados con un mensaje
cat("Probabilidad de que haya al menos un afectado por FC en una pareja portadora con tres hijos/as:", sprintf("%.2f%%", fc321 * 100), "\n")

## Probabilidad de que haya al menos un afectado por FC en una pareja portadora con tres hijos/as: 57.81%

Distribución de Poisson

La distribución de Poisson es una distribución de probabilidad discreta que describe el número de eventos que ocurren en un intervalo de tiempo o espacio fijo, con una tasa de ocurrencia promedio conocida. La distribución de Poisson se caracteriza por:

El número de eventos que ocurren en un intervalo de tiempo o espacio es independiente de los eventos anteriores.
La tasa de ocurrencia promedio es constante en el tiempo o espacio.
La probabilidad de que ocurra más de un evento en un intervalo infinitesimal es despreciable.

La función de probabilidad de la distribución de Poisson es:

\[P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}\]

donde:

\(\lambda\) es la tasa de ocurrencia promedio.
\(k\) es el número de eventos.
\(e\) es la base del logaritmo natural.
\(k!\) es el factorial de \(k\).

La función de distribución acumulada de la distribución de Poisson es:

\[F(x) = P(X \leq x) = \sum_{k = 0}^{x} \frac{\lambda^k e^{-\lambda}}{k!}\]

# Función de probabilidad de la distribución de Poisson
poi3 <- dpois(3, lambda = 2)
cat("La probabilidad de que ocurran exactamente 3 eventos en un intervalo de tiempo o unidad de espacio con una tasa de ocurrencia promedio de 2 es:", sprintf("%.2f%%", poi3 * 100), "\n")

## La probabilidad de que ocurran exactamente 3 eventos en un intervalo de tiempo o unidad de espacio con una tasa de ocurrencia promedio de 2 es: 18.04%

cat("\n")

# Función de distribución acumulada de la distribución de Poisson
pois3 <- ppois(3, lambda = 2)
cat("La probabilidad de que ocurran hasta 3 eventos en un intervalo de tiempo o unidad de espacio con una tasa de ocurrencia promedio de 2 es:", sprintf("%.2f%%", pois3 * 100), "\n")

## La probabilidad de que ocurran hasta 3 eventos en un intervalo de tiempo o unidad de espacio con una tasa de ocurrencia promedio de 2 es: 85.71%

# Gráfico de la función de probabilidad de la distribución de Poisson con ggplot2
df <- data.frame(x = 0:10, y = dpois(0:10, lambda = 2))
ggplot(df, aes(x = x, y = y)) +
  geom_point() + 
  geom_line() + 
  scale_x_continuous(breaks = 0:10) +
  labs(title = "Función de Probabilidad de la Distribución de Poisson", x = "Número de Eventos", y = "Probabilidad")

# Gráfico de la función de distribución acumulada de la distribución de Poisson con ggplot2
df <- data.frame(x = 0:10, y = ppois(0:10, lambda = 2))
ggplot(df, aes(x = x, y = y)) + 
  geom_point() + 
  geom_line() + 
  scale_x_continuous(breaks = 0:10) +
  labs(title = "Función de Distribución Acumulada de la Distribución de Poisson", x = "Número de Eventos", y = "Probabilidad")

Ejemplo de Aplicación de la Distribución de Poisson

La tasa promedio de llamadas telefónicas que recibe una oficina de atención al cliente es de 5 llamadas por hora. ¿Cuál es la probabilidad de que reciban 3 llamadas en una hora?

# Función de probabilidad de la distribución de Poisson
poiscall <- dpois(3, lambda = 5)
cat("La probabilidad de que reciban exactamente 3 llamadas en una hora es:", sprintf("%.2f", poiscall), "\n")

## La probabilidad de que reciban exactamente 3 llamadas en una hora es: 0.14

EJERCICIO 1. La distribución del número de plántulas de arce (maple) en 100 parcelas cuadradas de 1 m^2, en teoría puede seguir una distribución de Poisson. La media de la muestra, llamada también lambda (𝜆) en la distribución de Poisson, es 1.41 plántulas de arce por parcela. ¿Cuál es la probabilidad de que en una parcela haya 0 plántulas de arce? ¿Cincos plántulas de arce?

# Función de probabilidad de la distribución de Poisson
dpois(0, lambda = 1.41)

## [1] 0.2441433

dpois(5, lambda = 1.41)

## [1] 0.01133859

Crear una gráfica de la función de probabilidad de la distribución de Poisson con lambda = 1.41, y los siguientes valores de plántula por parcela: 0 = 24, 1 = 35, 2 = 25, 3 = 11,4 = 4, 5 = 1.

# Gráfico de la función de probabilidad de la distribución de Poisson y los valores reales en barras con ggplot2

df <- data.frame(x = 0:5, y = dpois(0:5, lambda = 1.41)*100, reales = c(35, 26, 15, 11, 6, 4))
ggplot(df, aes(x = x, y = y)) + geom_point() + geom_line() + geom_bar(aes(x = x, y = reales), stat = "identity", fill = "lightblue", alpha = 0.5) + labs(title = "Función de Probabilidad de la Distribución de Poisson", x = "Número de Plántulas", y = "Frecuencia")

Distribuciones de Variables Aleatorias Discretas

D. S. Fernández del Viso

2026-03-17