La distribución binomial es una distribución de probabilidad discreta que describe el número de éxitos en una secuencia de n ensayos independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un experimento binomial se caracteriza por:
La función de probabilidad de la distribución binomial es:
\[P(X = x) = \binom{k}{x} p^x q^{k - x}\]
donde:
La función de distribución acumulada de la distribución binomial es:
\[F(x) = P(X \leq x) = \sum_{i = 0}^{x} \binom{k}{i} p^i q^{k - i}\]
# Función de probabilidad de la distribución binomial
px <- dbinom(3, size = 10, prob = 0.5)
# escribir el resultado con un mensaje
cat("La probabilidad de obtener exactamente 3 éxitos en 10 ensayos con una probabilidad de éxito de 0.5 es:", px, "\n")
## La probabilidad de obtener exactamente 3 éxitos en 10 ensayos con una probabilidad de éxito de 0.5 es: 0.1171875
cat("\n")
# Función de distribución acumulada de la distribución binomial
psx <- pbinom(3, size = 10, prob = 0.5)
# escribir el resultado con un mensaje
cat("La probabilidad de obtener 3 o menos éxitos en 10 ensayos con una probabilidad de éxito de 0.5 es:", psx, "\n")
## La probabilidad de obtener 3 o menos éxitos en 10 ensayos con una probabilidad de éxito de 0.5 es: 0.171875
# Gráfico de la función de probabilidad de la distribución binomial con ggplot2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
df <- data.frame(x = 0:10, y = dbinom(0:10, size = 10, prob = 0.5))
ggplot(df, aes(x = x, y = y)) +
geom_point() +
geom_line() +
scale_x_continuous(breaks = 0:10) + # <-- enteros en el eje x
labs(
title = "Función de Probabilidad de la Distribución Binomial",
x = "Número de Éxitos",
y = "Probabilidad"
)
# Gráfico de la función de distribución acumulada de la distribución binomial con ggplot2
# números enteros en el eje x
df <- data.frame(x = 0:10, y = pbinom(0:10, size = 10, prob = 0.5))
ggplot(df, aes(x = x, y = y)) +
geom_point() +
geom_line() +
scale_x_continuous(breaks = 0:10) + # <-- enteros en el eje x
labs(
title = "Función de Distribución Acumulada de la Distribución Binomial",
x = "Número de Éxitos",
y = "Probabilidad"
)
La probabilidad de que una mujer activa sexualmente y sin uso de método anticonceptivo quede embarazada en un año es del 20%. Si 10 mujeres activas sexualmente son seleccionadas al azar, ¿cuál es la probabilidad de que exactamente 5 queden embarazadas en un año?
# Función de probabilidad de la distribución binomial
dbinom(5, size = 10, prob = 0.2)
## [1] 0.02642412
cat("La probabilidad de que exactamente 5 mujeres queden embarazadas en un año es:", dbinom(5, size = 10, prob = 0.2), "\n")
## La probabilidad de que exactamente 5 mujeres queden embarazadas en un año es: 0.02642412
La probabilidad de que una mujer activa sexualmente y con uso de método anticonceptivo quede embarazada en un año es del 1%. Si 10 mujeres activas sexualmente son seleccionadas al azar, ¿cuál es la probabilidad de que exactamente 5 queden embarazadas en un año?
# Función de probabilidad de la distribución binomial
dbinom(5, size = 10, prob = 0.01)
## [1] 2.396495e-08
cat("La probabilidad de que exactamente 5 mujeres queden embarazadas en un año es:", dbinom(5, size = 10, prob = 0.01), "\n")
## La probabilidad de que exactamente 5 mujeres queden embarazadas en un año es: 2.396495e-08
EJERCICIO 1 De acuerdo a “Planned Parenthood” (2018), cuando se usan anticonceptivos orales de manera típica (con algunos errores comunes en su uso), su efectividad es 91% anual, es decir que la probabilidad para una mujer de quedar embarazada, si está activa sexualmente, es de 0.09 en un año. Cuando se usan de manera ideal la efectividad es del 99%. Calcule lo siguiente:
# Función de probabilidad de la distribución binomial
tipico <- 1 - pbinom(0, size = 3, prob = 0.09)
ideal <- 1 - pbinom(0, size = 3, prob = 0.01)
# añadir % al resultado
cat("Probabilidad de quedar embarazada al menos una vez en 3 años con uso típico:", sprintf("%.1f%%", tipico * 100), "\n")
## Probabilidad de quedar embarazada al menos una vez en 3 años con uso típico: 24.6%
cat("\n")
cat("Probabilidad de quedar embarazada al menos una vez en 3 años con uso típico:", sprintf("%.1f%%", ideal * 100), "\n")
## Probabilidad de quedar embarazada al menos una vez en 3 años con uso típico: 3.0%
EJERCICIO 2. La fibrosis cística (FC) es un desorden hereditario, caracterizado por acumulación de mucosidad en los pulmones. El gen que la determina es uno autosómico recesivo, por lo tanto si dos portadores heterocigotos tienen hijos, el riesgo de producir un bebé homocigoto con FC es 0.25, según la genética mendeliana.
# Función de probabilidad de la distribución binomial
fc3 <- dbinom(1:3, size = 3, prob = 0.25)
# imprimir resultados con un mensaje
cat("Probabilidad de que haya 1 afectado por FC en una pareja portadora con tres hijos/as:", sprintf("%.2f%%", fc3[1] * 100), "\n")
## Probabilidad de que haya 1 afectado por FC en una pareja portadora con tres hijos/as: 42.19%
cat("\n")
cat("Probabilidad de que haya 2 afectados por FC en una pareja portadora con tres hijos/as:", sprintf("%.2f%%", fc3[2] * 100), "\n")
## Probabilidad de que haya 2 afectados por FC en una pareja portadora con tres hijos/as: 14.06%
cat("\n")
cat("Probabilidad de que haya 3 afectados por FC en una pareja portadora con tres hijos/as:", sprintf("%.2f%%", fc3[3] * 100), "\n")
## Probabilidad de que haya 3 afectados por FC en una pareja portadora con tres hijos/as: 1.56%
# Función de probabilidad de la distribución binomial
fc321 <- 1 - pbinom(0, size = 3, prob = 0.25)
# imprimir resultados con un mensaje
cat("Probabilidad de que haya al menos un afectado por FC en una pareja portadora con tres hijos/as:", sprintf("%.2f%%", fc321 * 100), "\n")
## Probabilidad de que haya al menos un afectado por FC en una pareja portadora con tres hijos/as: 57.81%
La distribución de Poisson es una distribución de probabilidad discreta que describe el número de eventos que ocurren en un intervalo de tiempo o espacio fijo, con una tasa de ocurrencia promedio conocida. La distribución de Poisson se caracteriza por:
La función de probabilidad de la distribución de Poisson es:
\[P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}\]
donde:
La función de distribución acumulada de la distribución de Poisson es:
\[F(x) = P(X \leq x) = \sum_{k = 0}^{x} \frac{\lambda^k e^{-\lambda}}{k!}\]
# Función de probabilidad de la distribución de Poisson
poi3 <- dpois(3, lambda = 2)
cat("La probabilidad de que ocurran exactamente 3 eventos en un intervalo de tiempo o unidad de espacio con una tasa de ocurrencia promedio de 2 es:", sprintf("%.2f%%", poi3 * 100), "\n")
## La probabilidad de que ocurran exactamente 3 eventos en un intervalo de tiempo o unidad de espacio con una tasa de ocurrencia promedio de 2 es: 18.04%
cat("\n")
# Función de distribución acumulada de la distribución de Poisson
pois3 <- ppois(3, lambda = 2)
cat("La probabilidad de que ocurran hasta 3 eventos en un intervalo de tiempo o unidad de espacio con una tasa de ocurrencia promedio de 2 es:", sprintf("%.2f%%", pois3 * 100), "\n")
## La probabilidad de que ocurran hasta 3 eventos en un intervalo de tiempo o unidad de espacio con una tasa de ocurrencia promedio de 2 es: 85.71%
# Gráfico de la función de probabilidad de la distribución de Poisson con ggplot2
df <- data.frame(x = 0:10, y = dpois(0:10, lambda = 2))
ggplot(df, aes(x = x, y = y)) +
geom_point() +
geom_line() +
scale_x_continuous(breaks = 0:10) +
labs(title = "Función de Probabilidad de la Distribución de Poisson", x = "Número de Eventos", y = "Probabilidad")
# Gráfico de la función de distribución acumulada de la distribución de Poisson con ggplot2
df <- data.frame(x = 0:10, y = ppois(0:10, lambda = 2))
ggplot(df, aes(x = x, y = y)) +
geom_point() +
geom_line() +
scale_x_continuous(breaks = 0:10) +
labs(title = "Función de Distribución Acumulada de la Distribución de Poisson", x = "Número de Eventos", y = "Probabilidad")
La tasa promedio de llamadas telefónicas que recibe una oficina de atención al cliente es de 5 llamadas por hora. ¿Cuál es la probabilidad de que reciban 3 llamadas en una hora?
# Función de probabilidad de la distribución de Poisson
poiscall <- dpois(3, lambda = 5)
cat("La probabilidad de que reciban exactamente 3 llamadas en una hora es:", sprintf("%.2f", poiscall), "\n")
## La probabilidad de que reciban exactamente 3 llamadas en una hora es: 0.14
EJERCICIO 1. La distribución del número de plántulas de arce (maple) en 100 parcelas cuadradas de 1 m^2, en teoría puede seguir una distribución de Poisson. La media de la muestra, llamada también lambda (𝜆) en la distribución de Poisson, es 1.41 plántulas de arce por parcela. ¿Cuál es la probabilidad de que en una parcela haya 0 plántulas de arce? ¿Cincos plántulas de arce?
# Función de probabilidad de la distribución de Poisson
dpois(0, lambda = 1.41)
## [1] 0.2441433
dpois(5, lambda = 1.41)
## [1] 0.01133859
Crear una gráfica de la función de probabilidad de la distribución de Poisson con lambda = 1.41, y los siguientes valores de plántula por parcela: 0 = 24, 1 = 35, 2 = 25, 3 = 11,4 = 4, 5 = 1.
# Gráfico de la función de probabilidad de la distribución de Poisson y los valores reales en barras con ggplot2
df <- data.frame(x = 0:5, y = dpois(0:5, lambda = 1.41)*100, reales = c(35, 26, 15, 11, 6, 4))
ggplot(df, aes(x = x, y = y)) + geom_point() + geom_line() + geom_bar(aes(x = x, y = reales), stat = "identity", fill = "lightblue", alpha = 0.5) + labs(title = "Función de Probabilidad de la Distribución de Poisson", x = "Número de Plántulas", y = "Frecuencia")