# Ejemplo 1. Gráfico de una variable de Poisson de parametro lamda = 5
plot(dpois(0:15,5),xlab="k",ylab="P(X=k)",main="Distribución de Poisson - X ~ P(5)", type = "h", lwd = 5, col = 1:10)

# Rejilla de valores del eje X
x <- 0:50

#-----------
# lambda: 5
#-----------
lambda <- 5
plot(dpois(x, lambda), type = "h", lwd = 2,
     main = "Distribución de Poisson",
     ylab = "P(X = x)", xlab = "Número de eventos")

#-----------
# lambda: 10
#-----------
lambda <- 10
lines(dpois(x, lambda), type = "h", lwd = 2, col = rgb(1,0,0, 0.7))

#-----------
# lambda: 20
#-----------
lambda <- 20
lines(dpois(x, lambda), type = "h", lwd = 2, col = rgb(0, 1, 0, 0.7))

# Leyenda
legend("topright", legend = c("Cartagena, 5", " Santa Marta, 10", "Barranquilla, 20"),
       title = expression(lambda), title.adj = 0.75,
       lty = 1, col = 1:3, lwd = 2, box.lty = 0)

Ejercicio 1: Sea X el número de infracciones de tránsito por día en un lugar emblemático en cada una de las ciudades: Cartagena (en promedio 25 semanales), Santa Marta (en promedio 20) y Barranquilla (en Promedio 30).

# Rejilla de valores del eje X
x <- 0:50

#-----------
# lambda: 5
#-----------
lambda <- 25
plot(dpois(x, lambda), type = "h", lwd = 2,
     main = "Distribución de Poisson",
     ylab = "P(X = x)", xlab = "Número de eventos")

#-----------
# lambda: 10
#-----------
lambda <- 20
lines(dpois(x, lambda), type = "h", lwd = 2, col = rgb(1,0,0, 0.7))

#-----------
# lambda: 20
#-----------
lambda <- 30
lines(dpois(x, lambda), type = "h", lwd = 2, col = rgb(0, 1, 0, 0.7))

# Leyenda
legend("topright", legend = c("Cartagena, 25", " Santa Marta, 20", "Barranquilla, 30"),
       title = expression(lambda), title.adj = 0.75,
       lty = 1, col = 1:3, lwd = 2, box.lty = 0)

Ejemplo 3: Hallar la probabilidad que en un dia cualquiera se reciban entre 10 y 15 infracciones en un día en la ciudad de Santa Marta

dpois(10:15, 10)
## [1] 0.12511004 0.11373640 0.09478033 0.07290795 0.05207710 0.03471807
sum(dpois(10:15, 10))
## [1] 0.4933299

Ejemplo 4. La probabilidad de que cierto examen médico dé lugar a una reacción “positiva” es igual a 0.8, ¿cuál es la probabilidad de que ocurran 5 reacciones “negativas” antes de la tercera positiva?

plot(dnbinom(0:10,3,0.8),type="h",xlab="k",ylab="P(X=k)",main="X ~ Bneg(3,0.8)")

###Ejemplo 5. ¿cuál es la probabilidad de que ocurran 5 reacciones “negativas” antes de la tercera positiva?

dnbinom(5,3,0.8)
## [1] 0.00344064

Ejemplo 7 En la convocatoria de la selección Colombia el técnico llama a los tres goleadores del momento en el futbol internacional Julio Huetado que en 50 partidos ha marcado 10 goles, Alberto Patiño que en 50 partidos ha marcado 15 goles y Jorge Villalba que en 50 partidos ha marcado 20 goles. Queremos saber cual será su comportamiento en la cancha de juegos conociendo su palmarés de Goles en los próxumos 50 encuentros de las Eliminatorias y amistosos para el 2026

# Rejilla de valores del eje X
x <- 1:50

# n = 50, p = 0.2
plot(dbinom(x, size = 50, prob = 0.2), type = "h", lwd = 2,
     main = "Función de probabilidad binomial",
     ylab = "P(X = x)", xlab = "Número de goles de Julio, Alberto y Jorge")

# n = 50, p = 0.3
lines(dbinom(x, size = 50, prob = 0.3), type = "h",
      lwd = 2, col = rgb(1,0,0, 0.7))

# n = 50, p = 0.4
lines(dbinom(x, size = 50, prob = 0.4), type = "h",
      lwd = 2, col = rgb(0, 1, 0, 0.7))

# Añadimos una leyenda
legend("topright", legend = c("50  0.2 Julio", "50  0.3 Alberto", "50  0.4 Jorge"),
       title = "n     p", title.adj = 0.85,
       lty = 1, col = 1:3, lwd = 2, box.lty = 0)

###Ejercicio 4. En una nueva convocatoria de la selección Colombia el técnico llama a los tres goleadores del momento en el futbol internacional Seferino Marciano que en 30 partidos ha marcado 10 goles, Lucrecio Jupiteriano que en 25 partidos ha marcado 15 goles y Moringo Mercurio que en 30 partidos ha marcado 20 goles. Queremos saber cual será su comportamiento en la cancha de juegos conociendo su palmarés de Goles en los próxumos 50 encuentros de las Eliminatorias y amistosos para el 2030**

# Rejilla de valores del eje X (número de goles posibles)
x <- 1:50

# Probabilidades reales (promedio de gol por partido)
p_seferino <- 10/30      # 0.333
p_lucrecio  <- 15/25     # 0.6
p_moringo   <- 20/30     # 0.666

# === Gráfico ===

# Seferino
plot(dbinom(x, size = 50, prob = p_seferino), type = "h", lwd = 2,
     main = "Probabilidad de goles en 50 partidos (Distribución Binomial)",
     ylab = "P(X = x)", xlab = "Número de goles",
     col = rgb(0, 0, 1, 0.7))

# Lucrecio
lines(dbinom(x, size = 50, prob = p_lucrecio), type = "h",
      lwd = 2, col = rgb(1, 0, 0, 0.7))

# Moringo
lines(dbinom(x, size = 50, prob = p_moringo), type = "h",
      lwd = 2, col = rgb(0, 1, 0, 0.7))

# Leyenda
legend("topright",
       legend = c("Seferino (p=0.333)", "Lucrecio (p=0.6)", "Moringo (p=0.666)"),
       title = "Jugadores",
       lty = 1,
       col = c(rgb(0,0,1,0.7), rgb(1,0,0,0.7), rgb(0,1,0,0.7)),
       lwd = 2, box.lty = 0)

##3.44 Distribución Normal.

###Ejemplo 8. Eligiendo una muestra aleatoria de Tamaño 30 de una poblacion normal.Calcular 30 posibles puntajes de un grupo de Estadistica I en el primer corte, si éstos se distribuyen como una variable normal cuya media se distribuye aleatoriamente y con hiperparametros de mean = 70 y sd = 5

medias<-rnorm(30, mean = 70, sd = 5)
medias
##  [1] 72.14437 69.18028 68.21671 79.11150 73.73386 63.98221 73.72839 65.36046
##  [9] 73.73180 69.90961 72.64901 69.65816 68.40738 74.58594 74.91280 68.68165
## [17] 75.97654 70.98509 74.70015 75.89476 56.53677 77.46231 64.75875 72.03057
## [25] 63.10614 69.20603 70.51823 71.89080 66.93532 70.62605
# Rejilla de valores del eje X
x <- round(medias)
hist(x,  lwd = 2,
     main = "Función densidad de probabilidad", ylim=c(0,20),
     ylab = "Numero de Estudiantes", xlab = "Puntaje obtenido", col = 1:10)

###3.45 Ejemplo 9

(a) *Calcular la probabilidad de que un hombre mida menos de 66 pulgadas, suponiendo que las alturas de los hombres se distribuyen normalmente con una media de 70 pulgadas y una desviacion estandar de 3 pulgadas:P(X≤66)=pnorm(66,μ,σ)

# P(X<=66) dado que X ~ N (70, 3): Usando RStudio
pnorm(66, mean = 70, sd = 3)
## [1] 0.09121122
# Usando Rstudio para graficar la región
regionX=seq(60,66,0.01)            # Intervalo a sombrear
xP <- c(50,regionX,66)             # Base de los poligonos que crean el efecto "sombra"
yP <- c(0,dnorm(regionX,70,3),0)   # Altura de los poligonos sombreados
curve(dnorm(x,70,3),xlim=c(60,80),yaxs="i",ylim=c(0,0.15),ylab="f(x)",
      main='Densidad N(70,3)') 
polygon(xP,yP,col="orange1")
box()

legend("topright", legend = round(pnorm(66, 70, 3),5),
       title = expression("P(X<=66)"), title.adj = 0.75,
       lty = 1, col = "orange1", lwd = 2, box.lty = 0)

###(b). Calcular la probabilidad de que un hombre mida mas de 66 pulgadas, suponiendo que las alturas de los hombres se distribuyen normalmente con una media de 70 pulgadas y una desviacion estandar de 3 pulgadas. P(X≥66) dado que X ~ N (70, 3)

# P(U+2265) dado que X ~ N (70, 3):
pnorm(66, mean = 70, sd = 3, lower.tail = FALSE)
## [1] 0.9087888
regionX=seq(66,90,0.01)            # Intervalo a sombrear
xP <- c(66,regionX,90)             # Base de los poligonos que crean el efecto "sombra"
yP <- c(0,dnorm(regionX,70,3),0)   # Altura de los poligonos sombreados
curve(dnorm(x,70,3),xlim=c(60,80),yaxs="i",ylim=c(0,0.15),ylab="f(x)",
      main='Densidad N(70,3)') 
polygon(xP,yP,col="orange1")
box()
legend("topright", legend = round(pnorm(66, 70, 3, lower.tail = F),3),
       title = expression("P(X≥66)"), title.adj = 0.75,
       lty = 1, col = "orange1", lwd = 2, box.lty = 0)

###(c). P(64 < X < 76)

#  P(64 < X < 76)
pnorm(76,70,3)-pnorm(64,70,3)
## [1] 0.9544997
sum(pnorm(64:76,70,3))
## [1] 6.5
# Usando RStudio
regionX=seq(64,76,0.01)            # Intervalo a sombrear
xP <- c(64,regionX,76)             # Base de los poligonos que crean el efecto "sombra"
yP <- c(0,dnorm(regionX,70,3),0)   # Altura de los poligonos sombreados
curve(dnorm(x,70,3),xlim=c(60,80),yaxs="i",ylim=c(0,0.15),ylab="f(x)",
      main='Densidad N(70,3)') 
polygon(xP,yP,col="orange1")
box()
legend("topright", legend = round(pnorm(76, 70, 3, lower.tail = T)- pnorm(64, 70, 3, lower.tail = T),3),
       title = expression("P(64 < X < 76)"), title.adj = 0.75,
       lty = 1, col = "orange1", lwd = 2, box.lty = 0)

Ejercicio 5. Repite el ejemplo anterios para calcular P(72 < X < 78)

# P(72 < X < 78) para X ~ N(70, 3)
pnorm(78, 70, 3) - pnorm(72, 70, 3)
## [1] 0.2486622
# Suma de probabilidades para 72 a 78
sum(pnorm(72:78, 70, 3))
## [1] 6.413455
# Intervalo a sombrear
regionX = seq(72, 78, 0.01)

# Polígono de sombreado
xP <- c(72, regionX, 78)
yP <- c(0, dnorm(regionX, 70, 3), 0)

# Curva normal
curve(dnorm(x, 70, 3),
      xlim = c(60, 85), yaxs="i",
      ylim = c(0, 0.15), ylab = "f(x)",
      main = 'Densidad N(70, 3)')

# Sombra
polygon(xP, yP, col = "orange1")

box()

# Leyenda con el valor de la probabilidad
legend("topright",
       legend = round(pnorm(78, 70, 3) - pnorm(72, 70, 3), 3),
       title = expression("P(72 < X < 78)"),
       title.adj = 0.75,
       lty = 1, col = "orange1", lwd = 2, box.lty = 0)

### Ejercicio 6. Repite el ejemplo anterios para calcular. P(65 < X < 68)

# P(65 < X < 68) para X ~ N(70, 3)
pnorm(68, 70, 3) - pnorm(65, 70, 3)
## [1] 0.2047022
# Suma de probabilidades para 65 a 68
sum(pnorm(65:68, 70, 3))
## [1] 0.5501494
# Intervalo a sombrear
regionX = seq(65, 68, 0.01)

# Polígono para la sombra
xP <- c(65, regionX, 68)
yP <- c(0, dnorm(regionX, 70, 3), 0)

# Curva normal
curve(dnorm(x, 70, 3),
      xlim = c(55, 85), yaxs = "i",
      ylim = c(0, 0.15), ylab = "f(x)",
      main = "Densidad N(70, 3)")

# Sombra del área
polygon(xP, yP, col = "orange1")

# Caja del gráfico
box()

# Leyenda con el valor de la probabilidad
legend("topright",
       legend = round(pnorm(68, 70, 3) - pnorm(65, 70, 3), 3),
       title = expression("P(65 < X < 68)"),
       title.adj = 0.75,
       lty = 1, col = "orange1", lwd = 2, box.lty = 0)

Objetivo del ensayo

El propósito de este ensayo es explorar las distribuciones de probabilidad clave en estadística —Poisson, binomial negativa, hipergeométrica y normal— destacando sus características principales, condiciones de uso y aplicaciones prácticas en el análisis de datos reales, para mostrar cómo cada una se adapta perfectamente a situaciones específicas y ayuda a convertir la incertidumbre en información útil para decisiones cotidianas.

Distribución de Poisson y sus Gráficas

La distribución de Poisson es ideal para contar eventos raros que suceden de forma independiente en un período fijo, como las llamadas que llegan a un call center en una hora o los defectos que aparecen en una pieza de fabricación. Sus gráficas son fascinantes porque muestran una curva que empieza asimétrica cuando los eventos son poco frecuentes, pero se vuelve más simétrica y parecida a una campana conforme aumentan las ocurrencias promedio, lo que permite ver de un vistazo dónde se concentran las probabilidades más altas. Es súper útil en logística para planificar entregas, en hospitales para prever ingresos de pacientes o en control de calidad para anticipar fallos, ayudando a asignar recursos justo donde se necesitan.

Distribución Binomial Negativa

Esta distribución entra en juego cuando te preguntas cuántos intentos necesitas para lograr un número específico de éxitos, como cuántas llamadas de ventas debes hacer hasta cerrar tres contratos o cuántos componentes fallan antes de que uno funcione r veces. A diferencia de otras, aquí fijas los éxitos deseados y calculas los fracasos necesarios, capturando esa idea de persistencia hasta alcanzar la meta. Se usa mucho en marketing para estimar campañas, en ingeniería para medir confiabilidad de equipos y en seguros para calcular tiempos hasta siniestros repetidos, porque refleja procesos reales donde sigues probando hasta conseguir lo que buscas.

Distribución Hipergeométrica

Piensa en revisar un lote finito de productos sin devolver lo que sacas, como inspeccionar 10 piezas de un total de 50 donde sabes que hay 5 defectuosas. La hipergeométrica considera que cada extracción cambia las probabilidades para las siguientes, porque la población es limitada y no se repone. Es perfecta para auditorías donde cuentas cada unidad disponible, encuestas en grupos pequeños o estudios ecológicos de especies en hábitats cerrados, evitando el error de asumir que todo es independiente cuando en realidad los recursos se van agotando.

Distribución Normal

La distribución normal es esa famosa curva en forma de campana simétrica que describe la mayoría de los fenómenos continuos en la naturaleza, como las alturas de las personas o los puntajes en exámenes. Su magia está en que casi cualquier suma o promedio de datos independientes termina pareciéndose a ella, gracias al teorema central del límite, lo que la hace universal para aproximar realidades complejas. La usamos en finanzas para predecir rendimientos, en manufactura para medir tolerancias o en ciencias sociales para analizar encuestas grandes, convirtiéndola en la base de casi todas las pruebas estadísticas y decisiones basadas en datos.

Conclusión

Entender estas distribuciones —Poisson para lo raro e intermitente, binomial negativa para la perseverancia, hipergeométrica para lo finito y normal para lo simétrico— es como tener un kit de herramientas para descifrar el mundo aleatorio. Cada una encaja en escenarios específicos de la vida real, transformando datos confusos en predicciones claras que guían desde la planificación empresarial hasta la investigación científica, demostrando que elegir el modelo correcto es lo que separa un análisis superficial de uno realmente impactante.