# Verificar, instalar y activar el paquete "tidyverse"if (!require(tidyverse)) {install.packages("tidyverse")}library(tidyverse)# Verificar, instalar y activar el paquete "kableExtra"if (!require(kableExtra)) {install.packages("kableExtra")}library(kableExtra)# Verificar, instalar y activar el paquete "dplyr"if (!require(dplyr)) {install.packages("dplyr")}library(dplyr)
2 .MODELOS PROBABILISTICOS
Definición general
Un modelo probabilístico es una representación matemática de un fenómeno o proceso aleatorio (es decir, incierto), donde los resultados posibles y su probabilidad de ocurrencia se describen mediante la teoría de la probabilidad.
En otras palabras: Un modelo probabilístico permite predecir o analizar eventos que no son completamente determinísticos, pero cuya incertidumbre puede medirse con probabilidades.
3 .Componentes de un modelo probabilístico
Un modelo probabilístico generalmente incluye:
Espacio muestral (S): conjunto de todos los resultados posibles de un experimento aleatorio. Ejemplo: al lanzar una moneda, ( S = {Cara, Sello} ).
Eventos (A, B, C…): subconjuntos del espacio muestral, que representan los sucesos de interés. Ejemplo: “que salga cara”.
Probabilidad (P): función que asigna un número entre 0 y 1 a cada evento, indicando la posibilidad de que ocurra. Ejemplo: ( P() = 0.5 ).
Variable aleatoria (X): variable numérica que representa los resultados del experimento. Ejemplo: X = número de ciudadanos satisfechos.
Función de probabilidad o distribución: describe cómo se distribuyen los valores de la variable aleatoria (por ejemplo, binomial, Poisson, normal).
Tipos de modelos probabilísticos
Modelos discretos
La variable aleatoria solo puede tomar valores enteros o contables.
Se usa cuando los resultados se pueden enumerar (por ejemplo, número de usuarios atendidos).
Ejemplos:
Distribución binomial
Distribución de Poisson
Distribución geométrica
Modelos continuos
La variable aleatoria puede tomar infinitos valores dentro de un intervalo.
Se usa cuando la medición es continua (por ejemplo, tiempo de atención, peso, altura, duración).
Ejemplos:
Distribución normal
Distribución exponencial
Distribución uniforme continua
Importancia en la administración pública
En el ámbito de la gestión pública, los modelos probabilísticos permiten:
Tomar decisiones basadas en evidencia y no en intuiciones.
Predecir resultados de procesos administrativos o sociales.
Evaluar el riesgo en la ejecución de políticas, proyectos o programas.
Optimizar recursos mediante simulaciones de escenarios probables.
Medir la incertidumbre en los indicadores de desempeño o satisfacción ciudadana.
Ejemplo aplicado
Situación: La Secretaría de Movilidad de Ibagué quiere saber cuántos ciudadanos quedarán satisfechos con la atención. De estudios previos se sabe que el 80% (p = 0.8) suele estar conforme.
Si se atienden 10 personas (n = 10), y definimos [ X = ,] entonces: [] X Binomial(10, 0.8)]
Este es un modelo probabilístico discreto, pues:
Hay incertidumbre (no se sabe cuántos estarán satisfechos).
Se pueden calcular probabilidades para cada posible resultado (0, 1, 2, …, 10).
Permite predecir comportamientos y evaluar la calidad del servicio.
En resumen
Elemento
Descripción
Concepto
Representación matemática de un fenómeno aleatorio.
Finalidad
Analizar, estimar o predecir resultados bajo incertidumbre.
Tipos
Discretos y continuos.
Aplicación en lo público
Planificación, gestión del riesgo, control de calidad, evaluación de servicios.
4 .DISTRIBUCIÓN BINOMIAL
Definición general
La distribución binomial es una de las distribuciones de probabilidad discretas más importantes en la estadística. Se utiliza cuando se realiza un experimento compuesto por un número fijo de ensayos independientes, en los cuales solo pueden ocurrir dos resultados posibles:
Éxito (ocurre el evento de interés).
Fracaso (no ocurre el evento).
Cada ensayo tiene la misma probabilidad de éxito (p) y de fracaso (q = 1 – p).
Variable aleatoria
Sea la variable aleatoria X = número de éxitos obtenidos en n ensayos independientes. Entonces:
[] X Binomial(n, p)]
donde:
( n ): número de ensayos.
( p ): probabilidad de éxito en un ensayo.
( q = 1 - p ): probabilidad de fracaso.
( X ): toma valores discretos ( 0, 1, 2, …, n ).
Función de probabilidad
La probabilidad de obtener exactamente k éxitos en n ensayos se calcula con la fórmula:
[P(X = k) = p^k (1 - p)^{n - k}]
donde: [ = ] es el coeficiente binomial, que indica el número de formas distintas en que pueden lograrse ( k ) éxitos en ( n ) intentos.
Propiedades fundamentales
4.0.1 a) Media (valor esperado)
[] E(X) = n p
4.0.2 b) Varianza
[] Var(X) = n p (1 - p)]
4.0.3 c) Desviación estándar
[= ]
4.0.4 d) Forma de la distribución
Si ( p = 0.5 ) → distribución simétrica.
Si ( p < 0.5 ) → distribución asimétrica hacia la derecha.
Si ( p > 0.5 ) → distribución asimétrica hacia la izquierda.
4.0.5 e) Suma de probabilidades
[] _{k=0}^{n} P(X = k) = 1]
Condiciones para aplicar la distribución binomial
El experimento consta de n ensayos fijos.
Cada ensayo tiene dos resultados posibles: éxito o fracaso.
La probabilidad de éxito (p) es constante en cada ensayo.
Los ensayos son independientes entre sí.
Ejemplo aplicado a la Administración Pública
Contexto
En una jornada de atención al ciudadano, la Secretaría de Movilidad de Ibagué registra que la probabilidad de satisfacción del usuario es del 80% (p = 0.8). Durante el día se atienden 10 ciudadanos (n = 10).
Variable aleatoria: [ X = ]
Entonces: [Binomial(10, 0.8)]
4.0.6 Ejemplo de cálculo:
¿Cuál es la probabilidad de que exactamente 8 ciudadanos queden satisfechos?
P(X = 8) = (0.8)^8 (0.2)^2
P(X = 8) = 45 = 0.30199
✅ Resultado: La probabilidad de que 8 ciudadanos estén satisfechos es aproximadamente 0.302 (30.2%).
Usos de la distribución binomial en la administración pública
Evaluar la eficiencia de atención ciudadana (satisfacción de usuarios).
Analizar la probabilidad de cumplimiento de metas en programas sociales.
Medir la tasa de errores en procesos administrativos.
Estimar la probabilidad de aprobación de solicitudes, proyectos o trámites.
Predecir la calidad del servicio con base en resultados anteriores.
Interpretación estadística
La distribución binomial permite modelar y predecir resultados en contextos donde hay una probabilidad fija de éxito y un número determinado de ensayos. En el ámbito público, es una herramienta útil para la toma de decisiones basada en datos, ayudando a mejorar la eficiencia, calidad y planificación de los servicios ciudadanos.
5 .Ejercicio de Distribución Binomial (Contexto: Administración Pública)
ContextO
La Secretaría de Movilidad del Municipio de Ibagué está evaluando la eficiencia en la atención ciudadana en su ventanilla única. De acuerdo con datos históricos, el 80% de los ciudadanos (p = 0.8) quedan satisfechos con el servicio recibido.
Durante un día, se atienden 10 usuarios (n = 10) seleccionados al azar, y se desea analizar la probabilidad de satisfacción ciudadana.
Definimos la variable aleatoria:
X = número de ciudadanos satisfechos
Entonces:
( X Binomial(n = 10, p = 0.8) )
Incisos del ejercicio
a) ¿Cuál es la probabilidad de que exactamente 8 ciudadanos estén satisfechos?
( P(X = 8) )
b) ¿Cuál es la probabilidad de que menos de 8 ciudadanos estén satisfechos?
( P(X < 8) = P(X ) )
c) ¿Cuál es la probabilidad de que al menos 8 ciudadanos estén satisfechos?
( P(X ) )
d) ¿Cuál es la probabilidad de que como máximo 6 ciudadanos estén satisfechos?
( P(X ) )
e) ¿Cuál es la probabilidad de que más de 9 ciudadanos estén satisfechos?
( P(X > 9) = P(X = 10) )
Fórmula general de la distribución binomial
[ P(X = k) = p^k (1 - p)^{n - k}] donde:
( n = 10 )
( p = 0.8 )
( k ) es el número de éxitos (ciudadanos satisfechos)
Hay un 30% de probabilidad de que exactamente 8 usuarios estén satisfechos.
Existe una 67.7% de probabilidad de que al menos 8 usuarios se vayan contentos.
Solo en 3% de los casos se esperarían menos de 7 ciudadanos satisfechos, lo que sería una alerta de mala atención.
Ver código
# --------------------------------------------------------------# DISTRIBUCIÓN BINOMIAL - SECRETARÍA DE MOVILIDAD DE IBAGUÉ# Evaluación de satisfacción ciudadana en ventanilla única# --------------------------------------------------------------# Parámetros del probleman <-10# número de ciudadanos atendidosp <-0.8# probabilidad de satisfacción (éxito)q <-1- p # probabilidad de insatisfacción (fracaso)# Variable aleatoria: X = número de ciudadanos satisfechos# a) P(X = 8) -> probabilidad de que exactamente 8 ciudadanos estén satisfechosP_igual_8 <-dbinom(8, n, p)P_igual_8
[1] 0.3019899
Ver código
# b) P(X < 8) -> probabilidad de que menos de 8 ciudadanos estén satisfechosP_menor_8 <-pbinom(7, n, p) # acumulada hasta 7P_menor_8
[1] 0.3222005
Ver código
# c) P(X ≥ 8) -> probabilidad de que al menos 8 ciudadanos estén satisfechosP_mayor_igual_8 <-1-pbinom(7, n, p)P_mayor_igual_8
[1] 0.6777995
Ver código
# d) P(X ≤ 6) -> probabilidad de que como máximo 6 ciudadanos estén satisfechosP_menor_igual_6 <-pbinom(6, n, p)P_menor_igual_6
[1] 0.1208739
Ver código
# e) P(X > 9) -> probabilidad de que más de 9 ciudadanos estén satisfechosP_mayor_9 <-1-pbinom(9, n, p) # o dbinom(10, n, p)P_mayor_9
P(X = 8) -> probabilidad de que exactamente 8 ciudadanos estén satisfechos P_igual_8 <- dbinom(8, n, p) P_igual_8
P(X < 8) -> probabilidad de que menos de 8 ciudadanos estén satisfechos P_menor_8 <- pbinom(7, n, p) # acumulada hasta 7 P_menor_8
P(X ≥ 8) -> probabilidad de que al menos 8 ciudadanos estén satisfechos P_mayor_igual_8 <- 1 - pbinom(7, n, p) P_mayor_igual_8
P(X ≤ 6) -> probabilidad de que como máximo 6 ciudadanos estén satisfechos P_menor_igual_6 <- pbinom(6, n, p) P_menor_igual_6
P(X > 9) -> probabilidad de que más de 9 ciudadanos estén satisfechos P_mayor_9 <- 1 - pbinom(9, n, p) # o dbinom(10, n, p) P_mayor_9
Función
Descripción
dbinom(k, n, p)
Calcula la probabilidad puntual ( P(X = k) ).
pbinom(k, n, p)
Calcula la probabilidad acumulada ( P(X k) ).
1 - pbinom(k, n, p)
Calcula ( P(X > k) ) o ( P(X k+1) ).
Inciso
Probabilidad
a) P(X = 8)
0.3020
b) P(X < 8)
0.3222
c) P(X ≥ 8)
0.6778
d) P(X ≤ 6)
0.0328
e) P(X > 9)
0.1074
Ver código
# --------------------------------------------------------------# DISTRIBUCIÓN BINOMIAL - SECRETARÍA DE MOVILIDAD DE IBAGUÉ# Evaluación de satisfacción ciudadana en ventanilla única# --------------------------------------------------------------# Parámetros del probleman <-10# número de ciudadanos atendidosp <-0.8# probabilidad de satisfacción (éxito)q <-1- p # probabilidad de insatisfacción (fracaso)# Variable aleatoria: X = número de ciudadanos satisfechos# --------------------------------------------------------------# CÁLCULO DE PROBABILIDADES SEGÚN LOS INCISOS# --------------------------------------------------------------# a) P(X = 8) -> probabilidad de que exactamente 8 ciudadanos estén satisfechosP_igual_8 <-dbinom(8, n, p)# b) P(X < 8) -> probabilidad de que menos de 8 ciudadanos estén satisfechosP_menor_8 <-pbinom(7, n, p)# c) P(X ≥ 8) -> probabilidad de que al menos 8 ciudadanos estén satisfechosP_mayor_igual_8 <-1-pbinom(7, n, p)# d) P(X ≤ 6) -> probabilidad de que como máximo 6 ciudadanos estén satisfechosP_menor_igual_6 <-pbinom(6, n, p)# e) P(X > 9) -> probabilidad de que más de 9 ciudadanos estén satisfechosP_mayor_9 <-1-pbinom(9, n, p) # equivalente a dbinom(10, n, p)# --------------------------------------------------------------# TABLA RESUMEN DE RESULTADOS# --------------------------------------------------------------resultados <-data.frame(Inciso =c("a) P(X = 8)","b) P(X < 8)","c) P(X ≥ 8)","d) P(X ≤ 6)","e) P(X > 9)"),Probabilidad =round(c(P_igual_8, P_menor_8, P_mayor_igual_8, P_menor_igual_6, P_mayor_9), 4))print(resultados)
# --------------------------------------------------------------# DISTRIBUCIÓN BINOMIAL - SECRETARÍA DE MOVILIDAD DE IBAGUÉ# Evaluación de satisfacción ciudadana en ventanilla única# --------------------------------------------------------------# Parámetros del probleman <-10# número de ciudadanos atendidosp <-0.8# probabilidad de satisfacción (éxito)q <-1- p # probabilidad de insatisfacción (fracaso)# Variable aleatoria: X = número de ciudadanos satisfechos# --------------------------------------------------------------# CÁLCULO DE PROBABILIDADES SEGÚN LOS INCISOS# --------------------------------------------------------------# a) P(X = 8) -> probabilidad de que exactamente 8 ciudadanos estén satisfechosP_igual_8 <-dbinom(8, n, p)# b) P(X < 8) -> probabilidad de que menos de 8 ciudadanos estén satisfechosP_menor_8 <-pbinom(7, n, p)# c) P(X ≥ 8) -> probabilidad de que al menos 8 ciudadanos estén satisfechosP_mayor_igual_8 <-1-pbinom(7, n, p)# d) P(X ≤ 6) -> probabilidad de que como máximo 6 ciudadanos estén satisfechosP_menor_igual_6 <-pbinom(6, n, p)# e) P(X > 9) -> probabilidad de que más de 9 ciudadanos estén satisfechosP_mayor_9 <-1-pbinom(9, n, p) # equivalente a dbinom(10, n, p)# GRÁFICO DE LA DISTRIBUCIÓN BINOMIAL# --------------------------------------------------------------# Generar valores posibles de X (0 a 10 ciudadanos satisfechos)x <-0:n# Calcular las probabilidades de cada valorprobabilidades <-dbinom(x, n, p)# Crear el gráfico de barrasbarplot(probabilidades,names.arg = x,col =ifelse(x ==8, "steelblue", "lightgray"),main ="Distribución Binomial: Satisfacción Ciudadana\nSecretaría de Movilidad de Ibagué",xlab ="Número de ciudadanos satisfechos (X)",ylab ="Probabilidad P(X = x)",ylim =c(0, max(probabilidades) +0.05))# Agregar etiquetas de probabilidad sobre cada barratext(x =seq_along(probabilidades),y = probabilidades,labels =round(probabilidades, 3),pos =3,cex =0.8)
Gráfica de Probalidad
Ver código
# Parámetrosn <-10# número de ensayosp <-0.5# probabilidad de éxitox <-0:n# Distribución de probabilidadprob <-dbinom(x, n, p)# Gráfica de probabilidadplot(x, prob, type ="h", lwd =3, col ="steelblue",main ="Distribución Binomial - Probabilidad",xlab ="x", ylab ="P(X = x)")points(x, prob, pch =16, col ="steelblue")
Gráfica Acumulada
Ver código
# Distribución acumuladaacum <-pbinom(x, n, p)# Gráfica acumuladaplot(x, acum, type ="s", lwd =2, col ="firebrick",main ="Distribución Binomial - Acumulada",xlab ="x", ylab ="P(X ≤ x)")points(x, acum, pch =16, col ="firebrick")
6 .DISTRIBUCION DE POISSON
Definición general
La distribución de Poisson es una distribución de probabilidad discreta que modela el número de veces que ocurre un evento en un intervalo fijo de tiempo, espacio o área, cuando dichos eventos:
Ocurren de manera independiente unos de otros.
Se presentan de forma aleatoria y a una tasa promedio constante (λ, llamada lambda).
Variable aleatoria
Sea la variable aleatoria:
[ X = ]
Entonces se dice que:
[ X Poisson()]
donde:
( ): media o tasa promedio de ocurrencia (por unidad de tiempo o espacio).
( X ): número de veces que ocurre el evento (0, 1, 2, 3, …).
Función de probabilidad
La probabilidad de que ocurran exactamente k eventos en el intervalo se calcula mediante la fórmula:
[ P(X = k) = ]
donde:
( e ) = 2.71828 (base del logaritmo natural),
( ) = tasa media de ocurrencias,
( k ) = número de ocurrencias (0, 1, 2, …).
Propiedades de la distribución de Poisson
Propiedad
Fórmula
Descripción
Media (valor esperado)
( E(X) = )
Promedio de ocurrencias esperadas en el intervalo.
Varianza
( Var(X) = )
La varianza es igual a la media.
Desviación estándar
( = )
Medida de dispersión de los datos.
Rango de valores
( X = 0, 1, 2, 3, … )
La variable aleatoria es discreta e infinita.
Suma de probabilidades
( _{k=0}^{} P(X=k) = 1 )
Todas las probabilidades suman 1.
Condiciones para aplicar la distribución de Poisson
Los eventos ocurren de forma independiente entre sí.
Los eventos se producen con una tasa promedio constante (λ).
En intervalos muy pequeños, no ocurren dos o más eventos simultáneamente (baja probabilidad conjunta).
La probabilidad de que un evento ocurra en un intervalo depende solo del tamaño del intervalo, no de su ubicación.
Ejemplo aplicado a la administración pública
Contexto:
En la Secretaría de Movilidad del Municipio de Ibagué, se registra que en promedio llegan 3 quejas ciudadanas por hora sobre el servicio de atención. Se desea calcular la probabilidad de que en una hora se presenten exactamente 5 quejas.
Datos:
[ = 3, k = 5]
6.0.1 Aplicando la fórmula de Poisson:
[ P(X = 5) = ]
[ P(X = 5) = = 0.1008]
✅ Resultado: La probabilidad de recibir exactamente 5 quejas en una hora es 0.1008 (10.08%).
Interpretación práctica
Si el promedio es de 3 quejas por hora, hay un 10% de probabilidad de recibir exactamente 5 quejas.
También se pueden calcular probabilidades acumuladas, como ( P(X ) ) o ( P(X > 5) ), para analizar escenarios más amplios.
Este modelo ayuda a anticipar la carga laboral, planificar personal y mejorar la atención ciudadana.
Aplicaciones de la distribución de Poisson en la administración pública
Aplicación
Ejemplo
Gestión de servicios al ciudadano
Número de llamadas, quejas o peticiones por hora.
Seguridad vial
Número de accidentes por día en una intersección.
Gestión documental
Número de documentos mal radicados por semana.
Salud pública
Número de casos de una enfermedad por zona.
Infraestructura
Número de fallas o reportes en semáforos o luminarias.
Comparación con la distribución binomial
Característica
Binomial
Poisson
Tipo
Discreta
Discreta
Ensayos
Fijos (n)
No definidos, evento continuo en el tiempo/espacio
Parámetros
n, p
λ
Aplicación típica
Éxitos en n ensayos
Ocurrencias por intervalo
Varianza
( n p (1 - p) )
( )
Resumen conceptual
La distribución de Poisson es una herramienta clave para modelar eventos raros pero cuantificables. En el ámbito de la administración pública, permite analizar fenómenos operativos (quejas, errores, solicitudes, fallos técnicos) y planificar recursos o estrategias con base en probabilidades objetivas.
7 .Ejercicio: Distribución de Poisson en la Administración Pública**
Contexto:
La Secretaría de Movilidad del Municipio de Ibagué recibe quejas ciudadanas sobre el servicio de atención al usuario. De acuerdo con los registros históricos, en promedio se reciben 3 quejas por hora.
Se desea modelar el número de quejas que pueden recibirse en una hora determinada, para mejorar la planeación del personal de atención.
Definimos la variable aleatoria:
( X = )
Entonces: [ X Poisson(= 3)] donde (= 3) es el número promedio esperado de eventos por unidad de tiempo.
Fórmula general
[ P(X = k) = ]
donde:
( e )
( = 3 )
( k = 0, 1, 2, )
Incisos del ejercicio
a) ¿Cuál es la probabilidad de que se reciban exactamente 2 quejas en una hora?
( P(X = 2) )
b) ¿Cuál es la probabilidad de que se reciban menos de 2 quejas?
( P(X < 2) = P(X = 0) + P(X = 1) )
c) ¿Cuál es la probabilidad de que se reciban como máximo 4 quejas?
Es probable que se reciban exactamente 2 quejas en una hora.
b
(P(X < 2))
0.199
Menos de 2 quejas por hora es poco frecuente.
c
(P(X ))
0.815
En el 81.5% de las horas habrá máximo 4 quejas.
d
(P(X > 4))
0.185
Solo el 18.5% de las horas supera 4 quejas.
e
(P(X ))
0.801
Hay un 80% de probabilidad de que lleguen al menos 2 quejas.
Propiedades de la distribución de Poisson
Propiedad
Expresión
Valor
Media
( E(X) = )
3
Varianza
( Var(X) = )
3
Desviación estándar
( = )
1.732
Interpretación final
El análisis muestra que:
Es muy probable (80%) que se reciban dos o más quejas por hora.
Casos extremos (más de 4 quejas) son menos frecuentes (18%), pero pueden requerir refuerzo de personal en ventanilla.
La media y varianza iguales (λ = 3) confirman que el proceso sigue un patrón aleatorio típico de eventos esporádicos en tiempo continuo, ideal para modelar llegadas o quejas.
Ver código
# -----------------------------------------------------------# EJERCICIO: Distribución de Poisson - Secretaría de Movilidad de Ibagué# Contexto: Promedio de 3 quejas ciudadanas por hora# Variable aleatoria: X = número de quejas por hora# Parámetro: lambda = 3# -----------------------------------------------------------# Definimos el parámetro de la distribuciónlambda <-3# a) Probabilidad de que se reciban exactamente 2 quejasp_igual_2 <-dpois(2, lambda)p_igual_2
[1] 0.2240418
Ver código
# b) Probabilidad de que se reciban menos de 2 quejasp_menor_2 <-ppois(1, lambda) # P(X < 2) = P(X <= 1)p_menor_2
[1] 0.1991483
Ver código
# c) Probabilidad de que se reciban como máximo 4 quejasp_menor_igual_4 <-ppois(4, lambda) # P(X <= 4)p_menor_igual_4
[1] 0.8152632
Ver código
# d) Probabilidad de que se reciban más de 4 quejasp_mayor_4 <-1-ppois(4, lambda) # P(X > 4)p_mayor_4
[1] 0.1847368
Ver código
# e) Probabilidad de que se reciban al menos 2 quejasp_mayor_igual_2 <-1-ppois(1, lambda) # P(X >= 2)p_mayor_igual_2
# -----------------------------------------------------------# (Opcional) Representación gráfica# Distribución de probabilidad de Poisson con λ = 3# -----------------------------------------------------------valores <-0:10probabilidades <-dpois(valores, lambda)barplot(probabilidades, names.arg = valores,main ="Distribución de Poisson (λ = 3)\nQuejas por hora - Secretaría de Movilidad",xlab ="Número de quejas (X)",ylab ="Probabilidad",col ="skyblue")
Gráfica Probabilidad
Ver código
# Parámetro lambda (media de eventos)lambda <-4x <-0:15# Distribución de probabilidadprob <-dpois(x, lambda)# Gráfica de probabilidadplot(x, prob, type ="h", lwd =3, col ="darkgreen",main ="Distribución Poisson - Probabilidad",xlab ="x", ylab ="P(X = x)")points(x, prob, pch =16, col ="darkgreen")
Gráfica Acumulada
Ver código
# Distribución acumuladaacum <-ppois(x, lambda)# Gráfica acumuladaplot(x, acum, type ="s", lwd =2, col ="purple",main ="Distribución Poisson - Acumulada",xlab ="x", ylab ="P(X ≤ x)")points(x, acum, pch =16, col ="purple")
Probabilidad de que se reciban exactamente 2 quejas p_igual_2 <- dpois(2, lambda) p_igual_2
Probabilidad de que se reciban menos de 2 quejas p_menor_2 <- ppois(1, lambda) # P(X < 2) = P(X <= 1) p_menor_2
Probabilidad de que se reciban como máximo 4 quejas p_menor_igual_4 <- ppois(4, lambda) # P(X <= 4) p_menor_igual_4
Probabilidad de que se reciban más de 4 quejas p_mayor_4 <- 1 - ppois(4, lambda) # P(X > 4) p_mayor_4
Probabilidad de que se reciban al menos 2 quejas p_mayor_igual_2 <- 1 - ppois(1, lambda) # P(X >= 2) p_mayor_igual_2
Sección
Descripción
dpois(k, lambda)
Calcula ( P(X = k) )
ppois(k, lambda)
Calcula ( P(X k) )
1 - ppois(k, lambda)
Calcula ( P(X > k) )
data.frame()
Muestra los resultados organizados
barplot()
Grafica la distribución de probabilidades
Inciso
Expresión
Probabilidad
a
( P(X = 2) )
0.2240
b
( P(X < 2) )
0.1992
c
( P(X ) )
0.8152
d
( P(X > 4) )
0.1848
e
( P(X ) )
0.8008
8 .DISTRIBICIÓN HIPERGEOMÉTRICA
Definición
La distribución hipergeométrica describe la probabilidad de obtener un número determinado de éxitos en una muestra sin reemplazo extraída de una población finita que contiene dos tipos de elementos: éxitos y fracasos.
Se utiliza cuando:
La población es finita.
Los elementos no se reemplazan después de ser seleccionados.
Se desea conocer la probabilidad de obtener un número específico de éxitos en una muestra.
Ejemplo contextual (Administración Pública)
Supón que la Secretaría de Movilidad de Ibagué tiene 20 funcionarios, de los cuales 8 son expertos en atención al ciudadano (éxitos) y los otros 12 no lo son (fracasos). Si se seleccionan 5 funcionarios al azar para atender una jornada especial, la distribución hipergeométrica permite calcular la probabilidad de que exactamente 3 de los seleccionados sean expertos.
Parámetros
Símbolo
Significado
( N )
Tamaño total de la población
( K )
Número total de éxitos en la población
( n )
Tamaño de la muestra seleccionada
( k )
Número de éxitos observados en la muestra
Función de probabilidad
[ P(X = k) = ]
donde:
( = ) es el coeficiente combinatorio.
( X ) es la variable aleatoria que representa el número de éxitos en la muestra.
Características principales
Concepto
Expresión
Descripción
Variable aleatoria
( X )
Número de éxitos en una muestra sin reemplazo
Dominio
( (0, n - (N - K)) X (n, K) )
Valores posibles de ( X )
Media
( E(X) = n )
Promedio esperado de éxitos en la muestra
Varianza
( Var(X) = n )
Dispersión o variabilidad de los resultados
Desviación estándar
( = )
Raíz cuadrada de la varianza
Interpretación
La hipergeométrica se diferencia de la binomial porque no hay reemplazo.
Se usa cuando la probabilidad cambia después de cada selección (por ejemplo, extraer expedientes o funcionarios de un grupo cerrado).
Hay un 23.85% de probabilidad de que, al seleccionar 5 funcionarios al azar, exactamente 3 sean expertos en atención al ciudadano. Esto permite planificar recursos humanos y garantizar una atención de calidad durante la jornada.
Propiedades clave de la distribución hipergeométrica
Propiedad
Descripción
Tipo de población: finita
Reemplazo: no existe (extracción sin reemplazo)
Dependencia: las selecciones no son independientes
Asimetría: depende de los valores relativos de ( N, K, n )
Relación con otras distribuciones: cuando ( N ) es grande y ( n/N ) es pequeño, se aproxima a la binomial ( B(n, p) ), con ( p = K/N ).
Usos frecuentes en la administración pública
Selección de auditorías o revisiones sin reemplazo.
Muestreo de documentos o expedientes en control interno.
Evaluación de desempeño de grupos pequeños de servidores.
Estudios de calidad de atención donde se revisa una muestra de casos sin repetirlos.
9 .Ejercicio: Distribución Hipergeométrica en la Administración Pública**
9.0.1Contexto
La Secretaría de Hacienda del Municipio de Ibagué está realizando un proceso de verificación de facturas en su sistema de contratación pública. Durante una auditoría se revisará una muestra de 10 facturas tomadas sin reemplazo de un total de 50 facturas emitidas en el mes.
De las 50 facturas, se sabe que 15 presentan inconsistencias (errores contables o faltantes de soportes), y el resto 35 son correctas.
Definimos la variable aleatoria: [ X = ] Entonces: [ X Hipergeométrica(N = 50,; K = 15,; n = 10)]
Datos del problema
Parámetro
Significado
Valor
( N )
Total de facturas revisadas
50
( K )
Facturas con error (éxitos)
15
( n )
Tamaño de la muestra
10
( X )
Facturas con error encontradas en la muestra
Variable aleatoria
Función de probabilidad
[ P(X = k) = ] donde ( = )
Incisos del ejercicio
a) ¿Cuál es la probabilidad de que en la muestra se encuentren exactamente 3 facturas con error?
(P(X = 3))
b) ¿Cuál es la probabilidad de que se encuentren menos de 3 facturas con error?
(P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2))
c) ¿Cuál es la probabilidad de que se encuentren como máximo 4 facturas con error?
d) ¿Cuál es la probabilidad de que se encuentren más de 4 facturas con error?
(P(X > 4) = 1 - P(X ))
e) ¿Cuál es la probabilidad de que se encuentren al menos 3 facturas con error?
(P(X ) = 1 - P(X < 3))
f) ¿Cuál es la probabilidad de que se encuentren entre 2 y 5 facturas con error (inclusive)?
(P(2 X ) = P(X ) - P(X ))
Cálculos (valores aproximados)
Usando la fórmula: [ P(X = k) = ]
Cálculos principales (redondeados a 4 decimales):
(k)
(P(X = k))
0
0.0350
1
0.1337
2
0.2384
3
0.2662
4
0.1921
5
0.0942
6
0.0321
7
0.0074
8
0.0010
9–10
≈ 0.0000
Resultados de los incisos
Inciso
Expresión
Resultado
Interpretación
a
(P(X = 3))
0.2662
Probabilidad de encontrar exactamente 3 facturas erradas es 26.6%.
b
(P(X < 3))
0.4071
Menos de 3 facturas con error ocurre el 40.7% de las veces.
c
(P(X ))
0.8654
En 86.5% de las muestras habrá 4 o menos errores.
d
(P(X > 4))
0.1346
Solo en 13.5% de los casos habrá más de 4 errores.
e
(P(X ))
0.5929
En casi 59.3% de las revisiones habrá al menos 3 errores.
f
(P(2 X ))
0.7910
Probabilidad de encontrar entre 2 y 5 errores es 79.1%.
Interpretación estadística y administrativa
Es muy probable (86%) que al revisar 10 facturas, se hallen 4 o menos con error.
Encontrar 3 facturas con error es el resultado más esperado (moda del modelo).
El hallazgo de más de 5 errores sería un caso atípico que justificaría una auditoría más profunda o revisión del contratista.
La distribución hipergeométrica permite modelar procesos de control interno en los que la revisión no es aleatoria con reemplazo, como ocurre con auditorías o verificaciones de documentos públicos.
Propiedades de la distribución hipergeométrica
Propiedad
Expresión
Descripción
Media (esperanza)
(E(X) = n )
Promedio de éxitos esperados en la muestra.
Varianza
(Var(X) = n )
Dispersión de los valores posibles.
Desviación estándar
(= )
Variación típica esperada.
Población finita
(N) es limitado y sin reemplazo.
Selección dependiente
Cada extracción afecta la probabilidad de las siguientes.
Aplicaciones comunes en la administración pública
Auditorías de contratos o facturas sin reemplazo.
Verificación de muestras documentales en archivos institucionales.
Evaluación de desempeño de funcionarios en equipos limitados.
Control de calidad de procesos administrativos o financieros.
Ver código
# -----------------------------------------------# DISTRIBUCIÓN HIPERGEOMÉTRICA - EJERCICIO ADMINISTRACIÓN PÚBLICA# Secretaría de Hacienda del Municipio de Ibagué# -----------------------------------------------# Parámetros del problemaN <-50# Total de facturasK <-15# Facturas con error (éxitos)n <-10# Tamaño de la muestra# Variable aleatoria: X = número de facturas con error encontradas# X ~ Hipergeométrica(N, K, n)# -----------------------------------------------# a) P(X = 3)px_igual_3 <-dhyper(3, K, N - K, n)# b) P(X < 3) = P(X <= 2)px_menor_3 <-phyper(2, K, N - K, n)# c) P(X <= 4)px_menor_igual_4 <-phyper(4, K, N - K, n)# d) P(X > 4) = 1 - P(X <= 4)px_mayor_4 <-1-phyper(4, K, N - K, n)# e) P(X >= 3) = 1 - P(X <= 2)px_mayor_igual_3 <-1-phyper(2, K, N - K, n)# f) P(2 <= X <= 5) = P(X <= 5) - P(X <= 1)px_entre_2_y_5 <-phyper(5, K, N - K, n) -phyper(1, K, N - K, n)# -----------------------------------------------# Crear una tabla con los resultadosresultados <-data.frame(Inciso =c("a) P(X = 3)", "b) P(X < 3)", "c) P(X ≤ 4)", "d) P(X > 4)", "e) P(X ≥ 3)", "f) P(2 ≤ X ≤ 5)"),Probabilidad =round(c(px_igual_3, px_menor_3, px_menor_igual_4, px_mayor_4, px_mayor_igual_3, px_entre_2_y_5), 4))print(resultados)
Inciso Probabilidad
1 a) P(X = 3) 0.2979
2 b) P(X < 3) 0.3616
3 c) P(X ≤ 4) 0.8751
4 d) P(X > 4) 0.1249
5 e) P(X ≥ 3) 0.6384
6 f) P(2 ≤ X ≤ 5) 0.8490
Ver código
# -----------------------------------------------# (Opcional) Graficar la distribución de probabilidadx <-0:10px <-dhyper(x, K, N - K, n)barplot(px, names.arg = x, col ="skyblue", main ="Distribución Hipergeométrica - Secretaría de Hacienda Ibagué",xlab ="Número de facturas con error (X)",ylab ="Probabilidad",ylim =c(0, max(px) +0.02))
Ver código
# Mostrar la media y la varianza teóricasmedia <- n * (K / N)varianza <- n * (K / N) * ((N - K) / N) * ((N - n) / (N -1))cat("\nMedia teórica (E[X]) =", round(media, 2))
# ParámetrosN <-50# tamaño total de la poblaciónK <-20# número de éxitos en la poblaciónn <-10# tamaño de la muestrax <-0:n# Distribución de probabilidadprob <-dhyper(x, K, N - K, n)# Gráfica de probabilidadplot(x, prob, type ="h", lwd =3, col ="darkorange",main ="Distribución Hipergeométrica - Probabilidad",xlab ="x", ylab ="P(X = x)")points(x, prob, pch =16, col ="darkorange")
Gráfica Acumulada
Ver código
# Distribución acumuladaacum <-phyper(x, K, N - K, n)# Gráfica acumuladaplot(x, acum, type ="s", lwd =2, col ="brown",main ="Distribución Hipergeométrica - Acumulada",xlab ="x", ylab ="P(X ≤ x)")points(x, acum, pch =16, col ="brown")