En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla” según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es 0.8, siendo la evaluación independiente entre equipos.
rango = seq(0,3)
distribucion = dbinom(rango, size = 3, prob = 0.8)
datos=data.frame(rango,distribucion)
grafico = ggplot(data=datos,aes(x=rango,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)
En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la evaluación de una persona es independiente de otra:
evaluaciones = seq(2,3)
personas_portadoras=2
distribucion = dnbinom(personas_portadoras, size=evaluaciones, prob=0.1)
1- sum(distribucion)
## [1] 0.97084
esperanza = 2/0.1
esperanza
## [1] 20
# siendo 2 el numero de personas portadoras del gen(r casos faorables)
# y 0.1 la probabilidad de que una persona tenga el gen
evaluaciones = seq(2,50)
personas_portadoras=2
distribucion = dnbinom(x=evaluaciones, size=personas_portadoras, prob=0.1)
datos=data.frame(evaluaciones,distribucion)
#Gráfico
grafico = ggplot(data=datos,aes(x=evaluaciones,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución
binomial negativa")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)
Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.
h_totales=800
h_con_marcador=h_totales*0.3
h_sin_marcador = h_totales - h_con_marcador
distribucion = dhyper(x=1, m=h_con_marcador, n=h_sin_marcador, k=10)
distribucion
## [1] 0.1200794
exitos=seq(2,10)
h_totales=800
h_con_marcador=h_totales*0.3
h_sin_marcador = h_totales - h_con_marcador
distribucion = dhyper(x=exitos, m=h_con_marcador, n=h_sin_marcador, k=10)
sum(distribucion)
## [1] 0.8523523
exitos=seq(2,10)
h_totales=800
h_con_marcador=h_totales*0.3
h_sin_marcador = h_totales - h_con_marcador
distribucion = dhyper(x=exitos, m=h_con_marcador, n=h_sin_marcador, k=10)
datos=data.frame(exitos,distribucion)
#Gráfico
grafico = ggplot(data=datos,aes(x=exitos,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución hipergeométrica")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)
El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.
promedio_llamadas=8
prob= dpois(5, promedio_llamadas)
prob
## [1] 0.09160366
promedio_llamadas=8
tres_o_menos = seq(0,3)
prob=dpois(tres_o_menos, promedio_llamadas)
prob
## [1] 0.0003354626 0.0026837010 0.0107348041 0.0286261442
Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos. Media:
media = 129 * 10
media
## [1] 1290
Varianza:
desvE= 14
varianza_total = desvE^2 * 10
varianza_total
## [1] 1960