En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla” según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es 0.8, siendo la evaluación independiente entre equipos
Señale el tipo de variable aleatoria y la distribución que sigue. Tenemos una variable aleatoria discreta y distribución binomial.
Determine la función de probabilidad de masa.
## Función de probabilidad
probDeMasa <- function(x){
factorial(3)/(factorial(x) * factorial(3-x)) * 0.8^x * (1-0.8)^(3-x)
}
probDeMasa(3)
## [1] 0.512
rango <- seq(0,3)
distribucion <- dbinom(rango,3,prob=0.8)
datos = data.frame(rango, distribucion)
grafico = ggplot(data=datos,aes(x=rango,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Probabilidad telefonos sin fallas entre 3")
grafico = grafico + xlab("Rango") + ylab("Probabilidades")
plot(grafico)
print(datos)
## rango distribucion
## 1 0 0.008
## 2 1 0.096
## 3 2 0.384
## 4 3 0.512
En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la evaluación de una persona es independiente de otra:
Señale el tipo de variable aleatoria y la distribución que sigue. Tenemos una variable aleatoria discreta (exito o fallo) y distribución de bernoulli.
¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen?
evaluaciones <- seq(0,3)
dis <- dbinom(2,size = evaluaciones, prob=0.1)
1-sum(dis)
## [1] 0.963
## La esperanza se calcula como n*p
esperanza = 2*0.1
esperanza
## [1] 0.2
personasEvaluadas = seq(4,100)
portadoresGen = 2
distribucion = dnbinom(x=personasEvaluadas, size = portadoresGen, prob = 0.1)
datos=data.frame(personasEvaluadas,distribucion)
grafico = ggplot(data=datos,aes(x=personasEvaluadas,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)
Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.
Señale el tipo de variable aleatoria y la distribución que sigue. Es una variable aleatoria discreta y bernoulli
Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que exactamente 1 hombre tenga el marcador?
muestra = 10
exitos = 1
probDeExito = 0.3
unoMarcado = dbinom(exitos,size=muestra,prob = probDeExito)
unoMarcado
## [1] 0.1210608
masDeUno = dbinom(0,size=muestra,prob = probDeExito)
1 - masDeUno
## [1] 0.9717525
consultados = 10
exito = seq(0,10)
distribucion = dbinom(exito, size = consultados, prob = 0.3)
datos=data.frame(consultados,distribucion)
grafico = ggplot(data=datos,aes(x=exito,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Probabilidad de obtener x hombres de 10 con el gen")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)
El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.
Señale el tipo de variable aleatoria y la distribución que sigue. el tipo de variable aleatoria es discreta y la distribución de Poisson.
¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?
dpois(5,8)
## [1] 0.09160366
sum(dpois(seq(0,3),8))
## [1] 0.04238011
Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos.
Ya que se realizó un estudio a muchos hospitales con más de 300 cirujías al año, y se tiene la media de cada una de las cirujías que se van a realizar durante el día en cada hospital, esta corresponde a 129 minutos. Ahora, también nos preguntan cuál es la varianza del tiempo total, este valor lo podemos encontrar, dado que tenemos como resultado del estudio la desviación estandar, podemos elevar al cuadrado la desviación estandar obtenida y encontrar la varianza, de este modo, la varianza es 196 minutos.
Aborde los ejercicios 1 y 4 efectuando una aproximación mediante una distribución normal. ¿Qué puede concluir?