1. En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla” según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es 0.8, siendo la evaluación independiente entre equipos.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

Es de tipo de variable aleatoria discreta y su distribución corresponde a la binominal.

b) Determine la función de probabilidad de masa

masa = function(x){
  vector = c()
  contador = 0
  total = 0
  while (contador <= x) {
    valor = dbinom(contador,size=3, prob=0.8)
    vector[contador+1] = valor
    cat("La probabilidad de masa para", contador, "es", valor,"\n")
    total = total + valor
    contador = contador + 1
  } 
  cat("Al sumar todas las probabilidades de masa, da como resultado", total)
  return(vector)
}
vector = masa(3)
## La probabilidad de masa para 0 es 0.008 
## La probabilidad de masa para 1 es 0.096 
## La probabilidad de masa para 2 es 0.384 
## La probabilidad de masa para 3 es 0.512 
## Al sumar todas las probabilidades de masa, da como resultado 1

c) Grafique la distribución.

valores = c(0:3)
datos = data.frame(valores, vector)

grafico = ggplot(data=datos,aes(x=valores,y=vector))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades binominal")
grafico = grafico + xlab("Teléfonos funcionales") + ylab("Probabilidad")
plot(grafico)

2. En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la evaluación de una persona es independiente de otra:

a) Señale el tipo de variable aleatoria y la distribución que sigue.

Es de tipo de variable aleatoria discreta y su distribución es binominal negativa, dado que se deben realizar experimentos hasta que se encuentren 2 personas con el gen (casos favorables).

b) ¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen?

Dado que se deben evaluar como mínimo 4 personas, se tiene P(x >= 4) = 1 - P(x < 4) Ahora, para determinar P(x < 4), se debe sumar la probabilidad de P(2) y de P(3), dado que se pide que 2 personas sean portadoras de dicho gen. Para calcular P(2), P(3) y luego p(4) se tiene lo siguiente:

p_2 = dnbinom(x=(2-2), size=2, prob=0.1)
p_3 = dnbinom(x=(3-2), size=2, prob=0.1)
p_4 = 1-(p_2 + p_3)
paste("probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen es de", p_4)
## [1] "probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen es de 0.972"

c) ¿Cuál es el número esperado de evaluaciones que debo realizar para detectar dos personas portadoras del gen?

Para responder la pregunta anterior, se debe calcular la esperanza, la cual se determina como:

esperanza = (2/0.1)
paste("Luego, se espera que se deban realizar", esperanza, "personas para detectar a dos personas portadoras del gen")
## [1] "Luego, se espera que se deban realizar 20 personas para detectar a dos personas portadoras del gen"

d) Grafique la distribución.

3.Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

Es de tipo de variable aleatoria discreta y su distribución es hipergeométrica, dado que de los 800 hombres solo se analizará a 10 de ellos, es decir se toma una muestra.

b) Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que exactamente 1 hombre tenga el marcador?

De lo anterior, se sabe que m corresponde a los hombres que poseen el cromosoma, n corresponde al total de hombres menos los hombres que podrían tener el cromosoma (m), x a los casos de éxito y k a la muestra. Luego se tiene lo siguiente:

prob_cromosoma = dhyper(x=1, m=(800*0.3), k=10, n= (800-(800*0.3)))
paste("La probabilidad de que exactamente 1 hombre tenga el marcador de los 10 que se les realiza la prueba, es de", prob_cromosoma)
## [1] "La probabilidad de que exactamente 1 hombre tenga el marcador de los 10 que se les realiza la prueba, es de 0.120079449685738"

c) Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que más de 1 tenga el marcador?

Dado que se pide que sea más de 1 hombre que tenga el cromosoma, se tiene P(x > 1) = 1 - P(x <= 1) = 1 - (P(1) + P(0)). Luego:

prob_cromosoma_0 = dhyper(x=0, m=(800*0.3), k=10, n= (800-(800*0.3)))
prob = 1 - prob_cromosoma - prob_cromosoma_0
paste("La probabilidad de que más de 1 hombre tenga el marcador de los 10 que se les realiza la prueba, es de", prob)
## [1] "La probabilidad de que más de 1 hombre tenga el marcador de los 10 que se les realiza la prueba, es de 0.852352309990578"

d) Grafique la distribución

4. El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

Es de tipo de variable aleatoria discreta y su distribución es poisson, dado que existe una frecuencia de concurrencia (8 llamadas por hora).

b) ¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?

De lo anterior, se tiene que lambda corresponde a 8, dado que son 8 llamadas por hora, por otro lado, x = 5, dado que se pide que sean exactamente dicho valor de llamadas en una hora.

prob_5 = dpois(5,8)
paste("La probabilidad de que haya exactamente cinco llamadas en una hora es de", prob_5)
## [1] "La probabilidad de que haya exactamente cinco llamadas en una hora es de 0.0916036615925792"

c) ¿Cuál es la probabilidad de que haya tres llamadas o menos en una hora?

De la pregunta anterior, se sabe que P(x <= 3) = P(0) + P(1) + P(2) + P(3). Luego, se tiene lo siguiente:

prob_0 = dpois(0,8)
prob_1 = dpois(1,8)
prob_2 = dpois(2,8)
prob_3 = dpois(3,8)
prob_acumulada = prob_0 + prob_1 + prob_2 + prob_3
paste("La probabilidad de que haya tres llamadas o menos en una hora es de", prob_acumulada)
## [1] "La probabilidad de que haya tres llamadas o menos en una hora es de 0.042380111991684"

5. Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos.

Dado que cada cirujía demora 129 minutos y son 10, entonces, la media = 10 x 129 = 1290. Por otro lado, a la varianza se le debe multiplicar el número de cirujias que es 10, luego la varianza = 14 x 14 x 10 = 1960,

6.Aborde los ejercicios 1 y 4 efectuando una aproximación mediante una distribución normal. ¿Qué puede concluir?

Para el ejercicio 1, se tiene lo siguiente:

X = (3+0.5-3*0.8)/sqrt(3*0.8*(1-0.8))
probabilidad_1 = pnorm(X,0,1)
np_1 = 3*0.8
paste("Al efectuar una aproximacion mediante una distribución normal para el ejercicio 1, se obtiene una probabilidad de", probabilidad_1, ", el valor de np =", np_1, "y el valor de n(1-p) =", (3*(1-0.8)))
## [1] "Al efectuar una aproximacion mediante una distribución normal para el ejercicio 1, se obtiene una probabilidad de 0.943824401154768 , el valor de np = 2.4 y el valor de n(1-p) = 0.6"

Dado que n*p y n(1-p) son menores a 5, la aproximación no es buena # Para el ejercicio 4.b, se tiene lo siguiente:

lambda = 8
X = (5-lambda)/sqrt(lambda)
probabilidad_4b = pnorm(X,0,1)
paste("Al efectuar una aproximacion mediante una distribución normal para el ejercicio 4b, se obtiene una probabilidad de", probabilidad_4b, ", el valor calculado en 4b =", prob_5, "y el valor de lambda es", lambda)
## [1] "Al efectuar una aproximacion mediante una distribución normal para el ejercicio 4b, se obtiene una probabilidad de 0.144422183173242 , el valor calculado en 4b = 0.0916036615925792 y el valor de lambda es 8"

Dado que lambda es mayor a 5, esta es una buena aproximación, sin embargo, no se aproxima al valor calculado en el ejercicio 4b.

Para el ejercicio 4.c, se tiene lo siguiente:

lambda = 8
X0 = (0-lambda)/sqrt(lambda)
X1 = (1-lambda)/sqrt(lambda)
X2 = (2-lambda)/sqrt(lambda)
X3 = (3-lambda)/sqrt(lambda)
probabilidad_4c = pnorm(X0,0,1) + pnorm(X1,0,1) + pnorm(X2,0,1) + pnorm(X3,0,1)
paste("Al efectuar una aproximacion mediante una distribución normal para el ejercicio 4b, se obtiene una probabilidad de", probabilidad_4c, ", la probabilidad de 4c =", prob_acumulada, "y el valor de lambda es", lambda)
## [1] "Al efectuar una aproximacion mediante una distribución normal para el ejercicio 4b, se obtiene una probabilidad de 0.064500394515048 , la probabilidad de 4c = 0.042380111991684 y el valor de lambda es 8"

Dado que lambda es mayor a 5, esta es una buena aproximación, sin embargo, no se acerca al valor calculado en el ejercico 4c.