1. En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla” según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es 0.8, siendo la evaluación independiente entre equipos.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

La categorización de cada pieza corresponde a una variable aleatoria discreta, con una distribución binomial, dado que cuenta el número de éxitos (funcional) en tres ensayos independientes entre sí, con una probabilidad fija de ocurrencia.

b) Determine la función de probabilidad de masa.

funcionProbMasa = function(n,x,p){
  return (factorial(n)*(p^x)*((1-p)^(n-x))/(factorial(x)*factorial(n-x)))
}

# Además, podemos obtener las probabilidades con la función de probabilidad de masa
p1 = funcionProbMasa(3,0,0.8)
p1
## [1] 0.008
p2=funcionProbMasa(3,1,0.8)
p2
## [1] 0.096
p3=funcionProbMasa(3,2,0.8)
p3
## [1] 0.384
p4=funcionProbMasa(3,3,0.8)
p4
## [1] 0.512

c) Grafique la distribución

2. En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la evaluación de una persona es independiente de otra:

a) Señale el tipo de variable aleatoria y la distribución que sigue.

Corresponde a una variable aleatoria discreta y sigue una distribución binomial negativa, dado que realiza una cierta cantidad de ensayos hasta encontrar un caso favorable (aparición del gen). Además, cada experimento es independiente de los demás.

b) ¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen?

print("La probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen es de:")
## [1] "La probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen es de:"
print(1-((dnbinom(x=2, size=2, prob=0.1))+(dnbinom(x=3, size=2, prob=0.1))))
## [1] 0.94654

c) ¿Cuál es el número esperado de evaluaciones que debo realizar para detectar dos personas portadoras del gen?

# Esperanza
E = 2/0.1
print("El número de esperado de evaluaciones necesarias para detectar a dos personas portadoras del gen es:")
## [1] "El número de esperado de evaluaciones necesarias para detectar a dos personas portadoras del gen es:"
print(E)
## [1] 20

d) Grafique la distribución.

3. Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

Es una variable aleatoria discreta, con una distribución hipergeométrica, ya que se mide la cantidad de apariciones de un marcador en el cromosona Y dentro del subconjunto de 800 hombres menores de 55 años.

b) Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que exactamente 1 hombre tenga el marcador?

hombres = 800 # N 
hombres_marcador = 240 # K
hombres_sanos = hombres - hombres_marcador # N - K
subconjunto = 10 # n
exitos = 1 # Exitos
print("La probabilidad de que un hombre tenga el marcador es de:")
## [1] "La probabilidad de que un hombre tenga el marcador es de:"
print(dhyper(x=exitos, m=hombres_marcador, k=subconjunto, n=hombres_sanos))
## [1] 0.1200794

c) Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que más de 1 tenga el marcador?

hombres = 800 # N 
hombres_marcador = 240 # K
hombres_sanos = hombres - hombres_marcador # N - K
subconjunto = 10 # n
exitos = 1 # Exitos
print("La probabilidad de que más de un hombre tenga el marcador es de:")
## [1] "La probabilidad de que más de un hombre tenga el marcador es de:"
print(1 - dhyper(x=exitos, m=hombres_marcador, k=subconjunto, n=hombres_sanos)-dhyper(x=0, m=hombres_marcador, k=subconjunto, n=hombres_sanos))
## [1] 0.8523523

d) Grafique la distribución

4. El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

Corresponde a una variable aleatoria discreta que sigue una distribución de Poisson, porque a partir de la frecuencia media de llamadas, puede calcular la cantidad de llamadas que llegan a la central en un intervalo de tiempo.

b) ¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?

frecuencia = 8
llamadas = 5
print("La probabilidad de que hayan cinco llamadas en una hora es de:")
## [1] "La probabilidad de que hayan cinco llamadas en una hora es de:"
print(dpois(llamadas,frecuencia))
## [1] 0.09160366

c) ¿Cuál es la probabilidad de que haya tres llamadas o menos en una hora?

frecuencia = 8

print("La probabilidad de que hayan máximo tres llamadas en una hora es de:")
## [1] "La probabilidad de que hayan máximo tres llamadas en una hora es de:"
print(dpois(0,frecuencia) + dpois(1,frecuencia) + dpois(2,frecuencia) + dpois(3,frecuencia))
## [1] 0.04238011

5. Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos.

media = 129 * 10
varianza = 14*14*10
print("La media del tiempo total para completar las cirugías es de:")
## [1] "La media del tiempo total para completar las cirugías es de:"
print(media)
## [1] 1290
print("Además, la varianza es de:")
## [1] "Además, la varianza es de:"
print(varianza)
## [1] 1960

6. Aborde los ejercicios 1 y 4 efectuando una aproximación mediante una distribución normal. ¿Qué puede concluir?

# Ejercicio 1
x=3
p=0.8
n=3
X=(x+0.5-n*p)/sqrt(n*p*(1-p))
probabilidad=pnorm(X,0,1) 
print(probabilidad)
## [1] 0.9438244
# Se puede concluir que no es una buena aproximación, dado que np y n(1-p) son menores a 5, lo cual es requisito para obtener un resultado correcto.
np = n*p
np
## [1] 2.4
n_p = n*(1-p)
n_p
## [1] 0.6
# Ejercicio 4b
x=5
lambda=8
X=(x-lambda)/sqrt(lambda)
probabilidad=pnorm(X,0,1)
print(probabilidad) 
## [1] 0.1444222
# Ejercicio 4c
x=3
lambda=8
X=(x-lambda)/sqrt(lambda)
probabilidad=pnorm(X,0,1)
print(probabilidad) 
## [1] 0.03854994
# A pesar de que las aproximaciones deben ser correctas, dado que lambda es mayor a 5, el resultado obtenido no es cercano a los calculados anteriormente.