Ejercicios 03

1. En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por
trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla”
según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es
0.8, siendo la evaluación independiente entre equipos.
a) Señale el tipo de variable aleatoria y la distribución que sigue.
b) Determine la función de probabilidad de masa.
c) Grafique la distribución.

a ) El tipo de variable aleatoria que podemos ver en el proceso de fabricación de teléfonos corresponde a una variable númerica y del tipo discreta debido a los resultados que podemos obtener, es decir, cantidad de teléfonos funcionales y cuantos están defectuosos o con fallas.

La distribución que sigue es del tipo Binomial.
b ) La función de probabilidad de masa se da por la siguiente función:

bim_funct = function(x){
  factorial(3)/(factorial(x)*factorial(3-x)) *0.8^x * 0.2^(3-x)
}
prob1=bim_funct(0)
prob2=bim_funct(1)
prob3=bim_funct(2)
prob4=bim_funct(3)

c ) Para graficar la distribución

x = c(0,1,2,3)
y = c(prob1, prob2, prob3, prob4)
datos = data.frame(x, y)
graph1 = ggplot(datos, aes(x = x, y = y)) + geom_bar(stat = "identity", fill = "darkgreen")
graph1 = graph1 + theme_bw() + ggtitle("Distribución binomial (Fabricación de teléfonos)")
graph1 = graph1 + xlab("Número de casos exitosos") + ylab("Probabilidades")
plot(graph1)

2. En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la
evaluación de una persona es independiente de otra:
a) Señale el tipo de variable aleatoria y la distribución que sigue.
b) ¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas
para detectar a dos personas portadoras del gen?
c) ¿Cuál es el número esperado de evaluaciones que debo realizar para detectar
dos personas portadoras del gen?
d) Grafique la distribución.

a ) Parecido al caso anterior en este caso también estamos frente a una variable aleatoria del tipo númerica y discreta pero a diferencia del caso de la fabricación de teléfonos acá tenemos una distribución del tipo binomial negativa.
b ) Para dar respuesta a esta pregunta primeramente debemos conocer la fórmula la cual es la siguiente:

Distro Binom Negativa Esta fórmula está integrada en la herramienta rstudio por lo que podemos simplemente llamarla como pnbinom.

dos_resultado_b=(1-pnbinom(1,2,0.1))
dos_resultado_b

## [1] 0.972

c ) Esa pregunta apunta hacia la esperanza relacionada con la distribución binomial negativa, esta la obtenemos dividiendo r entre p. Para este caso el valor de r es igual a 2 y el de p es igual 0.1.

r=2
p=0.1
dos_resultado_c= r/p
dos_resultado_c

## [1] 20

d ) Se llevará a cabo el gráfico de la distribución con 50 personas:

cantpersonas = seq(0,49)
distro = dnbinom(cantpersonas, 2, prob=0.1)
data=data.frame(cantpersonas,distro)

dos_graph_d = ggplot(data=data,aes(x=cantpersonas,y=distro))
dos_graph_d = dos_graph_d + geom_bar(stat="identity",fill="darkgreen")
dos_graph_d = dos_graph_d + theme_bw() + ggtitle("Distribución binomial negativa (Estudio clínico)")
dos_graph_d = dos_graph_d + xlab("Cantidad de personas") + ylab("Probabilidades")
plot(dos_graph_d)

3. Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.
a) Señale el tipo de variable aleatoria y la distribución que sigue.
b) Si a 10 hombres de la empresa se les hace la prueba del marcador en este
cromosoma, ¿cuál es la probabilidad de que exactamente 1 hombre tenga el marcador?
c) Si a 10 hombres de la empresa se les hace la prueba del marcador en este
cromosoma, ¿cuál es la probabilidad de que más de 1 tenga el marcador?
d) Grafique la distribución

a ) El tipo de variable que se encuentra en este caso es del tipo numérica discreta y la distribución seguida es Hipergeométrica, esto se sabe debido a que se conoce el tamaño de la población.
b ) Antes de proceder al cálculo debemos conocer la fórmula con la que se trabaja una distribución hipergeométrica, esta es la siguiente: Al igual que en el caso anterior la herramienta para trabajar con esta distribución ya está implementada, esta es, “dhyper”. Por lo que resolvemos.

tres_resultado_b=dhyper(x=1,m=240,k=10,n=560)
tres_resultado_b

## [1] 0.1200794

c ) Para resolver esto debemos ajustar el x y restar 1.

tres_resultado_c=1 - (dhyper(x = 1, m = 240, k = 10, n = 560)) - (dhyper(x = 0, m = 240, k = 10, n = 560))
tres_resultado_c

## [1] 0.8523523

d ) Se llevará a cabo el gráfico con 20 personas

cantpersonas = seq(0,19)
distro = dhyper(x=cantpersonas, m=240, k=20, n=500)
data=data.frame(cantpersonas,distro)

tres_graph_d = ggplot(data=data,aes(x=cantpersonas,y=distro))
tres_graph_d = tres_graph_d + geom_bar(stat="identity",fill="darkgreen")
tres_graph_d = tres_graph_d + theme_bw() + ggtitle("Distribución hipergeométrica (Caso de empresa)")
tres_graph_d = tres_graph_d + xlab("Cantidad de personas") + ylab("Probabilidades")
plot(tres_graph_d)

4. El número de llamadas telefónicas que llegan a una central telefónica se modela como una
variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.
a) ¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?
b) ¿Cuál es la probabilidad de que haya tres llamadas o menos en una hora?

a )Nos indican que se debe trabajar con distribución de Poisson para trabajar con esta tenemos que: Esamos interesados en el tiempo por lo que sabemos que es una variable del tipo discreta, ocupamos la herramienta “dpois”.

cuatro_resultado_a = dpois(5,8)
cuatro_resultado_a

## [1] 0.09160366

Estas son las probabilidades de que hayan 5 llamadas en una hora.

cuatro_resultado_b=ppois(3, 8, lower.tail=T)
cuatro_resultado_b

## [1] 0.04238011

Probabilidades de que haya 3 o menos llamadas en el tramo de una hora.

5. Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider
Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos.

Primeramente debemos encontrar la media para luego dar con la varianza, entonces tenemos que:

# MEDIA
cinco_resultado_media=129*10
cinco_resultado_media

## [1] 1290

# VARIANZA
cinco_resultado_varianza=100*(14*14)
cinco_resultado_varianza

## [1] 19600

6. Aborde los ejercicios 1 y 4 efectuando una aproximación mediante una distribución
normal. ¿Qué puede concluir?

Ejercicio 1 ) Para poder concluir debemos calcular media y desviación.

avg=0.8*3
desv=sqrt((0.8*0.2*3))
distro1=pnorm((3.5-avg)/desv)
distro1

## [1] 0.9438244

Ahora calculamos inexactitud de la aproximación.

p=0.8
n=3
inex=n*p
inex

## [1] 2.4

p=0.8
n=3
n*(1-p)

## [1] 0.6

A raíz de esto se puede concluir que a causa de que estos valores que se han calculado todos rondan debajo a 5 podemos concluir que la aproximación no es buena. - Ejercicio 4 )

value = (5 - 8)/(sqrt(8))
aprox= pnorm(value, 0, 1)
aprox

## [1] 0.1444222

value0 = (0-8)/(sqrt(8))
value1 = (1-8)/(sqrt(8))
value2 = (2-8)/(sqrt(8))
value3 = (3-8)/(sqrt(8))
aprox= pnorm(value0, 0, 1) + pnorm(value1, 0, 1) + pnorm(value2, 0, 1) + pnorm(value3, 0, 1)
aprox

## [1] 0.06450039

Al tener que lambda toma un valor que es mayor a 5, se puede concluir que las aproximaciones no son buenas.

Ejercicios 03

Bastián Olea Díaz