Ejercicio 03: Distribuciones de probabilidad

#library("Rlab")
library("ggplot2")

1. En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla” según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es 0.8, siendo la evaluación independiente entre equipos.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

El tipo de variable aleatoria es discreta y la distribución corresponde a la binomial porque tenemos dos resultado: “funcional” y “con falla”.

b) Determine la función de probabilidad de masa.

Determinaremos la funcion de probabilidad con la distribución binomial.

\[ f(x)=\binom{n}{x}*p^x(1-p)^{n-x} =\frac{n!}{x!(n-x)!}*p^x(1-p)^{n-x} \] Donde x = [0,1,2,3,…,n]

R nos ofrece la función dbinom para calcular la funcion de probabilidad, procedemos entonces a usarla.

dbinom(0,3,0.8)

## [1] 0.008

dbinom(1,3,0.8)

## [1] 0.096

dbinom(2,3,0.8)

## [1] 0.384

dbinom(3,3,0.8)

## [1] 0.512

Al ser una funcion de probabilidad, se debe cumplir que la suma de cada una de las probabilidad es 1.

sum(dbinom(0:3,3,0.8))

## [1] 1

c) Grafique la distribución.

rango = seq(0,3)
distribucion = dbinom(rango,3,0.8)
datos=data.frame(rango,distribucion)
grafico = ggplot(datos,aes(x=rango,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución binomial")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)

2. En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la evaluación de una persona es independiente de otra:

a) Señale el tipo de variable aleatoria y la distribución que sigue.

Esta variable aleatoria es de tipo discreta y la distribución que sigue es binomial negativa.

b) ¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas

para detectar a dos personas portadoras del gen?

Usaremos la función pnbinom para hallar la probabilidad de detectar a una o cero personas portadoras del gen y hallaremos su complemento para así obtener la probabilidad que buscamos.

print(1-pnbinom(1, size=2, prob=0.1))

## [1] 0.972

c) ¿Cuál es el número esperado de evaluaciones que debo realizar para detectar

dos personas portadoras del gen?

Al decir número esperado concluimos que se refiere a esperanza. La esperanza de la distribución binomial negativa es:

r=2
p=0.1
espdbinom = r / p
espdbinom

## [1] 20

d) Grafique la distribución.

#Consideremos a 10 personas
num_personas = seq(0,10)
distribucion = dnbinom(x=num_personas, size=2, prob=0.1)
datos=data.frame(num_personas,distribucion)
grafico = ggplot(data=datos,aes(x=num_personas,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución binomial negativa")
grafico = grafico + xlab("Numero de personas") + ylab("Probabilidad")
plot(grafico)

3. Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

b) Si a 10 hombres de la empresa se les hace la prueba del marcador en este

cromosoma, ¿cuál es la probabilidad de que exactamente 1 hombre tenga el marcador?

Los elementos asociados al evento exitoso es el 30% de los 800 hombres, o sea, 240, los elementos asociados al evento fallido será en este caso 560.

exito=1 #Corresponde al hombre elejido con el marcador
marcados=240 #Corresponde a los elementos del evento exitoso
evaluados=10 #Corresponde a esos 10 hombre que se van a evaluar
nomarcados=560 #Corresponde a los elementos del evento fallido
print(dhyper(x = exito, m = marcados, k = evaluados, n = nomarcados))

## [1] 0.1200794

c) Si a 10 hombres de la empresa se les hace la prueba del marcador en este

cromosoma, ¿cuál es la probabilidad de que más de 1 tenga el marcador?

print(phyper(q=10,m=240,k=10,n=560)-phyper(q=1,m=240,k=10,n=560))

## [1] 0.8523523

d) Grafique la distribución

exitos=seq(0:10) #Exitos
distribucion = dhyper(x = exitos, m = marcados, k = evaluados, n = nomarcados)
datos=data.frame(exitos,distribucion)
grafico = ggplot(data=datos,aes(x=exitos,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución de 
probabilidades")
grafico = grafico + xlab("Personas") + ylab("Probabilidad")
plot(grafico)

4. El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.

a) ¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?

Se tiene 5 como valor de x y 8 como valor de lambda puesto a que hay 8 llamadas en promedio por hora y en la pregunta se mantiene que sea en una hora.

dpois(5,8)

## [1] 0.09160366

b) ¿Cuál es la probabilidad de que haya tres llamadas o menos en una hora?

En este caso, usaremos la funcion ppois para hallar P(X<=3), con q igual a 3 y lambda igual a 8.

ppois(3,8)

## [1] 0.04238011

5. Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos.

tiempo_medio=129
desviación_estandar=14
#media
media_total=129*10 #10 por la necesidad de programar 10 cirugías
print(media_total)

## [1] 1290

#varianza
varianza = desviación_estandar^(2)*10^(2)
print(varianza)

## [1] 19600

6. Aborde los ejercicios 1 y 4 efectuando una aproximación mediante una distribución normal. ¿Qué puede concluir?

Aproximando ejercicio 1 con distribución normal.

x=3
n=3
p=0.8
z=(x+0.5-n*p)/sqrt(n*p*(1-p))
pnorm(z,0,1)

## [1] 0.9438244

Para verificar si la aproximación con la distribución normal es buena se debe realizar el producto de n con p, y si el resultado es mayor a 5 entonces es buena aproximación.

print(n*p)

## [1] 2.4

Se concluye que no es buena aproximación y que los valores son distantes.

Aproximando ejercicio 4a con distribución normal.

X=5
lambda=8
z = function(k,lambda){return((k-lambda)/sqrt(lambda))}
pnorm(z(X,lambda),0,1)

## [1] 0.1444222

Aproximando ejercicio 4b con distribución normal.

X=(0:3)
sum(pnorm(z(X,lambda),0,1))

## [1] 0.06450039

Para que sea considerada buena aproximación el lambda debe ser mayor que 5, ese caso lo cumple, pero los valores son bastante diferentes, por lo tanto no se puede concluir que es buena aproximación.

Ejercicio 03: Distribuciones de probabilidad

José Marín

2022-10-08

a) Señale el tipo de variable aleatoria y la distribución que sigue.

b) Determine la función de probabilidad de masa.

c) Grafique la distribución.

2. En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la evaluación de una persona es independiente de otra:

a) Señale el tipo de variable aleatoria y la distribución que sigue.

b) ¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas

c) ¿Cuál es el número esperado de evaluaciones que debo realizar para detectar

d) Grafique la distribución.

3. Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.

a) Señale el tipo de variable aleatoria y la distribución que sigue.

b) Si a 10 hombres de la empresa se les hace la prueba del marcador en este

c) Si a 10 hombres de la empresa se les hace la prueba del marcador en este

d) Grafique la distribución

4. El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.

a) ¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?

b) ¿Cuál es la probabilidad de que haya tres llamadas o menos en una hora?

6. Aborde los ejercicios 1 y 4 efectuando una aproximación mediante una distribución normal. ¿Qué puede concluir?