1.En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla” según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es 0.8, siendo la evaluación independiente entre equipos.

-Señale el tipo de variable aleatoria y la distribución que sigue.

La variable aleatoria corresponde a una variable del tipo discreta. La distribucion que sigue es una distribucion Binomial, ya que se realizan 3 eventos que siguen la distribucion de Bernoulli.

-Determine la función de probabilidad de masa.

La siguiente funcion definida en R corresponde a la funcion de probabilidad o masa de probabilidad para un x entre 0 y 3:

masaTelefonos <- function(x){
  factorial(3)/(factorial(x)*factorial(3-x)) * 0.8^x * (1-0.8)^(3-x)
}
masaTelefonos(3)
## [1] 0.512
-Grafique la distribución
rango <- seq(0,3)
distribucion <- dbinom(rango,3,prob=0.8)
datos = data.frame(rango,distribucion)

grafico = ggplot(data=datos,aes(x=rango,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Probabilidad de telefonos sin fallas de entre 3")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)

2.En un estudio clínico, los voluntarios son examinados para encontrar un gen asociado a la aparición del cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la evaluación de una persona es independiente de la otra:

-Señale el tipo de variable aleatoria y la distribucion que sigue.

La variable es del tipo discreta (toma valores de 1 o 0, exito o fallo). La distribucion que se sigue en este caso es de Bernoulli.

-¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen?

consultados <- seq(0,3)
distribucion <- dbinom(2,size=consultados, prob=0.1)
1-sum(distribucion)
## [1] 0.963

-¿Cuál es el número esperado de evaluaciones que debo realizar para detectar dos personas portadoras del gen?

Para este caso, se debe considerar una distribucion binomial negativa, especificamente la esperanza de este caso, ya que se requiere buscar el valor esperado para obtener una cantidad de casos “exitosos”. Esto se realizaria de la siguiente manera:

#esperanza binomial negativa
#E[x]=r/p, donde r corresponde a la cantidad de casos favorables esperados y p la probabilidad de exito
esperanza <- 2/0.1
esperanza
## [1] 20

-Grafique la distribución.

#Establecimiento de datos
examinados <- seq(0,100)
positivos <- 2
distribucion <- dbinom(positivos,size=examinados, prob=0.1)
datos <- data.frame(examinados,distribucion)
#creacion del grafico
grafico = ggplot(data=datos,aes(x=examinados,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("probabilidad de detectar a 2 personas")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)

3. Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.

-Señale el tipo de variable aleatoria y la distribución que sigue

La variable es del tipo discreta y sigue una distribucion de bernoulli

-Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que exactamente 1 hombre tenga el marcador?

En este caso, el tipo de distribucion que se sigue es binomial negativa

consultados <- 10
marcado <- 1
distribucion <- dbinom(marcado, size=consultados, prob=0.3)
distribucion
## [1] 0.1210608

-Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que más de 1 tenga el marcador?

En este caso se utiliza una distribucion de tipo binomial, donde queremos saber la probabilidad de que el evento tenga 1 o mas eventos exitosos.

#
consultados <- 10
distribucion <- dbinom(0, size=consultados, prob=0.3)
1-sum(distribucion)
## [1] 0.9717525

-Grafique la distribución

Se graficará la posibilidad de que x personas posean el gen:

consultados <- 10
exitos <- seq(0,10)
distribucion <- dbinom(exitos,size=consultados,prob=0.3)
datos <- data.frame(consultados,distribucion)

grafico = ggplot(data=datos,aes(x=exitos,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("probabilidad x hombres con el gen de 10")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
plot(grafico)

4. El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.

-Señale el tipo de variable aleatoria y la distribución que sigue.

El tipo de variable que posee es discreta con una distribución de Poisson

-¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?

Como es una distribución de Poisson, se establece los valores, donde el promedio lambda=8 y el valor de probabilidad a calcular es k=5

#k=5 , lambda=8
dpois(5,8)
## [1] 0.09160366

-¿Cuál es la probabilidad de que haya tres llamadas o menos en una hora?

Nuevamente, la distribución preguntada se mantiene, ahora se establecera k=x donde x pertenece a [0,3] enteros.

k <- seq(0,3)
sum(dpois(k,8))
## [1] 0.04238011

5.Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos.

El estudio realizado por Knee Surgery Sports Traumatology, realizado tras obtener los datos de hospitales con mas de 300 cirugias de ese tipo por año nos indica que no existira variacion para un caso particular de otro hospital. El tiempo medio que demorara por cada una de las 10 cirugias por el dia sera de 129 minutos con una varianza de (14 minutos)^2, equivalente a 196 minutos.

6.Aborde los ejercicios 1 y 4 efectuando una aproximación mediante una distribución normal. ¿Qué puede concluir?

Funciones a utilizar:

normbin <- function(x, p, n){
  X = (x+0.5-n*p)/sqrt(n*p*(1-p))
  probabilidad=pnorm(X,0,1)
  return(probabilidad)
}

normpois <- function(k,lambda){
  X <- (k-lambda)/sqrt(lambda)
  return(pnorm(X,0,1))
}

-Ejercicio 1, pregunta b

x <- 3
p <- 0.8
n <- 3

normbin(x,p,n)
## [1] 0.9438244
#demostracion de inexactitud de la aproximación
n*p
## [1] 2.4
n*(1-p)
## [1] 0.6

Podemos ver que el valor resultante de esta aproximacion a normalizacion no es buena, ya que los valores de n*p y n(1-p) son menores a 5, la cual es un requerimiento para una efectiva normalización.

-Ejercicio 4, pregunta b

k <- 5
lambda <- 8
normpois(k,lambda)
## [1] 0.1444222
lambda
## [1] 8

Resulta en un resultado bastante alejado del valor no aproximado a una normalización.

-Ejercicio 4, pregunta c

k <- seq(0,3)
lambda <- 8
sum(normpois(k,lambda))
## [1] 0.06450039
lambda
## [1] 8

Se obtiene un resultado algo cercano al esperado, pero con un error notable.