Ejercicios

  1. En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla” según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es 0.8, siendo la evaluación independiente entre equipos.

    En el problema podemos ver que en una pieza sabemos todos los resultados posibles siendo entonces una tipo de variable aleatoria discreta, de la misma forma sabemos que solo hay 2 posibles opciones con o sin fallas y con experimentos de forma continua sabemos que sigue la distribución binomial.

    Funcion de probabilidad de masa

    funcionProbabilidad <- function(x){
      factorial(3)/(factorial(x)*factorial(3-x))*(0.8^x)*(0.2)^(3-x)  
    }
    funcionProbabilidad(1)
    ## [1] 0.096
    funcionProbabilidad(2)
    ## [1] 0.384
    funcionProbabilidad(3)
    ## [1] 0.512

    Gráfico de distribución

    rango = seq(1,3)
    distribucion = dbinom(rango, size = 3,prob = 0.8)
    datos=data.frame(rango,distribucion)
    
    grafico = ggplot(data=datos,aes(x=rango,y=distribucion))
    grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
    grafico = grafico + theme_bw() + ggtitle("Probabilidad de telefonos sin fallas entre 3")
    grafico = grafico + xlab("Rango") + ylab("Probabilidad")
    plot(grafico)

  2. En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Se asume que la evaluación de una persona es independiente de otra

    Igual que el caso anterior tenemos solo dos resultados(tiene el gen o no) por lo que es una variable aleatoria discreta y sigue la distribución de Bernoulli

    Preguntas

    ¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen?

    R: estamos buscando P(X >= 4) y eso es 1-(P(3)+P(2))

    probBinomN <- function(x,r,p){
      choose(x-1,r-1) * p^r*(1-p)^(x-r)
    }
    # x = cantidad de personas analizadas
    # r = cantidad de personas con el gen
    # p = probabilidad de tener el gen
    1 - (probBinomN(3,2,0.1) + probBinomN(2,2,0.1))
    ## [1] 0.972

    Cuál es el número esperado de evaluaciones que debo realizar para detectar dos personas portadoras del gen?

    e = 2/0.1 # E = r/p
    e
    ## [1] 20

    Gráfico de distribución

    personas = seq(0,100)
    distribucion = dbinom(x=2,size=personas, prob=0.10)
    datos=data.frame(personas,distribucion)
    
    grafico = ggplot(data=datos,aes(x=personas,y=distribucion))
    grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
    grafico = grafico + theme_bw() + ggtitle("Distribución de
    probabilidades")
    grafico = grafico + xlab("Pruebas") + ylab("Probabilidad")
    plot(grafico)

  3. Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.

    En este caso tenemos una variable aleatoria discreta con una distribución hypergeometrica.

    Preguntas

    Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que exactamente 1 hombre tenga el marcador?

    R:

    n = 800
    k = n*0.3
    m = n-k
    dist <- dhyper(1,k,m,10)
    dist
    ## [1] 0.1200794

    Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que más de 1 tenga el marcador?

    n = 800
    k = n*0.3
    m = n-k
    dist <- dhyper(seq(0,1),k,m,10)
    1-sum(dist)
    ## [1] 0.8523523

    Gráfico de la distribución

    library("Rlab")
    provedorA=n*0.3 
    provedorB=n-k #Fracasos
    ventas=10 #Experimentos
    exitos=seq(0:10) #Exitos
    distribucion = dhyper(x=exitos, m=provedorA, k=ventas, n=provedorB)
    datos=data.frame(exitos,distribucion)
    #Gráfico
    library("ggplot2")
    grafico = ggplot(data=datos,aes(x=exitos,y=distribucion))
    grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
    grafico = grafico + theme_bw() + ggtitle("Distribución de
    probabilidades")
    grafico = grafico + xlab("Productos de A") + ylab("Probabilidad")
    plot(grafico)

  4. El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.

    El problema contiene una variable aleatoria discreta y sigue una distribucion de Poisson

    Preguntas

    ¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?

    lambda=8
    dist = dpois(5,lambda)
    dist
    ## [1] 0.09160366

    ¿Cuál es la probabilidad de que haya tres llamadas o menos en una hora?

    llamadas = seq(0,3)
    lambda = 8
    dist = dpois(llamadas,lambda)
    sum(dist)
    ## [1] 0.04238011
  5. Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos.

    R: El tiempo medio se mantendria en 1290 minutos y debido a los 14 minutos de desviacion estandar tendriamos de varianza 1960 minutos.