R Markdown

  1. En el proceso de fabricación de teléfonos, tres de ellos son seleccionados aleatoriamente por trabajadores para evaluar su calidad. Cada pieza es categorizada como “funcional” o “con falla” según los resultados de su evaluación. Si la probabilidad de que un teléfono no tenga fallas es 0.8, siendo la evaluación independiente entre equipos.
  1. (3 puntos) Señale el tipo de variable aleatoria y la distribución que sigue.
  2. (4 puntos) Determine la función de probabilidad de masa.
  3. (3 puntos) Grafique la distribución.
library("ggplot2")
#a)variable aleatoria discreta y distribucion binomial porque se tiene un n = 3 y una probabilidad de exito de 0,8 en cada n(donde los n #son los telefonos seleccionados al azar.)
#b
funMasa <- function(n,p,x){
  (factorial(n)/(factorial(x)*factorial(n - x)))*(p**x)*((1-p)**(n-x))
}
funMasa(3,0.8, 3)
## [1] 0.512
#c)#Gráfico
rango = seq(0,3)
distribucion = dbinom(rango, size = 3,prob = 0.8)
datos=data.frame(rango,distribucion)

grafico = ggplot(data=datos,aes(x=rango,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("probabilidad de telefonos")
grafico = grafico + xlab("telefonos") + ylab("Probabilidad")

  1. En un estudio clínico los voluntarios son examinados para encontrar un gen asociado a la aparición de cáncer. La probabilidad de que una persona tenga el gen es 0.1. Si se asume que la evaluación de una persona es independiente de otra:
  1. (2 puntos) Señale el tipo de variable aleatoria y la distribución que sigue.
  2. (3 puntos) ¿Cuál es la probabilidad de que cuatro o más evaluaciones deban ser efectuadas para detectar a dos personas portadoras del gen?
  3. (3 puntos) ¿Cuál es el número esperado de evaluaciones que debo realizar para detectar dos personas portadoras del gen?
  4. (2 puntos) Grafique la distribución.
#a) Est un tipo de variable aleatoria discreta y sigue una distribución binomial negativa, ya que se pide los números de ensayos que se deben realizar para obtener r casos favorables.
#b)
print((1-dnbinom(x=2, size= 2, prob=0.1)))
## [1] 0.9757
#c)
#valor esperado  es r/p dado que en la distribución binomial negativa se tiene la formula r(1−p)/p, por lo que con r=2 y p=0.1, el número esperado será el resultado de esta fórmula (número de fracasos esperados) más el número de exitos(2), quedando un total de:
valor_esperado = 2/0.1
valor_esperado
## [1] 20
#d)Considerando r=2
rango = seq(0,60)
distribucion = dnbinom(rango, 2,0.1)
datos = data.frame(rango, distribucion)

grafico = ggplot(data=datos, aes(x=rango,y=distribucion))
grafico = grafico + geom_bar(stat="identity", fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución binomial negativa")
grafico = grafico + xlab("Rango") + ylab("Probabilidad")
grafico = grafico + scale_x_continuous(breaks = c(0,8,9,20,60))
plot(grafico)

  1. Una empresa contrata a 800 hombres menores de 55 años. Suponga que el 30 % tiene un marcador en el cromosoma masculino que indica un mayor riesgo de cáncer de próstata.
  1. (2 puntos) Señale el tipo de variable aleatoria y la distribución que sigue.
  2. (3 puntos) Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que exactamente 1 hombre tenga el marcador?
  3. (3 puntos) Si a 10 hombres de la empresa se les hace la prueba del marcador en este cromosoma, ¿cuál es la probabilidad de que más de 1 tenga el marcador?
  4. (2 puntos) Grafique la distribución
#a)Siendo x el número de hombres que tengan el marcador corresponde a un variable aleatoria cuantitativa discreta y como estamos tomando una muestra sin repetición para una variable discreta corresponde a una distribución hipergeometrica.
#b)
print(dhyper(1,240,800-240,10))
## [1] 0.1200794
#c) se debe calcular la probabilidad de que 0s personas de la muestra tenga el gen por lo que la diferencia entre 1 y este calculodara como resultado el resto de todas las probabilidades
print(1-dhyper(x=1, m=240, k=10, n=560))
## [1] 0.8799206
#d)
poblacion=240 #Exitos
total=560 #Fracasos
hombres=10 #Experimentos
exitos=seq(0,10) #Exitos
distribucion = dhyper(x=exitos, m=poblacion, k=hombres, n=total)
datos=data.frame(exitos,distribucion)
#Gráfico
library("ggplot2")
grafico = ggplot(data=datos,aes(x=exitos,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades")
grafico = grafico + xlab("hombres") + ylab("Probabilidad")
plot(grafico)

  1. El número de llamadas telefónicas que llegan a una central telefónica se modela como una variable aleatoria de Poisson. Suponga que en promedio hay 8 llamadas por hora.
  1. (5 puntos) ¿Cuál es la probabilidad de que haya exactamente cinco llamadas en una hora?
  2. (5 puntos) ¿Cuál es la probabilidad de que haya tres llamadas o menos en una hora?
#a)
print(dpois(5, 8))
## [1] 0.09160366
#b)
print(ppois(3, 8))
## [1] 0.04238011
  1. (10 puntos) Un artículo en Knee Surgery Sports Traumatology, Arthroscopy [“Effect of Provider Volume on Resource Utilization for Surgical Procedures” (2005, Vol. 13, pp. 273–279)] mostró un tiempo medio de 129 minutos y una desviación estándar de 14 minutos para cirugía de reconstrucción de LCA para hospitales de alto volumen (con más de 300 cirugías de este tipo por año). Si un hospital de alto volumen necesita programar 10 cirugías, ¿cuáles son la media y la varianza del tiempo total para completar estas cirugías? Suponga que los tiempos de las cirugías son independientes y normalmente distribuidos.

R:Dado que el articulo indique que se realizó en hospitales con mas de 300 cirugias,sice que entonces no existe variacion particular para un hospital en especifico, por lo que la media seria de 10 multiplicado por 129 minutos = 1290 y por 14^2 mitutos, lo cual seria 1960 minutos, ya que son 10 hospitales lo que indican.Media total=1290 y Varianza=1960.

  1. (2 puntos) Aborde los ejercicios 1 y 4 efectuando una aproximación mediante una distribución normal. ¿Qué puede concluir?
#ejercicio 1
media = 3 * 0.8
desviacion= (3 * 0.8 * 0.2)**(1/2)
aproximacion= pnorm((3.5 - media)/desviacion)
print(aproximacion)
## [1] 0.9438244
#La aproximacion es buena solo si estrictamente np >= 5 y n(1 - p) > 5  de hecho  podemos comprobar que np es menor que 5(2.4) y n(1-p)(0.6) menor que 5, ninguna de está es correcta, por lo tanto no es válida la aproximación.
#ejercicio 4
#b)
k = 5
lambda= 8
X = (k-lambda)/(sqrt(lambda))
aproximacion= pnorm(X, 0, 1)
aproximacion
## [1] 0.1444222
#c)
k = (seq (0,3))
lambda= 8
X = (1-lambda)/(sqrt(lambda))
X2 = (2-lambda)/(sqrt(lambda))
X3 = (3-lambda)/(sqrt(lambda))
aproximacion= pnorm(X, 0, 1) + pnorm(X2, 0, 1) + pnorm(X3, 0, 1)
aproximacion
## [1] 0.06216153
#Dado que el lambda es mayor a 5, y que los valores son cercanos a los reales, entonces se puede concluir que las aproximaciones son #relativamente buenas.