Este documento contiene las instrucciones y enunciados asociados a la Prueba Especial Programada (PEP) del curso de Estadística Computacional modalidad vespertina. Con respecto a ello:
Solo el 20% de los alumnos de la USACH portan su credencial. Si llegan 20 alumnos a la universidad y en la puerta les pediran su credencial.
Se utilizó la distribución binomial porque el problema involucra eventos con dos posibles resultados (portar o no portar la credencial) y se busca calcular probabilidades de ocurrencia de un número específico de éxitos en un número fijo de ensayos (20 alumnos).
prob = 0.20 # Probabilidad de que alumno porte su credencial
portan = 10 # n alumnos que si portan
llegaron = 20 # numero alumnos que llegaron
probabilidad = dbinom(portan, size=llegaron, prob)
print(paste("La probabilidad de que 10 de ellos no porten su credencial es:", probabilidad))## [1] "La probabilidad de que 10 de ellos no porten su credencial es: 0.00203141370301382"
prob = 0.20 # Probabilidad de que alumno porte su credencial
portan = 13 # n alumnos que si portan
llegaron = 20 # numero alumnos que llegaron
probabilidad = dbinom(x=portan, size=llegaron, prob)
print(paste("La probabilidad de que 13 de ellos si porten su credencial es:", probabilidad))## [1] "La probabilidad de que 13 de ellos si porten su credencial es: 1.33178345914368e-05"
prob = 0.20 # Probabilidad de que alumno porte su credencial
portan = 4 # máximo n de alumnos que portan su identificación
llegaron = 20 # numero alumnos que llegaron
probabilidad = pbinom(portan, llegaron, prob)
print(paste("La probabilidad de que menos de 5 de alumnos porten su credencial es:", probabilidad))## [1] "La probabilidad de que menos de 5 de alumnos porten su credencial es: 0.629648263902669"
p = 0.20 # Probabilidad de que alumno porte su credencial
k1 = 4 # máximo n de alumnos que portan su identificación
k2 = 7 # máximo n de alumnos que portan su identificación
n = 20 # numero alumnos que llegaron
probabilidad = pbinom(k2, n, p) - pbinom(k1, n, p)
print(paste("La probabilidad de que entre 5 y 8 alumnos porten su credencial es:", probabilidad))## [1] "La probabilidad de que entre 5 y 8 alumnos porten su credencial es: 0.338209073016456"
“Café Rápido” es uno de los cafés más populares de santiago, es por ello que su local suele recibir un promedio de 80 clientes por hora.
Se utiliza Poisson, debido a que modela eventos discretos que ocurren de forma independiente en un intervalo de tiempo, como el número de clientes que llegan a Café Rápido por hora. Con una tasa promedio de 80 clientes por hora, se puede calcular la probabilidad de que exactamente 15 clientes lleguen en una hora utilizando esta distribución.
lambda = 80 # Tasa promedio de llamadas por hora
k = 15 # Número específico de llamadas
probabilidad = dpois(k, lambda)
print(paste("La probabilidad de que exactamente 15 clientes lleguen en 1 hora es:", probabilidad))## [1] "La probabilidad de que exactamente 15 clientes lleguen en 1 hora es: 4.85614495083519e-19"
Dividimos la tasa promedio de clientes por hora 80 entre 2 para obtener la tasa promedio por 30 minutos. Nuevamente utilizando la Poisson, se puede calcular la probabilidad de que exactamente 15 clientes lleguen en 30 minutos.
lambda = 80/2 # Tasa promedio de llamadas por hora
k = 15 # Número específico de llamadas
probabilidad = dpois(k, lambda)
print(paste("La probabilidad de que exactamente 15 clientes lleguen 30 minutos es:", probabilidad))## [1] "La probabilidad de que exactamente 15 clientes lleguen 30 minutos es: 3.4883574678088e-06"
La distribución de Poisson modela la variabilidad en el número de clientes que llegan al café en un intervalo de tiempo. El gráfico muestra la probabilidad de diferentes cantidades de clientes, mostrando la distribución alrededor del valor promedio.
library(plotly)
lambda = 50/2 # Tasa promedio de llamadas por 30 minutos
k = seq(0:20) # Número de llamadas (0 a 20) para graficar la distribución
probabilidades = dpois(k, lambda)
data = data.frame(Número_de_llamadas = k, Probabilidad = probabilidades)
plot = plot_ly(data, x = ~Número_de_llamadas, y = ~Probabilidad, type = "bar",
marker = list(color = "blue", opacity = 0.7),
xlab = "Número de llamadas", ylab = "Probabilidad",
title = "Distribución de Poisson")
plot = plot %>% layout(showlegend = FALSE)
plotLas enfermedades cardiovasculares (ECVs) son la principal causa de muerte en Chile, representando 27,1% del total de defunciones en el año 2016, con una tasa de mortalidad por accidente cerebrovascular e infarto de miocardio de 46,4 y 44,8 por 100.000 habitantes, respectivamente. Basándonos en esta información y situándonos en dicho año/contexto:
La distribución hipergeométrica se utilizó para calcular la probabilidad de que, en una muestra de 4 personas seleccionadas sin reposición de la población de Santiago (6.544.000 habitantes en 2016), exactamente 1 persona fallezca de una enfermedad cardiovascular.
A=round(91.2/100000*6544000) #Total de persona que fallecen de una ECVs
B=6544000-A #Total de personas que no mueren de una ECVs
pac_tub = 1 #Total de personas que se espera fallezcan de una ECVs (Posibilidad de éxito)
pac_muestreados = 4 #Total de personas seleccionadas
respuesta=dhyper(x=pac_tub, m=A, k=pac_muestreados, n=B)
print(paste("La probabilidad de que al seleccionar a 4 personas sin reposición, y una de ellas fallezca de una ECVs es:", respuesta))## [1] "La probabilidad de que al seleccionar a 4 personas sin reposición, y una de ellas fallezca de una ECVs es: 0.00363795202601039"
cat("Un valor muy pequeño, dado el tamaño de la muestra de persona que no fallacen de una ECVS.")## Un valor muy pequeño, dado el tamaño de la muestra de persona que no fallacen de una ECVS.
La distribución hipergeométrica se utilizó con los parámetros: muestra de tamaño 200, éxitos en la población A, población de tamaño 6.544.000 y 5 éxitos esperados en la muestra. Esto permite calcular la probabilidad de que exactamente 5 personas fallezcan de una enfermedad cardiovascular en la muestra.
A=round(91.2/100000*6544000) #Total de persona que fallecen de una ECVs
B=6544000-A #Total de personas que no mueren de una ECVs
pac_tub = 5 #Total de personas que se espera fallezcan de una ECVs (Posibilidad de éxito)
pac_muestreados = 200 #Total de personas seleccionadas
respuesta=dhyper(x=pac_tub, m=A, k=pac_muestreados, n=B)
print(paste("La probabilidad de que al seleccionar a 200 personas sin reposición, y que 5 de ellas fallezcan de una ECVs es:", respuesta))## [1] "La probabilidad de que al seleccionar a 200 personas sin reposición, y que 5 de ellas fallezcan de una ECVs es: 1.33685639011787e-06"
Se utiliza una distribución hipergeométrica para graficar la probabilidad de obtener personas que falleceran debido a una ECVs en una muestra de 4.
#Datos
pac_tub = seq(0,5)
pac_muestreados=4 #Total de personas seleccionadas
distribucion = dhyper(x=pac_tub, m=A, k=pac_muestreados, n=B)
datos=data.frame(pac_tub,distribucion)
#Gráfico
grafico = ggplot(data=datos,aes(x=pac_tub,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades")
grafico = grafico + xlab("Prob. entre 0 a 5 personas que podrian fallecer de una ECVs al seleccionar 4 sin rep.") +
ylab("Probabilidad")
ggplotly(grafico)Se utiliza una distribución hipergeométrica para graficar la probabilidad de obtener personas que falleceran debido a una ECVs en una muestra de 200
#Datos
pac_tub = seq(0,6)
pac_muestreados=200 #Pacientes muestrados
distribucion = dhyper(x=pac_tub, m=A, k=pac_muestreados, n=B)
datos=data.frame(pac_tub,distribucion)
#Gráfico
grafico = ggplot(data=datos,aes(x=pac_tub,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades")
grafico = grafico + xlab("Prob. entre 0 a 5 personas que podrian fallecer de una ECVs al seleccionar 200 sin rep.") +
ylab("Probabilidad")
ggplotly(grafico)