PEP Personal

1. Instrucciones

Este documento contiene las instrucciones y enunciados asociados a la Prueba Especial Programada (PEP) del curso de Estadística Computacional modalidad vespertina. Con respecto a ello:

La prueba tiene un total de 60 puntos, lo que sumado al puntaje base permitirá calcular directamente su nota final sumando un máximo de 70 puntos.
Se dispone de todo el bloque de clases para realizar la evaluación. Esta deberá ser desarrollada en R.
Las respuestas escritas empleando RMarkdown deberán ser enviadas al profesor por correo electrónico al finalizar el tiempo de evaluación.
Puede usar apuntes y material disponible en Moodle como apoyo.
Cualquier sospecha de falta ética será castigada directamente con nota 1.0 en la evaluación.
En cada caso, no responda sólo numéricamente, sino que contextualice su respuesta para el problema. Esto puede ser al final de cada pregunta.

2. Preguntas

Pregunta 1 - (20 puntos)

Solo el 20% de los alumnos de la USACH portan su credencial. Si llegan 20 alumnos a la universidad y en la puerta les pediran su credencial.

Preguntas

Cual es la probabilidad de que 10 de ellos no porten su credencial?
Cual es la probabilidad de que 13 de ellos si porten su credencial?
Cual es la probabilidad de que menos de 5 de alumnos porten su credencial?
Cual es la probabilidad de que entre 5 y 8 alumnos porten su credencial?

Respuestas

Se utilizó la distribución binomial porque el problema involucra eventos con dos posibles resultados (portar o no portar la credencial) y se busca calcular probabilidades de ocurrencia de un número específico de éxitos en un número fijo de ensayos (20 alumnos).

Parte a

prob = 0.20     # Probabilidad de que alumno porte su credencial
portan = 10     # n alumnos que si portan
llegaron = 20   # numero alumnos que llegaron

probabilidad = dbinom(portan, size=llegaron, prob)
print(paste("La probabilidad de que 10 de ellos no porten su credencial es:", probabilidad))

## [1] "La probabilidad de que 10 de ellos no porten su credencial es: 0.00203141370301382"

Parte b

prob = 0.20     # Probabilidad de que alumno porte su credencial
portan = 13     # n alumnos que si portan
llegaron = 20   # numero alumnos que llegaron

probabilidad = dbinom(x=portan, size=llegaron, prob)
print(paste("La probabilidad de que 13 de ellos si porten su credencial es:", probabilidad))

## [1] "La probabilidad de que 13 de ellos si porten su credencial es: 1.33178345914368e-05"

Parte c

prob = 0.20    # Probabilidad de que alumno porte su credencial
portan = 4     # máximo n de alumnos que portan su identificación
llegaron = 20  # numero alumnos que llegaron

probabilidad = pbinom(portan, llegaron, prob)
print(paste("La probabilidad de que menos de 5 de alumnos porten su credencial es:", probabilidad))

## [1] "La probabilidad de que menos de 5 de alumnos porten su credencial es: 0.629648263902669"

Parte d

p = 0.20  # Probabilidad de que alumno porte su credencial
k1 = 4    # máximo n de alumnos que portan su identificación
k2 = 7    # máximo n de alumnos que portan su identificación
n = 20    # numero alumnos que llegaron

probabilidad = pbinom(k2, n, p) - pbinom(k1, n, p)
print(paste("La probabilidad de que entre 5 y 8  alumnos porten su credencial es:", probabilidad))

## [1] "La probabilidad de que entre 5 y 8  alumnos porten su credencial es: 0.338209073016456"

Pregunta 2 - (20 puntos)

“Café Rápido” es uno de los cafés más populares de santiago, es por ello que su local suele recibir un promedio de 80 clientes por hora.

Preguntas

Suponiendo que es un día ocupado, ¿Cuál es la probabilidad de que exactamente 15 clientes lleguen en una hora?
En un día tranquilo, ¿Cuál es la probabilidad de que exactamente 15 clientes lleguen en 30 minutos?
Grafique la distribución asociada y brinde contexto a su respuesta para el problema.

Respuestas

Parte a

Se utiliza Poisson, debido a que modela eventos discretos que ocurren de forma independiente en un intervalo de tiempo, como el número de clientes que llegan a Café Rápido por hora. Con una tasa promedio de 80 clientes por hora, se puede calcular la probabilidad de que exactamente 15 clientes lleguen en una hora utilizando esta distribución.

lambda = 80  # Tasa promedio de llamadas por hora
k = 15  # Número específico de llamadas

probabilidad = dpois(k, lambda)
print(paste("La probabilidad de que exactamente 15 clientes lleguen en 1 hora es:", probabilidad))

## [1] "La probabilidad de que exactamente 15 clientes lleguen en 1 hora es: 4.85614495083519e-19"

Parte b

Dividimos la tasa promedio de clientes por hora 80 entre 2 para obtener la tasa promedio por 30 minutos. Nuevamente utilizando la Poisson, se puede calcular la probabilidad de que exactamente 15 clientes lleguen en 30 minutos.

lambda = 80/2  # Tasa promedio de llamadas por hora
k = 15  # Número específico de llamadas

probabilidad = dpois(k, lambda)
print(paste("La probabilidad de que exactamente 15 clientes lleguen 30 minutos es:", probabilidad))

## [1] "La probabilidad de que exactamente 15 clientes lleguen 30 minutos es: 3.4883574678088e-06"

Parte c

La distribución de Poisson modela la variabilidad en el número de clientes que llegan al café en un intervalo de tiempo. El gráfico muestra la probabilidad de diferentes cantidades de clientes, mostrando la distribución alrededor del valor promedio.

library(plotly)

lambda = 50/2  # Tasa promedio de llamadas por 30 minutos
k = seq(0:20)  # Número de llamadas (0 a 20) para graficar la distribución
probabilidades = dpois(k, lambda)

data = data.frame(Número_de_llamadas = k, Probabilidad = probabilidades)
plot = plot_ly(data, x = ~Número_de_llamadas, y = ~Probabilidad, type = "bar",
                marker = list(color = "blue", opacity = 0.7),
                xlab = "Número de llamadas", ylab = "Probabilidad",
                title = "Distribución de Poisson")

plot = plot %>% layout(showlegend = FALSE)
plot

Pregunta 3 - (20 puntos)

Las enfermedades cardiovasculares (ECVs) son la principal causa de muerte en Chile, representando 27,1% del total de defunciones en el año 2016, con una tasa de mortalidad por accidente cerebrovascular e infarto de miocardio de 46,4 y 44,8 por 100.000 habitantes, respectivamente. Basándonos en esta información y situándonos en dicho año/contexto:

Preguntas

¿Cuál es la probabilidad de que si selecciona aleatoriamente sin reposición a 4 personas de la ciudad de santiago, una de ellas fallezca de una enfermedad cardiovascular? (se considera la población de santiago en el año 2016, 6.544.000)
¿Cuál es la probabilidad de que si selecciona aleatoriamente sin reposición a 200 personas de la ciudad de santiago, 5 de ellas fallezcan de una enfermedad cardiovascular? (se considera la población de santiago en el año 2016, 6.544.000)
Grafique la distribución asociada y brinde contexto a su respuesta para el problema.

Respuestas

Parte a

La distribución hipergeométrica se utilizó para calcular la probabilidad de que, en una muestra de 4 personas seleccionadas sin reposición de la población de Santiago (6.544.000 habitantes en 2016), exactamente 1 persona fallezca de una enfermedad cardiovascular.

A=round(91.2/100000*6544000) #Total de persona que fallecen de una ECVs
B=6544000-A                  #Total de personas que no mueren de una ECVs
pac_tub = 1                  #Total de personas que se espera fallezcan de una ECVs (Posibilidad de éxito)
pac_muestreados = 4          #Total de personas seleccionadas

respuesta=dhyper(x=pac_tub, m=A, k=pac_muestreados, n=B)
print(paste("La probabilidad de que al seleccionar a 4 personas sin reposición, y una de ellas fallezca de una ECVs es:", respuesta))

## [1] "La probabilidad de que al seleccionar a 4 personas sin reposición, y una de ellas fallezca de una ECVs es: 0.00363795202601039"

cat("Un valor muy pequeño, dado el tamaño de la muestra de persona que no fallacen de una ECVS.")

## Un valor muy pequeño, dado el tamaño de la muestra de persona que no fallacen de una ECVS.

Parte b

La distribución hipergeométrica se utilizó con los parámetros: muestra de tamaño 200, éxitos en la población A, población de tamaño 6.544.000 y 5 éxitos esperados en la muestra. Esto permite calcular la probabilidad de que exactamente 5 personas fallezcan de una enfermedad cardiovascular en la muestra.

A=round(91.2/100000*6544000) #Total de persona que fallecen de una ECVs
B=6544000-A                  #Total de personas que no mueren de una ECVs
pac_tub = 5                  #Total de personas que se espera fallezcan de una ECVs (Posibilidad de éxito)
pac_muestreados = 200        #Total de personas seleccionadas

respuesta=dhyper(x=pac_tub, m=A, k=pac_muestreados, n=B)
print(paste("La probabilidad de que al seleccionar a 200 personas sin reposición, y que 5 de ellas fallezcan de una ECVs es:", respuesta))

## [1] "La probabilidad de que al seleccionar a 200 personas sin reposición, y que 5 de ellas fallezcan de una ECVs es: 1.33685639011787e-06"

Parte c

Se utiliza una distribución hipergeométrica para graficar la probabilidad de obtener personas que falleceran debido a una ECVs en una muestra de 4.

#Datos
pac_tub = seq(0,5)
pac_muestreados=4 #Total de personas seleccionadas
distribucion = dhyper(x=pac_tub, m=A, k=pac_muestreados, n=B)
datos=data.frame(pac_tub,distribucion)

#Gráfico
grafico = ggplot(data=datos,aes(x=pac_tub,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades")
grafico = grafico + xlab("Prob. entre 0 a 5 personas que podrian fallecer de una ECVs al seleccionar 4 sin rep.") +
  ylab("Probabilidad")
ggplotly(grafico)

Se utiliza una distribución hipergeométrica para graficar la probabilidad de obtener personas que falleceran debido a una ECVs en una muestra de 200

#Datos
pac_tub = seq(0,6)
pac_muestreados=200 #Pacientes muestrados
distribucion = dhyper(x=pac_tub, m=A, k=pac_muestreados, n=B)
datos=data.frame(pac_tub,distribucion)

#Gráfico
grafico = ggplot(data=datos,aes(x=pac_tub,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="lightblue3")
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades")
grafico = grafico + xlab("Prob. entre 0 a 5 personas que podrian fallecer de una ECVs al seleccionar 200 sin rep.") +
  ylab("Probabilidad")
ggplotly(grafico)

Referencias

Troncoso-Pantoja, Claudia, Martínez-Sanguinetti, María Adela, Ulloa, Natalia, & Celis-Morales, Carlos. (2020). La mayoría de las enfermedades cardiovasculares se atribuyen a factores de riesgo que podrían ser modificados con cambios de los estilos de vida. Revista médica de Chile, 148(1), 126-128. https://dx.doi.org/10.4067/S0034-98872020000100126
Villalobos Cid, M. (2022). PEP1 - Estadística Computacional. Recuperado de https://rpubs.com/privado/PEP1_EST_2_2022
R-Coder. (s.f.). Distribución binomial en R. Recuperado de https://r-coder.com/distribucion-binomial-r/

Pep Recuperativa

Enrique Rodriguez-Lapuente

PEP Personal

1. Instrucciones

2. Preguntas

Pregunta 1 - (20 puntos)

Preguntas

Respuestas

Parte a

Parte b

Parte c

Parte d

Pregunta 2 - (20 puntos)

Preguntas

Respuestas

Parte a

Parte b

Parte c

Pregunta 3 - (20 puntos)

Preguntas

Respuestas

Parte a

Parte b

Parte c

Referencias