Este documento contiene las instrucciones y enunciados asociados a la Prueba Especial Programada 1 (PEP1) del curso de Estadística Computacional. Al respecto:
Se tiene registro de que en la temporada 2022/2023 el futbolista
argentino Lionel Messi ha marcado 30 goles en
50 partidos jugados. Después de ganar el último mundial de Qatar
2022 con su selección nacional, el deportista a dejado entrever que
debido a su edad es improbable que juegue el próximo mundial, por lo que
su retiro podría estar cerca.
Un grupo de
amigos fanáticos de Messi está intentando usar la estadística para
descifrar cuántos goles más de Messi podrían llegar a ver antes de su
retiro. Si sabemos que un partido de fútbol dura 90 minutos y asumimos
un rendimiento constante de Lionel Messi para los siguientes encuentros,
sin considerar el nivel de los rivales a enfrentar, determine:
Este ejercicio es posible resolverlo mediante una distribución de Poisson. Para calcular las probabilidades debemos primeramente determinar la media (\(\lambda\)) para la cantidad de goles por partido o cada 90 minutos.
## [1] 0.6
Esto nos permitirá calcular los goles por 300 minutos jugado:
## [1] 2
De manera que si queremos calcular probabilidad de goles por partido
(Pregunta A), nuestro (\(\lambda\))
será la variable golesPorPartido y si queremos calcular la
probabilidad de goles dada una cantidad de minutos jugados (Pregunta B),
entonces (\(\lambda\)) será igual a
golesPorMinuto.
# Probabilidad de 1 Partido sin convertir
prob_partido_sin_gol = dpois(0,golesPorPartido)
print(prob_partido_sin_gol)## [1] 0.5488116
# Probabilidad de 1 Partido = 1 Gol
prob_partido_un_gol = dpois(1,golesPorPartido)
print(prob_partido_un_gol)## [1] 0.329287
# Probabilidad de hasta 5 Goles en 300 minutos jugados
p_cinco_goles = ppois(5, golesPorMinuto)
print(p_cinco_goles)## [1] 0.9834364
# Probabilidad de más de siete goles en 300 minutos jugados
p_tenplus_goles = 1 - ppois(7, golesPorMinuto, lower.tail = TRUE)
print(p_tenplus_goles)## [1] 0.001096719
## [1] 33
# Goles esperados en 100 partidos
goles_esperados_cien = golesPorPartido * 100
print(goles_esperados_cien)## [1] 60
library("ggplot2")
library("plotly")
goles=seq(0,10)
distribucion = dpois(goles,golesPorPartido)
datos=data.frame(goles,distribucion)
grafico = ggplot(data=datos,aes(x=goles,y=distribucion))
grafico = grafico + geom_bar(stat="identity",fill="navajowhite",color="orange3", size = 0.1)
grafico = grafico + theme_bw() + ggtitle("Distribución de probabilidades - Poisson")
grafico = grafico + xlab("Número de goles por partido") + ylab("Probabilidad")
ggplotly(grafico)En Chile un estudio realizado por IPSOS en marzo de 2023 revela que un 56% de las personas encuestadas cree que la delincuencia debe ser la prioridad para el gobierno, por otra parte, una encuesta realizada por CADEM publicada en abril del mismo año entrega una cifra aún mayor; el 71% cree que el combate a la delincuencia debe ser la prioridad del gobierno.
Por su parte, el Centro de Estudios y Análisis del Delito (CEAD) proporciona las siguientes estadísticas respecto de delitos de mayor connotación social para los últimos cinco años:
En la comuna de Estación Central específicamente, donde está
ubicada una reconocida Universidad nacional, la cantidad de delitos
registrados en la misma categoría corresponde a:
· 9115 en 2018
· 9735 en 2019
· 6508 en 2020
· 5297 en 2021
· 7999 en
2022
Se proyecta que en 2021 la misma comuna tendría una población de alrededor de 214.470 personas. Suponga que la universidad tiene además un total de 25.000 estudiantes. (Asuma que ningún estudiante vive en la comuna).
De acuerdo a estas cifras, responda:
En esta pregunta, cada respuesta debe ser abordada mediante una distribución diferente. Para el caso de la pregunta a), al igual que en la pregunta anterior, se puede determinar la probabilidad mediante Poisson:
# Probabilidad de que un habitante de Estación Central sea víctima de un delito mañana
delitos_por_dia = (9115+9735+6508+5297+7999)/5
habitantes <- 214470
delito_por_habitante = delitos_por_dia/habitantes
prob_1delito_habitantes <- dpois(1, delito_por_habitante)
print(prob_1delito_habitantes)## [1] 0.03476989
# Probabilidad de que un estudiante sea víctima de un delito cualquier día del año
estudiantes <- 25000
delito_por_estudiante <- delitos_por_dia/estudiantes
prob_1delito_estudiantes <- dpois(1, delito_por_estudiante)
print(prob_1delito_estudiantes)## [1] 0.2269795
Para la respuesta b) es necesario utilizar una distribución hipergeométrica:
N = 30 # Tamaño de población
K = 21 # Casos favorables en N
n = 5 # Muestra
x = 3 # Casos favorables en n
binomio = function(n,k)
{resultado=factorial(n)/(factorial(n-k)*factorial(k))
return(resultado)}
probabilidad = (binomio(K,x)*binomio(N-K,n-x))/binomio(N,n)
print(probabilidad)## [1] 0.3359859
También puede utilizarse la función dhyper
## [1] 0.3359859
Para la respuesta c, podemos utilizar distribución binomial.
# Valores dados
delitos <- 549837
poblacion <- 18751000
muestra <- 10
# Probabilidad de haber sido víctima de un delito en 2018
prob_delito <- delitos / poblacion
# Probabilidad de encontrar al menos una víctima en 10 entrevistados
probabilidad_victima <- 1 - dbinom(0, size = muestra, prob = prob_delito)
probabilidad_victima## [1] 0.2574135
Los servicios de geolocalización en tiempo real son ampliamente
utilizados hoy en día por personas e instituciones para moderse a través
de las ciudades. De acuerdo a Google, cada día se conduce más de 1
billón de kilómetros en 220 países utilizando
Google Maps.
Una compañía chilena de repartos de encomiendas y
productos tiene 3 vehículos disponibles para repartir 120 paquetes el
día de hoy. Esta compañía utiliza a diario los servicios de Google Maps
para ordenar sus entregas y definir las rutas, sin embargo, debido a una
falla satelital mundial, los servicios de mapas y geolocalización en
tiempo real están caídos. La empresa debe cumplir con sus pedidos de
manera urgente, por lo que deciden preparar las rutas de entrega a mano
para aquel día.
Durante la planificación de la jornada se genera un debate. Un conductor plantea que cada vehículo debe repartir una cantidad igual de paquetes y que debe existir una ruta óptima de reparto que sea la más eficiente, en donde no se pase más de una vez por el mismo sector. Propone entonces armar listas de rutas posibles e ir evaluando una a una su duración total con el fin de escoger la que resulte más corta para cada conductor. Un segundo conductor dice que esa evaluación tomaría mucho tiempo, por lo que propone es mejor que carguen los vehículos y salgan a repartir lo antes posible confiando en su experiencia e intuición, sin planificación previa.
Si se interpreta por el estudiante que la evaluación de rutas posibles debe realizarse mediante combinaciones:
# Fórmula Cn = n! / (x! * (n-x)!)
x=40
n=120
combinaciones <- factorial(n) / (factorial(x) * factorial(n-x))
combinaciones## [1] 1.145568e+32
Si se interpreta por el estudiante que la evaluación de rutas posibles debe realizarse mediante permutaciones:
# Fórmula Pn = n!
# Si se calcula el total de entregas de la compañía
n <- 120
permutations <- factorial(n)
permutations## [1] 6.689503e+198
# Si se calcula el total de entregas utilizando los 3 vehículos,
# cada vehículo reparte 40 paquetes, por lo tanto, cada vehículo tendrá 40!
# combinaciones de orden
v <- 40
permutations_v <- factorial(v)
permutations_v## [1] 8.159153e+47
## [1] 6.873411e+33
## [1] 1.145568e+32
## [1] 1.909281e+30
## [1] 7.955337e+28
## [1] 2.179544e+26
# Si son 120 paquetes y 3 vehículos, cada conductor debe repartir:
entregas_por_conductor = 120/3
print(entregas_por_conductor)## [1] 40
# Si la jornada laboral es de 8 horas, máximo de minutos por entrega:
minutos_totales = 8*60
minutos_por_entrega = minutos_totales/entregas_por_conductor
print(minutos_por_entrega)## [1] 12
Última parte de la respuesta d) es de argumentación libre. Puede recomendar algoritmos de orden basados en distancias entre puntos. También es válido recomendar desde el punto de vista empresarial la contratación incidental de conductores adicionales o renegociar algunas entregas, dada la situación particular. Avisar oportunamente un retraso en el servicio a los clientes también sería recomendable. Adicionalmente, desde lo organizacional e incluso ético, se podría revisar si tienen algún reparto de mayor urgencia (como medicamentos o entregas a algún hospital) para priorizar aquellos.