Un investigador estudió los ritmos biológicos en ratones para analizar el efecto del fármaco Probenecid en la reducción de peso (Morgan 2018). Cada mañana, el investigador registró el momento en que los ratones despertaron y comenzaron sus actividades. Este evento ocurrió entre las 5:35 y las 6:10 de la mañana. Si asume que la distribución de este evento es uniforme en ese rango de tiempo:
- Grafique la función de densidad correspondiente
Las horas se pasaron a decimales.
m1 = 5.5833
m2 = 6.1667
x = seq(m1, m2, length = 1000)
y = dunif(x, min = m1, max = m2)
plot(x, y, type = "l", xlab = "Hora del despertar", ylab = "Densidad", main = "Despertar de los ratones")- Grafique la función de masa correspondiente
- Calcule la media y la desviación estándar de la variable estudiada. Argumente y contextualice su respuesta
datos_ratones = runif(20, min = 5.35, max = 6.10)
media = mean(datos_ratones)
desviacion_estandar = sd(datos_ratones)
print(desviacion_estandar)## [1] 0.1964712
En el caso de los ratones, la desviación estándar es bastante pequeña, lo que indica que los valores de los momentos de despertar de los ratones están muy cerca del valor típico de 5:55am.
En el caso de la media, se puede decir que el valor en que los ratones despertaron es a las 5:55 am. Hay que tener en cuenta que la media se encuentra en el punto medio de los valores posibles.
Un estudio ha señalado que en el Hospital de Medellín hubo 292 accidentes laborales entre los años 2015 y 2019 (Pérez-Correa 2022).
- Calcule la probabilidad de que hoy no ocurran accidentes
Se utiliza la distribucion de Poisson, en este caso se considera 292/5 = 58,4 accidentes por año.
lambda = 58.4
probabilidad = dpois(0, lambda)
print(probabilidad)## [1] 4.337128e-26
La probabilidad de que hoy ocurra un accidente es extremadamente minima.
- Calcule la probabilidad de que ocurran como máximo dos accidentes esta semana
Se utiliza la misma logica de la pregunta anterior, pero en este caso lambda tendra el valor de 58,4/52, que es la division por la cantidad de semanas que hay en un año
lambda = 58.4/52
probabilidad = ppois(2, lambda)
print(probabilidad)## [1] 0.8957254
La probabilidad de que ocurran dos accidentes esta semana es de 89.57%, es decir, altamente probable que ocurre un accidente
- Grafique la distribución de probabilidad asociada
Un investigador está utilizando un Modelo de Regresión de Cox para explicar una variable fisiológica causante de una enfermedad (Rivas 2006). Este modelo requiere la estimación de cuatro parámetros en un rango de 0 a 100: una constante base (mantisa) y tres asociados a un exponente. Para llevar a cabo la estimación, el investigador ha dividido cada variable en 10 intervalos
- ¿Cuántos modelos diferentes deberá evaluar el investigador para considerar todas las posibles combinaciones de parámetros?
intervalos = 10
parametros = 4
num_modelos = intervalos ^ parametros
print(num_modelos)## [1] 10000
Considerando que son 4 parametros, serian 10000 modelos a evaluar.
- Si cada modelo tarda 1 minuto en ser evaluado en el computador del investigador, ¿cuántas horas de cómputo necesitará el investigador para evaluar todos los modelos? Asuma que usará el mismo equipo
tiempo = num_modelos * 1 / 60
print(tiempo)## [1] 166.6667
Necesitaria para investigar 166.6 horas ## c
- Si usted descubre que la probabilidad de que un parámetro tome un determinado valor sigue una distribución normal con media 50 y desviación estándar 10, ¿qué sugeriría al investigador para abordar la estimación de parámetros? Explique su argumento
La estimación de parámetros cuando se tiene los datos sobre la distribución de probabilidad se recomienda usar formar de optimizar de forma apropiada que permita el ajuste del modelo y optimizar la función. Para empezar la estimación de los parámetros, el investigador podría usar la optimización sea la indicada para el ajuste de modelos de regresión. Si se asume que la probabilidad de que cada parámetro tome un valor que sigue una distribución normal con media igual a 50 y desviación 10, entonces la distribución de los parámetros podría ser vistas usando una distribución normal con los parámetros específicos.