Ejercicio: Supongamos que las calificaciones en un examen siguen una distribución normal con media 75 y desviación estándar 10. Encuentra la probabilidad de que un estudiante obtenga una calificación menor a 80. Respuesta:
p <- pnorm(80, mean = 75, sd = 10)
p
## [1] 0.6914625
Ejercicio: Imagina que deseas estimar el intervalo de confianza para la media de las calificaciones de una muestra de 20 estudiantes. La media muestral es 70, y la desviación estándar es 8. Calcula el intervalo de confianza al 95%. Respuesta:
n <- 20
x_bar <- 70
s <- 8
alpha <- 0.05
lower <- qt(alpha/2, df = n - 1) * (s/sqrt(n)) + x_bar
upper <- qt(1 - alpha/2, df = n - 1) * (s/sqrt(n)) + x_bar
lower
## [1] 66.25588
upper
## [1] 73.74412
Ejercicio: Supongamos que quieres realizar un análisis de varianza (ANOVA) para comparar las calificaciones promedio de tres grupos de estudiantes. Calcula la estadística F y su p-valor. Respuesta:
# Datos ficticios de tres grupos
grupo1 <- c(75, 80, 85, 90, 95)
grupo2 <- c(70, 78, 82, 88, 92)
grupo3 <- c(65, 72, 79, 84, 91)
# Realizar ANOVA
resultado_anova <- anova(lm(c(grupo1, grupo2, grupo3) ~ rep(1:3, each = 5)))
# Obtener la estadística F
F_estadistico <- resultado_anova$F[1]
p_valor <- resultado_anova$Pr[1]
F_estadistico
## [1] 1.569777
p_valor
## [1] 0.2323078
Ejercicio: Supongamos que deseas verificar si la distribución de las edades de los huéspedes en un hotel sigue una distribución uniforme. Para ello, debes calcular la estadística chi-cuadrado y su p-valor. Respuesta:
# Datos ficticios de edades de huéspedes
edades <- c(25, 30, 35, 40, 45, 50, 55, 60, 65, 70)
# Definir los límites de los intervalos
intervalos <- seq(20, 75, by = 10)
# Calcular las frecuencias observadas en cada intervalo
frec_obs <- table(cut(edades, breaks = intervalos))
# Calcular las frecuencias esperadas si fuera uniforme
n <- length(edades)
frec_esp <- rep(n/length(intervalos), length(intervalos)-1)
# Calcular estadística chi-cuadrado
chi_cuadrado <- sum((frec_obs - frec_esp)^2 / frec_esp)
# Calcular p-valor
p_valor <- 1 - pchisq(chi_cuadrado, df = length(intervalos) - 1)
chi_cuadrado
## [1] 0.3333333
p_valor
## [1] 0.9969688
Ejercicio: Supongamos que deseas modelar el tiempo que los huéspedes pasan en la piscina de un hotel antes de comprar un refrigerio. Asumiendo una distribución gamma con forma 2 y escala 1/3, calcula la probabilidad de que un huésped pase más de 10 minutos en la piscina antes de comprar un refrigerio. Respuesta:
probabilidad <- 1 - pgamma(10, shape = 2, scale = 1/3)
probabilidad
## [1] 2.900902e-12
Ejercicio: Imagina que estás analizando la tasa de ocupación de las habitaciones de un hotel a lo largo del año. Supongamos que asumimos una distribución beta con parámetros a = 3 y b = 5. Calcula la probabilidad de que la tasa de ocupación sea mayor al 70%. Respuesta:
probabilidad <- 1 - pbeta(0.7, shape1 = 3, shape2 = 5)
probabilidad
## [1] 0.0287955
Ejercicio: Supongamos que deseas simular la llegada de turistas a un centro turístico durante el día, asumiendo una distribución uniforme continua entre las 9:00 AM y las 6:00 PM. Calcula la probabilidad de que un turista llegue entre las 10:30 AM y las 12:00 PM. Respuesta:
probabilidad <- punif(12 - 10.5, min = 0, max = 6 - 9)
## Warning in punif(12 - 10.5, min = 0, max = 6 - 9): NaNs produced
probabilidad
## [1] NaN
Ejercicio: Supongamos que deseas modelar el tiempo de espera de los clientes en la recepción de un hotel antes de ser atendidos, asumiendo una distribución exponencial con una tasa de llegada de 0.2 clientes por minuto. Calcula la probabilidad de que un cliente espere menos de 5 minutos. Respuesta:
probabilidad <- pexp(5, rate = 0.2)
probabilidad
## [1] 0.6321206