Una empresa emplea 1500 personas. La cantidad promedio gastada, durante un Año determinado, en servicios médicos personales por empleado fue de 2.575 dólares y la desviación típica de 525 dólares. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 empleados (seleccionados sin reemplazo) arroje una media comprendida entre 2500 y 2700 dólares?
# Parámetros dados
mu <- 2575 # Media de la población
sigma <- 525 # Desviación estándar de la población
n <- 100 # Tamaño de la muestra
# Parámetros de la distribución muestral
mu_x_bar <- mu # Media muestral
sigma_x_bar <- sigma / sqrt(n) # Desviación estándar muestral
# Intervalo de interés
intervalo_inferior <- 2500
intervalo_superior <- 2700
# Calcular la probabilidad utilizando la distribución normal
probabilidad <- pnorm(intervalo_superior, mean = mu_x_bar, sd = sigma_x_bar) - pnorm(intervalo_inferior, mean = mu_x_bar, sd = sigma_x_bar)
# Imprimir la probabilidad
print(probabilidad)
## [1] 0.9148023
Se identificaron dos poblaciones de alumnos de último año de un colegio. La variable de interés en la investigación consistía en los puntajes obtenidos en una prueba de rendimiento en estadística que hicieron los estudiantes de las dos poblaciones. Los investigadores suponían que los puntajes de las dos poblaciones estaban distribuidos normalmente con las siguientes medias y varianzas:
Una muestra aleatoria de tamaño n1=10 se saca de la población1 y una de tamaño n2=12 de población 2. ¿Cuál es la probabilidad de que la diferencia entre las medias muestrales esté entre 5 y 15?
# Parámetros
mu1 <- 50
sigma1_sq <- 40
mu2 <- 40
sigma2_sq <- 60
n1 <- 10
n2 <- 12
# Calcular la varianza de la diferencia de las medias muestrales
var_diff <- (sigma1_sq / n1) + (sigma2_sq / n2)
# Calcular la media de la diferencia de las medias muestrales bajo la hipótesis nula
mu_diff <- mu1 - mu2
# Calcular la probabilidad de que la diferencia entre las medias muestrales esté entre 5 y 15
prob <- pnorm(15, mean = mu_diff, sd = sqrt(var_diff)) - pnorm(5, mean = mu_diff, sd = sqrt(var_diff))
# Imprimir el resultado
print(prob)
## [1] 0.9044193
Se desea estudiar una muestra de 20 personas para saber la proporción de ellas que tienen más de 40 años. Sabiendo que la proporción en la población es del 40%, ¿cuál es la probabilidad de que la proporción en la muestra sea menor del 50%?
# Definir los parámetros
n <- 20 # Tamaño de la muestra
p <- 0.4 # Proporción en la población
# Calcular la probabilidad acumulada de tener menos del 50% de personas mayores de 40 años en la muestra
prob_menor_50 <- pbinom(floor(n*0.5), n, p)
# Calcular la probabilidad de que la proporción en la muestra sea menor del 50%
prob_mayor_50 <- 1 - prob_menor_50
# Imprimir el resultado
print(prob_mayor_50)
## [1] 0.1275212
Se cree que 0,16 de las industrias de un área metropolitana I son textiles. Se cree además que en un área metropolitana II esta proporción es de 0,11. Si estas cifras son exactas, ¿cuál es la probabilidad de que una muestra aleatoria simple de 200 industrias del área I y una muestra aleatoria simple independiente de 225 industrias del área II arrojen una diferencia entre las proporciones muestrales mayor o igual que 0,10?
# Definición de parámetros
prop_I <- 0.16 # Proporción en el área metropolitana I
prop_II <- 0.11 # Proporción en el área metropolitana II
n_I <- 200 # Tamaño de la muestra en el área metropolitana I
n_II <- 225 # Tamaño de la muestra en el área metropolitana II
diferencia <- 0.10 # Diferencia entre las proporciones muestrales considerada significativa
# Simulación Monte Carlo para obtener la distribución de diferencias bajo la hipótesis nula
B <- 10000 # Número de repeticiones
diferencias <- numeric(B) # Vector para almacenar las diferencias simuladas
for (i in 1:B) {
# Generar muestra aleatoria para el área metropolitana I
muestra_I <- sample(c(0, 1), size = n_I, replace = TRUE, prob = c(1-prop_I, prop_I))
prop_muestra_I <- mean(muestra_I)
# Generar muestra aleatoria para el área metropolitana II
muestra_II <- sample(c(0, 1), size = n_II, replace = TRUE, prob = c(1-prop_II, prop_II))
prop_muestra_II <- mean(muestra_II)
# Calcular la diferencia entre las proporciones muestrales
diferencia_muestral <- prop_muestra_I - prop_muestra_II
# Almacenar la diferencia en el vector
diferencias[i] <- diferencia_muestral
}
# Calcular la probabilidad de obtener una diferencia igual o mayor que 0.10
probabilidad <- mean(abs(diferencias) >= diferencia)
# Imprimir el resultado
print(probabilidad)
## [1] 0.0666
Las rentabilidades mensuales de cierto tipo de acciones son independientes unas de otras y siguen una distribución normal con desviación típica de 1,7. Se toma una muestra de 12 meses. Hallar la probabilidad de que la desviación estándar muestral sea: (a) menor que 2,5 (b) mayor que 1
# Tamaño de la muestra
n <- 12
# Desviación típica poblacional
sigma <- 1.7
# Grados de libertad
df <- n - 1
# Probabilidad de que la desviación estándar muestral sea menor que 2.5
prob_a <- pchisq((2.5 / sigma)^2 * df, df)
# Probabilidad de que la desviación estándar muestral sea mayor que 1
prob_b <- 1 - pchisq((1 / sigma)^2 * df, df)
# Imprimir resultados
print(paste("Probabilidad de que la desviación estándar muestral sea menor que 2.5:", prob_a))
## [1] "Probabilidad de que la desviación estándar muestral sea menor que 2.5: 0.986346976109843"
print(paste("Probabilidad de que la desviación estándar muestral sea mayor que 1:", prob_b))
## [1] "Probabilidad de que la desviación estándar muestral sea mayor que 1: 0.975246169132498"
Se supone que la varianza de las calificaciones de las pruebas de estado en cierto país es la misma para hombres y mujeres. Una muestra aleatoria de 21 hombres y una muestra aleatoria independiente de 19 mujeres dan varianzas de 876 y 400 respectivamente. Si las calificaciones para hombres y mujeres están normalmente distribuidas y tienen varianzas iguales, ¿cuál es la probabilidad de obtener de esas muestras resultados tan extremos o más extremos que estos?
# Datos
n1 <- 21 # Tamaño de la muestra de hombres
n2 <- 19 # Tamaño de la muestra de mujeres
s1_sq <- 876 # Varianza muestral de hombres
s2_sq <- 400 # Varianza muestral de mujeres
# Estadística de prueba (F)
F_stat <- (s1_sq / s2_sq)
# Grados de libertad
df1 <- n1 - 1
df2 <- n2 - 1
# Probabilidad de obtener resultados tan extremos o más extremos
p_value <- pf(F_stat, df1, df2, lower.tail = FALSE) * 2
# Imprimir resultado
print(p_value)
## [1] 0.1001248