Una empresa emplea 1500 personas. La cantidad promedio gastada, durante un año determinado, en servicios médicos personales por empleado fue de 2.575 dólares y la desviación típica de 525 dólares. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 empleados (seleccionados sin reemplazo) arroje una media comprendida entre 2500 y 2700 dólares?
# Datos dados
media_poblacional <- 2575
desviacion <- 525
n <- 100
media_muestra_menor <- 2500
media_muestra_mayor <- 2700
# Calcular la t de Student para la muestra menor
t_menor <- (media_muestra_menor - media_poblacional) / (desviacion / sqrt(n))
# Calcular la t de Student para la muestra mayor
t_mayor <- (media_muestra_mayor - media_poblacional) / (desviacion / sqrt(n))
# Calcular la probabilidad utilizando la función pt() para la distribución t
probabilidad_menor <- pt(t_menor, df = n - 1)
probabilidad_mayor <- pt(t_mayor, df = n - 1)
# La probabilidad buscada es la diferencia entre las probabilidades superior e inferior
probabilidad <- probabilidad_mayor - probabilidad_menor
# Imprimir el resultado
print(paste("La probabilidad de que una muestra aleatoria de 100 empleados sea de una media comprendida entre 2500 y 2700 dólares es:", probabilidad))
## [1] "La probabilidad de que una muestra aleatoria de 100 empleados sea de una media comprendida entre 2500 y 2700 dólares es: 0.912271986362013"
Se identificaron dos poblaciones de alumnos de último año de un colegio. La variable de interés en la investigación consistía en los puntajes obtenidos en una prueba de rendimiento en estadística que hicieron los estudiantes de las dos poblaciones. Los investigadores suponían que los puntajes de las dos poblaciones estaban distribuidos normalmente con las siguientes medias y varianzas: µ1=50, σ^2 uno es 40, µ2=40,σ^2 dos es 60. Una muestra aleatoria de tamaño n1=10 se saca de la población1 y una de tamaño n2=12 de población 2. ¿Cuál es la probabilidad de que la diferencia entre las medias muestrales esté entre 5 y 15?
Población de estudiantes 1: Tamaño muestra = 10 Media = 50 Desviación = 40
Población de estudiantes 2: Tamaño muestra = 12 Media = 40 Desviación = 60
n_1 <- 10
media_1 <- 50
desviacion_1 <- 40
n_2 <- 12
media_2 <- 40
desviacion_2 <- 60
diferencia_observada <- media_1 - media_2
diferencia_espera1 <- 5
diferencia_espera2 <- 15
## desviación estándar de la diferencia
desviacion_diferencia <- sqrt((diferencia_espera1 / n_1) + (diferencia_espera2 / n_2))
## Z
Z1 <- (diferencia_espera1 - diferencia_observada) / desviacion_diferencia
Z2 <- (diferencia_espera2 - diferencia_observada) / desviacion_diferencia
## probabilidad utilizando la distribución normal estándar
probabilidad <- pnorm(Z1)
probabilidad2 <- pnorm(Z2)
print("La probabilidad que la diferencia de las medias muestrales es de")
## [1] "La probabilidad que la diferencia de las medias muestrales es de"
print(probabilidad2-probabilidad)
## [1] 0.9998429
Se desea estudiar una muestra de 20 personas para saber la proporción de ellas que tienen más de 40 años. Sabiendo que la proporción en la población es del 40%, ¿cuál es la probabilidad de que la proporción en la muestra sea menor del 50%?
Muestra: 20, Proporción: 0.4, Probabilidad: 0.5
p <- 0.4
n <- 20
qq <- 0.5
#Calculamos Z
dif_p <- p-qq
raiz <- sqrt((p*(1-p))/n)
z <- dif_p/raiz
#Buscamos la probabilidad
prob <- pnorm(z)
print("La probabilidad de que la proporción sea del 50% es del:")
## [1] "La probabilidad de que la proporción sea del 50% es del:"
print(probabilidad)
## [1] 7.852614e-05
Se cree que 0,16 de las industrias de un área metropolitana I son textiles. Se cree además que en un área metropolitana II esta proporción es de 0,11. Si estas cifras son exactas, ¿cuál es la probabilidad de que una muestra aleatoria simple de 200 industrias del área I y una muestra aleatoria simple independiente de 225 industrias del área II arrojen una diferencia entre las proporciones muestrales mayor o igual que 0,10?
#Datos dados
p_I <- 0.16
p_II <- 0.11
pp <- 0.10
n_I <- 200
n_II <- 225
dif_p <- 0.05
#Calculo de Z
raizp <- sqrt((p_I*(1-p_I)/n_I)+(p_II*(1-p_II)/n_II))
z <- (pp-dif_p)/raizp
#Probabilidad de Z
prob <- pnorm(z)
print("La probabilidad de que sea mayor o igual a 10% es:")
## [1] "La probabilidad de que sea mayor o igual a 10% es:"
print(prob)
## [1] 0.9335427
Se supone que la varianza de las calificaciones de las pruebas de estado en cierto país es la misma para hombres y mujeres. Una muestra aleatoria de 21 hombres y una muestra aleatoria independiente de 19 mujeres dan varianzas de 876 y 400 respectivamente. Si las calificaciones para hombres y mujeres están normalmente distribuidas y tienen varianzas iguales, ¿cuál es la probabilidad de obtener de esas muestras resultados tan extremos o más extremos que estos?
#para la muestra 1
desviacion_estandar_1 <- sqrt(876)
n1 <- 21
#para la muestra_2
desviacion_estandar_2 <- sqrt(400)
n2 <- 19
#la razón de varianzas
razon_varianzas <- (desviacion_estandar_1 **2) / (desviacion_estandar_2 **2)
#Definir los grados de libertad para la distribución F
df1 <- n1 - 1
df2 <- n2 - 1
#probabilidad utilizando la distribución F de Fisher
probabilidad <- pf(razon_varianzas, df1, df2, lower.tail = FALSE)
cat("la probabilidad de que la razón de varianzas sea MAYOR a :", probabilidad, "\n")
## la probabilidad de que la razón de varianzas sea MAYOR a : 0.05006241