DISTRIBUCIÓN DE LA MEDIA MUESTRAL (MUESTRAS GRANDES)
# Problema 1
# Una empresa emplea 1500 personas. La cantidad promedio gastada, durante un año determinado, en servicios médicos personales por empleado fue de 2.575 dólares y la desviación típica de 525 dólares. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 empleados (seleccionados sin reemplazo) arroje una media comprendida entre 2500 y 2700 dólares?
# Parámetros dados
media_poblacional <- 2575
desviacion <- 525
n <- 100
media_muestra_inferior <- 2500
media_muestra_superior <- 2700
# Calcular la t de Student para la muestra inferior
t_inferior <- (media_muestra_inferior - media_poblacional) / (desviacion / sqrt(n))
# Calcular la t de Student para la muestra superior
t_superior <- (media_muestra_superior - media_poblacional) / (desviacion / sqrt(n))
# Calcular la probabilidad utilizando la función pt() para la distribución t
probabilidad_inferior <- pt(t_inferior, df = n - 1)
probabilidad_superior <- pt(t_superior, df = n - 1)
# La probabilidad buscada es la diferencia entre las probabilidades superior e inferior
probabilidad <- probabilidad_superior - probabilidad_inferior
# Imprimir el resultado
print(paste("La probabilidad de que una muestra aleatoria de 100 empleados arroje una media comprendida entre 2500 y 2700 dólares es:", probabilidad))
## [1] "La probabilidad de que una muestra aleatoria de 100 empleados arroje una media comprendida entre 2500 y 2700 dólares es: 0.912271986362013"
# Problema 2
# Un estudio de tránsito revela que el número promedio de ocupantes de un auto es 1.75. En una muestra de 50 autos con desviación estándar 0.65, seleccionada de una población normal, encuentre la probabilidad de que el número promedio de ocupantes sea mayor que 2.
# Parámetros dados
media_poblacional <- 1.75
desviacion <- 0.65
n <- 50
media_muestra <- 2
# Calcular la t de Student
t <- (media_muestra - media_poblacional) / (desviacion / sqrt(n))
# Calcular la probabilidad usando la función pt() para la distribución t
probabilidad <- pt(t, df = n - 1, lower.tail = FALSE)
# Imprimir el resultado
cat("La probabilidad de que el número promedio de ocupantes sea mayor que 2 es:", probabilidad, "\n")
## La probabilidad de que el número promedio de ocupantes sea mayor que 2 es: 0.004508133
# Problema 3
# Supongamos que el incremento porcentual de los salarios de los funcionarios de todas las corporaciones medianas se distribuye siguiendo una normal con media 12.2% y desviación típica 3.6%. Se toma una muestra aleatoria de nueve observaciones de esta población de incrementos porcentuales de salario. ¿Cuál es la probabilidad de que la media muestral sea mayor del 10%?
# Parámetros dados
media_poblacional <- 12.2
desviacion <- 3.6
n <- 9
media_muestra <- 10
# Calcular la t de Student
t <- (media_muestra - media_poblacional) / (desviacion / sqrt(n))
# Calcular la probabilidad usando la función pt() para la distribución t
probabilidad <- pt(t, df = n - 1, lower.tail = FALSE)
# Imprimir el resultado
cat("La probabilidad de que la media muestral sea mayor del 10% es:", probabilidad, "\n")
## La probabilidad de que la media muestral sea mayor del 10% es: 0.947948
# Problema 4
# Supongamos que el tiempo de respuesta de todos los servidores de una red empresarial sigue una distribución normal con una media de 15 milisegundos y una desviación estándar de 4 milisegundos. Se selecciona una muestra aleatoria de nueve observaciones de estos tiempos de respuesta. ¿Cuál es la probabilidad de que la media muestral sea mayor de 12 milisegundos?
# Parámetros dados
media_poblacional <- 15
desviacion <- 4
n <- 9
media_muestra <- 12
# Calcular la t de Student
t <- (media_muestra - media_poblacional) / (desviacion / sqrt(n))
# Calcular la probabilidad usando la función pt() para la distribución t
probabilidad <- pt(t, df = n - 1, lower.tail = FALSE)
# Imprimir el resultado
cat("La probabilidad de que la media muestral sea mayor de 12 milisegundos es:", probabilidad, "\n")
## La probabilidad de que la media muestral sea mayor de 12 milisegundos es: 0.9727163
# Problema 5
# Los tiempos requeridos para que unos trabajadores terminen cierta labor, se distribuyen normalmente con media de 30 minutos y una desviación estándar de 9 minutos. Si de la planta de trabajadores se toma una muestra aleatoria de 25, encuentre la probabilidad de que la media del tiempo requerido para concluir la tarea en la muestral esté entre 28 y 33 minutos.
# Parámetros dados
media_poblacional <- 30
desviacion <- 9
n <- 25
media_muestra_inferior <- 28
media_muestra_superior <- 33
# Calcular la t de Student para la muestra inferior
t_inferior <- (media_muestra_inferior - media_poblacional) / (desviacion / sqrt(n))
# Calcular la t de Student para la muestra superior
t_superior <- (media_muestra_superior - media_poblacional) / (desviacion / sqrt(n))
# Calcular la probabilidad utilizando la función pt() para la distribución t
probabilidad_inferior <- pt(t_inferior, df = n - 1)
probabilidad_superior <- pt(t_superior, df = n - 1)
# La probabilidad buscada es la diferencia entre las probabilidades superior e inferior
probabilidad <- probabilidad_superior - probabilidad_inferior
# Imprimir el resultado
cat("La probabilidad de que la media del tiempo requerido para concluir la tarea en la muestra esté entre 28 y 33 minutos es:", probabilidad, "\n")
## La probabilidad de que la media del tiempo requerido para concluir la tarea en la muestra esté entre 28 y 33 minutos es: 0.8069458
DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL
# Problema 12
# Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la proporción de casas de este tipo cuya instalación eléctrica resulta insegura. Supongamos que, de hecho, el 30% de todos los edificios de esta población tienen una instalación insegura. Hallar la probabilidad de que la proporción de edificios de la muestra con instalación insegura esté entre 0,25 y 0,35.
# Datos dados en el problema
p_poblacional <- 0.3 # Proporción poblacional de casas con instalación insegura
n_muestra <- 250 # Tamaño de la muestra
p_muestra <- n_muestra * p_poblacional # Media de la distribución binomial
desviacion_muestra <- sqrt(n_muestra * p_poblacional * (1 - p_poblacional)) # Desviación estándar de la distribución binomial
# Calcular el valor Z para los límites del intervalo dado
z_inferior <- (0.25 * n_muestra - p_muestra) / desviacion_muestra
z_superior <- (0.35 * n_muestra - p_muestra) / desviacion_muestra
# Calcular la probabilidad utilizando la distribución normal estándar
probabilidad_inferior <- pnorm(z_inferior)
probabilidad_superior <- pnorm(z_superior)
# La probabilidad total es la diferencia entre las probabilidades acumuladas en el intervalo
probabilidad <- probabilidad_superior - probabilidad_inferior
# Imprimir el resultado
cat("La probabilidad de que la proporción de edificios de la muestra con instalación insegura esté entre 0,25 y 0,35 es:", probabilidad, "\n")
## La probabilidad de que la proporción de edificios de la muestra con instalación insegura esté entre 0,25 y 0,35 es: 0.9155021
# Problema 13
# Se desea estudiar una muestra de 20 personas para saber la proporción de ellas que tienen más de 40 años. Sabiendo que la proporción en la población es del 40%, ¿cuál es la probabilidad de que la proporción en la muestra sea menor del 50%?
# Datos dados en el problema
prop_poblacional <- 0.40 # Proporción en la población
n <- 20 # Tamaño de la muestra
prop_muestra <- 0.50 # Proporción en la muestra
# Calcular el número esperado de personas mayores de 40 años en la muestra
numero_esperado <- prop_poblacional * n
# Calcular la probabilidad utilizando la distribución binomial
probabilidad <- pbinom(floor(prop_muestra * n), size = n, prob = prop_poblacional)
# Imprimir el resultado
cat("La probabilidad de que la proporción en la muestra sea menor del 50% es:", probabilidad, "\n")
## La probabilidad de que la proporción en la muestra sea menor del 50% es: 0.8724788
DISTRIBUCIÓN DE LA DIFERENCIA DE PROPORCIONES MUESTRALES
# Problema 15
# Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto país difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo el 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres, su opinión sobre la promulgación de la pena de muerte para personas culpables de asesinato determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de mujeres.
# Datos dados en el problema
prop_hombres_poblacional <- 0.12 # Proporción de hombres a favor de la pena de muerte en la población
prop_mujeres_poblacional <- 0.10 # Proporción de mujeres a favor de la pena de muerte en la población
n_hombres <- 150 # Tamaño de la muestra de hombres
n_mujeres <- 100 # Tamaño de la muestra de mujeres
# Calcular la media muestral y la desviación estándar muestral para hombres
media_hombres <- prop_hombres_poblacional
desviacion_hombres <- sqrt((prop_hombres_poblacional * (1 - prop_hombres_poblacional)) / n_hombres)
# Calcular la media muestral y la desviación estándar muestral para mujeres
media_mujeres <- prop_mujeres_poblacional
desviacion_mujeres <- sqrt((prop_mujeres_poblacional * (1 - prop_mujeres_poblacional)) / n_mujeres)
# Calcular la diferencia de medias observada
diferencia_observada <- media_hombres - media_mujeres - 0.03
# Calcular la desviación estándar de la diferencia
desviacion_diferencia <- sqrt(desviacion_hombres^2 + desviacion_mujeres^2)
# Calcular el valor Z
Z <- diferencia_observada / desviacion_diferencia
# Calcular la probabilidad utilizando la distribución normal estándar
probabilidad <- pnorm(Z)
# Imprimir el resultado
cat("La probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de mujeres es:", probabilidad, "\n")
## La probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de mujeres es: 0.4014143
# Problema 16
# En una muestra aleatoria simple de 150 ingenieros que habían culminado su carrera en universidades privadas, 45 gozan de una estabilidad económica. En una muestra aleatoria simple independiente de 200 ingenieros que habían culminado su carrera en universidades públicas, 20 gozan de una estabilidad económica. Supongamos que la proporción de los ingenieros que gozan de una estabilidad económica es de 0,15 en cada grupo. ¿Cuál es la probabilidad de que los resultados obtenidos con estas muestras lleguen a este extremo o a más?
# Datos dados en el problema
prop_privadas_poblacional <- 0.15 # Proporción de ingenieros con estabilidad económica en universidades privadas en la población
prop_publicas_poblacional <- 0.15 # Proporción de ingenieros con estabilidad económica en universidades públicas en la población
n_privadas <- 150 # Tamaño de la muestra de ingenieros de universidades privadas
n_publicas <- 200 # Tamaño de la muestra de ingenieros de universidades públicas
obs_privadas <- 45 # Número observado de ingenieros con estabilidad económica en universidades privadas
obs_publicas <- 20 # Número observado de ingenieros con estabilidad económica en universidades públicas
# Calcular la media muestral y la desviación estándar muestral para universidades privadas
media_privadas <- prop_privadas_poblacional
desviacion_privadas <- sqrt((prop_privadas_poblacional * (1 - prop_privadas_poblacional)) / n_privadas)
# Calcular la media muestral y la desviación estándar muestral para universidades públicas
media_publicas <- prop_publicas_poblacional
desviacion_publicas <- sqrt((prop_publicas_poblacional * (1 - prop_publicas_poblacional)) / n_publicas)
# Calcular la diferencia de medias observada
diferencia_observada <- obs_privadas/n_privadas - obs_publicas/n_publicas
# Calcular la desviación estándar de la diferencia
desviacion_diferencia <- sqrt(desviacion_privadas^2 + desviacion_publicas^2)
# Calcular el valor Z
Z <- diferencia_observada / desviacion_diferencia
# Calcular la probabilidad utilizando la distribución normal estándar
probabilidad <- pnorm(Z)
# Imprimir el resultado
cat("La probabilidad de que los resultados obtenidos con estas muestras lleguen a este extremo o a más es:", probabilidad, "\n")
## La probabilidad de que los resultados obtenidos con estas muestras lleguen a este extremo o a más es: 0.9999999
DISTRIBUCIÓN DE LA VARIANZA MUESTRAL
# Problema 18
# Calidad en la Producción de Componentes Electrónicos: En el ámbito económico, consideremos un escenario donde una empresa se especializa en la producción de componentes electrónicos esenciales para diversos sectores económicos. La resistencia en ohmios de estos componentes, cuando el proceso de producción funciona correctamente, sigue una distribución normal con desviación típica de 3.6 ohmios. La empresa está interesada en evaluar la consistencia en la resistencia de sus productos y decide tomar muestras aleatorias de 4 componentes para analizar la variabilidad. ¿Cuál es la probabilidad de que la varianza muestral sea mayor 27?
# Datos del problema
desviacion_estandar <- 3.6 # Desviación estándar de la resistencia en ohmios
n <- 4 # Tamaño de la muestra de componentes electrónicos
varianza_limite <- 27 # Varianza límite deseada
# Calcular el valor chi-cuadrado para la varianza límite deseada
chi_cuadrado <- (n - 1) * varianza_limite / (desviacion_estandar^2)
# Calcular la probabilidad utilizando la distribución chi-cuadrado
probabilidad <- pchisq(chi_cuadrado, df = n - 1, lower.tail = FALSE)
# Imprimir el resultado
cat("La probabilidad de que la varianza muestral sea mayor a 27 es:", probabilidad, "\n")
## La probabilidad de que la varianza muestral sea mayor a 27 es: 0.1000608
# Problema 19
# Las rentabilidades mensuales de cierto tipo de acciones son independientes unas de otras y siguen una distribución normal con desviación típica de 1,7. Se toma una muestra de 12 meses. Hallar la probabilidad de que la desviación estándar muestral sea:
# (a) Menor que 2.5
# (b) Mayor que 1
# Datos del problema
desviacion_estandar_poblacional <- 1.7 # Desviación estándar poblacional de las rentabilidades mensuales
n <- 12 # Tamaño de la muestra de meses
varianza_poblacional <- desviacion_estandar_poblacional^2 # Varianza poblacional
# a) Calcular la probabilidad de que la desviación estándar muestral sea menor que 2.5
desviacion_estandar_limite_a <- 2.5 # Desviación estándar límite a verificar
varianza_limite_a <- desviacion_estandar_limite_a^2 # Varianza límite
# Calcular el valor chi-cuadrado para la varianza límite deseada
chi_cuadrado_a <- (n - 1) * varianza_limite_a / varianza_poblacional
# Calcular la probabilidad utilizando la distribución chi-cuadrado
probabilidad_a <- pchisq(chi_cuadrado_a, df = n - 1, lower.tail = TRUE)
# b) Calcular la probabilidad de que la desviación estándar muestral sea mayor que 1
desviacion_estandar_limite_b <- 1 # Desviación estándar límite b verificar
varianza_limite_b <- desviacion_estandar_limite_b^2 # Varianza límite
# Calcular el valor chi-cuadrado para la varianza límite deseada
chi_cuadrado_b <- (n - 1) * varianza_limite_b / varianza_poblacional
# Calcular la probabilidad utilizando la distribución chi-cuadrado
probabilidad_b <- pchisq(chi_cuadrado_b, df = n - 1, lower.tail = FALSE)
# Imprimir los resultados
cat("a) La probabilidad de que la desviación estándar muestral sea menor que 2.5 es:", probabilidad_a, "\n")
## a) La probabilidad de que la desviación estándar muestral sea menor que 2.5 es: 0.986347
cat("b) La probabilidad de que la desviación estándar muestral sea mayor que 1 es:", probabilidad_b, "\n")
## b) La probabilidad de que la desviación estándar muestral sea mayor que 1 es: 0.9752462
DISTRIBUCIÓN DE LA RAZÓN DE VARIANZAS MUESTRALES
# Problema 20
# Evaluación de Rendimiento en Equipos de Producción: En un contexto de gestión de operaciones, consideremos una situación en la que se está llevando a cabo una evaluación de rendimiento entre dos equipos de producción, denominados A y B, en una planta de manufactura. El equipo A consiste en 61 operadores y el equipo B en 41 operadores. Suponiendo que la eficiencia en la producción de cada operador se distribuye normalmente y que sus varianzas son iguales. Se registrará la eficiencia en la producción de cada operador y se busca determinar si hay diferencias significativas en la variabilidad del rendimiento entre los dos equipos.\n")
# Datos del problema
n_A <- 61 # Número de operadores en el equipo A
n_B <- 41 # Número de operadores en el equipo B
F_limit <- 1.64 # Valor límite de la razón de las varianzas
# Definir los grados de libertad para la distribución F
df1 <- n_A - 1
df2 <- n_B - 1
# Calcular la probabilidad utilizando la distribución F de Fisher
probabilidad <- pf(F_limit, df1, df2, lower.tail = FALSE)
# Imprimir el resultado
cat("La probabilidad de que la razón de las varianzas muestrales de A y B sea mayor que 1.64 es:", probabilidad, "\n")
## La probabilidad de que la razón de las varianzas muestrales de A y B sea mayor que 1.64 es: 0.04943336