Taller.

Distr Muestral de la Media

Muestras Grandes

  1. Una empresa emplea 1500 personas. La cantidad promedio gastada, durante un Año determinado, en servicios médicos personales por empleado fue de2.575dólares y la desviacióntípica de 525 dólares. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 empleados (seleccionados sin reemplazo) arroje una media comprendida entre 2500 y 2700 dólares?
N <- 1500        # Tamaño de la población
n <- 100         # Tamaño de la muestra
media_poblacional <- 2575  # Media poblacional
desviacion_poblacional <- 525  # Desviación típica poblacional

# Intervalo de interés
limite_inferior <- 2500
limite_superior <- 2700

# Ajuste por corrección de población finita
factor_correcion <- sqrt((N - n) / (N - 1))

# Error estándar ajustado
error_estandar <- (desviacion_poblacional / sqrt(n)) * factor_correcion

# Cálculo de los valores Z
z_inferior <- (limite_inferior - media_poblacional) / error_estandar
z_superior <- (limite_superior - media_poblacional) / error_estandar

# Cálculo de las probabilidades acumuladas
prob_inferior <- pnorm(z_inferior)
prob_superior <- pnorm(z_superior)

# Probabilidad de estar entre los límites
probabilidad <- prob_superior - prob_inferior

# Resultados
cat("Error estándar ajustado: ", error_estandar, "\n")
## Error estándar ajustado:  50.73673
cat("Valor Z para 2500: ", z_inferior, "\n")
## Valor Z para 2500:  -1.478219
cat("Valor Z para 2700: ", z_superior, "\n")
## Valor Z para 2700:  2.463698
cat("Probabilidad de estar entre 2500 y 2700: ", probabilidad, "\n")
## Probabilidad de estar entre 2500 y 2700:  0.9234498

muestras pequeñas

  1. Suponga que de una población normal con media de 20 se toma una muestra de tamaño 16. si la desviación estandar muestral es 4, encuentre la probabilidad de que la media muestral sea estrictamente mayor que 21,753
mu <- 20              # Media poblacional
s <- 4                # Desviación estándar muestral
n <- 16               # Tamaño de la muestra
x_barra <- 21.753     # Media muestral a analizar

# Calcular el error estándar
error_estandar <- s / sqrt(n)
cat("Error estándar:", error_estandar, "\n")
## Error estándar: 1
# Calcular el valor t
t_calculado <- (x_barra - mu) / error_estandar
cat("Valor t calculado:", t_calculado, "\n")
## Valor t calculado: 1.753
# Calcular los grados de libertad
gl <- n - 1
cat("Grados de libertad:", gl, "\n")
## Grados de libertad: 15
# Calcular la probabilidad de que la media muestral sea mayor
# Como es estrictamente mayor, usamos la cola superior de la distribución t
probabilidad <- 1 - pt(t_calculado, df = gl)
cat("La probabilidad de que la media muestral sea estrictamente mayor que 21.753 es:", probabilidad, "\n")
## La probabilidad de que la media muestral sea estrictamente mayor que 21.753 es: 0.05000445

Caso 1: varianzas poblaciónales conocidas o desconocidas y muestras grandes

  1. Se identificaron dos poblaciones de alumnos de ultimo año de un colegio. la variable de interes en la investigacion consistia en los puntajes obtenidos en una prueba de rendimiento en estadistica, que hicieron los estudiantes de las dos poblaciones. los investigadores suponian que los puntajes de las poblaciones estaban distribuidos normalmente con las siguientes medias y varianzas: μ1 = 50 σ21 =40, μ2 = 40 σ21 = 60. Al tomar una muestra aleatoria de tamaño n = 10 de la poblacion 1 y otra de tamaño n = 2, ¿cual es la probablidad de que la diferencia entre las medias muestrales se halle entre 5 y 15?
mu1 <- 50
mu2 <- 40
var1 <- 40
var2 <- 60
n1 <- 10
n2 <- 12

# Media y desviación estándar de la diferencia de medias
mu_D <- mu1 - mu2
sigma_D <- sqrt(var1/n1 + var2/n2)

# Valores Z para los límites
Z1 <- (5 - mu_D) / sigma_D
Z2 <- (15 - mu_D) / sigma_D

# Probabilidades acumuladas
P1 <- pnorm(Z1)
P2 <- pnorm(Z2)

# Probabilidad solicitada
prob <- P2 - P1

# Resultado
cat("La probabilidad de que la diferencia esté entre 5 y 15 es:", prob)
## La probabilidad de que la diferencia esté entre 5 y 15 es: 0.9044193

Caso 2: varianzas poblaciónales desconocidas, iguales y muestras pequeñas

  1. En una escuela se quiere comparar el rendimiento en matematicas de dos grupos de estudiantes. se sabe que los puntajes siguen una distribución normal: Grupo A, n1 = 10 estudiantes, con media muestral XA = 80 y desviación estandar muestral sA = 6. Grupo B, n1 = 12 estudiantes, con una media muestral XB = 74 y desviación estandar muestral sB =5. ¿cual es la probabilidad de que la diferencia en las medias muestrales sea mayor que 4 puntos?
n1 <- 10        # Tamaño muestral del Grupo A
n2 <- 12        # Tamaño muestral del Grupo B
x1_bar <- 80    # Media muestral del Grupo A
x2_bar <- 74    # Media muestral del Grupo B
s1 <- 6         # Desviación estándar muestral del Grupo A
s2 <- 5         # Desviación estándar muestral del Grupo B

# Varianza muestral combinada
s_pooled <- sqrt(((n1 - 1) * s1^2 + (n2 - 1) * s2^2) / (n1 + n2 - 2))
cat("Varianza muestral combinada:", s_pooled, "\n")
## Varianza muestral combinada: 5.472659
# Error estándar de la diferencia de medias
se_diff <- s_pooled * sqrt(1/n1 + 1/n2)
cat("Error estándar de la diferencia de medias:", se_diff, "\n")
## Error estándar de la diferencia de medias: 2.343253
# Grados de libertad
df <- n1 + n2 - 2
cat("Grados de libertad:", df, "\n")
## Grados de libertad: 20
# Diferencia de medias observada
diff_obs <- x1_bar - x2_bar
cat("Diferencia de medias observada:", diff_obs, "\n")
## Diferencia de medias observada: 6
# Calculando la probabilidad
# P((X1_bar - X2_bar) > 4)
p <- 1 - pt((4 - diff_obs) / se_diff, df)

cat("Probabilidad de que la diferencia en las medias sea mayor que 4 puntos:", p, "\n")
## Probabilidad de que la diferencia en las medias sea mayor que 4 puntos: 0.7982595