Problemas de distribuciones muestrales

Distribución de la Media Muestral

Una empresa emplea 1500 personas. La cantidad promedio gastada, durante un Año determinado, en servicios médicos personales por empleado fue de 2.575 dólares y la desviación típica de 525 dólares. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 empleados (seleccionados sin reemplazo) arroje una media comprendida entre 2500 y 2700 dólares?

probabilidad_ma <- pnorm(2700, mean =2575, sd=525)

probabilidad_me <- pnorm(2500, mean=2575, sd=525, lower.tail = FALSE )

PROBABILIDAD_TOTAL= (probabilidad_ma-probabilidad_me)

print("La probabilidad de que al elegir 100 empleados aleatoriamente y que la media esté comprendida entre 2500 y 2700 es de:")
## [1] "La probabilidad de que al elegir 100 empleados aleatoriamente y que la media esté comprendida entre 2500 y 2700 es de:"
print (PROBABILIDAD_TOTAL)
## [1] 0.03729789

Distribución de la diferencia de medias muestrales

Se identificaron dos poblaciones de alumnos de último año de un colegio. La variable de interés en la investigación consistía en los puntajes obtenidos en una prueba de rendimiento en estadística que hicieron los estudiantes de las dos poblaciones. Los investigadores suponían que los puntajes de las dos poblaciones estaban distribuidos normalmente con las siguientes medias y varianzas: µ1=50, σ^2 uno es 40, µ2=40,σ^2 dos es 60. Una muestra aleatoria de tamaño n1=10 se saca de la población1 y una de tamaño n2=12 de población 2. ¿Cuál es la probabilidad de que la diferencia entre las medias muestrales esté entre 5 y 15?

Población de estudiantes 1: Tamaño muestra = 10 Media = 50 Desviación = 40

Población de estudiantes 2: Tamaño muestra = 12 Media = 40 Desviación = 60

n_1 <- 10
media_1 <- 50
desviacion_1 <- 40


n_2 <- 12
media_2 <- 40
desviacion_2 <- 60


diferencia_observada <- media_1 - media_2


diferencia_esperada_1 <- 5

diferencia_esperada_2 <- 15

## desviación estándar de la diferencia
desviacion_diferencia <- sqrt((desviacion_1 / n_1) + (desviacion_2 / n_2))

## Z
Z1 <- (diferencia_esperada_1 - diferencia_observada) / desviacion_diferencia
Z2 <- (diferencia_esperada_2 - diferencia_observada) / desviacion_diferencia


## probabilidad utilizando la distribución normal estándar
probabilidad <- pnorm(Z1)
probabilidad2 <- pnorm(Z2)

print("La probabilidad que la diferencia de las medias muestrales es de")
## [1] "La probabilidad que la diferencia de las medias muestrales es de"
print(probabilidad2-probabilidad)
## [1] 0.9044193

Distribución de la proporción muestral

Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la proporción de casas de este tipo cuya instalación eléctrica resulta insegura. Supongamos que, de hecho, el 30% de todos los edificios de esta población tienen una instalación insegura. Hallar la probabilidad de que la proporción de edificios de la muestra con instalación insegura esté entre 0,25 y 0,35.

## Datos
prop_poblacional <- 0.30
tam_muestra <- 250
prop_insegura_min <- 0.25
prop_insegura_max <- 0.35

## Calcular la desviación estándar
desviacion_estandar <- sqrt(prop_poblacional * (1 - prop_poblacional) / tam_muestra)

## Calcular Z
z_min <- (prop_insegura_min - prop_poblacional) / desviacion_estandar
z_max <- (prop_insegura_max - prop_poblacional) / desviacion_estandar

## Calcular la probabilidad
probabilidad <- pnorm(z_max) - pnorm(z_min)

print(paste("La probabilidad de que la proporción de edificios de la muestra con instalación insegura esté entre", prop_insegura_min, "y", prop_insegura_max, "es aproximadamente:", probabilidad))
## [1] "La probabilidad de que la proporción de edificios de la muestra con instalación insegura esté entre 0.25 y 0.35 es aproximadamente: 0.91550206027607"

Distribución de la diferencia de proporciones muestrales

Se cree que 0,16 de las industrias de un área metropolitana I son textiles. Se cree además que en un área metropolitana II esta proporción es de 0,11. Si estas cifras son exactas, ¿cuál es la probabilidad de que una muestra aleatoria simple de 200 industrias del área I y una muestra aleatoria simple independiente de 225 industrias del área II arrojen una diferencia entre las proporciones muestrales mayor o igual que 0,10?

#Datos
pI <- 0.16
pII <- 0.11
pp <- 0.10
nI <- 200
nII <- 225
dif_p <- 0.05

#Calculo de Z
raizp <- sqrt((pI*(1-pI)/nI)+(pII*(1-pII)/nII))
z <- (pp-dif_p)/raizp

#Probabilidad de Z
prob <- pnorm(z)

print("La probabilidad de que sea mayor o igual a 10% es:")
## [1] "La probabilidad de que sea mayor o igual a 10% es:"
print(prob)
## [1] 0.9335427

Distribución de la varianza muestral

Las rentabilidades mensuales de cierto tipo de acciones son independientes unas de otras y siguen una distribución normal con desviación típica de 1,7. Se toma una muestra de 12 meses. Hallar la probabilidad de que la desviación estándar muestral sea: (a) menor que 2,5 (b) mayor que 1.

n <- 12 
desviacion_tipica <- 1.7
desviacion_A <- 2.5
desviacion_B <- 1

#Cálculo de los valores de chi^2

chi2_A <- (n - 1) * (desviacion_A^2)/ (desviacion_tipica^2)
chi2_B <- (n - 1) * (desviacion_B^2) / (desviacion_tipica^2)

#Probabilidad_A
probabilidad_A <- pchisq(chi2_A, df = n - 1, lower.tail = FALSE)

#Probabilidad_B 
probabilidad_B <- 1 - pchisq(chi2_B, df = n - 1)

print(paste ("la probabilidad de que la desviación estándar muestral sea menor que 2,5 es", probabilidad_A))
## [1] "la probabilidad de que la desviación estándar muestral sea menor que 2,5 es 0.0136530238901565"
print(paste ("la probabilidad de que la desviación estándar muestral sea mayor que 1 es", probabilidad_B))
## [1] "la probabilidad de que la desviación estándar muestral sea mayor que 1 es 0.975246169132498"

Distribución de la razon de varianzas muestrales

Se supone que la varianza de las calificaciones de las pruebas de estado en cierto país es la misma para hombres y mujeres. Una muestra aleatoria de 21 hombres y una muestra aleatoria independiente de 19 mujeres dan varianzas de 876 y 400 respectivamente. Si las calificaciones para hombres y mujeres están normalmente distribuidas y tienen varianzas iguales, ¿cuál es la probabilidad de obtener de esas muestras resultados tan extremos o más extremos que estos?

n_H <- 21 # Muestra de hombres
n_M <- 19 # Muestra de mujeres
desviacion_H <- 876 #Muestra de hombres 
desviacion_M <- 400 #Muestra de mujer 

#Razón de varianzas 
razon_varianzas <- (desviacion_H^2)/(desviacion_M^2)

#Grados de libertad F
dfH <- n_H - 1
dfM <- n_M - 1

#Probabilidad 
probabilidad <- pf(F,razon_varianzas, dfH, dfM, lower.tail = FALSE)*2

print(paste("La probabilidad de obtener de esas muestras resultados tan extremos o más extremos que estos es de", probabilidad))
## [1] "La probabilidad de obtener de esas muestras resultados tan extremos o más extremos que estos es de 2"