Estadística Inferencial

true
2023-08-02

Distribuciones Muestrales

Distribución de la media muestral

  1. Supongamos que el incremento porcentual de los salarios de los funcionarios de todas las corporaciones medianas se distribuye siguiendo una normal con media 12,2% y desviación típica 3,6%. Se toma una muestra aleatoria de nueve observaciones de esta población de incrementos porcentuales de salario. ¿Cuál es la probabilidad de que la media muestral sea mayor del 10%?.
n<-9              #A)  Tamaño de la Muestra
sigma<-3.6           #B  Desviación Típica
xbarra <- 10      #C)  Media muestral
mu <- 12.2        #D)  Media poblacional
ES <- sigma/sqrt(n)   #E)  Error estándar (desviación del estadístico)
Z <- (xbarra-mu)/ES; Z  #D) Valor de Z
[1] -1.833333

Como la probabilidad pedida es P(Z> 10) y la distribución entrega la probabilidad menor al valor estandar entonces se utiliza el complemento.

probabilidad_d <- 1 - pnorm(Z); probabilidad_d 
[1] 0.9666235
#cat("La probabilidad de que la media muestral sea mayor del 10% es:", probabilidad_d, "\n")

Otra forma de calcular la probabilidad

pnorm(10, mean = 12.2, 3.6/sqrt(9),lower.tail = F )
[1] 0.9666235
  1. Suponga que de una población normal con media 20 se toma una muestra de tamaño 16. Si la desviación estándar muestral es 4, encuentre la probabilidad de que la media muestral sea estrictamente mayor que 21,753.
n<- 16
s<-4
xbarra <- 21.753           #A) Media muestral
mu <- 20                #B) Media poblacional
ES <- s/sqrt(n)          #C) Error estándar (desviación del estadístico)
t <- (xbarra-mu)/ES; t   #D) Valor del estadístico t
[1] 1.753
glib <- n-1
probabilidad_t <- 1 - pt(t,glib); probabilidad_t    #E) Probabilidad pedida
[1] 0.05000445

Distribución de la proporción muestral

Se desea estudiar una muestra de 20 personas para saber la proporción de ellas que tienen más de 40 años. Sabiendo que la proporción en la población es del 40%, ¿cuál es la probabilidad de que la proporción en la muestra sea menor del 50%?

n<- 20                 #Muestra
p<-0.4                 #Proporción Poblacional
p_barra <- 0.5         #Proporción muestral
ES <- sqrt((p*(1-p))/n)
Z <- (0.1)/ES; Z
[1] 0.9128709

Luego que ya se tiene el valor de la Z, se calcula que la probabilidad de que la proporción en la muestra sea menor del 50%

probabilidad2_p <- pnorm(Z); probabilidad2_p
[1] 0.8193448

La propabilidad de que la proporción en la muestra sea menor del 50% es del 82%

Distribución Muestral de diferencia de dos proporciones muestrales

Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto país difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo el 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres, su opinión sobre la promulgación de la pena de muerte para personas culpables de asesinato, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de mujeres.

# Parámetros poblacionales
p_hombres <- 0.12  # Proporción de hombres a favor
p_mujeres <- 0.10  # Proporción de mujeres a favor

# Tamaños de las muestras
n_hombres <- 150
n_mujeres <- 100

# Varianzas estimadas para proporciones
var_hombres <- p_hombres * (1 - p_hombres) / n_hombres
var_mujeres <- p_mujeres * (1 - p_mujeres) / n_mujeres

# Varianza de la diferencia de proporciones
var_diferencia <- var_hombres + var_mujeres

# Calcular la diferencia de proporciones
diferencia_prop <- p_hombres - p_mujeres

# Calcular el z-score
z <- (diferencia_prop - 0.03) / sqrt(var_diferencia)

# Calcular la probabilidad de que la diferencia sea al menos 3%
probabilidad <- pnorm(z)

# Imprimir la probabilidad
cat("La probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de mujeres es:", probabilidad, "\n")
La probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de mujeres es: 0.4014143 

Distribución Muestral de diferencia de dos medias muestrales.

En un estudio para comparar los pesos promedios de niños y niñas de sexto grado en una escuela de instrucción media, se usará una muestra aleatoria de 20 niños y otra igual de 25 niñas. Se sabe que, tanto para niños y niñas, los pesos siguen una distribución normal. El promedio de los pesos de todos lo niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14,142, mientras que el promedio de los pesos de todas las niñas del sexto grado es de 85 libras y su desviación estándar es de 12,247. Encuentre la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de los de las 25 niñas.

desviacion_ninos <- 14.142
desviacion_ninas <- 12.247

tamano_muestra_ninos <- 20
tamano_muestra_ninas <- 25

mean_niños<-100
mean_niñas<-85
mean_diferenciada<-mean_niños-mean_niñas

desviacion_diferencia <- sqrt((desviacion_ninos^2 / tamano_muestra_ninos) + (desviacion_ninas^2 / tamano_muestra_ninas))
diferencia_deseada <- 20

# Calcula la probabilidad utilizando la función de distribución acumulativa de la distribución normal estándar
probabilidad <- 1 - pnorm(diferencia_deseada, mean=mean_diferenciada, sd = desviacion_diferencia)

# Imprime la probabilidad
print(probabilidad)
[1] 0.1056453

Distribución Muestral de la Varianza.

Cuando un proceso de producción está funcionando correctamente, la resistencia en ohmios de los componentes que produce sigue una distribución normal con desviación típica 3,6. si toma una muestra aleatoria de 4 componentes ¿Cuál es la probabilidad de que la varianza muestral sea mayor 27?

n<-4                       #Muestra
grados_de_libertad <- n-1  # Grados de libertad
S2<- 27                    # Varianza muestral
sigma<- 3.6                # Varianza poblacional

X <- (((n-1)*(S2))/(sigma)^{2}) #Formula

# Calcula la probabilidad acumulativa de una Chi-cuadrado con 3 grados de libertad
prob_menor_igual_27 <- pchisq(X, df = grados_de_libertad)

# La probabilidad de que la varianza sea mayor que 27 es 1 - probabilidad menor o igual a 27
prob_mayor_27 <- 1 - prob_menor_igual_27

# Imprime la probabilidad
print(prob_mayor_27)
[1] 0.1000608

Distribución Muestral de la Razón de dos Varianzas.

En una prueba sobre la efectividad de dos tipos de píldoras para dormir A y B, la píldora A un grupo de tamaños 61 y el otro grupo B, de tamaño 41 , se le administrara la píldora B, registrándose el número de horas de sueño de cada individuo participante en el estudio. Suponiendo que el número de horas de sueño de quienes usan cada tipo de píldoras se distribuye normalmente y que las varianzas P son iguales, calcule la probabilidad de que la razón de las varianzas muestrales de A y B SEA MAYOR QUE 1,64.

# Tamaños de muestra
nA <- 61
nB <- 41

# Valor límite de F
valor_F <- 1.64

# Grados de libertad
df1 <- nA - 1
df2 <- nB - 1

# Calcula la probabilidad utilizando la función pf de la distribución F
probabilidad <- 1 - pf(valor_F, df1, df2)

# Imprime la probabilidad
print(probabilidad)
[1] 0.04943336

La probabilidad de que la razón de las varianzas muestrales A y B sean mayores que 1,64 es de 0,05 es decir un 5%

Intervalos de confianza.

Intervalos de confianza para la media poblacional.

Un fabricante produce bolsas de arroz. El peso del contenido de estas bolsas tiene una distribución normal con desviación típica 15 gramos. Los contenidos de una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos. Calcular un intervalo de confianza del 95% para el verdadero peso medio de todas las bolsas de arroz producidas por el fabricante.

#Datos
n<-25
alpha<-0.05
Z<-qnorm(1-alpha/2)
desviacion<-15
media<-100

#Intervalos
lim_inf<- media-Z*desviacion/sqrt(n)
lim_sup<- media+Z*desviacion/sqrt(n)
paste('El intervalo de confianza es [',
      format(lim_inf,digits = 6),',',format(lim_sup,digits = 6),'] con Z=',
      format(Z,digits = 6),' y 1-alpha=',100*(1-alpha),'%.')
[1] "El intervalo de confianza es [ 94.1201 , 105.88 ] con Z= 1.95996  y 1-alpha= 95 %."

Intervalos de confianza para la proporción poblacional.

En una muestra aleatoria de 85 soportes para la pieza de un motor de automóvil, 10 tienen un pequeño defecto. Calcular un intervalo de confianza del 95% para la proporción p de piezas de motor en la población que tiene un pequeño defecto.

# Tamaño de la muestra
n <- 85

# Proporción muestral
p <- 10/85

# Nivel de confianza
confianza <- 0.95

# Error estándar
error_estandar <- sqrt(p*(1-p)/n)

# Valor crítico de Z para el nivel de confianza dado
z_critico <- qnorm(1 - (1 - confianza) / 2)

# Intervalo de confianza
limite_inferior <- p - z_critico * error_estandar
limite_superior <- p + z_critico * error_estandar

# Resultado
cat("Intervalo de confianza al 95% para la proporción de soportes con defectos:", round(limite_inferior, 3), "a", round(limite_superior, 3))
Intervalo de confianza al 95% para la proporción de soportes con defectos: 0.049 a 0.186

Intervalos de confianza para la diferencia de dos proporciones.

Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de estadística de sexo masculino y femenino. De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6 años. De 141 mujeres encuestadas, 73 tenían esta esperanza. Hallar un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales.

# Número de éxitos y tamaño de las muestras
success_men <- 107
sample_size_men <- 120
success_women <- 73
sample_size_women <- 141

# Realizar el test de proporciones
prop_test <- prop.test(c(success_men, success_women), c(sample_size_men, sample_size_women), alternative = "two.sided", conf.level = 0.95)

# Mostrar el intervalo de confianza
prop_test$conf.int
[1] 0.2667507 0.4811216
attr(,"conf.level")
[1] 0.95

Intervalos de confianza para la diferencia de dos medias.

Para una muestra aleatoria de 321 fumadores, el número medio de horas de absentismo laboral al mes fue de 3,01 y la desviación típica muestral fue de 1,09 horas al mes. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el número medio de horas fue de 2,88 y la desviación típica muestral fue de 1,01 horas al mes. Calcular un intervalo de confianza del 95% para la diferencia entre las dos medias poblacionales.

# Datos para fumadores
n1 <- 321
media1 <- 3.01
desviacion1 <- 1.09

# Datos para no fumadores
n2 <- 94
media2 <- 2.88
desviacion2 <- 1.01

# Nivel de confianza
confianza <- 0.95

# Calcula el intervalo de confianza utilizando la prueba t de Welch
diferencia_medias <- media1 - media2
error_estandar <- sqrt((desviacion1^2 / n1) + (desviacion2^2 / n2))

#COMPLETA

Intervalo para la varianza poblacional.

Una muestra aleatoria de tabletas para el dolor de estómago tiene una desviación típica de 0,8% en la concentración del ingrediente activo. Hallar un intervalo de confianza del 90% para la varianza y para la desviación poblacional. *

# Tamaño de la muestra y desviación típica muestral
n <- 20  # Tamaño de la muestra
s <- 0.008  # Desviación típica muestral en forma decimal (0.8%)

# Nivel de confianza
confianza <- 0.90

# Grados de libertad
grados_libertad <- n - 1

#Completa

Intervalos de confianza para la razón de varianzas poblacionales.

Un fabricante de detergente liquido está interesado en la uniformidad de la máquina utilizando para llenar las botellas. De manera específica, es deseable que la desviación estándar σ del proceso de llenado sea menor que 0,5 onzas de líquido. De otro modo, existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral 𝑠^2= 0,00153 (onzas de fluido)2. Calcule un intervalo de confianza del 90% para σ.

# Datos del proceso 1
n1 <- 12
s1 <- 5.1^2  # Varianza muestral del proceso 1

# Datos del proceso 2
n2 <- 15
s2 <- 4.7^2  # Varianza muestral del proceso 2

# Nivel de confianza
confianza <- 0.90

# Valores críticos de la distribución F
alpha <- 1 - confianza
valor_critico_superior <- qf(1 - alpha/2, df1 = n1 - 1, df2 = n2 - 1)
valor_critico_inferior <- qf(alpha/2, df1 = n1 - 1, df2 = n2 - 1)

#Completa