Se asume que \(X_1,\ldots,X_n\) es una muestra aleatoria tal que \(X_i\stackrel{\text{IID}}{\sim} \textsf{N}(\mu, \sigma^2)\), para \(i=1,\ldots,n\).
Antes de implementar los intervalos, es indispensable verificar que la distribución de la variable aleatoria objeto de estudio tenga distribución Normal, de lo contrario, se deben utilizar otras técnicas de inferencia (e.g., Bootstrap).
El proceso de prueba para \(\mu\) se puede resumir con el siguiente esquema:
Observaciones
Se pueden utilizar estas pruebas de acuerdo con la condición de \(\sigma\) siempre que:
Se simula una muestra de 50 estudiantes para determinar si en promedio los estudiantes no tienen sobrepeso (IMC < 25) con un nivel de significancia del \(5\%\).
Solución
El sistema de hipótesis que se quiere probar es:
\[H_0:\mu= 25\qquad\text{ frente a }\qquad H_1: \mu< 25\]
# simulación de la muestra aleatoria
set.seed(123)
imc <- rnorm(n = 50, mean = 25.5, sd = 1)
head(imc)
## [1] 24.93952 25.26982 27.05871 25.57051 25.62929 27.21506
# prueba sobre el promedio poblacional
t.test(x = imc, alternative = "less", mu = 25, conf.level = 0.95)
##
## One Sample t-test
##
## data: imc
## t = 4.0814, df = 49, p-value = 0.9999
## alternative hypothesis: true mean is less than 25
## 95 percent confidence interval:
## -Inf 25.75393
## sample estimates:
## mean of x
## 25.5344
Dado que el valor \(p > 0.05\), con una confiabilidad del 95% no existe suficiente evidencia empĆrica para establecer que en promedio los estudiantes no tienen sobrepeso.
Para probar los supuestos del modelo se debe probar el sistema de hipótesis:
\[ H_0: \text{La población tiene distribución Normal} \qquad\text{ frente a }\qquad H_1: \text{La población no tiene distribución Normal} \]
# prueba de normalidad de Shapiro-Wilk
shapiro.test(imc)
##
## Shapiro-Wilk normality test
##
## data: imc
## W = 0.98928, p-value = 0.9279
# prueba de normalidad de Kolmogorov-Smirnov
nortest::lillie.test(imc)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: imc
## D = 0.083232, p-value = 0.5233
# prueba de normalidad de Anderson-Darling
nortest::ad.test(imc)
##
## Anderson-Darling normality test
##
## data: imc
## A = 0.20995, p-value = 0.8529
Dado que el valor \(p > 0.05\), con una confiabilidad del 95% no existe suficiente evidencia empĆrica para establecer el IMC de la población no tiene distribución Normal.
# descripcion
summary(imc)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 23.53 24.94 25.43 25.53 26.20 27.67
# grafico
par(mfrow = c(1,2))
# histograma
hist(x = imc, freq = F, col = "white", xlim = c(21,29), ylim = c(0,0.5), xlab = "Balance", ylab = "Densidad", main = "")
curve(expr = dnorm(x, mean = mean(imc), sd = sd(imc)), col = 2, add = TRUE)
# grfico cuantil-cuantil
qqnorm(imc, xlab = "Cuantiles normales", ylab = "Cuantiles observados", main = "")
qqline(imc, col = 2)
El proceso de prueba para \(\mu\) se puede resumir con el siguiente esquema:
Generalmente, \(\epsilon=\alpha/2\) y \(\delta=1-\alpha/2\).
Una pieza debe fabricarse con medidas de tolerancia muy estrechas para que sea aceptada por el cliente. Las especificaciones de producción indican que la varianza mÔxima en la longitud de la pieza debe ser 0.0004. En 30 piezas la varianza muestral encontrada es 0.0005. Use un nivel de significancia de 0.05 para probar si se estÔ violando la especificación acerca de la variabilidad poblacional.
Solución
var1_test_V1 <- function(s2, n, sigma2, alternativa = "diferente", confianza = 0.95) {
# informacion muestral
s2 <- as.numeric(s2)
n <- as.numeric(n)
# estadistico de prueba
chi <- (n-1)*s2/sigma2
# valor p
if (alternativa == "menor") {
p <- pchisq(q = chi, df = n-1, lower.tail = T)
}
if (alternativa == "mayor") {
p <- pchisq(q = chi, df = n-1, lower.tail = F)
}
if (alternativa == "diferente") {
p1 <- pchisq(q = chi, df = n-1, lower.tail = T)
p2 <- pchisq(q = chi, df = n-1, lower.tail = F)
p <- 2*min(p1,p2)
}
# salida
return(p)
}
var1_test_V2 <- function(s2, n, sigma2, alternativa = "diferente", confianza = 0.95) {
# informacion muestral
s2 <- as.numeric(s2)
n <- as.numeric(n)
# estadistico de prueba
chi <- (n-1)*s2/sigma2
# valor p
if (alternativa == "menor") {
p <- pchisq(q = chi, df = n-1, lower.tail = T)
}
if (alternativa == "mayor") {
p <- pchisq(q = chi, df = n-1, lower.tail = F)
}
if (alternativa == "diferente") {
p1 <- pchisq(q = chi, df = n-1, lower.tail = T)
p2 <- pchisq(q = chi, df = n-1, lower.tail = F)
p <- 2*min(p1,p2)
}
# imprimir en pantalla
cat("Prueba sobre la varianza poblaciónal bajo normalidad \n",
"El valor valor p es ", p, sep = "")
}
El sistema de hipótesis que se quiere probar es:
\[H_0:\sigma^2 = 0.0004\qquad\text{ frente a }\qquad H_1: \sigma^2 > 0.0004\]
# prueba sobre la varianza poblacional
var1_test_V1(s2 = 0.0005, n = 30, sigma2 = 0.0004, alternativa = "mayor", confianza = 0.95)
## [1] 0.1663945
# prueba sobre la varianza poblacional
var1_test_V2(s2 = 0.0005, n = 30, sigma2 = 0.0004, alternativa = "mayor", confianza = 0.95)
## Prueba sobre la varianza poblaciónal bajo normalidad
## El valor valor p es 0.1663945
Dado que el valor \(p > 0.05\), con una confiabilidad del 95% no existe suficiente evidencia empĆrica para establecer que se estĆ” violando la especificación acerca de la variabilidad poblacional del proceso de producción.
Se considera una muestra aleatoria \(X_1,\ldots,X_n\) de una población \(\textsf{Bernoulli}(\pi)\).
Se tienen los siguientes sistemas de hipótesis:
\[\text{Sistema A: }\qquad H_0:\pi=\pi_0\qquad\text{ frente a }\qquad H_1:\pi<\pi_0\] \[\text{Sistema B: }\qquad H_0:\pi=\pi_0\qquad \text{ frente a }\qquad H_1:\pi>\pi_0\] \[\text{Sistema C: }\qquad H_0:\pi=\pi_0\qquad \text{ frente a }\qquad H_1:\pi\neq\pi_0\] El estadĆstico de prueba es
\[Z=\frac{P-\pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}}\]
y los tests son respectivamente:
\[\tau_A:\qquad \text{Rechazar }H_0\text{ si }z_c<z_{\alpha}\]
\[\tau_B:\qquad \text{Rechazar }H_0\text{ si }z_c>z_{1-\alpha}\]
\[\tau_C:\qquad \text{Rechazar }H_0\text{ si }|z_c|>z_{1-\alpha/2}\]
Se observa una muestra aleatoria de 300 componentes electrónicos fabricados mediante un proceso especĆfico y se encuentra que 25 son defectuosos. Sea \(\pi\) la proporción poblacional de componentes fabricados mediante este proceso que presentan defectos. El responsable del proceso de producción afirma que \(p \leq 0.05\). ĀæLa muestra proporciona suficiente evidencia para rechazar la afirmación?