library(readxl)
datos <- read_excel("datos taller 4 DBCA.xlsx")Taller verificación de supuestos y pruebas de rangos múltiples DBCA
Análisis de varianza del experimento
- Hipótesis basadas en los efectos.
\(H_0: \tau_1=\tau_2=\tau_3=\tau_4=0\)
\(H_1: \tau_i \neq 0,~para~al~menos~un~i,~i=1,2,3,4\)
- Hipótesis basadas en los efectos del factor bloque
\(H0: \beta_1 =\beta_2=\beta_3=\beta_4=\beta_5=\beta_6=0\)
\(H1: \beta_j \neq 0,~para~al~menos~un~j,~~j=1,2,3,4,5,6\)
datos$tratamiento <- as.factor(datos$tratamiento)
datos$bloque <- as.factor(datos$bloque)modelo <- lm(observacion~ tratamiento + bloque, datos)
anova <- aov(modelo)
residuales <- anova$residuals
ajustados <- anova$fitted.values
summary(anova) Df Sum Sq Mean Sq F value Pr(>F)
tratamiento 3 178.2 59.39 8.107 0.00192 **
bloque 5 192.2 38.45 5.249 0.00553 **
Residuals 15 109.9 7.33
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
- Estadísticos de prueba
\(F_0=8.107\)
\(F_{0_B}=5.249\)
- Estadísticos Teóricos
qf(0.05,3,15,lower.tail = FALSE)[1] 3.287382
\(F_{0.05,3,15} = 3.287382\)
qf(0.05,5,15, lower.tail = FALSE)[1] 2.901295
\(F_{0.05,5,15}=2.901295\)
- Conclusiones
\(F_0 = 8.107 > F_{0.05,3,15} = 3.287\)
Del análisis de varianza, con nivel de significancia \(\alpha=0.05\), existe suficiente evidencia estadística para rechazar H0, por lo tanto, se concluye que al menos un par de medias de los tratamientos son distintas, por ello al menos un nivel de presión de extrusión tiene efecto en el porcentaje de tubos de la tirada de producción que no contenían ninguna fisura.
\(F_{0_B} = 5.249 > F_{0.05,5,15} = 2.901\)
Del análisis de varianza, con nivel de significancia \(\alpha=0.05\) se concluye que se rechaza H0, por lo que existe evidencia estadística suficiente para afirmar que al menos un par de medias de los bloque son distintas, por tanto al menos un lote de resina influye en la presencia de flicks.
Verificación de supuestos
NORMALIDAD
\(H_0: e_{ij}∼N(0,σ^2)\)
\(H_1 :e_{ij} \nsim N(0, \sigma^2)\) \(i,j =1,2,3,4\)
- Verificación gráfica
library(car)Loading required package: carData
qqPlot (anova, main= "Gráfico Cuantil - Cuantil", id=FALSE)Teniendo en cuenta la grafica, se puede concluir que no existe evidencia para sospechar de la no existencia de la normalidad de los residuales
- Verificación formal por el test de Shapiro-Wilk
shapiro.test(modelo$residuals)
Shapiro-Wilk normality test
data: modelo$residuals
W = 0.95631, p-value = 0.3689
\(W= 0.922\)
\(W_{0.95} = 0.984\)
\(W < W(0.95)\), por lo que no existe suficiente prueba estadística para rechazar \(H_0\), por ende los residuales provienen de una distribución normal.
- Verificación formal por el test de Kolmogorov - Smirnov
library(nortest)
lillie.test(anova$residuals)
Lilliefors (Kolmogorov-Smirnov) normality test
data: anova$residuals
D = 0.1305, p-value = 0.3617
kn <- sqrt(24)-0.01+(0.85/sqrt(24))
ca <- 0.895
KS<-ca/kn
KS[1] 0.1767906
\(C_{\alpha} = 0.895\)
\(K_S= 0.1767906\)
\(D = 0.18\)
Como \(K_S = 0.17 \ngtr D = 0.18\) , se concluye que no existe suficiente evidencia para rechazar \(H_0\), por lo que los residuales provienen de una distribución normal
HOMOCEDASTICIDAD
\(H_0: \sigma_1^2 = \sigma_2^2 = \sigma_3^2 = \sigma_4^2 =\sigma^2\)
\(H_1: \sigma_i^2 \neq \sigma_j^2~para~al~menos~un~par~(i,j)~con~i \neq j\)
\(i,j=1,2,3,4\\\)
- Verificación grafica
plot(x=anova$fitted.values, y=anova$residuals, main = "Grafica Homocedasticidad", xlab= "Ajustados por modelo", ylab="Residuales", ylim = c(-6,6))En la verificacion grafica no se logra observar algun tipo de tendencia por lo que no se debe dudar de la homogeneidad de la varianza
- Verificación formal por el test de Bartlett
bartlett.test(residuales~datos$tratamiento)
Bartlett test of homogeneity of variances
data: residuales by datos$tratamiento
Bartlett's K-squared = 0.15654, df = 3, p-value = 0.9843
qchisq(0.05,3,lower.tail = F)[1] 7.814728
\(X_0^2 = 0.256\)
\(X_{0.05,3}=7.814\)
Dado que, \(X_0^2 = 0.256 \ngtr X_{0.05,3}=7.814\), no existe evidencia suficiente para rechazar \(H_0\).Por lo tanto, se concluye que las varianzas de los tratamientos son iguales.
INDEPENDENCIA
\(H_0: \rho = 0\)
\(H_1: \rho \neq 0 \\\)
- Verificación grafica
datos3 = read_excel("datos ind.xlsx")
datos3$tratamiento = as.factor(datos3$tratamiento)
datos3$bloque= as.factor(datos3$bloque)
modelo2 = lm(datos3$observacion~datos3$tratamiento+datos3$bloque)
anova2 = aov(modelo2)
residuales2 = anova2$residuals
orden = c(1:24)plot(orden, residuales2, ylim = c(-3,5), xlim = c(1,25), main = "Grafico de independencia")Basándonos en la gráfica, no se observa un patrón claro en los datos, por lo que no existe evidencia para dudar de la independencia entre los residuales
- Verificación formal por el test de Durbin Watson
library(car)
durbinWatsonTest(modelo2, alternative = "two.sided") lag Autocorrelation D-W Statistic p-value
1 -0.2278286 2.407773 0.296
Alternative hypothesis: rho != 0
\(D=2.407\)
\(D_L=1.013\)
\(D_U= 1.775\)
\(4-D_L= 2.987\)
\(4-D_U=2.225\)
Dado que \(4-D_U=2.225 < D=2.407 < 4-D_U=2.225\). La prueba resulta no ser concluyente.
Prueba de rangos multiples
\(H_0: \mu_1 = \mu_2~~~~~~~~H_0: \mu_1 = \mu_3~~~~~~~~H_0: \mu_1 = \mu_4\)
\(H_1 : \mu_1 \neq \mu_2~~~~~~~~H_1 : \mu_1 \neq \mu_3~~~~~~~~H_1 : \mu_1 \neq \mu_4 \\\)
\(H_0: \mu_2 = \mu_3~~~~~~~~H_0: \mu_2 = \mu_4~~~~~~~~H_0: \mu_4 = \mu_4\)
\(H_1 : \mu_2 \neq \mu_3~~~~~~~~H_1 : \mu_2 \neq \mu_4~~~~~~~~H_1 : \mu_3 \neq \mu_4 \\\)
- Prueba Least Significant Difference de Fisher
library(agricolae)Warning: package 'agricolae' was built under R version 4.3.3
LSD <- LSD.test(anova,trt = "tratamiento", group = T)
LSD$statistics
MSerror Df Mean CV t.value LSD
7.32575 15 89.79583 3.014185 2.13145 3.330738
$parameters
test p.ajusted name.t ntr alpha
Fisher-LSD none tratamiento 4 0.05
$means
observacion std r se LCL UCL Min Max Q25 Q50
A 92.81667 4.577081 6 1.10497 90.46148 95.17185 87.4 98.2 89.475 92.10
B 91.68333 3.304189 6 1.10497 89.32815 94.03852 87.0 95.8 89.775 91.55
C 88.91667 2.966760 6 1.10497 86.56148 91.27185 85.5 93.4 86.650 88.80
D 85.76667 4.445072 6 1.10497 83.41148 88.12185 78.9 90.7 83.275 86.50
Q75
A 96.900
B 94.150
C 90.500
D 88.975
$comparison
NULL
$groups
observacion groups
A 92.81667 a
B 91.68333 ab
C 88.91667 bc
D 85.76667 c
attr(,"class")
[1] "group"
Los tratamientos A y B suponen medias estadísticamente iguales y representan los tratamientos con una media muestral más alta. Por lo tanto, tienen el mayor rendimiento. Se concluye que el menor de los niveles de presión de extrusión considerados es el que tendrá un mayor porcentaje de tubos de la tirada de producción que no contienen ninguna fisura, es decir el nive 8500 PSI
- Prueba Honest Significant Difference de Tuckey
TukeyHSD(anova, conf.level = 0.95) Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = modelo)
$tratamiento
diff lwr upr p adj
B-A -1.133333 -5.637161 3.370495 0.8854831
C-A -3.900000 -8.403828 0.603828 0.1013084
D-A -7.050000 -11.553828 -2.546172 0.0020883
C-B -2.766667 -7.270495 1.737161 0.3245644
D-B -5.916667 -10.420495 -1.412839 0.0086667
D-C -3.150000 -7.653828 1.353828 0.2257674
$bloque
diff lwr upr p adj
bloque2-bloque1 2.050 -4.1680828 8.2680828 0.8853016
bloque3-bloque1 3.300 -2.9180828 9.5180828 0.5376297
bloque4-bloque1 2.850 -3.3680828 9.0680828 0.6757699
bloque5-bloque1 -2.375 -8.5930828 3.8430828 0.8105903
bloque6-bloque1 6.750 0.5319172 12.9680828 0.0297368
bloque3-bloque2 1.250 -4.9680828 7.4680828 0.9845521
bloque4-bloque2 0.800 -5.4180828 7.0180828 0.9980198
bloque5-bloque2 -4.425 -10.6430828 1.7930828 0.2483499
bloque6-bloque2 4.700 -1.5180828 10.9180828 0.1986961
bloque4-bloque3 -0.450 -6.6680828 5.7680828 0.9998784
bloque5-bloque3 -5.675 -11.8930828 0.5430828 0.0837504
bloque6-bloque3 3.450 -2.7680828 9.6680828 0.4925715
bloque5-bloque4 -5.225 -11.4430828 0.9930828 0.1263042
bloque6-bloque4 3.900 -2.3180828 10.1180828 0.3674672
bloque6-bloque5 9.125 2.9069172 15.3430828 0.0027838
Según los resultados de la prueba de Tukey, los niveles de presión de extrusión A, B y C se desempeñan estadísticamente iguales en términos del porcentaje de tubos de producción sin fisuras. Sin embargo, la presión de extrusión D ofrece un rendimiento significativamente más alto que los niveles A y B, pero no significativamente diferente al nivel C. Por lo tanto, se podría seleccionar la presión de extrusión C o D como la mejor opción