Ejercicio 6-1
Un ingeniero esta interesado en los efectos de la velocidad de corte (A), la geometria de la herramienta (B) y el angulo de corte (C) sobre la vida (en horas) de una maquina de herramienta. Se eligen dos niveles de cada factor y se corren tres replicas de un diseño factorial \(2^3\). Los resultados fueron los siguientes:
| A | B | C | Combinacion de tratamientos | Replica I | Replica II | Replica III |
|---|---|---|---|---|---|---|
| - | - | - | (1) | 22 | 31 | 25 |
| + | - | - | a | 32 | 43 | 29 |
| - | + | - | b | 35 | 34 | 50 |
| + | + | - | ab | 55 | 47 | 46 |
| - | - | + | c | 44 | 45 | 38 |
| + | - | + | ac | 40 | 37 | 36 |
| - | + | + | bc | 60 | 50 | 54 |
| + | + | + | abc | 39 | 41 | 49 |
Como primer paso debemos importar los datos desde el archivo que los contiene, ubicado en la carpeta de trabajo, que para este caso se llama dataset.txt.
library(readxl)
library(FrF2)
datos=read_excel(path ="dataset.xlsx")
attach(datos)
a) Estimar los efectos de los factores. ¿Que efectos parecen ser grandes?
Para calcular los efectos de los factores, debemos considerar que en la ejecución de un diseño factorial completo \(2^3\); el modelo matemático queda de la siguiente manera:
#--------Modelo matematico---------#
f_velocidad=factor(Velocidad)
f_geometria=factor(Geometria)
f_angulo=factor(Angulo)
modelo=lm(Respuesta~(f_velocidad+f_geometria+f_angulo+f_velocidad*f_geometria+f_velocidad*f_angulo+f_geometria*f_angulo+f_velocidad*f_geometria*f_angulo))
summary(modelo)
##
## Call:
## lm.default(formula = Respuesta ~ (f_velocidad + f_geometria +
## f_angulo + f_velocidad * f_geometria + f_velocidad * f_angulo +
## f_geometria * f_angulo + f_velocidad * f_geometria * f_angulo))
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.667 -3.500 -1.167 3.167 10.333
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 26.000 3.171 8.199 4.02e-07 ***
## f_velocidad1 8.667 4.485 1.933 0.07119 .
## f_geometria1 13.667 4.485 3.048 0.00768 **
## f_angulo1 16.333 4.485 3.642 0.00219 **
## f_velocidad1:f_geometria1 1.000 6.342 0.158 0.87668
## f_velocidad1:f_angulo1 -13.333 6.342 -2.102 0.05171 .
## f_geometria1:f_angulo1 -1.333 6.342 -0.210 0.83614
## f_velocidad1:f_geometria1:f_angulo1 -8.667 8.969 -0.966 0.34828
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.492 on 16 degrees of freedom
## Multiple R-squared: 0.7696, Adjusted R-squared: 0.6689
## F-statistic: 7.637 on 7 and 16 DF, p-value: 0.0003977
De acuerdo a los resultados obtenidos, se acepta la hipótesis debido a que el valor presentado por \(Valor_p\) es menor y confirma la existencia de efectos significativos. A continuación, se muestra el siguiente procedimiento para determinar en qué medida interfieren estos efectos en el análisis
b) Usar el analisis de varianza para confirmar las conclusiones del inciso a.
Para verificar la significancia de los efectos de los factores se utiliza el Analisis de Varianza (ANOVA). A continuacion, se presentan los calculos:
#-----------Tabla ANOVA-----------#
anova(aov(modelo))
## Analysis of Variance Table
##
## Response: Respuesta
## Df Sum Sq Mean Sq F value Pr(>F)
## f_velocidad 1 0.67 0.67 0.0221 0.8836803
## f_geometria 1 770.67 770.67 25.5470 0.0001173 ***
## f_angulo 1 280.17 280.17 9.2873 0.0076787 **
## f_velocidad:f_geometria 1 16.67 16.67 0.5525 0.4680784
## f_velocidad:f_angulo 1 468.17 468.17 15.5193 0.0011722 **
## f_geometria:f_angulo 1 48.17 48.17 1.5967 0.2244753
## f_velocidad:f_geometria:f_angulo 1 28.17 28.17 0.9337 0.3482825
## Residuals 16 482.67 30.17
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Al observar los resultados obtenidos del análisis de la tabla ANOVA en términos individuales, muestra que los efectos significativos cuyo valor de P es menor a 0.5 son la geometría, ángulo y la interacción entre velocidad-ángulo. Sin embargo, el valor preponderante es la geometría al presentar el valor más bajo. Por otra parte, la velocidad, la interacción velocidad-geométrica, la interacción geometría-ángulo y la interacción velocidad-geometría-ángulo son los factores que no presentan ser significativos al mostrar valores P superiores al 0.5.
c) Escribir un modelo de regresion para predecir la vida de la herramienta (en horas) con base los resultados de este experimento.
Para el caso del modelo estadistico, el resultado obtenido reporta que los coeficientes de regresion quedarian representados de la siguiente manera :
\[Y=26+13.667B+16.333C-13.333AC\]
d) Analizar los residuales. ¿Hay algun problema evidente?
En este caso se utiliza la prueba de normalidad de los residuos de Shapiro-Wilks, donde se plantean las siguientes hipotesis:
\[{H_0}={x∈N}{(μ=0,σ^2=Constante)}\]
\[{H_1}={x\notin N}{(μ=0,σ^2=Constante)}\]
normalidad=shapiro.test(resid(modelo))
print(normalidad)
##
## Shapiro-Wilk normality test
##
## data: resid(modelo)
## W = 0.92106, p-value = 0.06166
La hipotesis nula de la Prueba de Shapiro-Wilks se rechaza cuando el \(Valor_p<0.05\)
El valor presentado por \(Valor_p\) es de 0.06166 lo cual indica que es mayor a 0.05. En conclusión, se acepta la hipótesis nula y se dice que los residuos son normales. Sin embargo, es importante verificar que cumplan con una varianza constante y por tanto se debe realizar la prueba de Bartlett. A continuación, se muestra el procedimiento:
Prueba Igualdad de Varianzas de Bartlett
La Prueba de Homocedasticidad, o de Varianzas Iguales, se realiza mediante la Prueba de Bartlett, misma que para el caso particular, como sólo es significativo el factor de tratamiento, solo se considerará éste para la ejecución de la prueba.
La Prueba de Bartlett tiene las siguientes hipótesis:
\[{H_0}:σ_i^2=σ_j^2=Constante\]
\[{H_1}:σ_i^2 \neq σ_j^2\neq Constante\]
homocedasticidad=bartlett.test(resid(modelo),f_velocidad,f_geometria,f_angulo,data=experimento_resp)
print(homocedasticidad)
##
## Bartlett test of homogeneity of variances
##
## data: resid(modelo) and f_velocidad
## Bartlett's K-squared = 0.30309, df = 1, p-value = 0.582
En conclusión, se obtiene un valor de \(Valor_p\) de 0.582 que es mayor a 0.05, por lo tanto se acepta la hipótesis nula indicando que los residuos presentan una distribución normal y varianza constante, favoreciendo a la implementación de un modelo lineal.
e) Con base el analisis de las graficas de los efectos principales y las interacciones, ¿cuales serian los niveles de A, B y C que se recomendaria utilizar?
Para obtener la grafica de los efectos individuales, se realiza lo siguiente:
library(FrF2)
experimento=FrF2(nruns=8,nfactors=3,factor.names=list(f_velocidad=c(-1,1),f_geometria=c(-1,1),f_angulo=c(-1,1)),replications=3,randomize=FALSE)
experimento_resp=add.response(design = experimento,response = Respuesta)
MEPlot(experimento_resp)
Para obtener la grafica de interacciones, se realiza lo siguiente:
IAPlot(experimento_resp)
Al observar la gráfica de efectos individuales, se puede percatar que los efectos que realmente son significativos es la geometría, en el caso del ángulo se llega apreciar un efecto medianamente significativo. Por otra parte, para la velocidad no resulta tan relevante, pero el valor preponderante sin ninguna duda es el efecto geometría.
En la gráfica de interacciones, se observa que la que la velocidad con relación a la geometría si presenta un ligero cambio de mínimo a máximo, en relación a la velocidad-ángulo la interacción resulta ser mayor. En la situación de la geometría en relación con la velocidad, se mantiene constante y en relación con el ángulo tiende a incrementar las horas vida. Por otra parte, el ángulo en relación con la velocidad presenta una tendencia decreciente y para el caso de la geométrica presenta una elevación indicando el aumento significativo de horas vida, y en conclusión se dice que los principales efectos que provocan las interacciones más relevantes es la geométrica cuando interactúa con el ángulo.
La mejor combinación de niveles a utilizar seria geometría (B) y ángulos (C) a niveles alto y velocidad (A) a niveles bajos.