DISEÑO DE EXPERIMENTO \(2^3\)

Suponga que se encuentran en estudio tres factores A, B y C, cada uno con dos niveles. Este diseño se conoce como diseño factorial, 23 y las ocho combinaciones de tratamientos pueden representarse gráficamente mediante un cubo. Existen en realidad tres notaciones distintas que se usan ampliamente para las corridas o ejecuciones en el diseño 2k:

  1. La primera es la notación “+,-”, llamada “geométrica”.
  2. La segunda consiste en el uso de letras minúsculas para identificar las combinaciones de tratamientos.
  3. En la tercera se utilizan los dígitos 1 y -1 para denotar los niveles alto y bajo del factor, respectivamente.

MODELO ESTADISTICO

El modelo estadístico para este diseño experimental considera la interacción entre los factores involucrados en el análsis, la ecuación para este modelo se muestra a continuación:

\(y_{ijk}=μ+\alpha_i+\beta_j+\gamma_k+\alpha\beta_{ij}+\alpha\gamma_{ik}+\beta\gamma_{jk}+\alpha\beta\gamma_{ijk}+εijk\)

Donde:
\(μ\) es la media general del experimento.
\(\alpha_i\) es el efecto debido al i-ésimo nivel del factor A.
\(\beta_j\) es el efecto del j-ésimo nivel del factor B.
\(\gamma_k\) es el efecto del k-ésimo nivel del factor C.
\(\alpha\beta_{ij}\) representa el efecto de interacción de la combinación ij.
\(\alpha\gamma_{ik}\) representa el efecto de interacción de la combinación ik.
\(\beta\gamma_{jk}\) representa el efecto de interacción de la combinación jk.
\(\alpha\beta\gamma_{ijk}\) representa el efecto de interacción de la combinación ijk
\(εijk\) el error aleatorio que , se supone, sigue una distribución normal con \(μ=0\) y \(σ2=Constante\), además de que son independientes entre sí.

Para establecer la influencia de los factores analizados en la variable de respuesta será necesario probar las siguientes hipótesis de trabajo:
Para los efectos del factor A:

\(H0:\alpha_i=\alpha_j=0\)
\(H1:\alpha_i≠\alpha_j≠0\)
Para los efectos del factor B:
\(H0:βi=βj=0\)
\(H1:βi≠βj≠0\)
Para los efectos del factor C:
\(H0:\gamma_i=\gamma_j=0\)
\(H1:\gamma_i≠\gamma_j≠0\)

EJERCICIO

Tomado del libro (Montgomery, 2004), ejercicio 6.1. Un ingeniero está interesado en los efectos de la velocidad de corte (A), la geometría de la herramienta (B) y el ángulo de corte(C) sobre la vida (en horas) de una máquina de herramientas. Se eligen dos niveles de cada factor y se corren tres réplicas de un diseño factorial \(2^2\). Los resultados fueron los siguientes:


Resolver lo siguiente:

  1. Estimar los efectos de los factores. ¿Qué efectos parecen ser grandes?
  2. Usar el análisis de varianza para confirmar las conclusiones del insiso a.
  3. Escribir un modelo de regresión para predecir la vida de la herramienta (en horas) con base en los resultados de este experimento.
  4. Analizar los residuales. ¿Hay algún problema evidente?
  5. Con base en el análisis delas gráficas de los efectos principales y las interacciones ¿Cuáles serían los niveles de A, B y C que se recomendaría usar?

Inciso A

Para comenzar se mandan a llamar las siguientes paqueterias para poder importar la base de datos creada en excel.

library(readxl)
datos=read_excel(path = "dataset.xlsx")
View(datos)
attach(datos)

Ahora, se declaran las 3 variables(A,B,C) y el modelo con sus posibles interaciones con el fin de poder visualizar su impacto en la vida en horas de las máquinas.

f_vel=factor(Velocidad)
f_geo=factor(Geometria)
f_angulo=factor(Angulo)
modelo=lm(Vida~(f_vel+f_geo+f_angulo+f_vel*f_geo+f_vel*f_angulo+f_geo*f_angulo+f_vel*f_geo*f_angulo))
summary(modelo)
## 
## Call:
## lm(formula = Vida ~ (f_vel + f_geo + f_angulo + f_vel * f_geo + 
##     f_vel * f_angulo + f_geo * f_angulo + f_vel * f_geo * f_angulo))
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -5.667 -3.500 -1.167  3.167 10.333 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)               26.000      3.171   8.199 4.02e-07 ***
## f_vel1                     8.667      4.485   1.933  0.07119 .  
## f_geo1                    13.667      4.485   3.048  0.00768 ** 
## f_angulo1                 16.333      4.485   3.642  0.00219 ** 
## f_vel1:f_geo1              1.000      6.342   0.158  0.87668    
## f_vel1:f_angulo1         -13.333      6.342  -2.102  0.05171 .  
## f_geo1:f_angulo1          -1.333      6.342  -0.210  0.83614    
## f_vel1:f_geo1:f_angulo1   -8.667      8.969  -0.966  0.34828    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.492 on 16 degrees of freedom
## Multiple R-squared:  0.7696, Adjusted R-squared:  0.6689 
## F-statistic: 7.637 on 7 and 16 DF,  p-value: 0.0003977
library(FrF2)
## Warning: package 'FrF2' was built under R version 4.0.5
## Warning: package 'DoE.base' was built under R version 4.0.5
experimento=FrF2(nruns = 8,nfactors = 3,factor.names = list(f_vel=c(-1,1),f_geo=c(-1,1),f_angulo=c(-1,1)),replications = 3,randomize= FALSE)
experimento_resp=add.response(design=experimento,response=Vida)
grafica_efectos_principales=MEPlot(experimento_resp, main= "Gráfica de Efectos Individuales")

grafica_interacciones=IAPlot(experimento_resp, main= "Gráfica de Interacciones")

head(grafica_efectos_principales)
##      f_vel    f_geo f_angulo
## - 40.66667 35.16667 37.41667
## + 41.00000 46.50000 44.25000
head(grafica_interacciones)
##     f_vel:f_geo f_vel:f_angulo f_geo:f_angulo
## -:-    34.16667       32.83333       30.33333
## +:-    36.16667       42.00000       44.50000
## -:+    47.16667       48.50000       40.00000
## +:+    45.83333       40.00000       48.50000

Analizando lo anterior, se llega a la conclusión que los efectos de la geometría de la herramienta y el ángulo de corte son los que parecen ser más grandes, también se puede considerar la velocidad de corte y la interacción entre la velocidad y el ángulo de corte, pero se recomienda realizar más pruebas para poder determinar si el impacto es significativo.

Inciso B

Con el fin de reafirmar la deduccion anterior, se procede a realizar el Análisis de Varianza(ANOVA) correspondiente.

anova=aov(modelo)
summary(anova)
##                      Df Sum Sq Mean Sq F value   Pr(>F)    
## f_vel                 1    0.7     0.7   0.022 0.883680    
## f_geo                 1  770.7   770.7  25.547 0.000117 ***
## f_angulo              1  280.2   280.2   9.287 0.007679 ** 
## f_vel:f_geo           1   16.7    16.7   0.552 0.468078    
## f_vel:f_angulo        1  468.2   468.2  15.519 0.001172 ** 
## f_geo:f_angulo        1   48.2    48.2   1.597 0.224475    
## f_vel:f_geo:f_angulo  1   28.2    28.2   0.934 0.348282    
## Residuals            16  482.7    30.2                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se puede concluir que la geometría de la herramienta es el efecto que más impacta en la vida en horas de una máquina, por otra parte, también se debe contemplar el ángulo de corte y la interacción entre la velocidad y el angulo de corte ya que su valor P, aún está por debajo del nivel de significancia \(α=0.05\).

Inciso C

Para el caso del modelo estadístico, el resultado obtenido reporta que los coeficientes de regresión dados los datos presentados quedarían representados de la siguiente manera:

\(Vida_{ijk}=26+8.67Vel_i+13.67Geo_j+16.33Angulo_k+1VelGeo_{ij}-13.33VelAngulo_{ik}-1.33GeoAngulo_{jk}-8.67VelGeoAngulo_{ijk}+ε_{ijk}\)

Inciso D

Una vez realizado el Análisis de Varianza, es importante verificar las pruebas de adecuación del modelo, para lo cual se efectuarán las siguientes pruebas:

  1. Prueba de Normalidad de Residuos de Shapiro Wilks
  2. Prueba de Barttlet para Igualdad de Varianzas

Prueba Shapiro Wilks

Para el caso específico de la normalidad, procederemos a utilizar la Prueba de Bondad de Ajuste a la Distribución Normal de Shapiro-Wilks, aunque cabe mencionar que puede utilizarse cualquier otra, como Kolmogorov-Smirnov o Anderson-Darlind, la prueba de Shapiro-Wilks está diseñada específicamente para la Distribución Normal(Montgomery, 2004). Para realizar esta prueba debemos plantear las siguientes hipótesis de trabajo:

\(H_0:x∈N(μ=0,σ^2=Constante)\)
\(H_1:x∉N(μ=0,σ^2=Constante)\)

La hipótesis nula de la Prueba de Shapiro-Wilks se rechaza cuando \(Valorp<0.05\), siempre es recomendable realizar una gráfica de probabilidad normal para confirmar la prueba de hipótesis, para lo cual utilizaremos la siguiente secuencia de comandos:

normalidad=shapiro.test(resid(modelo))
print(normalidad)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo)
## W = 0.92106, p-value = 0.06166

Dado a los resultados obtenidos, se acepta la hipotesis nula ya que el valor de P es mayor que 0.05 y se puede continuar en el analisis.

Prueba de Barttlet

La Prueba de Homocedasticidad, o de Varianzas Iguales, se realiza mediante la Prueba de Bartlett, misma que para el caso particular, como sólo es significativo el factor de tratamiento, solo se considerará éste para la ejecución de la prueba(Pulido, De la Vara Salazar, González, Martı́nez, & Pérez, 2012). La Prueba de Bartlett tiene las siguientes hipótesis:

\(H_0:σ^2_i=σ^2_j=Constante\)
\(H_1:σ^2_i≠σ^2_j≠Constante\)
homocedasticidad=bartlett.test(resid(modelo),f_vel,f_geo,f_angulo,data=experimento_resp)
print(homocedasticidad)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  resid(modelo) and f_vel
## Bartlett's K-squared = 0.30309, df = 1, p-value = 0.582

Dado los resultados, se determina que si tiene una varianza constante y el modelo matematico lineal si es adecuado. ### Inciso E

Se recomienda utilizar A(-1) B(1) C(1) Debido a que con esta combinacion se encuentran los valores mas altos,el efecto A se coloca negativo dado que en ese nivel aumentan los valorescuando esta en interaccion con los otros elementos

Bibliografía

Montgomery, D. (2004). Diseño y análisis de experimentos. México: Compañı́a Editorial Limusa Wiley.

Pulido, H. G., De la Vara Salazar, R., González, P. G., Martı́nez, C. T., & Pérez, M. del C. T. (2012). Análisis y diseño de experimentos. McGraw-Hill New York, NY, USA: