Diseño Factorial 2^4

En un estudio de tres factores A, B, C y D cada uno con dos niveles. Este diseño se conoce como diseño factorial, \(2^4\) y se pueden realizar 16 combinaciones de tratamientos.

Existen en realidad tres notaciones distintas que se usan ampliamente para las corridas o ejecuciones en el diseño 2k:

  1. La primera es la notación “+,-”, llamada “geométrica”.
  2. La segunda consiste en el uso de letras minúsculas para identificar las combinaciones de tratamientos.
  3. En la tercera se utilizan los dígitos 1 y -1 para denotar los niveles alto y bajo del factor, respectivamente.

MODELO ESTADISTICO

El modelo estadístico para este diseño experimental considera la interacción entre los factores involucrados en el análsis, la ecuación para este modelo se muestra a continuación:

\(y_{ijkl}=μ+\alpha_i+\beta_j+\gamma_k+\delta_l+\alpha\beta_{ij}+\alpha\gamma_{ik}+\alpha\delta_{il}+\beta\gamma_{jk}+\beta\delta_{jl}+\gamma\delta_{kl}+\alpha\beta\gamma_{ijk}+\alpha\beta\delta_{ijl}+\alpha\gamma\delta_{ikl}+\beta\gamma\delta_{jkl}+εijkl\)

Donde:
\(μ\) es la media general del experimento.

\(\alpha_i\) es el efecto debido al i-ésimo nivel del factor A.

\(\beta_j\) es el efecto del j-ésimo nivel del factor B.

\(\gamma_k\) es el efecto del k-ésimo nivel del factor C.

\(\delta_l\) es el efecto del l-ésimo nivel del factor D.

\(\alpha\beta_{ij}\) representa el efecto de interacción de la combinación ij.

\(\alpha\gamma_{ik}\) representa el efecto de interacción de la combinación ik.

\(\alpha\delta_{il}\) representa el efecto de interacción de la combinación il.

\(\beta\gamma_{jk}\) representa el efecto de interacción de la combinación jk.

\(\beta\delta_{jl}\) representa el efecto de interacción de la combinación jl.

\(\gamma\delta_{kl}\) representa el efecto de interacción de la combinación kl.

\(\alpha\beta\gamma_{ijk}\) representa el efecto de interacción de la combinación ijk.

\(\alpha\beta\delta_{ijl}\) representa el efecto de interacción de la combinación ijl.

\(\alpha\gamma\delta_{ikl}\) representa el efecto de interacción de la combinación ijk.

\(\beta\gamma\delta_{jkl}\) representa el efecto de interacción de la combinación jkl.

\(\alpha\beta\gamma\delta_{ijkl}\) representa el efecto de interacción de la combinación ijkl.

\(εijkl\) el error aleatorio que , se supone, sigue una distribución normal con \(μ=0\) y \(σ2=Constante\), además de que son independientes entre sí.

Para establecer la influencia de los factores analizados en la variable de respuesta será necesario probar las siguientes hipótesis de trabajo:

Para los efectos del factor A:

\(H0:\alpha_i=\alpha_j=0\)
\(H1:\alpha_i≠\alpha_j≠0\)
Para los efectos del factor B:
\(H0:βi=βj=0\)
\(H1:βi≠βj≠0\)
Para los efectos del factor C:
\(H0:\gamma_i=\gamma_j=0\)
\(H1:\gamma_i≠\gamma_j≠0\)
Para los efectos del factor D:
\(H0:\delta_i=\delta_j=0\)
\(H1:\delta_i≠\delta_j≠0\)

EJERCICIO

En una empresa de electrónica una máquina toma componentes que le proporciona su alimentador, para montarlos o depositarlos en una tarjeta. Se ha tenido el problema de que la maquina falla en sus intentos por tomar el componente, lo cual causa paros de la máquina que detienen el proceso hasta que el operador se da cuenta y reinicia el proceso. Para diagnosticar mejor la situación, se decide correr un diseño de experimentos \(2^4\) con n=2 réplica, en el que se tienen los siguientes factores y niveles respectivamente; a) velocidad de cam (70%, 100%), b) velocidad de mesa (media, alta), c) orden o secuencia de colocación (continua, variable), d) alimentador (1,2). Como el proceso el muy rápido es necesario dejarlo operar en cada condición experimental el tiempo suficiente para reproducir el problema. Se consideró que esto se lograba con suficiente confianza con 500 componentes; por ello, cada una de las corridas experimentales consistió en colocar 500 componentes y se midieron dos variables de respuesta Y1= número de errores (o intentos fallidos) y Y2= tiempo real (en segundos) para tomar o “colocar” los 500 componentes. Es evidente que se quiere minimizar ambas variables. Los datos obtenidos se muestran en la siguiente tabla:


  1. Al observar los datos obtenidos se deduce que hay algunos tratamientos que tienen pocos o ningún componente caídos, como por ejemplo el (–1, –1, +1, +1), alguien muy “práctico” decidiría poner la máquina a operar bajo estas condiciones, y olvidarse del análisis estadístico. De proceder así, explique qué información se perdería.

  2. Investigue qué efectos influyen de manera significativa sobre Y1 (apóyese en Pareto y ANOVA).

  3. Obtenga el mejor ANOVA.

  4. Si en el análisis anterior encuentra alguna interacción significativa, analice con detalle la más importante e interprete en términos físicos.

  5. ¿Qué tratamiento minimiza Y1? f ) Ahora investigue qué efectos influyen de manera relevante sobre Y2.

  6. ¿Qué tratamiento minimiza Y2?

  7. Encuentre una condición satisfactoria tanto para minimizar Y1 como Y2. i ) De los análisis de varianza para Y1 y Y2 observe el coeficiente R2. ¿Qué concluye de ello?

  8. Verifique residuos.

Inciso A

Si se sigue el planteamiento propuesto, se perderia la posibilidad de obtener un resultado más preciso y caería en un error básico queriendo concluir con solo su razonamiento con base en el sentido común. El cuál, no es válido para una buena hipotesis. Además, se perderia la información de saber que interacciones son las más influyente para ambos efectos.

Inciso B

Para comenzar con el uso del Software, se escriben las siguientes lineas de codigo para poder importar la base de datos creada en excel.

library(readxl)
datos=read_excel(path = "dataset.xlsx")
View(datos)
attach(datos)

Ahora, se declaran las 4 variables(A,B,C y D) y el modelo con sus posibles interaciones con el fin de poder visualizar su impacto en los números de errores.

f_vel=factor=factor(`Factor A`)
f_mes=factor=factor(`Factor B`)
f_ord=factor=factor(`Factor C`)
f_ali=factor=factor(`Factor D`)
modelo1=lm(Y1~(f_vel+f_mes+f_ord+f_ali+f_vel*f_mes+f_vel*f_ord+f_vel*f_ali+f_mes*f_ord+f_mes*f_ali+f_ord*f_ali+f_vel*f_mes*f_ord+f_vel*f_mes*f_ali+f_vel*f_ord*f_ali+f_mes*f_ord*f_ali+f_vel*f_mes*f_ord*f_ali))
summary(modelo1)
## 
## Call:
## lm(formula = Y1 ~ (f_vel + f_mes + f_ord + f_ali + f_vel * f_mes + 
##     f_vel * f_ord + f_vel * f_ali + f_mes * f_ord + f_mes * f_ali + 
##     f_ord * f_ali + f_vel * f_mes * f_ord + f_vel * f_mes * f_ali + 
##     f_vel * f_ord * f_ali + f_mes * f_ord * f_ali + f_vel * f_mes * 
##     f_ord * f_ali))
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -20.500  -5.125   0.000   5.125  20.500 
## 
## Coefficients:
##                             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                   55.500      8.317   6.673 5.35e-06 ***
## f_vel1                        46.000     11.762   3.911  0.00124 ** 
## f_mes1                        -5.000     11.762  -0.425  0.67643    
## f_ord1                       -38.000     11.762  -3.231  0.00523 ** 
## f_ali1                       -40.000     11.762  -3.401  0.00365 ** 
## f_vel1:f_mes1                 28.000     16.634   1.683  0.11172    
## f_vel1:f_ord1                -35.000     16.634  -2.104  0.05153 .  
## f_vel1:f_ali1                 -3.000     16.634  -0.180  0.85914    
## f_mes1:f_ord1                 31.000     16.634   1.864  0.08083 .  
## f_mes1:f_ali1                  3.500     16.634   0.210  0.83600    
## f_ord1:f_ali1                 22.500     16.634   1.353  0.19497    
## f_vel1:f_mes1:f_ord1         -18.500     23.524  -0.786  0.44311    
## f_vel1:f_mes1:f_ali1         -18.500     23.524  -0.786  0.44311    
## f_vel1:f_ord1:f_ali1          -2.500     23.524  -0.106  0.91669    
## f_mes1:f_ord1:f_ali1         -24.500     23.524  -1.041  0.31313    
## f_vel1:f_mes1:f_ord1:f_ali1   13.500     33.268   0.406  0.69027    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.76 on 16 degrees of freedom
## Multiple R-squared:  0.9461, Adjusted R-squared:  0.8955 
## F-statistic: 18.72 on 15 and 16 DF,  p-value: 2.305e-07
library(FrF2)
## Warning: package 'FrF2' was built under R version 4.0.5
## Warning: package 'DoE.base' was built under R version 4.0.5
experimento1=FrF2(nruns = 16,nfactors = 4,factor.names = list(f_vel=c(-1,1),f_mes=c(-1,1),f_ord=c(-1,1),f_ali=c(-1,1)),replications = 2,randomize= FALSE)
experimento_resp1=add.response(design=experimento1,response=Y1)
MEPlot(experimento_resp1)

IAPlot(experimento_resp1)

Analizando todo lo anterior, se determina que los efectos que más influyen sobre el total de errores son 3, La velocidad de cam, la velocidad de la mesa y el alimentador. Asimismo, se observa que la interacción entre la velocidad y el orden de colocación y la de velocidad de mesa con el orden de colocacion, están influyendo en el resultado final.

Inciso C

Ahora se muestra el código para poder obtener la tabla ANOVA

anova1=aov(modelo1)
summary(anova1)
##                         Df Sum Sq Mean Sq F value   Pr(>F)    
## f_vel                    1   8613    8613  62.260 6.63e-07 ***
## f_mes                    1   1263    1263   9.126 0.008117 ** 
## f_ord                    1  11820   11820  85.436 8.12e-08 ***
## f_ali                    1  11666   11666  84.328 8.87e-08 ***
## f_vel:f_mes              1    332     332   2.396 0.141163    
## f_vel:f_ord              1   3549    3549  25.654 0.000115 ***
## f_vel:f_ali              1    205     205   1.482 0.241106    
## f_mes:f_ord              1    332     332   2.396 0.141163    
## f_mes:f_ali              1    428     428   3.092 0.097779 .  
## f_ord:f_ali              1    306     306   2.214 0.156214    
## f_vel:f_mes:f_ord        1     69      69   0.499 0.490107    
## f_vel:f_mes:f_ali        1     69      69   0.499 0.490107    
## f_vel:f_ord:f_ali        1      9       9   0.065 0.801591    
## f_mes:f_ord:f_ali        1    158     158   1.139 0.301766    
## f_vel:f_mes:f_ord:f_ali  1     23      23   0.165 0.690267    
## Residuals               16   2213     138                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Inciso D

Analizando la tabla anova se llega a la conclusión de que los factores que más influyen son el A,C y D. No obstante, el factor B también es significativo ya que tiene un valor aún muy bajo por debajo de 0.05. Por otro lado, la interacción que más interviene al momento de los errores es el facto A junto con el C.

Inciso E

Viendo toda la información anterior, para poder minimizar los errores, se sugiere colocar la siguiente combinación.

A (-1)
B (-1)
C (1)
D (1)

Inciso F

Ahora, se procede a realizar lo que corresponde al segundo efecto. El cuál es el tiempo real para tomar los 500 componentes.

modelo2=lm(Y2~(f_vel+f_mes+f_ord+f_ali+f_vel*f_mes+f_vel*f_ord+f_vel*f_ali+f_mes*f_ord+f_mes*f_ali+f_ord*f_ali+f_vel*f_mes*f_ord+f_vel*f_mes*f_ali+f_vel*f_ord*f_ali+f_mes*f_ord*f_ali+f_vel*f_mes*f_ord*f_ali))
summary(modelo2)
## 
## Call:
## lm.default(formula = Y2 ~ (f_vel + f_mes + f_ord + f_ali + f_vel * 
##     f_mes + f_vel * f_ord + f_vel * f_ali + f_mes * f_ord + f_mes * 
##     f_ali + f_ord * f_ali + f_vel * f_mes * f_ord + f_vel * f_mes * 
##     f_ali + f_vel * f_ord * f_ali + f_mes * f_ord * f_ali + f_vel * 
##     f_mes * f_ord * f_ali))
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -13.5   -1.0    0.0    1.0   13.5 
## 
## Coefficients:
##                             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                   83.500      4.274  19.538 1.37e-12 ***
## f_vel1                        -7.500      6.044  -1.241    0.233    
## f_mes1                        -1.500      6.044  -0.248    0.807    
## f_ord1                        10.500      6.044   1.737    0.102    
## f_ali1                        -7.500      6.044  -1.241    0.233    
## f_vel1:f_mes1                  1.500      8.548   0.175    0.863    
## f_vel1:f_ord1                 -3.500      8.548  -0.409    0.688    
## f_vel1:f_ali1                 -3.500      8.548  -0.409    0.688    
## f_mes1:f_ord1                 -4.000      8.548  -0.468    0.646    
## f_mes1:f_ali1                  4.000      8.548   0.468    0.646    
## f_ord1:f_ali1                 -2.500      8.548  -0.292    0.774    
## f_vel1:f_mes1:f_ord1           1.000     12.088   0.083    0.935    
## f_vel1:f_mes1:f_ali1          10.500     12.088   0.869    0.398    
## f_vel1:f_ord1:f_ali1           7.000     12.088   0.579    0.571    
## f_mes1:f_ord1:f_ali1           2.500     12.088   0.207    0.839    
## f_vel1:f_mes1:f_ord1:f_ali1  -16.500     17.095  -0.965    0.349    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.044 on 16 degrees of freedom
## Multiple R-squared:  0.6925, Adjusted R-squared:  0.4042 
## F-statistic: 2.402 on 15 and 16 DF,  p-value: 0.04609
library(FrF2)
experimento2=FrF2(nruns = 16,nfactors = 4,factor.names = list(f_vel=c(-1,1),f_mes=c(-1,1),f_ord=c(-1,1),f_ali=c(-1,1)),replications = 2,randomize= FALSE)
experimento_resp2=add.response(design=experimento2,response=Y2)
MEPlot(experimento_resp2)

IAPlot(experimento_resp2)

También, para tener un mejor analisis se obtiene en este momento la tabla ANOVA.

anova2=aov(modelo2)
summary(anova2)
##                         Df Sum Sq Mean Sq F value  Pr(>F)   
## f_vel                    1  472.8   472.8  12.942 0.00241 **
## f_mes                    1    3.8     3.8   0.104 0.75183   
## f_ord                    1  294.0   294.0   8.049 0.01190 * 
## f_ali                    1  247.5   247.5   6.776 0.01922 * 
## f_vel:f_mes              1   19.5    19.5   0.535 0.47523   
## f_vel:f_ord              1   26.3    26.3   0.719 0.40885   
## f_vel:f_ali              1    2.5     2.5   0.069 0.79573   
## f_mes:f_ord              1   81.3    81.3   2.225 0.15525   
## f_mes:f_ali              1   81.3    81.3   2.225 0.15525   
## f_ord:f_ali              1    7.0     7.0   0.192 0.66673   
## f_vel:f_mes:f_ord        1   26.3    26.3   0.719 0.40885   
## f_vel:f_mes:f_ali        1    2.5     2.5   0.069 0.79573   
## f_vel:f_ord:f_ali        1    0.8     0.8   0.021 0.88556   
## f_mes:f_ord:f_ali        1   16.5    16.5   0.453 0.51074   
## f_vel:f_mes:f_ord:f_ali  1   34.0    34.0   0.932 0.34882   
## Residuals               16  584.5    36.5                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con la información dada, se llega a la conclusión de que la velocidad de cam es el factor más influyente, pero, también debe tomar en cuenta los factores del orden y la alimentación, ya que ambos, aún cumplen con la condición de que su valor de F sea menor a 0.05. Aquí se descarta el factor B y cualquier interacción posible.

Inciso G

Debido a que el efecto es tiempo, se busca minimizar esta respuesta, por lo tanto se sugiere con base a lo visto las anteriores gráficas que sea la siguiente combinación

A (1)
B (-1)
C (-1)
D (1)

El valor de B no importa significativamente, por lo tanto, si se buscará otra variable, se puede cambiar.

Inciso H

Para poder obtener la mejor combinación sin afectar alguno de los dos efectos, se sugiere eleccionar los siguientes valores para cada factor. Esto, tomando en cuenta los valores más significativos.

A (-1)
B (-1)
C (1)
D (1)

El valor se selecciona como negativo ya que su valor en positivo afectaría en mayor magnitud al efecto 1 que si fuera negativo en caso del efecto 2.

Inciso I

Se analiza el R cuadrado ajustado de ambos efectos, en el primer caso se tiene un valor de 0.8955 y en el segundo es de 0.6925. Ambos valores aceptables para poder reafirmar que este modelo se ajusta a una linea recta y que se puede continuar con el estudio.

Inciso J

Una vez realizado el Análisis de Varianza, es importante verificar las pruebas de adecuación del modelo, para lo cual se efectuarán las siguientes pruebas:

  1. Prueba de Normalidad de Residuos de Shapiro Wilks
  2. Prueba de Barttlet para Igualdad de Varianzas

Prueba Shapiro Wilks

Para el caso específico de la normalidad, procederemos a utilizar la Prueba de Bondad de Ajuste a la Distribución Normal de Shapiro-Wilks, aunque cabe mencionar que puede utilizarse cualquier otra, como Kolmogorov-Smirnov o Anderson-Darlind, la prueba de Shapiro-Wilks está diseñada específicamente para la Distribución Normal(Montgomery, 2004). Para realizar esta prueba debemos plantear las siguientes hipótesis de trabajo:

\(H_0:x∈N(μ=0,σ^2=Constante)\)
\(H_1:x∉N(μ=0,σ^2=Constante)\)

La hipótesis nula de la Prueba de Shapiro-Wilks se rechaza cuando \(Valorp<0.05\), siempre es recomendable realizar una gráfica de probabilidad normal para confirmar la prueba de hipótesis, para lo cual utilizaremos la siguiente secuencia de comandos:

Efecto 1

normalidad1=shapiro.test(resid(modelo1))
print(normalidad1)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo1)
## W = 0.96651, p-value = 0.4091

Efecto 2

normalidad2=shapiro.test(resid(modelo2))
print(normalidad2)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo2)
## W = 0.8854, p-value = 0.002686

Dado a los resultados obtenidos, para el caso de el efecto 1 se acepta la hipotesis nula ya que el valor de P es mayor que 0.05 y se puede continuar en el analisis. Sin embargo, se descarta el modelo para el efecto 2 ya que su valor p es 0.002, muy por debajo del valor requerido (0.05)

Prueba de Barttlet

La Prueba de Homocedasticidad, o de Varianzas Iguales, se realiza mediante la Prueba de Bartlett, misma que para el caso particular, como sólo es significativo el factor de tratamiento, solo se considerará éste para la ejecución de la prueba(Pulido, De la Vara Salazar, González, Martı́nez, & Pérez, 2012). La Prueba de Bartlett tiene las siguientes hipótesis:

\(H_0:σ^2_i=σ^2_j=Constante\)
\(H_1:σ^2_i≠σ^2_j≠Constante\)

La Prueba de Bartlett se realiza con la siguiente línea de comandos,

Efecto 1

homocedasticidad1=bartlett.test(resid(modelo1),f_vel,f_mes,f_ord,f_ali,data=experimento_resp1)
print(homocedasticidad1)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  resid(modelo1) and f_vel
## Bartlett's K-squared = 0.025372, df = 1, p-value = 0.8734

Efecto 2

homocedasticidad2=bartlett.test(resid(modelo2),f_vel,f_mes,f_ord,f_ali,data=experimento_resp2)
print(homocedasticidad2)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  resid(modelo2) and f_vel
## Bartlett's K-squared = 2.0788, df = 1, p-value = 0.1494

De acuerdo con los resultados, se determina que ambos efectos tienen una varianza constante. Pero por el resultado anterior, solo es recomendable concluir que el modelo matematico lineal solo es adecuado para el efecto 1, es decir, para poder determinar el número de errores totales

Montgomery, D. (2004). Diseño y análisis de experimentos. México: Compañı́a Editorial Limusa Wiley.

Pulido, H. G., De la Vara Salazar, R., González, P. G., Martı́nez, C. T., & Pérez, M. del C. T. (2012). Análisis y diseño de experimentos. McGraw-Hill New York, NY, USA: