Ejercicio 5.2 de BHH2: Sabor de las cotufas

Author

Rafael E. Borges, borgesr@gmail.com, Profesor Titular, Escuela de Estadística, ULA, Mérida, Venezuela.

Introducción

Se presenta el análisis para la variable respuesta sabor de las cotufas del ejercicio 5.2 del libro de Box, Hunter y Hunter (2008) en el cual se presentan los datos correspondientes a un diseño de experimentos factorial 23, para dos variables respuesta:

y1: Producción de cotufas (en tazas).

y2: Sabor de las cotufas (en una escala del 1 al 10).

Y donde los tres factores son:

A: Tipo de grano: Normal (-) o Gourmet (+).

B: Razón maíz/aceite: Baja (-) o Alta (+).

C: Tamaño de la taza de granos: 1/3 ee taza (-), 2/3 de taza (+).

Carga de los datos:

Como de trata de un diseño factorial, procederemos a la carga de las variables repuesta y los de los factores principales basados en los patrones de signos alternados para este tipo de diseño, y posteriormente se construirán a partir de estos fatores, los factores de interacción.

# Carga de las variables y los factores
# Carga de las variables:
cotufas <- matrix(c(6.25, 8, 6, 9.5, 8, 15, 9, 17, 6, 7, 10, 9, 6, 6, 9, 2),byrow=F,ncol=2)
dimnames(cotufas) <- list(c("(1)","a","b","ab","c","ac","bc","abc"),c("y1","y2"))
# factores principales:
A <- rep(c(-1,1),4)
B <- rep(c(-1,-1,1,1),2)
C <- c(rep(-1,4),rep(1,4))
# Factores de interacción:
AB <- A*B
AC <- A*C
BC <- B*C
ABC <- A*B*C
# Tabla del diseño:
cbind(cotufas,A,B,C,AB,AC,BC,ABC)
       y1 y2  A  B  C AB AC BC ABC
(1)  6.25  6 -1 -1 -1  1  1  1  -1
a    8.00  7  1 -1 -1 -1 -1  1   1
b    6.00 10 -1  1 -1 -1  1 -1   1
ab   9.50  9  1  1 -1  1 -1 -1  -1
c    8.00  6 -1 -1  1  1 -1 -1   1
ac  15.00  6  1 -1  1 -1  1 -1  -1
bc   9.00  9 -1  1  1 -1 -1  1  -1
abc 17.00  2  1  1  1  1  1  1   1

Análisis para el Sabor

Estimación de los efectos:

# #réplicas: n=1
n <- 1
y2 <- cotufas[9:16]
# Estimación de los efectos:
Aeff <- (y2 %*% A)/(4*n)
Beff <- (y2 %*% B)/(4*n)
Ceff <- (y2 %*% C)/(4*n)
ABeff <- (y2 %*% AB)/(4*n)
ACeff <- (y2 %*% AC)/(4*n)
BCeff <- (y2 %*% BC)/(4*n)
ABCeff <- (y2 %*% ABC)/(4*n)
# Resumen:
Efectos <- t(y2) %*% cbind(A,B,C,AB,AC,BC,ABC)/(4*n)
Resumen <- rbind( cbind(A,B,C,AB,AC,BC,ABC),Efectos )
dimnames(Resumen)[[1]] <- c(dimnames(cotufas)[[1]],"Efectos")
Resumen
            A     B     C    AB    AC    BC   ABC
(1)     -1.00 -1.00 -1.00  1.00  1.00  1.00 -1.00
a        1.00 -1.00 -1.00 -1.00 -1.00  1.00  1.00
b       -1.00  1.00 -1.00 -1.00  1.00 -1.00  1.00
ab       1.00  1.00 -1.00  1.00 -1.00 -1.00 -1.00
c       -1.00 -1.00  1.00  1.00 -1.00 -1.00  1.00
ac       1.00 -1.00  1.00 -1.00  1.00 -1.00 -1.00
bc      -1.00  1.00  1.00 -1.00 -1.00  1.00 -1.00
abc      1.00  1.00  1.00  1.00  1.00  1.00  1.00
Efectos -1.75  1.25 -2.25 -2.25 -1.75 -1.75 -1.25

Exploración de los datos:

La exploración de los datos puede hacerse de dos maneras:

  1. A través de la representación cúbica y el gráfico del diseño.
  2. A través de los gráficos de cajas múltiples de la variables respuesta según los niveles de cada factor, y los gráficos de interacción.

Representación cúbica

# Carga del paquete FrF2:
library(FrF2)
y2 <- cotufas[9:16]
cubePlot(y2, A, C, B, main=paste("Representación cúbica para Sabor"),
    cex.title=1,cex.lab=par("cex.lab"), cex.ax=par("cex.axis"),     cex.clab=1.2, size=0.3, round=NULL,
    abbrev=4,y.margin.add=-0.2, modeled=TRUE)

En este gráfico se puede observar que los mejores sabores se obtienen para razones altas de máiz/aceite, exceptuando el caso de una combinación de grano Gourmet y 2/3 de taza de granos, donde se obtiene el peor sabor.

Gráfico del diseño:

Para hacer este gráfico (y para los análisis de varianzas), debemos primero efectuar una transformación de los factores principales y de interacción a variables tipo factor:

A <- as.factor(A)
B <- as.factor(B)
C <- as.factor(C)
AB <- as.factor(AB)
AC <- as.factor(AC)
BC <- as.factor(BC)
ABC <- as.factor(ABC)

Y una vez efectuada está transformación, se puede obtener el gráfico del diseño, mediante:

Form <- y2 ~ A + B + C + AB + AC + BC + ABC
plot.design(Form, main = "Gráfico del diseño para Sabor", ylab = "Media de la sabor")

En este gráfico se obsserva que todos los factores (principales y de interacción parecieran tener un efecto similar sobre el sabor de las cotufas.

Gráficos de cajas múltiples:

Otra forma (menos eficiente) de visualizar los efectos de cada factor es a través de los gráficos de cajas múltiples de la variable respuesta según cada uno de los factores.

boxplot(y2 ~ A)

boxplot(y2 ~ B)

boxplot(y2 ~ C)

boxplot(y2 ~ AB)

boxplot(y2 ~ AC)

boxplot(y2 ~ BC)

boxplot(y2 ~ ABC)

Los cuales pueden complementarse xon los gráficos de interacciones.

Gráficos de interacciones:

Mediante estos gráficos podemos explorar las posibles interacciones de orden 2.

interaction.plot(A, B, y2)

interaction.plot(A, C, y2)

interaction.plot(B, C, y2)

Análisis de varianza:

Se parte del modelo que incluya los factores principales y las interacciones hasta el orden que lo permitan los grados de libertad.

Modelo 1:

anova(lm(y2 ~ A + B + C + AB + AC + BC))
Analysis of Variance Table

Response: y2
          Df Sum Sq Mean Sq F value Pr(>F)
A          1  6.125   6.125    1.96 0.3949
B          1  3.125   3.125    1.00 0.5000
C          1 10.125  10.125    3.24 0.3228
AB         1 10.125  10.125    3.24 0.3228
AC         1  6.125   6.125    1.96 0.3949
BC         1  6.125   6.125    1.96 0.3949
Residuals  1  3.125   3.125               

Eliminamos la interacción de orden mayor no significativa con mayor p-valor, en esta caso BC, y se corre un nuevo modelo.

Modelo 2:

anova(lm(y2 ~ A + B + C + AB + AC))
Analysis of Variance Table

Response: y2
          Df Sum Sq Mean Sq F value Pr(>F)
A          1  6.125   6.125  1.3243 0.3688
B          1  3.125   3.125  0.6757 0.4975
C          1 10.125  10.125  2.1892 0.2771
AB         1 10.125  10.125  2.1892 0.2771
AC         1  6.125   6.125  1.3243 0.3688
Residuals  2  9.250   4.625               

Siguiendo el procedimiento, se elimina la interacción AC y se corre un nuevo modelo.

Modelo 3:

anova(lm(y2 ~ A + B + C + AB))
Analysis of Variance Table

Response: y2
          Df Sum Sq Mean Sq F value Pr(>F)
A          1  6.125   6.125  1.1951 0.3542
B          1  3.125   3.125  0.6098 0.4918
C          1 10.125  10.125  1.9756 0.2545
AB         1 10.125  10.125  1.9756 0.2545
Residuals  3 15.375   5.125               

Se elimina la interacción AB y se corre un nuevo modelo.

Modelo 4:

anova(lm(y2 ~ A + + B + C))
Analysis of Variance Table

Response: y2
          Df Sum Sq Mean Sq F value Pr(>F)
A          1  6.125   6.125  0.9608 0.3825
B          1  3.125   3.125  0.4902 0.5224
C          1 10.125  10.125  1.5882 0.2761
Residuals  4 25.500   6.375               

Eliminamos el factor B, y ajustamos un nuevo modelo

Modelo 5:

anova(lm(y2 ~ A + C))
Analysis of Variance Table

Response: y2
          Df Sum Sq Mean Sq F value Pr(>F)
A          1  6.125   6.125  1.0699 0.3484
C          1 10.125  10.125  1.7686 0.2410
Residuals  5 28.625   5.725               

Eliminamos el factor A, y ajustamos un nuevo modelo

Modelo 6:

anova(lm(y2 ~ C))
Analysis of Variance Table

Response: y2
          Df Sum Sq Mean Sq F value Pr(>F)
C          1 10.125 10.1250  1.7482 0.2343
Residuals  6 34.750  5.7917               

No se puede encontrar un modelo factorial que sea significativo, por lo que no se puede continuar con el análisis.

Conclusiones

Para la variable respuesta sabor de las cotufas no se logra identificar algún factor con efecto significativo para la misma, lo cual pudiera estar debido a dos razones:

  1. Que las personas encargadas de valorar el sabor de las cotufas (catadores) no tengan la experticia necesaria para realizar la evaluación de esta característica organoléptica.
  2. Que estos factores no sean los que en realidad tengan efecto sobre el sabor de las cotufas, y que hayan otros que no han sido considerados, como por ejemplo: distintos niveles de combinación de aceite y mantequilla, el agregar algunos saborizantes que potencien el sabor de las cotufas, la temperatura en la cual se hacen las cotufas, entre otros.

Tomando en cuenta la representación cúbica pudiera sugerirse, para obtener un mejor sabor, el uso de una razón de maíz/aceite alta, pero evitar combinarna con un grano Goumet y con 2/3 de taza de granos.

Referencias

Box, G. E., Hunter, J. S. & Hunter, W. G. (2008). Estadística para Investigadores: Diseño, innovación y descubrimiento. Segunda edición. Barcelona, España: Editorial Reverté.