Análisis de un ejemplo de un Diseño en Cuadrados Latinos (ejemplo 8.3 de Melo, López y Melo (2020))

Author

Rafael E. Borges, borgesr@gmail.com, Profesor Titular, Escuela de Estadística, ULA, Mérida, Venezuela.

Presentación del ejemplo:

Se presenta el análisis del ejemplo 8.3 del libro de Melo, López & Melo (2020) que puede accederse y descargarse gratuitamente a través del enlace: https://repositorio.unal.edu.co/handle/unal/79912, en el cual se desea estudiar el efecto de cuatro métodos de preparación de mezclas de concreto (A, B, C y D), obtenidos usando dos relaciones de cemento y agua y dos duraciones de mezclado sobre la resistencia del concreto a la compresión en kg/cm2, colados en cilindros y medida a los 7 días de almacenamiento en cámaras especiales con 20oC y 50% de humedad relativa. Los cuatro métodos fueros controlados mediante cuatro lotes durante cuatro días.

Descripción de los datos:

Para facilitar el análisis, los datos fueron cargados en una hoja de Microsoft Excel que contiene las siguientes variables:

ResCon: Resistencia del concreto a la compresión en kg/cm2.

Trat: Método de preparación de mezcla de concreto (A, B, C y D) (variable tratamiento).

Dia: Día de preparación de la mezcla de concreto (D1, D2, D2 y D4) (variable bloque fila).

Lote: Lote del cual proviene el cemento con el que se elaboró la mezcla de concreto (L1, L2, L3 y L4) (variable bloque columna).

Lectura de los datos

Los datos fueron leídos usando el paquete readxl (Wikham & Brian, 2023)

library(readxl)
DCL_Ejemplo8_3_MLM <- read_excel("DCL_Ejemplo8_3_MLM.xlsx")
# View(DCL_Ejemplo8_3_MLM)

Análisis del ejemplo

El ejemplo fue analizado siguiendo los pasos recomendados para el análisis de los datos obtenidos a partir de un diseño de experimentos, que en este caso corresponde a un Diseño en Cuadrados Latinos.

Estos pasos son los siguientes:

  1. Análisis exploratorio de los datos:

    1.1. Gráfico de cajas múltiples de la resistencia al concreto (variable respuesta) según el método de mezclado (variable tratamiento).

    1.2. Gráficos de cajas múltiples de la resistencia al concreto (variable respuesta) según el día de preparación de la mezcla de concreto (variable bloque fila) y según el lote del cemento usado en la mezcla de concreto (variable bloque columna).

  2. Formulación del modelo.

  3. Ajuste del Modelo.

  4. Verificación de la significación del Modelo.

  5. Verificación de la significación de la diferencia en las medias de la resistencia a concreto para los distintos métodos de mezclado (y para los distintos día y para los distintos lotes).

  6. En caso de existir diferencias en las medias de la resistencia a concreto para los distintos métodos de mezclado, debe llevarse a cabo una prueba a posteriori.

  7. Análisis de residuos.

  8. Conclusiones y recomendaciones.

  9. Simplificación del modelo (opcional pero deseable).

El análisis se llevó a cabo usando funciones de la base de la versión 4.3.1 del lenguaje R (R Core Team, 2023) ejecutados en la versión 2022.7.2.576 del Ambiente de Desarrollo Integrado (IDE) RStudio (RStudio Team, 2022).

Análisis exploratorio de los datos:

Carga de los datos en memoria:

attach(DCL_Ejemplo8_3_MLM)

Gráfico de cajas múltiples de la resistencia al concreto (variable respuesta) según el método de mezclado (variable tratamiento):

boxplot(ResCon ~ Trat, main="Gráfico de cajas múltiples de la \n resistencia al concreto según tratamiento")

En este gráfico se puede observar que la mezcla en donde se obtiene una mayor resistencia del concreto es la A, la cual es seguida por la mezcla B, con la cual no pareciera existir diferencia significativa, y la mezcla que produce menor resistencia del concreto es la mezcla C, la cual es seguida por la mezcla B, con la cual no pareciera existir diferencia significativa.

Gráficos de cajas múltiples de la resistencia al concreto (variable respuesta) según el día de preparación de la mezcla de concreto (variable bloque fila) y según el lote del cemento usado en la mezcla de concreto (variable bloque columna):

boxplot(ResCon ~ Dia, main="Gráfico de cajas múltiples de la \n resistencia al concreto según día")

boxplot(ResCon ~ Lote, main="Gráfico de cajas múltiples de la \n resistencia al concreto según lote")

Al analizar el gráfico de cajas múltiples de la resistencia al concreto según el día de preparación de la mezcla de concreto, se puede observar que no pareciera existir diferencias en la resistencia al concreto para los distintos días.

Y al analizar el gráfico de cajas múltiples de la resistencia al concreto según el lote del cemento usado en la preparación de la mezcla de concreto, se observan que parecieran obtenerse diferencias en la resistencia del concreto para los distintos lotes de cemento.

Formulación del modelo:

El modelo planteado corresponde a un modelo de un diseño en Cuadrados Latinos, que para el caso general puede plantearse de acuerdo a la siguiente figura:

Tomado del Melo, López & Melo (2020).

Donde los variables son las que se presentarón en la sección correspondiente a la presentación de los datos.

Este modelo tiene dos supuestos básicos:

  1. La normalidad de los errores.
  2. La homocedasticidad (igualdad de varianza) para cada uno de los valores de la varible respuesta.

Ajuste del Modelo:

Para llevar a cabo este procedimiento, debemos obtener primero el ajuste del modelo:

Modelo <- lm(ResCon ~ Trat + Dia + Lote)

Verificación de la significación del Modelo:

Mediante el resúmen del modelo ajustado:

summary(Modelo)

Call:
lm(formula = ResCon ~ Trat + Dia + Lote)

Residuals:
   Min     1Q Median     3Q    Max 
-7.250 -2.875  0.375  2.438  8.000 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  300.000      5.274  56.885 1.98e-09 ***
TratB        -18.500      4.717  -3.922  0.00778 ** 
TratC        -27.000      4.717  -5.724  0.00123 ** 
TratD         -6.500      4.717  -1.378  0.21739    
DiaD2          3.500      4.717   0.742  0.48611    
DiaD3          6.750      4.717   1.431  0.20239    
DiaD4          3.750      4.717   0.795  0.45690    
LoteL2        16.500      4.717   3.498  0.01286 *  
LoteL3        13.750      4.717   2.915  0.02681 *  
LoteL4         3.750      4.717   0.795  0.45690    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 6.671 on 6 degrees of freedom
Multiple R-squared:  0.9064,    Adjusted R-squared:  0.7661 
F-statistic: 6.459 on 9 and 6 DF,  p-value: 0.01705

Podemos verificar la significación del modelo con el p-valor que se presenta al final de la salida (0,01705), y al ser este valor menor a 0,05 (usando un 5% de nivel de significación,el cual debe ser previamente fijado), podemos concluir quen la parte estructural (la parte derecha del modelo antes del término de error) es significativa.

En términos coloquiales, lo anterior equivale a decir que la variabilidad de la resistencia del concreto, puede ser explicada significativamente (al 5%) a través de la mezclas de concreto, controlando por día de la preparación de la mezcla y cemento usado para la mezcla, usando un Diseño en Cuadrados Latinos.

Verificación de la significación de la diferencia en las medias de la resistencia a concreto para los distintos métodos de mezclado (y para los distintos día y para los distintos lotes):

Para llevar a cabo esta verificación, se debe construir la tabla ANOVA (Análisis de Varianza):

anova(Modelo)
Analysis of Variance Table

Response: ResCon
          Df Sum Sq Mean Sq F value   Pr(>F)   
Trat       3 1750.0  583.33 13.1086 0.004815 **
Dia        3   91.5   30.50  0.6854 0.592903   
Lote       3  745.5  248.50  5.5843 0.035911 * 
Residuals  6  267.0   44.50                    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

A partir de la cual podemos concluir que:

  1. Existe diferencia significativa (al 5%) en las medias de la resistencia del concreto para las distintas mezclas (p-valor = 0,004815).
  2. No existe diferencia significativa (al 5%) en las medias de la resistencia del concreto para los distintos días de preparación de las mezclas (p-valor = 0,592903).
  3. Existe diferencia significativa (al 5%) en las medias de la resistencia del concreto para las distintos lotes de cemento con el cual se prepararon las mezclas (p-valor = 0,035911).

Prueba a posteriori para la identificación de los pares tratamientos que generan las diferencias de las medias:

Existen una variedad de pruebas a posteriori para poder hacer está identificación, siendo la Diferencia Honesta Significativa de Tukey una de ellas:

TukeyHSD(aov(Modelo), which="Trat", ordered = TRUE)
  Tukey multiple comparisons of means
    95% family-wise confidence level
    factor levels have been ordered

Fit: aov(formula = Modelo)

$Trat
    diff      lwr      upr     p adj
B-C  8.5 -7.82886 24.82886 0.3569696
D-C 20.5  4.17114 36.82886 0.0188535
A-C 27.0 10.67114 43.32886 0.0049764
D-B 12.0 -4.32886 28.32886 0.1490026
A-B 18.5  2.17114 34.82886 0.0297469
A-D  6.5 -9.82886 22.82886 0.5538194

A partir de la salida correspondiente podemos concluir que:

  1. La media de la resistencia al concreto obtenido en la mezcla A es significativamente mayor a la obtenida mediante la mezcla B (p-valor = 0,0297469) y a la obtenida mediante la mezcla C (p-valor = 0,0049764), y no difiere de la obtenida mediante la mezcla D (p-valor = 0,5538194).
  2. La media de la resistencia al concreto obtenido en la mezcla C no difiere significativamente de la obtsnida mediante la mezcla B (p-valor = 0,3569696), y es significativamente menor a la obtenida mediante la mezcla D (p-valor = 0,0188535) y al obtenida mediante la mezcla A (p-valor = 0,0049764).

Análisis de residuos:

La verificación de los supuestos, se puede hacer mediante el análisis de los residuos o mediantes pruebas estadística, en este caso utilizaremos el primero de los procedimientos, que e obtiene realizando un ploteo del modelo:

plot(Modelo)

En el cual analizamos los primeros dos gráficos obtenidos:

En el primer gráfico, al presentarse un patrón de “nube aleatoria”, podemos concluir que no pareciera violarse el supuesto de homocedasticidad.

En el segundo gráfico, y al estar los puntos cercanos a la línea recta, podemos concluir que pareciera noi violarse el supuesto de normalidad de los residuos.

Conclusiones y recomendaciones:

Tomando en cuenta los análisis ´previamente realizados, podemos concluir que existe diferencia significativa en la media para los distintos tratamientos, y para obtener una resistencia del concreto mayor se recomienda el uso de la mezcla A, a pesar de de que esta mezcla no produce una resistencia del concreto significativamente mayor de la obtenida mediante la mezcla D.

Simplificación del modelo:

La no significación de las medias de la resistencia al concreto para los distintos días, sugiere que esta variable tipo bloque pudiera ser eliminada, y usar un Diseño en Bloques Aleatorizados (solo con lotes como variable tipo bloque).

Esto también puede verse a través de la Eficiencia Relativa del DCL respecto al DBA sin la variable Dia:

# Fórmula: 1-(1/(t-1))*(1-F_Dias)
1-(1/(4-1))*(1-0.6854)
[1] 0.8951333

Y al ser este valor menor que 1, podemos concluir que, para estos datos, es más eficiente usar un DBA solo con Lote como varible tipo bloque.

Referencias:

Melo, O.O., López, L.A. & Melo, S.E. (2020). Diseño de experimentos : métodos y aplicaciones. Segunda edición. Bogotá Colombia: Universidad Nacional de Colombia.

R Core Team (2023). R: A Language and Environment for Statistical Computing. Viena, Austria: R Foundation for Statistical Computing. URL: https://www.R-project.org/.

RStudio Team (2022). RStudio: Integrated Development Environment for R. Boston, MA: RStudio, PBC. URL: http://www.rstudio.com/.

Wickham H, Bryan J (2023). readxl: Read Excel Files. R package version 1.4.3. URL: https://CRAN.R-project.org/package=readxl.