Diseño Cuadrado Latino

Problema a analizar: Se midió la concentracion de contaminantes presentes en el aire en cinco puntos geograficos de la ciudad: Norte, Sur, Este, Oeste y centro, a lo largo de distintos dias de la semana y en diferentes horarios.

##    Puntos       Dia  Hora   ppm
##    <char>    <char> <int> <int>
## 1:  Norte     Lunes     8   124
## 2:   Este     Lunes    11   112
## 3:    Sur     Lunes    14   123
## 4:  Oeste     Lunes    17   118
## 5: Centro     Lunes    20   102
## 6:    Sur Miercoles     8   124

Gráfico de cajas

TRC <- factor(DCL$Puntos)
FILA <- factor(DCL$Dia)
COL <- factor(DCL$Hora)

Resp <- as.vector(DCL$ppm)
Resp1 <- as.numeric(Resp)

boxplot(split(Resp1,TRC),xlab="Puntos de Ciudad", ylab="Concentraciones de monóxido de carbono")

De acuerdo al grafico de cajas, se determino que las concentraciones de monoxido de carbono en el este y oeste tienen variaciones similares, al igual que el norte y sur donde son mas elevadas, mientras que en el centro de la ciudad presenta una mayor variabilidad de los datos.

Cálculo ANOVA y modelo lineal

## 
## Call:
## lm(formula = Resp1 ~ FILA + COL + TRC)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -9.08  -2.28  -0.28   3.32   9.32 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    123.480      4.868  25.365 8.57e-12 ***
## FILALunes      -11.800      4.270  -2.764  0.01716 *  
## FILAMiercoles   -9.400      4.270  -2.202  0.04800 *  
## FILAS\xe1bado   -1.800      4.270  -0.422  0.68078    
## FILAViernes     -4.200      4.270  -0.984  0.34468    
## COL11           -6.200      4.270  -1.452  0.17211    
## COL14            0.800      4.270   0.187  0.85450    
## COL17            0.600      4.270   0.141  0.89057    
## COL20           -2.400      4.270  -0.562  0.58438    
## TRCEste          0.800      4.270   0.187  0.85450    
## TRCNorte        13.800      4.270   3.232  0.00719 ** 
## TRCOeste         1.000      4.270   0.234  0.81877    
## TRCSur          12.200      4.270   2.857  0.01442 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.751 on 12 degrees of freedom
## Multiple R-squared:  0.7463, Adjusted R-squared:  0.4925 
## F-statistic: 2.941 on 12 and 12 DF,  p-value: 0.03678
## Analysis of Variance Table
## 
## Response: Resp1
##           Df Sum Sq Mean Sq F value  Pr(>F)  
## FILA       4 502.56 125.640  2.7569 0.07757 .
## COL        4 174.16  43.540  0.9554 0.46626  
## TRC        4 931.76 232.940  5.1113 0.01224 *
## Residuals 12 546.88  45.573                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Analysis of Variance Table
## 
## Response: Resp1
##           Df Sum Sq Mean Sq F value  Pr(>F)  
## FILA       4 502.56 125.640  2.7569 0.07757 .
## COL        4 174.16  43.540  0.9554 0.46626  
## TRC        4 931.76 232.940  5.1113 0.01224 *
## Residuals 12 546.88  45.573                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##             Df Sum Sq Mean Sq F value Pr(>F)  
## FILA         4  502.6  125.64   2.757 0.0776 .
## COL          4  174.2   43.54   0.955 0.4663  
## TRC          4  931.8  232.94   5.111 0.0122 *
## Residuals   12  546.9   45.57                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El modelo toma como referencia el domingo para las comparaciones. Se observa una diferencia significativa en las concentraciones de monóxido de carbono los lunes en comparación con el domingo, ya que el valor p es menor a 0.05. En cambio, los demás días del fin de semana no presentan diferencias significativas con respecto al domingo. Además, no se encontraron diferencias significativas entre las mediciones realizadas a las 8 de la mañana y las de otras horas del día.

En cuanto a la influencia de la ubicación, se identificó una diferencia significativa en las concentraciones entre el norte y el centro de la ciudad. Específicamente, por cada unidad adicional de ppm en el centro, la concentración en el norte aumenta en promedio 13.8 ppm, mientras que en el sur el incremento promedio es de 12.2 ppm.

Respecto a al R cuadrado, se encontro que el experimento tiene un 74.6% de variabilidad en las concentraciones de monóxido de carbono.

Coeficiente de variación

library(agricolae) #coeficiente de variacion 
cv.model(DCL.aov)
## [1] 5.526197

El coeficiente de variacion fue de 5.52, lo que indica que la variabilidad de los datos es relativamente baja.

2. Supuestos del Diseño

Prueba de normalidad Shapiro-Wilk

## Loading required package: carData
## 
##  Shapiro-Wilk normality test
## 
## data:  DCL.lm$res
## W = 0.97948, p-value = 0.8746

## [1] 10 13

De acuerdo al grafico qqPlot, los residuos se aliean en la linea de 45 grados, por lo tanto estos tienen un comportamiento y distribucion aparentemente normal.

Gráfico de predichos contra residuos estandarizados

fitc <- fitted(DCL.aov)
res_stc <- rstandard(DCL.aov)  
plot(fitc,res_stc,xlab="Valores predichos", ylab="Residuos estandarizados",abline(h=0))

Prueba de independencia

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:data.table':
## 
##     yearmon, yearqtr
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
dwtest(DCL.lm, order.by = ~ Puntos, 
       data = DCL, 
       alternative = "two.sided")
## 
##  Durbin-Watson test
## 
## data:  DCL.lm
## DW = 2.2798, p-value = 0.9786
## alternative hypothesis: true autocorrelation is not 0

Pruebas de comparación múltiple de medias

Prueba de Duncan

duncan.test(DCL.aov, "TRC",console=TRUE)
## 
## Study: DCL.aov ~ "TRC"
## 
## Duncan's new multiple range test
## for Resp1 
## 
## Mean Square Error:  45.57333 
## 
## TRC,  means
## 
##        Resp1       std r       se Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 100 133 102 124 124
## Este   117.4  5.366563 5 3.019051 112 124 112 118 121
## Norte  130.4  3.911521 5 3.019051 124 134 130 131 133
## Oeste  117.6  4.560702 5 3.019051 112 122 114 118 122
## Sur    128.8  4.919350 5 3.019051 123 133 124 131 133
## 
## Alpha: 0.05 ; DF Error: 12 
## 
## Critical Range
##         2         3         4         5 
##  9.302621  9.737174 10.000463 10.174719 
## 
## Means with the same letter are not significantly different.
## 
##        Resp1 groups
## Norte  130.4      a
## Sur    128.8      a
## Oeste  117.6      b
## Este   117.4      b
## Centro 116.6      b

Segun la prueba Duncan, entre los puntos norte y sur no hay diferencias significativas, al iguel que en el oeste, este y centro, peto entre estos dos grupos si la hay.

Prueba Tukey

## 
## Study: DCL.aov ~ "TRC"
## 
## HSD Test for Resp1 
## 
## Mean Square Error:  45.57333 
## 
## TRC,  means
## 
##        Resp1       std r       se Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 100 133 102 124 124
## Este   117.4  5.366563 5 3.019051 112 124 112 118 121
## Norte  130.4  3.911521 5 3.019051 124 134 130 131 133
## Oeste  117.6  4.560702 5 3.019051 112 122 114 118 122
## Sur    128.8  4.919350 5 3.019051 123 133 124 131 133
## 
## Alpha: 0.05 ; DF Error: 12 
## Critical Value of Studentized Range: 4.50771 
## 
## Minimun Significant Difference: 13.609 
## 
## Treatments with the same letter are not significantly different.
## 
##        Resp1 groups
## Norte  130.4      a
## Sur    128.8     ab
## Oeste  117.6     ab
## Este   117.4     ab
## Centro 116.6      b

Segun la prueba Tukey, el Norte y el Centro presentan una diferencia significativa, ya que pertenecen a grupos distintos. En cambio, Sur, Oeste y Este comparten el grupo “ab”, lo que indica que no hay diferencias significativas entre ellos, pero sí con al menos uno de los otros grupos.

Prueba de Scott-Knott

library(ScottKnott)
sk <- SK(DCL.aov, which= "TRC",  dispersion="se", sig.level=0.05)
summary(sk)
## Goups of means at sig.level = 0.05 
##         Means G1 G2
## Norte  130.40  a   
## Sur    128.80  a   
## Oeste  117.60     b
## Este   117.40     b
## Centro 116.60     b

Según la prueba de Scott-Knott, Norte y Sur forman un grupo (“a”), mientras que Oeste, Este y Centro pertenecen a otro grupo (“b”). Esto indica una diferencia significativa entre ambos grupos, pero no dentro de cada uno.