Problema a analizar: Se midió la concentracion de contaminantes presentes en el aire en cinco puntos geograficos de la ciudad: Norte, Sur, Este, Oeste y centro, a lo largo de distintos dias de la semana y en diferentes horarios.
## Puntos Dia Hora ppm
## <char> <char> <int> <int>
## 1: Norte Lunes 8 124
## 2: Este Lunes 11 112
## 3: Sur Lunes 14 123
## 4: Oeste Lunes 17 118
## 5: Centro Lunes 20 102
## 6: Sur Miercoles 8 124
TRC <- factor(DCL$Puntos)
FILA <- factor(DCL$Dia)
COL <- factor(DCL$Hora)
Resp <- as.vector(DCL$ppm)
Resp1 <- as.numeric(Resp)
boxplot(split(Resp1,TRC),xlab="Puntos de Ciudad", ylab="Concentraciones de monóxido de carbono")
De acuerdo al grafico de cajas, se determino que las concentraciones de monoxido de carbono en el este y oeste tienen variaciones similares, al igual que el norte y sur donde son mas elevadas, mientras que en el centro de la ciudad presenta una mayor variabilidad de los datos.
##
## Call:
## lm(formula = Resp1 ~ FILA + COL + TRC)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.08 -2.28 -0.28 3.32 9.32
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 123.480 4.868 25.365 8.57e-12 ***
## FILALunes -11.800 4.270 -2.764 0.01716 *
## FILAMiercoles -9.400 4.270 -2.202 0.04800 *
## FILAS\xe1bado -1.800 4.270 -0.422 0.68078
## FILAViernes -4.200 4.270 -0.984 0.34468
## COL11 -6.200 4.270 -1.452 0.17211
## COL14 0.800 4.270 0.187 0.85450
## COL17 0.600 4.270 0.141 0.89057
## COL20 -2.400 4.270 -0.562 0.58438
## TRCEste 0.800 4.270 0.187 0.85450
## TRCNorte 13.800 4.270 3.232 0.00719 **
## TRCOeste 1.000 4.270 0.234 0.81877
## TRCSur 12.200 4.270 2.857 0.01442 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.751 on 12 degrees of freedom
## Multiple R-squared: 0.7463, Adjusted R-squared: 0.4925
## F-statistic: 2.941 on 12 and 12 DF, p-value: 0.03678
## Analysis of Variance Table
##
## Response: Resp1
## Df Sum Sq Mean Sq F value Pr(>F)
## FILA 4 502.56 125.640 2.7569 0.07757 .
## COL 4 174.16 43.540 0.9554 0.46626
## TRC 4 931.76 232.940 5.1113 0.01224 *
## Residuals 12 546.88 45.573
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Analysis of Variance Table
##
## Response: Resp1
## Df Sum Sq Mean Sq F value Pr(>F)
## FILA 4 502.56 125.640 2.7569 0.07757 .
## COL 4 174.16 43.540 0.9554 0.46626
## TRC 4 931.76 232.940 5.1113 0.01224 *
## Residuals 12 546.88 45.573
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Sum Sq Mean Sq F value Pr(>F)
## FILA 4 502.6 125.64 2.757 0.0776 .
## COL 4 174.2 43.54 0.955 0.4663
## TRC 4 931.8 232.94 5.111 0.0122 *
## Residuals 12 546.9 45.57
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El modelo toma como referencia el domingo para las comparaciones. Se observa una diferencia significativa en las concentraciones de monóxido de carbono los lunes en comparación con el domingo, ya que el valor p es menor a 0.05. En cambio, los demás días del fin de semana no presentan diferencias significativas con respecto al domingo. Además, no se encontraron diferencias significativas entre las mediciones realizadas a las 8 de la mañana y las de otras horas del día.
En cuanto a la influencia de la ubicación, se identificó una diferencia significativa en las concentraciones entre el norte y el centro de la ciudad. Específicamente, por cada unidad adicional de ppm en el centro, la concentración en el norte aumenta en promedio 13.8 ppm, mientras que en el sur el incremento promedio es de 12.2 ppm.
Respecto a al R cuadrado, se encontro que el experimento tiene un 74.6% de variabilidad en las concentraciones de monóxido de carbono.
library(agricolae) #coeficiente de variacion
cv.model(DCL.aov)
## [1] 5.526197
El coeficiente de variacion fue de 5.52, lo que indica que la variabilidad de los datos es relativamente baja.
## Loading required package: carData
##
## Shapiro-Wilk normality test
##
## data: DCL.lm$res
## W = 0.97948, p-value = 0.8746
## [1] 10 13
De acuerdo al grafico qqPlot, los residuos se aliean en la linea de 45 grados, por lo tanto estos tienen un comportamiento y distribucion aparentemente normal.
fitc <- fitted(DCL.aov)
res_stc <- rstandard(DCL.aov)
plot(fitc,res_stc,xlab="Valores predichos", ylab="Residuos estandarizados",abline(h=0))
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:data.table':
##
## yearmon, yearqtr
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
dwtest(DCL.lm, order.by = ~ Puntos,
data = DCL,
alternative = "two.sided")
##
## Durbin-Watson test
##
## data: DCL.lm
## DW = 2.2798, p-value = 0.9786
## alternative hypothesis: true autocorrelation is not 0
duncan.test(DCL.aov, "TRC",console=TRUE)
##
## Study: DCL.aov ~ "TRC"
##
## Duncan's new multiple range test
## for Resp1
##
## Mean Square Error: 45.57333
##
## TRC, means
##
## Resp1 std r se Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 100 133 102 124 124
## Este 117.4 5.366563 5 3.019051 112 124 112 118 121
## Norte 130.4 3.911521 5 3.019051 124 134 130 131 133
## Oeste 117.6 4.560702 5 3.019051 112 122 114 118 122
## Sur 128.8 4.919350 5 3.019051 123 133 124 131 133
##
## Alpha: 0.05 ; DF Error: 12
##
## Critical Range
## 2 3 4 5
## 9.302621 9.737174 10.000463 10.174719
##
## Means with the same letter are not significantly different.
##
## Resp1 groups
## Norte 130.4 a
## Sur 128.8 a
## Oeste 117.6 b
## Este 117.4 b
## Centro 116.6 b
Segun la prueba Duncan, entre los puntos norte y sur no hay diferencias significativas, al iguel que en el oeste, este y centro, peto entre estos dos grupos si la hay.
##
## Study: DCL.aov ~ "TRC"
##
## HSD Test for Resp1
##
## Mean Square Error: 45.57333
##
## TRC, means
##
## Resp1 std r se Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 100 133 102 124 124
## Este 117.4 5.366563 5 3.019051 112 124 112 118 121
## Norte 130.4 3.911521 5 3.019051 124 134 130 131 133
## Oeste 117.6 4.560702 5 3.019051 112 122 114 118 122
## Sur 128.8 4.919350 5 3.019051 123 133 124 131 133
##
## Alpha: 0.05 ; DF Error: 12
## Critical Value of Studentized Range: 4.50771
##
## Minimun Significant Difference: 13.609
##
## Treatments with the same letter are not significantly different.
##
## Resp1 groups
## Norte 130.4 a
## Sur 128.8 ab
## Oeste 117.6 ab
## Este 117.4 ab
## Centro 116.6 b
Segun la prueba Tukey, el Norte y el Centro presentan una diferencia significativa, ya que pertenecen a grupos distintos. En cambio, Sur, Oeste y Este comparten el grupo “ab”, lo que indica que no hay diferencias significativas entre ellos, pero sí con al menos uno de los otros grupos.
library(ScottKnott)
sk <- SK(DCL.aov, which= "TRC", dispersion="se", sig.level=0.05)
summary(sk)
## Goups of means at sig.level = 0.05
## Means G1 G2
## Norte 130.40 a
## Sur 128.80 a
## Oeste 117.60 b
## Este 117.40 b
## Centro 116.60 b
Según la prueba de Scott-Knott, Norte y Sur forman un grupo (“a”), mientras que Oeste, Este y Centro pertenecen a otro grupo (“b”). Esto indica una diferencia significativa entre ambos grupos, pero no dentro de cada uno.