En respuesta al creciente problema de la contaminación del aire en áreas urbanas, este estudio se llevó a cabo para evaluar las concentraciones de monóxido de carbono (CO) en diferentes zonas de la ciudad, distintos días de la semana y diferentes horas, identificando áreas de riesgo para la salud pública. Se seleccionaron cinco localidades (Centro, Este, Norte, Oeste y Sur) para el monitoreo de la calidad del aire medidos en ppm. Los datos recolectados permitieron determinar la variabilidad de los niveles de CO, con el objetivo de informar a las autoridades sobre la necesidad de implementar políticas de mitigación y mejorar la salud ambiental de los residentes.
if (!requireNamespace("data.table", quietly = TRUE)) install.packages("data.table")
library(data.table)
## Warning: package 'data.table' was built under R version 4.4.3
library(data.table)
DCL <- fread("https://dn790006.ca.archive.org/0/items/byrong_DCL/DCL.txt", header = TRUE, sep = "\t", dec = ",")
print(head(DCL))
## Puntos Dia Hora ppm
## <char> <char> <int> <int>
## 1: Norte Lunes 8 124
## 2: Este Lunes 11 112
## 3: Sur Lunes 14 123
## 4: Oeste Lunes 17 118
## 5: Centro Lunes 20 102
## 6: Sur Miercoles 8 124
attach(DCL)
TRC<- factor(DCL$Puntos)
FILA<-factor(DCL$Dia)
COL<-factor(DCL$Hora)
Resp<-as.vector(DCL$ppm)
Resp1<-as.numeric(Resp)
boxplot(split(Resp1, TRC), xlab = "Puntos de Ciudad", ylab = "Concentraciones de monóxido de carbono")
Presenta la distribución de las concentraciones de monóxido de carbono en diferentes puntos de la ciudad: Centro, Este, Norte, Oeste y Sur.Donde el centro se destaca como la zona con mayor contaminación por monóxido de carbono, mientras que Este, Norte, Oeste y Sur parecen tener concentraciones más bajas y estables.La variabilidad y los niveles altos en el Centro son preocupantes desde un punto de vista de salud pública, resaltando la necesidad de estudios adicionales y potencialmente medidas para reducir la contaminación en esa área.
DCL.lm <- lm(Resp1 ~ FILA + COL + TRC)
summary(DCL.lm)
##
## Call:
## lm(formula = Resp1 ~ FILA + COL + TRC)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.08 -2.28 -0.28 3.32 9.32
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 123.480 4.868 25.365 8.57e-12 ***
## FILAS\xe1bado -1.800 4.270 -0.422 0.68078
## FILALunes -11.800 4.270 -2.764 0.01716 *
## FILAMiercoles -9.400 4.270 -2.202 0.04800 *
## FILAViernes -4.200 4.270 -0.984 0.34468
## COL11 -6.200 4.270 -1.452 0.17211
## COL14 0.800 4.270 0.187 0.85450
## COL17 0.600 4.270 0.141 0.89057
## COL20 -2.400 4.270 -0.562 0.58438
## TRCEste 0.800 4.270 0.187 0.85450
## TRCNorte 13.800 4.270 3.232 0.00719 **
## TRCOeste 1.000 4.270 0.234 0.81877
## TRCSur 12.200 4.270 2.857 0.01442 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.751 on 12 degrees of freedom
## Multiple R-squared: 0.7463, Adjusted R-squared: 0.4925
## F-statistic: 2.941 on 12 and 12 DF, p-value: 0.03678
anova(DCL.lm)
## Analysis of Variance Table
##
## Response: Resp1
## Df Sum Sq Mean Sq F value Pr(>F)
## FILA 4 502.56 125.640 2.7569 0.07757 .
## COL 4 174.16 43.540 0.9554 0.46626
## TRC 4 931.76 232.940 5.1113 0.01224 *
## Residuals 12 546.88 45.573
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
DCL.aov<-aov(Resp1 ~ FILA + COL + TRC)
anova(DCL.aov)
## Analysis of Variance Table
##
## Response: Resp1
## Df Sum Sq Mean Sq F value Pr(>F)
## FILA 4 502.56 125.640 2.7569 0.07757 .
## COL 4 174.16 43.540 0.9554 0.46626
## TRC 4 931.76 232.940 5.1113 0.01224 *
## Residuals 12 546.88 45.573
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(DCL.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## FILA 4 502.6 125.64 2.757 0.0776 .
## COL 4 174.2 43.54 0.955 0.4663
## TRC 4 931.8 232.94 5.111 0.0122 *
## Residuals 12 546.9 45.57
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Los resultados proporcionados corresponden a un análisis de varianza (ANOVA) realizado para evaluar el efecto de tres factores: FILA, COL y TRC en las concentraciones de Resp1 (monóxido de carbono).El factor TRC tiene un impacto significativo en las concentraciones de monóxido de carbono, lo que sugiere que es importante evaluar las condiciones o características relacionadas con TRC en más detalle.Las variables FILA y COL no mostraron efectos significativos sobre los niveles de monóxido de carbono, lo que puede indicar que no son relevantes en el contexto de este análisis.
library(agricolae)
## Warning: package 'agricolae' was built under R version 4.4.2
cv.model(DCL.aov)
## [1] 5.526197
shapiro.test(DCL.lm$res)
##
## Shapiro-Wilk normality test
##
## data: DCL.lm$res
## W = 0.97948, p-value = 0.8746
library(car)
## Warning: package 'car' was built under R version 4.4.2
## Cargando paquete requerido: carData
## Warning: package 'carData' was built under R version 4.4.2
qqPlot(DCL.aov)
## [1] 10 13
fitc <- fitted(DCL.aov)
res_stc <- rstandard(DCL.aov)
plot(fitc, res_stc, xlab = "Valores predichos", ylab = "Residuos estandarizados")
abline(h = 0)
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.4.3
## Cargando paquete requerido: zoo
## Warning: package 'zoo' was built under R version 4.4.3
##
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:data.table':
##
## yearmon, yearqtr
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
dwtest(DCL.lm, order.by = ~ Puntos, data = DCL, alternative = "two.sided")
##
## Durbin-Watson test
##
## data: DCL.lm
## DW = 2.2798, p-value = 0.9786
## alternative hypothesis: true autocorrelation is not 0
La falta de autocorrelación indica que el modelo de regresión probablemente es adecuado y que los residuos son independientes, lo que es un buen signo para la validez de los resultados.
outLSD <- LSD.test(DCL.aov, "TRC", console = TRUE)
##
## Study: DCL.aov ~ "TRC"
##
## LSD t Test for Resp1
##
## Mean Square Error: 45.57333
##
## TRC, means and individual ( 95 %) CI
##
## Resp1 std r se LCL UCL Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 110.0221 123.1779 100 133 102 124 124
## Este 117.4 5.366563 5 3.019051 110.8221 123.9779 112 124 112 118 121
## Norte 130.4 3.911521 5 3.019051 123.8221 136.9779 124 134 130 131 133
## Oeste 117.6 4.560702 5 3.019051 111.0221 124.1779 112 122 114 118 122
## Sur 128.8 4.919350 5 3.019051 122.2221 135.3779 123 133 124 131 133
##
## Alpha: 0.05 ; DF Error: 12
## Critical Value of t: 2.178813
##
## least Significant Difference: 9.302621
##
## Treatments with the same letter are not significantly different.
##
## Resp1 groups
## Norte 130.4 a
## Sur 128.8 a
## Oeste 117.6 b
## Este 117.4 b
## Centro 116.6 b
outHSD <- HSD.test(DCL.aov, "TRC", console = TRUE)
##
## Study: DCL.aov ~ "TRC"
##
## HSD Test for Resp1
##
## Mean Square Error: 45.57333
##
## TRC, means
##
## Resp1 std r se Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 100 133 102 124 124
## Este 117.4 5.366563 5 3.019051 112 124 112 118 121
## Norte 130.4 3.911521 5 3.019051 124 134 130 131 133
## Oeste 117.6 4.560702 5 3.019051 112 122 114 118 122
## Sur 128.8 4.919350 5 3.019051 123 133 124 131 133
##
## Alpha: 0.05 ; DF Error: 12
## Critical Value of Studentized Range: 4.50771
##
## Minimun Significant Difference: 13.609
##
## Treatments with the same letter are not significantly different.
##
## Resp1 groups
## Norte 130.4 a
## Sur 128.8 ab
## Oeste 117.6 ab
## Este 117.4 ab
## Centro 116.6 b
SNK.test(DCL.aov, "TRC", console = TRUE)
##
## Study: DCL.aov ~ "TRC"
##
## Student Newman Keuls Test
## for Resp1
##
## Mean Square Error: 45.57333
##
## TRC, means
##
## Resp1 std r se Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 100 133 102 124 124
## Este 117.4 5.366563 5 3.019051 112 124 112 118 121
## Norte 130.4 3.911521 5 3.019051 124 134 130 131 133
## Oeste 117.6 4.560702 5 3.019051 112 122 114 118 122
## Sur 128.8 4.919350 5 3.019051 123 133 124 131 133
##
## Alpha: 0.05 ; DF Error: 12
##
## Critical Range
## 2 3 4 5
## 9.302621 11.390664 12.675968 13.609004
##
## Means with the same letter are not significantly different.
##
## Resp1 groups
## Norte 130.4 a
## Sur 128.8 a
## Oeste 117.6 b
## Este 117.4 b
## Centro 116.6 b
scheffe.test(DCL.aov, "TRC", console = TRUE)
##
## Study: DCL.aov ~ "TRC"
##
## Scheffe Test for Resp1
##
## Mean Square Error : 45.57333
##
## TRC, means
##
## Resp1 std r se Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 100 133 102 124 124
## Este 117.4 5.366563 5 3.019051 112 124 112 118 121
## Norte 130.4 3.911521 5 3.019051 124 134 130 131 133
## Oeste 117.6 4.560702 5 3.019051 112 122 114 118 122
## Sur 128.8 4.919350 5 3.019051 123 133 124 131 133
##
## Alpha: 0.05 ; DF Error: 12
## Critical Value of F: 3.259167
##
## Minimum Significant Difference: 15.41589
##
## Means with the same letter are not significantly different.
##
## Resp1 groups
## Norte 130.4 a
## Sur 128.8 a
## Oeste 117.6 a
## Este 117.4 a
## Centro 116.6 a
duncan.test(DCL.aov, "TRC", console = TRUE)
##
## Study: DCL.aov ~ "TRC"
##
## Duncan's new multiple range test
## for Resp1
##
## Mean Square Error: 45.57333
##
## TRC, means
##
## Resp1 std r se Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 100 133 102 124 124
## Este 117.4 5.366563 5 3.019051 112 124 112 118 121
## Norte 130.4 3.911521 5 3.019051 124 134 130 131 133
## Oeste 117.6 4.560702 5 3.019051 112 122 114 118 122
## Sur 128.8 4.919350 5 3.019051 123 133 124 131 133
##
## Alpha: 0.05 ; DF Error: 12
##
## Critical Range
## 2 3 4 5
## 9.302621 9.737174 10.000463 10.174719
##
## Means with the same letter are not significantly different.
##
## Resp1 groups
## Norte 130.4 a
## Sur 128.8 a
## Oeste 117.6 b
## Este 117.4 b
## Centro 116.6 b
LSD.test(DCL.aov, "TRC", p.adj= "bon", console = TRUE)
##
## Study: DCL.aov ~ "TRC"
##
## LSD t Test for Resp1
## P value adjustment method: bonferroni
##
## Mean Square Error: 45.57333
##
## TRC, means and individual ( 95 %) CI
##
## Resp1 std r se LCL UCL Min Max Q25 Q50 Q75
## Centro 116.6 14.724130 5 3.019051 110.0221 123.1779 100 133 102 124 124
## Este 117.4 5.366563 5 3.019051 110.8221 123.9779 112 124 112 118 121
## Norte 130.4 3.911521 5 3.019051 123.8221 136.9779 124 134 130 131 133
## Oeste 117.6 4.560702 5 3.019051 111.0221 124.1779 112 122 114 118 122
## Sur 128.8 4.919350 5 3.019051 122.2221 135.3779 123 133 124 131 133
##
## Alpha: 0.05 ; DF Error: 12
## Critical Value of t: 3.428444
##
## Minimum Significant Difference: 14.63802
##
## Treatments with the same letter are not significantly different.
##
## Resp1 groups
## Norte 130.4 a
## Sur 128.8 a
## Oeste 117.6 a
## Este 117.4 a
## Centro 116.6 a
Los datos presentados corresponden a un análisis de varianza (ANOVA) seguido de una prueba LSD (Least Significant Difference) para determinar las diferencias en las concentraciones de monóxido de carbono (Resp1) entre varios puntos de la ciudad.Se observan grupos que tienen la misma letra (a, b) al final de sus valores, lo que indica que no hay diferencias significativas estadísticas entre ellos.No se encontraron diferencias significativas entre el Oeste, Este y Centro, lo que sugiere que estos puntos tienen niveles de monóxido de carbono relativamente similares.
library(ScottKnott)
## Warning: package 'ScottKnott' was built under R version 4.4.3
sk <- SK(DCL.aov, which = "TRC", dispersion = "se", sig.level = 0.05)
summary(sk)
## Goups of means at sig.level = 0.05
## Means G1 G2
## Norte 130.40 a
## Sur 128.80 a
## Oeste 117.60 b
## Este 117.40 b
## Centro 116.60 b
La prueba de Scott-Knott se utiliza para separar grupos de medias con un nivel de significancia del 5%.Se ha identificado que el Norte y el Sur son significativamente diferentes de las otros puntos (Oeste, Este, y Centro). Esto significa que las concentraciones de monóxido de carbono son considerablemente más altas en estas dos zonas.La presencia de concentraciones más elevadas en el Norte y Sur podría señalar la necesidad de un enfoque regulatorio adicional en estas áreas, donde la exposición a contaminantes puede ser preocupante para la salud de los residentes.
detach(DCL)
rm(list=ls())