Investigación 1: Evaluación de los cambios en la degradación de la materia orgánica en ecosistemas acuáticos mediante microorganismos.
La degradación de materia orgánica (MODe) en ecosistemas acuáticos es fundamental para la transferencia energética en el ecosistema. El proceso de MODe está mediado por múltiples elementos bióticos y abióticos, sin embargo, son fundamentales la presión parcial del CO_2(ppmv) y la temperatura (^∘ C). La incidencia de estos componentes abióticos influye directa o indirectamente en la capacidad de degradación de la materia orgánica por parte de los microorganismos, los cuales inician la MODe posterior a la lixiviación de metabolitos de las plantas en el cauce del río. De acuerdo a la escenarios de cambio climático actuales, la temperatura y la presión parcial del CO_2 tenderán a variar, para lo cual el IPCC (2007) ha definido 3 posibles escenarios de cambio global: Escenario A: incremento de ~1.5°C y ~220 ppmv Escenario B: incremento de ~3.0°C y ~420 ppmv Escenario C: incremento de ~4.5°C y ~870 ppmv Basado en esta información, el investigador está interesado en establecer si existen variaciones en la capacidad del proceso de MODe de Conostegia macrantha, especie que se desarrolla en ambientes riparios, los cuales pueden o no estar inundados, según las condiciones de variación en el volumen del agua del río. En el caso de los hongos, estos constituyen uno de los principales grupos taxonómicos que aportan en la MODe, para lo cual se utiliza el ergosterol (μg/g).
Diseño experimental Se colectaron hojas de Conostegia macrantha, de individuos presentes en ambientes inundados (Inundado) y no inundados (no-inundado) en las cercanías a un río en la zona Norte de Coronado. Los sitios carecían de influencia antrópica, lo cual permite descartar la influencia de los parámetros físico químicos del agua en la variación del contenido nutricional de las plantas. Todas las hojas fueron transportadas a laboratorio, donde se llevaron a peso seco, permitiendo la homogenización de la muestra. Seguidamente, se crearon discos de 14 mm de diámetro de las hojas de Conostegia macrantha obtenidas de ambientes inundados o no inundados, las cuales se inocularon en 4 microcosmos (ambientes controlados en laboratorio).El primer microcosmos fue el control (Control) en el cual no se realizó ninguna variación en la temperatura o la presión parcial de CO_2; el segundo fue el Escenario-A con un incremento incremento de ~1.5°C y ~220 ppmv; el tercero Escenario-B con incremento de ~3.0°C y ~420 ppm y el cuarto Escenario-C con incremento de ~4.5°C y ~870 ppmv. Se inocularon un total de 16 discos en cada uno de los microcosmos (n=120), para luego retirarlos a los 7 días de incubación en los microcosmos. Durante la realización del estudio se efectuaron mediciones ambientales en el agua cada 30 minutos de la presión parcial del CO2 (ppCO2), temperatura (temp), conductividad eléctrica (ce) en cada uno de los microcosmos. Al finalizar el estudio (7 días), se realizaron mediciones del porcentaje de Carbono Orgánico (CO), Nitrógeno (N), Fosfato (P), Celulosa (Cel) y Lignina (Lig) en n=8 discos. La tasa de degradación de materia orgánica mediada por la acción de los hongos se calculó mediante ergosterol (μg/L) filtrando con metanol e hidróxido de potasio, para subsequentemente utilizar un HPLC en n=8 discos seleccionados al azar. Basado en la información del estudio (Archivo nutrientes.xlsx), resuelva lo que se solicita a continuación:
datos1 = read_xlsx("C:/Users/GOLLO/Desktop/nutrientes.xlsx", sheet = 1)
## New names:
## * `` -> ...1
datos1
## # A tibble: 2,688 x 6
## ...1 id microcosmo temp CE pCO2
## <chr> <dbl> <chr> <dbl> <dbl> <dbl>
## 1 1 1 control 29.8 127. 544.
## 2 2 2 control 30.5 99.7 542.
## 3 3 3 control 30.3 128. 531.
## 4 4 4 control 30.3 116. 543.
## 5 5 5 control 30.8 110. 566.
## 6 6 6 control 28.1 109. 515.
## 7 7 7 control 30.2 109. 536.
## 8 8 8 control 30.9 132. 536.
## 9 9 9 control 30.0 85.1 524.
## 10 10 10 control 31.7 113. 538.
## # ... with 2,678 more rows
#Regresiones
temp1<-lm(datos1$temp~datos1$microcosmo)
CE1<-lm(datos1$CE~datos1$microcosmo)
CO21<-lm(datos1$pCO2~datos1$microcosmo)
#Normalidad
shapiro.test(temp1$residuals)
##
## Shapiro-Wilk normality test
##
## data: temp1$residuals
## W = 1, p-value = 2e-05
shapiro.test(CE1$residuals)
##
## Shapiro-Wilk normality test
##
## data: CE1$residuals
## W = 0.93, p-value <2e-16
shapiro.test(CO21$residuals)
##
## Shapiro-Wilk normality test
##
## data: CO21$residuals
## W = 1, p-value = 7e-05
#Balance
tapply(datos1$temp,datos1$microcosmo, length)
## control escenario.A escenario.B escenario.C
## 672 672 672 672
tapply(datos1$CE,datos1$microcosmo, length)
## control escenario.A escenario.B escenario.C
## 672 672 672 672
tapply(datos1$pCO2,datos1$microcosmo, length)
## control escenario.A escenario.B escenario.C
## 672 672 672 672
#Homogeneidad
library(outliers)
fligner.test(datos1$temp,datos1$microcosmo)
##
## Fligner-Killeen test of homogeneity of variances
##
## data: datos1$temp and datos1$microcosmo
## Fligner-Killeen:med chi-squared = 222, df = 3, p-value <2e-16
fligner.test(datos1$CE,datos1$microcosmo)
##
## Fligner-Killeen test of homogeneity of variances
##
## data: datos1$CE and datos1$microcosmo
## Fligner-Killeen:med chi-squared = 845, df = 3, p-value <2e-16
fligner.test(datos1$pCO2,datos1$microcosmo)
##
## Fligner-Killeen test of homogeneity of variances
##
## data: datos1$pCO2 and datos1$microcosmo
## Fligner-Killeen:med chi-squared = 94, df = 3, p-value <2e-16
#ANOVA
kruskal.test(datos1$temp,datos1$microcosmo)
##
## Kruskal-Wallis rank sum test
##
## data: datos1$temp and datos1$microcosmo
## Kruskal-Wallis chi-squared = 1796, df = 3, p-value <2e-16
kruskal.test(datos1$CE,datos1$microcosmo)
##
## Kruskal-Wallis rank sum test
##
## data: datos1$CE and datos1$microcosmo
## Kruskal-Wallis chi-squared = 666, df = 3, p-value <2e-16
kruskal.test(datos1$pCO2,datos1$microcosmo)
##
## Kruskal-Wallis rank sum test
##
## data: datos1$pCO2 and datos1$microcosmo
## Kruskal-Wallis chi-squared = 2519, df = 3, p-value <2e-16
#Post-Hoc
pairwise.wilcox.test(datos1$temp,datos1$microcosmo, p.adj = "bonf",exact=F)
##
## Pairwise comparisons using Wilcoxon rank sum test with continuity correction
##
## data: datos1$temp and datos1$microcosmo
##
## control escenario.A escenario.B
## escenario.A <2e-16 - -
## escenario.B <2e-16 <2e-16 -
## escenario.C <2e-16 <2e-16 <2e-16
##
## P value adjustment method: bonferroni
pairwise.wilcox.test(datos1$CE,datos1$microcosmo, p.adj = "bonf",exact=F)
##
## Pairwise comparisons using Wilcoxon rank sum test with continuity correction
##
## data: datos1$CE and datos1$microcosmo
##
## control escenario.A escenario.B
## escenario.A <2e-16 - -
## escenario.B <2e-16 0.003 -
## escenario.C <2e-16 0.018 0.090
##
## P value adjustment method: bonferroni
pairwise.wilcox.test(datos1$pCO2,datos1$microcosmo, p.adj = "bonf",exact=F)
##
## Pairwise comparisons using Wilcoxon rank sum test with continuity correction
##
## data: datos1$pCO2 and datos1$microcosmo
##
## control escenario.A escenario.B
## escenario.A <2e-16 - -
## escenario.B <2e-16 <2e-16 -
## escenario.C <2e-16 <2e-16 <2e-16
##
## P value adjustment method: bonferroni
#Para los resultados obtenidos en la zona inundada (Escenario A, B y C), se tuvo que excluir el tratamiento control de los datos en una nueva hoja de excel.
datos1.1 = read_xlsx("C:/Users/GOLLO/Desktop/nutrientes.xlsx", sheet = 3)
datos1.1
## # A tibble: 2,016 x 4
## microcosmo temp CE pCO2
## <chr> <dbl> <dbl> <dbl>
## 1 escenario.A 28.7 133. 756.
## 2 escenario.A 30.1 143. 739.
## 3 escenario.A 29.9 134. 748.
## 4 escenario.A 28.0 145. 738.
## 5 escenario.A 27.1 136. 766.
## 6 escenario.A 28.3 143. 748.
## 7 escenario.A 28.4 136. 749.
## 8 escenario.A 27.2 168. 766.
## 9 escenario.A 30.0 134. 750.
## 10 escenario.A 28.5 143. 739.
## # ... with 2,006 more rows
hist(x = datos1.1$pCO2, main = "Histograma de frecuencias para pC02",
xlab = "pCO2", ylab = "Frecuencia",
col = "ivory", breaks = "Scott")
datos1.2 = read_xlsx("C:/Users/GOLLO/Desktop/nutrientes.xlsx", sheet = 2)
## New names:
## * `` -> ...1
datos1.2
## # A tibble: 64 x 8
## ...1 microcosmo carbon nitrogeno fosforo celulosa lignina hongo
## <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 Control_f 56.6 1.30 0.228 26.9 28.0 56.4
## 2 2 Control_f 55.5 1.72 0.0984 26.9 28.3 22.3
## 3 3 Control_f 50.1 1.24 0.527 27.0 28.4 43.0
## 4 4 Control_f 46.2 1.35 0.167 25.9 28.2 26.9
## 5 5 Control_f 55.7 1.71 0.209 26.7 27.7 37.1
## 6 6 Control_f 42.0 2.17 0.0830 26.9 27.5 42.5
## 7 7 Control_f 57.3 1.55 0.595 27.0 28.0 19.2
## 8 8 Control_f 49.7 0.785 0.307 26.4 27.9 44.9
## 9 9 A_f 56.1 2.64 0.0658 22.2 33.8 26.2
## 10 10 A_f 42.1 2.55 0.141 22.1 33.9 28.1
## # ... with 54 more rows
reg1<-lm(datos1.2$carbon ~ datos1.2$microcosmo+datos1.2$hongo)
reg2<-lm(datos1.2$nitrogeno ~ datos1.2$microcosmo+datos1.2$hongo)
reg3<-lm(datos1.2$fosforo ~ datos1.2$microcosmo+datos1.2$hongo)
reg4<-lm(datos1.2$celulosa ~ datos1.2$microcosmo+datos1.2$hongo)
reg5<-lm(datos1.2$lignina ~ datos1.2$microcosmo+datos1.2$hongo)
a1<-aov(reg1)
a2<-aov(datos1.2$nitrogeno ~ datos1.2$microcosmo+datos1.2$hongo)
a3<-aov(datos1.2$fosforo ~ datos1.2$microcosmo+datos1.2$hongo)
a4<-aov(datos1.2$celulosa ~ datos1.2$microcosmo+datos1.2$hongo)
a5<-aov(datos1.2$lignina ~ datos1.2$microcosmo+datos1.2$hongo)
a1
## Call:
## aov(formula = reg1)
##
## Terms:
## datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares 100.6 34.2 1390.9
## Deg. of Freedom 7 1 55
##
## Residual standard error: 5.029
## Estimated effects may be unbalanced
a2
## Call:
## aov(formula = datos1.2$nitrogeno ~ datos1.2$microcosmo + datos1.2$hongo)
##
## Terms:
## datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares 48.28 0.01 15.00
## Deg. of Freedom 7 1 55
##
## Residual standard error: 0.5223
## Estimated effects may be unbalanced
a3
## Call:
## aov(formula = datos1.2$fosforo ~ datos1.2$microcosmo + datos1.2$hongo)
##
## Terms:
## datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares 52.40 0.01 7.86
## Deg. of Freedom 7 1 55
##
## Residual standard error: 0.378
## Estimated effects may be unbalanced
a4
## Call:
## aov(formula = datos1.2$celulosa ~ datos1.2$microcosmo + datos1.2$hongo)
##
## Terms:
## datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares 180.04 0.01 5.98
## Deg. of Freedom 7 1 55
##
## Residual standard error: 0.3297
## Estimated effects may be unbalanced
a5
## Call:
## aov(formula = datos1.2$lignina ~ datos1.2$microcosmo + datos1.2$hongo)
##
## Terms:
## datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares 382.8 0.2 12.1
## Deg. of Freedom 7 1 55
##
## Residual standard error: 0.4684
## Estimated effects may be unbalanced
datos1.2
## # A tibble: 64 x 8
## ...1 microcosmo carbon nitrogeno fosforo celulosa lignina hongo
## <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 Control_f 56.6 1.30 0.228 26.9 28.0 56.4
## 2 2 Control_f 55.5 1.72 0.0984 26.9 28.3 22.3
## 3 3 Control_f 50.1 1.24 0.527 27.0 28.4 43.0
## 4 4 Control_f 46.2 1.35 0.167 25.9 28.2 26.9
## 5 5 Control_f 55.7 1.71 0.209 26.7 27.7 37.1
## 6 6 Control_f 42.0 2.17 0.0830 26.9 27.5 42.5
## 7 7 Control_f 57.3 1.55 0.595 27.0 28.0 19.2
## 8 8 Control_f 49.7 0.785 0.307 26.4 27.9 44.9
## 9 9 A_f 56.1 2.64 0.0658 22.2 33.8 26.2
## 10 10 A_f 42.1 2.55 0.141 22.1 33.9 28.1
## # ... with 54 more rows
regre_hongo<-lm(datos1.2$hongo~datos1.2$microcosmo)
regre_hongo
##
## Call:
## lm(formula = datos1.2$hongo ~ datos1.2$microcosmo)
##
## Coefficients:
## (Intercept) datos1.2$microcosmoA_nf
## 23.97 1.06
## datos1.2$microcosmoB_f datos1.2$microcosmoB_nf
## 19.62 11.38
## datos1.2$microcosmoC_f datos1.2$microcosmoC_nf
## 5.77 14.52
## datos1.2$microcosmoControl_f datos1.2$microcosmoControl_nf
## 12.58 12.70
summary(regre_hongo)
##
## Call:
## lm(formula = datos1.2$hongo ~ datos1.2$microcosmo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -17.363 -1.967 0.156 1.498 19.862
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.97 2.05 11.69 < 2e-16 ***
## datos1.2$microcosmoA_nf 1.06 2.90 0.37 0.71523
## datos1.2$microcosmoB_f 19.62 2.90 6.77 8.4e-09 ***
## datos1.2$microcosmoB_nf 11.38 2.90 3.92 0.00024 ***
## datos1.2$microcosmoC_f 5.77 2.90 1.99 0.05160 .
## datos1.2$microcosmoC_nf 14.52 2.90 5.01 5.8e-06 ***
## datos1.2$microcosmoControl_f 12.58 2.90 4.34 6.1e-05 ***
## datos1.2$microcosmoControl_nf 12.70 2.90 4.38 5.3e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.8 on 56 degrees of freedom
## Multiple R-squared: 0.581, Adjusted R-squared: 0.528
## F-statistic: 11.1 on 7 and 56 DF, p-value: 1.08e-08
Microcosmo<-datos1.2$microcosmo
ggplot(regre_hongo,aes(datos1.2$microcosmo, datos1.2$hongo, colour = Microcosmo ))+geom_point() + geom_boxplot()+
geom_jitter(position=position_jitter(0.2)) +
geom_jitter(position=position_jitter(0.2)) +
theme_classic(base_size = 14) +
xlab("Microcosmo") +
ylab("Concentración de ergosterol")
hongos <- read_xlsx("C:/Users/GOLLO/Desktop/nutrientes.xlsx", sheet = 2)
## New names:
## * `` -> ...1
str(hongos)
## tibble [64 x 8] (S3: tbl_df/tbl/data.frame)
## $ ...1 : chr [1:64] "1" "2" "3" "4" ...
## $ microcosmo: chr [1:64] "Control_f" "Control_f" "Control_f" "Control_f" ...
## $ carbon : num [1:64] 56.6 55.5 50.1 46.2 55.7 ...
## $ nitrogeno : num [1:64] 1.3 1.72 1.24 1.35 1.71 ...
## $ fosforo : num [1:64] 0.2277 0.0984 0.5267 0.1666 0.2095 ...
## $ celulosa : num [1:64] 26.9 26.9 27 25.9 26.7 ...
## $ lignina : num [1:64] 28 28.3 28.4 28.2 27.7 ...
## $ hongo : num [1:64] 56.4 22.3 43 26.9 37.1 ...
attach(hongos)
modeloergo <- aov(hongo ~ microcosmo)
modeloergo
## Call:
## aov(formula = hongo ~ microcosmo)
##
## Terms:
## microcosmo Residuals
## Sum of Squares 2608 1884
## Deg. of Freedom 7 56
##
## Residual standard error: 5.801
## Estimated effects may be unbalanced
summary(modeloergo)
## Df Sum Sq Mean Sq F value Pr(>F)
## microcosmo 7 2608 373 11.1 1.1e-08 ***
## Residuals 56 1884 34
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
round(qf(0.1, 7, 56, lower.tail = FALSE), 3)
## [1] 1.827
detach(hongos)
# El F tabular al 90% para la prueba de significancia de la variable ergosterol es de 1.827
Investigación 2. Análisis de la influencia de parámetros físico químicos y ambientales en la composición de macroinvertebrados bentónicos en ríos de Costa Rica.
En este estudio, se realizó el levantamiento de información físico química del agua y macroinvertebrados bentónicos en ríos de la zona Atlántica. En el documento “ambiental.xls” se está entregando la base de datos. Responda lo que se solicita a continuación: 1. Elabore un análisis de componentes principales. Indique cuál es la variable con mayor influencia en la composición de los parámetros analizados en el estudio. Además, presente un gráfico biplot para explicar la composición observada.
datos = read.csv("C:/Users/GOLLO/Desktop/ambiental.csv", sep = ";", dec = ",",header = T, row.names = 1)
is.data.frame(datos)
## [1] TRUE
summary(datos)
## Alcalinidad Aluminio Coliformes.Fecales Conductividad
## Min. :41.0 Min. : 81.8 Min. : 490 Min. : 7.38
## 1st Qu.:45.5 1st Qu.:119.6 1st Qu.: 1875 1st Qu.: 93.50
## Median :52.5 Median :193.3 Median : 5150 Median :120.00
## Mean :53.9 Mean :197.8 Mean :15528 Mean :115.94
## 3rd Qu.:58.8 3rd Qu.:270.1 3rd Qu.:11725 3rd Qu.:142.00
## Max. :70.0 Max. :342.7 Max. :70000 Max. :190.00
## DBO DQO Fosfatos Nitratos OD
## Min. : 1.60 Min. : 4.0 Min. :0.000 Min. :0.00 Min. :3.25
## 1st Qu.: 3.38 1st Qu.: 8.0 1st Qu.:0.000 1st Qu.:2.20 1st Qu.:7.15
## Median : 4.20 Median : 10.5 Median :0.000 Median :2.98 Median :7.38
## Mean : 8.82 Mean : 33.7 Mean :0.184 Mean :3.02 Mean :6.67
## 3rd Qu.: 8.10 3rd Qu.: 19.0 3rd Qu.:0.000 3rd Qu.:3.85 3rd Qu.:7.50
## Max. :36.00 Max. :210.0 Max. :1.840 Max. :7.79 Max. :7.95
## pH Sólidos.Totales Sólidos.Suspendidos Sólidos.Disueltos
## Min. :6.92 Min. :152 Min. :35.0 Min. :112
## 1st Qu.:7.09 1st Qu.:164 1st Qu.:39.8 1st Qu.:118
## Median :7.65 Median :184 Median :47.0 Median :138
## Mean :7.50 Mean :208 Mean :47.4 Mean :160
## 3rd Qu.:7.71 3rd Qu.:218 3rd Qu.:54.8 3rd Qu.:171
## Max. :8.20 Max. :376 Max. :61.0 Max. :318
## Sulfatos Temperatura
## Min. : 0.00 Min. :17.0
## 1st Qu.: 3.86 1st Qu.:20.1
## Median : 5.22 Median :21.4
## Mean : 5.76 Mean :23.0
## 3rd Qu.: 6.62 3rd Qu.:24.1
## Max. :18.47 Max. :36.7
str(datos)
## 'data.frame': 10 obs. of 15 variables:
## $ Alcalinidad : int 50 44 70 41 44 50 70 55 55 60
## $ Aluminio : num 172.2 81.8 214.4 107.8 286.3 ...
## $ Coliformes.Fecales : int 49000 490 1700 7900 2400 13000 7900 70000 490 2400
## $ Conductividad : num 86 7.38 172 90 104 121 120 190 120 149
## $ DBO : num 3.3 3.3 3.9 3.6 4.5 36 8.2 16 7.8 1.6
## $ DQO : int 8 8 8 10 11 210 21 44 13 4
## $ Fosfatos : num 0 0 0 0 0 1.84 0 0 0 0
## $ Nitratos : num 0 2.12 2.45 3.98 2.86 0 7.79 3.11 3.47 4.44
## $ OD : num 7.1 7.31 7.32 7.95 7.43 3.25 7.47 3.85 7.51 7.54
## $ pH : num 7.37 8.2 7.86 7.7 7.71 6.92 6.99 7 7.6 7.7
## $ Sólidos.Totales : int 152 166 212 198 262 163 170 376 158 220
## $ Sólidos.Suspendidos: int 39 38 61 56 51 48 35 58 46 42
## $ Sólidos.Disueltos : int 113 128 151 142 211 115 135 318 112 178
## $ Sulfatos : num 0 0 3.69 7.59 4.75 ...
## $ Temperatura : num 21.2 21.7 24.8 17 20.3 36.7 26.7 19.5 20 22.1
prin_comp <- prcomp(datos, scale. = T)
names(prin_comp)
## [1] "sdev" "rotation" "center" "scale" "x"
prin_comp$center
## Alcalinidad Aluminio Coliformes.Fecales
## 53.900 197.760 15528.000
## Conductividad DBO DQO
## 115.938 8.820 33.700
## Fosfatos Nitratos OD
## 0.184 3.022 6.673
## pH Sólidos.Totales Sólidos.Suspendidos
## 7.505 207.700 47.400
## Sólidos.Disueltos Sulfatos Temperatura
## 160.300 5.764 23.000
prin_comp$scale
## Alcalinidad Aluminio Coliformes.Fecales
## 1.028e+01 9.021e+01 2.403e+04
## Conductividad DBO DQO
## 5.086e+01 1.041e+01 6.300e+01
## Fosfatos Nitratos OD
## 5.819e-01 2.244e+00 1.666e+00
## pH Sólidos.Totales Sólidos.Suspendidos
## 4.239e-01 6.853e+01 8.996e+00
## Sólidos.Disueltos Sulfatos Temperatura
## 6.367e+01 5.161e+00 5.527e+00
prin_comp$rotation
## PC1 PC2 PC3 PC4 PC5 PC6
## Alcalinidad -0.04289 -0.09517 0.6204451 0.11206 0.23254 -0.394650
## Aluminio -0.11454 -0.26460 0.1712697 0.02452 0.46775 0.742862
## Coliformes.Fecales -0.23170 -0.18660 -0.2172157 -0.49540 0.36184 -0.301469
## Conductividad -0.25268 -0.24912 0.2915326 0.28240 0.19352 -0.207650
## DBO -0.36972 0.22079 0.0049643 0.01468 -0.08816 0.177130
## DQO -0.32884 0.29484 -0.0190870 0.07501 -0.11438 0.083381
## Fosfatos -0.28030 0.34692 -0.0218546 0.13586 -0.09505 0.059298
## Nitratos 0.10857 -0.20258 0.4728741 -0.14463 -0.58149 0.159018
## OD 0.40415 -0.07637 0.1240784 0.07747 0.00782 0.084970
## pH 0.33634 -0.01825 -0.2432045 0.39888 -0.05112 -0.102242
## Sólidos.Totales -0.20543 -0.37491 -0.1684429 0.04665 -0.20345 -0.120343
## Sólidos.Suspendidos -0.16594 -0.21591 -0.1950021 0.65866 0.04661 -0.002418
## Sólidos.Disueltos -0.19768 -0.37305 -0.1537592 -0.04286 -0.22558 -0.129197
## Sulfatos -0.30821 -0.27815 0.0003741 -0.05360 -0.30550 0.147217
## Temperatura -0.22814 0.34220 0.2539280 0.10310 -0.01660 -0.144043
## PC7 PC8 PC9 PC10
## Alcalinidad -0.153819 -0.384140 -0.004946 -0.098426
## Aluminio -0.281839 -0.051196 -0.056466 0.097790
## Coliformes.Fecales 0.222981 -0.174391 -0.137935 0.336753
## Conductividad 0.163330 0.509086 0.467284 0.080453
## DBO -0.015894 -0.205115 0.101445 0.002715
## DQO 0.001182 0.055545 0.039329 -0.218067
## Fosfatos 0.009680 0.218459 0.084541 0.446308
## Nitratos 0.133337 -0.086710 -0.134630 0.290185
## OD 0.205137 0.337911 -0.220582 0.038032
## pH -0.356170 -0.360522 0.368221 0.291828
## Sólidos.Totales -0.346779 0.160510 -0.174839 0.449581
## Sólidos.Suspendidos 0.416670 -0.194450 -0.454733 -0.038390
## Sólidos.Disueltos -0.432154 0.200251 -0.123943 -0.469964
## Sulfatos 0.260585 -0.334644 0.322803 -0.097081
## Temperatura -0.291398 -0.003574 -0.425604 0.097046
head(prin_comp$x)
## PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8
## Sitio_01 1.0312 0.8925 -0.9236 -1.4942 1.7303 -0.5864 0.36167 0.23017
## Sitio_02 2.7507 1.6287 -1.5094 -0.4311 -0.6537 -0.2779 -0.75964 -0.57340
## Sitio_03 0.3897 -0.7650 0.9857 2.1570 0.8905 -0.8647 -0.01819 -0.27282
## Sitio_04 1.3450 -0.4312 -1.2264 0.4552 -1.0722 0.1634 1.35494 0.01716
## Sitio_05 0.5992 -1.1372 -0.9210 0.5095 -0.1333 1.0202 -0.73520 0.55327
## Sitio_06 -4.3885 4.3489 -0.1235 0.4308 -0.2096 0.1108 0.00977 0.08171
## PC9 PC10
## Sitio_01 -0.10148 2.567e-16
## Sitio_02 0.02717 -1.631e-16
## Sitio_03 -0.20597 4.510e-16
## Sitio_04 -0.07966 -1.943e-16
## Sitio_05 -0.35512 2.359e-16
## Sitio_06 0.01874 -4.163e-16
dim(prin_comp$x)
## [1] 10 10
biplot(x = prin_comp, scale = 0, cex = 0.8, col = c("blue4", "brown3"))
prin_comp$rotation <- -prin_comp$rotation
prin_comp$x <- -prin_comp$x
#La influencia de las variables en la composición de los parámetros en estudio se puede notar en el gráfico PCA
biplot(x = prin_comp, scale = 0, cex = 0.8,col = c("blue4", "brown3"))
#La variable con mayor influencia es Sólidos Totales, en el sitio 8; seguido de la variable Fosfatos,en el Sitio 6.
df <- scale(datos)
head(df, n = 3)
## Alcalinidad Aluminio Coliformes.Fecales Conductividad DBO DQO
## Sitio_01 -0.3794 -0.2833 1.3927 -0.5887 -0.5304 -0.408
## Sitio_02 -0.9631 -1.2854 -0.6257 -2.1346 -0.5304 -0.408
## Sitio_03 1.5663 0.1845 -0.5754 1.1024 -0.4727 -0.408
## Fosfatos Nitratos OD pH Sólidos.Totales Sólidos.Suspendidos
## Sitio_01 -0.3162 -1.3470 0.2563 -0.3185 -0.81277 -0.9337
## Sitio_02 -0.3162 -0.4020 0.3823 1.6397 -0.60849 -1.0449
## Sitio_03 -0.3162 -0.2549 0.3883 0.8376 0.06275 1.5117
## Sólidos.Disueltos Sulfatos Temperatura
## Sitio_01 -0.7429 -1.1168 -0.3257
## Sitio_02 -0.5073 -1.1168 -0.2352
## Sitio_03 -0.1461 -0.4018 0.3257
set.seed(123)
km.res <- kmeans(df, 4, nstart = 25)
print(km.res)
## K-means clustering with 4 clusters of sizes 1, 5, 3, 1
##
## Cluster means:
## Alcalinidad Aluminio Coliformes.Fecales Conductividad DBO DQO
## 1 -0.3794 -0.6824 -0.1052 0.09954 2.6115 2.7985
## 2 0.5740 0.4217 -0.5222 0.33550 -0.3478 -0.3540
## 3 -0.8659 -0.8553 0.1499 -1.07779 -0.5208 -0.3974
## 4 0.1070 1.1400 2.2665 1.45633 0.6899 0.1635
## Fosfatos Nitratos OD pH Sólidos.Totales Sólidos.Suspendidos
## 1 2.8460 -1.34696 -2.0544 -1.3802 -0.65226 0.06669
## 2 -0.3162 0.52595 0.4687 0.1581 -0.04815 -0.04446
## 3 -0.3162 -0.44067 0.4683 0.5938 -0.52093 -0.34088
## 4 -0.3162 0.03922 -1.6943 -1.1915 2.45583 1.17826
## Sólidos.Disueltos Sulfatos Temperatura
## 1 -0.71153 0.1814 2.47887
## 2 -0.04555 -0.1527 -0.03981
## 3 -0.51257 -0.6266 -0.54885
## 4 2.47699 2.4618 -0.63329
##
## Clustering vector:
## Sitio_01 Sitio_02 Sitio_03 Sitio_04 Sitio_05 Sitio_06 Sitio_07 Sitio_08
## 3 3 2 3 2 1 2 4
## Sitio_09 Sitio_10
## 2 2
##
## Within cluster sum of squares by cluster:
## [1] 0.00 24.83 13.38 0.00
## (between_SS / total_SS = 71.7 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
aggregate(datos, by=list(cluster=km.res$cluster), mean)
## cluster Alcalinidad Aluminio Coliformes.Fecales Conductividad DBO DQO
## 1 1 50.0 136.2 13000 121.00 36.0 210.000
## 2 2 59.8 235.8 2978 133.00 5.2 11.400
## 3 3 45.0 120.6 19130 61.13 3.4 8.667
## 4 4 55.0 300.6 70000 190.00 16.0 44.000
## Fosfatos Nitratos OD pH Sólidos.Totales Sólidos.Suspendidos
## 1 1.84 0.000 3.250 6.920 163.0 48.00
## 2 0.00 4.202 7.454 7.572 204.4 47.00
## 3 0.00 2.033 7.453 7.757 172.0 44.33
## 4 0.00 3.110 3.850 7.000 376.0 58.00
## Sólidos.Disueltos Sulfatos Temperatura
## 1 115.0 6.700 36.70
## 2 157.4 4.976 22.78
## 3 127.7 2.530 19.97
## 4 318.0 18.470 19.50
dd <- cbind(datos, cluster = km.res$cluster)
head(dd)
## Alcalinidad Aluminio Coliformes.Fecales Conductividad DBO DQO
## Sitio_01 50 172.2 49000 86.00 3.3 8
## Sitio_02 44 81.8 490 7.38 3.3 8
## Sitio_03 70 214.4 1700 172.00 3.9 8
## Sitio_04 41 107.8 7900 90.00 3.6 10
## Sitio_05 44 286.3 2400 104.00 4.5 11
## Sitio_06 50 136.2 13000 121.00 36.0 210
## Fosfatos Nitratos OD pH Sólidos.Totales Sólidos.Suspendidos
## Sitio_01 0.00 0.00 7.10 7.37 152 39
## Sitio_02 0.00 2.12 7.31 8.20 166 38
## Sitio_03 0.00 2.45 7.32 7.86 212 61
## Sitio_04 0.00 3.98 7.95 7.70 198 56
## Sitio_05 0.00 2.86 7.43 7.71 262 51
## Sitio_06 1.84 0.00 3.25 6.92 163 48
## Sólidos.Disueltos Sulfatos Temperatura cluster
## Sitio_01 113 0.00 21.2 3
## Sitio_02 128 0.00 21.7 3
## Sitio_03 151 3.69 24.8 2
## Sitio_04 142 7.59 17.0 3
## Sitio_05 211 4.75 20.3 2
## Sitio_06 115 6.70 36.7 1
km.res$cluster
## Sitio_01 Sitio_02 Sitio_03 Sitio_04 Sitio_05 Sitio_06 Sitio_07 Sitio_08
## 3 3 2 3 2 1 2 4
## Sitio_09 Sitio_10
## 2 2
head(km.res$cluster, 4)
## Sitio_01 Sitio_02 Sitio_03 Sitio_04
## 3 3 2 3
km.res$size
## [1] 1 5 3 1
km.res$centers
## Alcalinidad Aluminio Coliformes.Fecales Conductividad DBO DQO
## 1 -0.3794 -0.6824 -0.1052 0.09954 2.6115 2.7985
## 2 0.5740 0.4217 -0.5222 0.33550 -0.3478 -0.3540
## 3 -0.8659 -0.8553 0.1499 -1.07779 -0.5208 -0.3974
## 4 0.1070 1.1400 2.2665 1.45633 0.6899 0.1635
## Fosfatos Nitratos OD pH Sólidos.Totales Sólidos.Suspendidos
## 1 2.8460 -1.34696 -2.0544 -1.3802 -0.65226 0.06669
## 2 -0.3162 0.52595 0.4687 0.1581 -0.04815 -0.04446
## 3 -0.3162 -0.44067 0.4683 0.5938 -0.52093 -0.34088
## 4 -0.3162 0.03922 -1.6943 -1.1915 2.45583 1.17826
## Sólidos.Disueltos Sulfatos Temperatura
## 1 -0.71153 0.1814 2.47887
## 2 -0.04555 -0.1527 -0.03981
## 3 -0.51257 -0.6266 -0.54885
## 4 2.47699 2.4618 -0.63329