Investigación 1: Evaluación de los cambios en la degradación de la materia orgánica en ecosistemas acuáticos mediante microorganismos.

La degradación de materia orgánica (MODe) en ecosistemas acuáticos es fundamental para la transferencia energética en el ecosistema. El proceso de MODe está mediado por múltiples elementos bióticos y abióticos, sin embargo, son fundamentales la presión parcial del CO_2(ppmv) y la temperatura (^∘ C). La incidencia de estos componentes abióticos influye directa o indirectamente en la capacidad de degradación de la materia orgánica por parte de los microorganismos, los cuales inician la MODe posterior a la lixiviación de metabolitos de las plantas en el cauce del río. De acuerdo a la escenarios de cambio climático actuales, la temperatura y la presión parcial del CO_2 tenderán a variar, para lo cual el IPCC (2007) ha definido 3 posibles escenarios de cambio global: Escenario A: incremento de ~1.5°C y ~220 ppmv Escenario B: incremento de ~3.0°C y ~420 ppmv Escenario C: incremento de ~4.5°C y ~870 ppmv Basado en esta información, el investigador está interesado en establecer si existen variaciones en la capacidad del proceso de MODe de Conostegia macrantha, especie que se desarrolla en ambientes riparios, los cuales pueden o no estar inundados, según las condiciones de variación en el volumen del agua del río. En el caso de los hongos, estos constituyen uno de los principales grupos taxonómicos que aportan en la MODe, para lo cual se utiliza el ergosterol (μg/g).

Diseño experimental Se colectaron hojas de Conostegia macrantha, de individuos presentes en ambientes inundados (Inundado) y no inundados (no-inundado) en las cercanías a un río en la zona Norte de Coronado. Los sitios carecían de influencia antrópica, lo cual permite descartar la influencia de los parámetros físico químicos del agua en la variación del contenido nutricional de las plantas. Todas las hojas fueron transportadas a laboratorio, donde se llevaron a peso seco, permitiendo la homogenización de la muestra. Seguidamente, se crearon discos de 14 mm de diámetro de las hojas de Conostegia macrantha obtenidas de ambientes inundados o no inundados, las cuales se inocularon en 4 microcosmos (ambientes controlados en laboratorio).El primer microcosmos fue el control (Control) en el cual no se realizó ninguna variación en la temperatura o la presión parcial de CO_2; el segundo fue el Escenario-A con un incremento incremento de ~1.5°C y ~220 ppmv; el tercero Escenario-B con incremento de ~3.0°C y ~420 ppm y el cuarto Escenario-C con incremento de ~4.5°C y ~870 ppmv. Se inocularon un total de 16 discos en cada uno de los microcosmos (n=120), para luego retirarlos a los 7 días de incubación en los microcosmos. Durante la realización del estudio se efectuaron mediciones ambientales en el agua cada 30 minutos de la presión parcial del CO2 (ppCO2), temperatura (temp), conductividad eléctrica (ce) en cada uno de los microcosmos. Al finalizar el estudio (7 días), se realizaron mediciones del porcentaje de Carbono Orgánico (CO), Nitrógeno (N), Fosfato (P), Celulosa (Cel) y Lignina (Lig) en n=8 discos. La tasa de degradación de materia orgánica mediada por la acción de los hongos se calculó mediante ergosterol (μg/L) filtrando con metanol e hidróxido de potasio, para subsequentemente utilizar un HPLC en n=8 discos seleccionados al azar. Basado en la información del estudio (Archivo nutrientes.xlsx), resuelva lo que se solicita a continuación:

  1. Determine con un p<0.05 si existen diferencias estadísticamente significativas para la totalidad de los parámetros del agua respecto a los microcosmos.
datos1 = read_xlsx("C:/Users/GOLLO/Desktop/nutrientes.xlsx", sheet = 1)
## New names:
## * `` -> ...1
datos1
## # A tibble: 2,688 x 6
##    ...1     id microcosmo  temp    CE  pCO2
##    <chr> <dbl> <chr>      <dbl> <dbl> <dbl>
##  1 1         1 control     29.8 127.   544.
##  2 2         2 control     30.5  99.7  542.
##  3 3         3 control     30.3 128.   531.
##  4 4         4 control     30.3 116.   543.
##  5 5         5 control     30.8 110.   566.
##  6 6         6 control     28.1 109.   515.
##  7 7         7 control     30.2 109.   536.
##  8 8         8 control     30.9 132.   536.
##  9 9         9 control     30.0  85.1  524.
## 10 10       10 control     31.7 113.   538.
## # ... with 2,678 more rows
#Regresiones
temp1<-lm(datos1$temp~datos1$microcosmo)
CE1<-lm(datos1$CE~datos1$microcosmo)
CO21<-lm(datos1$pCO2~datos1$microcosmo)

#Normalidad
shapiro.test(temp1$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  temp1$residuals
## W = 1, p-value = 2e-05
shapiro.test(CE1$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  CE1$residuals
## W = 0.93, p-value <2e-16
shapiro.test(CO21$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  CO21$residuals
## W = 1, p-value = 7e-05
#Balance
tapply(datos1$temp,datos1$microcosmo, length) 
##     control escenario.A escenario.B escenario.C 
##         672         672         672         672
tapply(datos1$CE,datos1$microcosmo, length)
##     control escenario.A escenario.B escenario.C 
##         672         672         672         672
tapply(datos1$pCO2,datos1$microcosmo, length)
##     control escenario.A escenario.B escenario.C 
##         672         672         672         672
#Homogeneidad
library(outliers)
fligner.test(datos1$temp,datos1$microcosmo) 
## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  datos1$temp and datos1$microcosmo
## Fligner-Killeen:med chi-squared = 222, df = 3, p-value <2e-16
fligner.test(datos1$CE,datos1$microcosmo)
## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  datos1$CE and datos1$microcosmo
## Fligner-Killeen:med chi-squared = 845, df = 3, p-value <2e-16
fligner.test(datos1$pCO2,datos1$microcosmo)
## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  datos1$pCO2 and datos1$microcosmo
## Fligner-Killeen:med chi-squared = 94, df = 3, p-value <2e-16
#ANOVA
kruskal.test(datos1$temp,datos1$microcosmo) 
## 
##  Kruskal-Wallis rank sum test
## 
## data:  datos1$temp and datos1$microcosmo
## Kruskal-Wallis chi-squared = 1796, df = 3, p-value <2e-16
kruskal.test(datos1$CE,datos1$microcosmo)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  datos1$CE and datos1$microcosmo
## Kruskal-Wallis chi-squared = 666, df = 3, p-value <2e-16
kruskal.test(datos1$pCO2,datos1$microcosmo)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  datos1$pCO2 and datos1$microcosmo
## Kruskal-Wallis chi-squared = 2519, df = 3, p-value <2e-16
#Post-Hoc
pairwise.wilcox.test(datos1$temp,datos1$microcosmo, p.adj = "bonf",exact=F)
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  datos1$temp and datos1$microcosmo 
## 
##             control escenario.A escenario.B
## escenario.A <2e-16  -           -          
## escenario.B <2e-16  <2e-16      -          
## escenario.C <2e-16  <2e-16      <2e-16     
## 
## P value adjustment method: bonferroni
pairwise.wilcox.test(datos1$CE,datos1$microcosmo, p.adj = "bonf",exact=F)
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  datos1$CE and datos1$microcosmo 
## 
##             control escenario.A escenario.B
## escenario.A <2e-16  -           -          
## escenario.B <2e-16  0.003       -          
## escenario.C <2e-16  0.018       0.090      
## 
## P value adjustment method: bonferroni
pairwise.wilcox.test(datos1$pCO2,datos1$microcosmo, p.adj = "bonf",exact=F)
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  datos1$pCO2 and datos1$microcosmo 
## 
##             control escenario.A escenario.B
## escenario.A <2e-16  -           -          
## escenario.B <2e-16  <2e-16      -          
## escenario.C <2e-16  <2e-16      <2e-16     
## 
## P value adjustment method: bonferroni
  1. Elabore un gráfico de histograma de frecuencia con el criterio de Scott para la variable pC02, únicamente para los resultados obtenidos en la zona inundada.
#Para los resultados obtenidos en la zona inundada (Escenario A, B y C), se tuvo que excluir el tratamiento control de los datos en una nueva hoja de excel.

datos1.1 = read_xlsx("C:/Users/GOLLO/Desktop/nutrientes.xlsx", sheet = 3)
datos1.1
## # A tibble: 2,016 x 4
##    microcosmo   temp    CE  pCO2
##    <chr>       <dbl> <dbl> <dbl>
##  1 escenario.A  28.7  133.  756.
##  2 escenario.A  30.1  143.  739.
##  3 escenario.A  29.9  134.  748.
##  4 escenario.A  28.0  145.  738.
##  5 escenario.A  27.1  136.  766.
##  6 escenario.A  28.3  143.  748.
##  7 escenario.A  28.4  136.  749.
##  8 escenario.A  27.2  168.  766.
##  9 escenario.A  30.0  134.  750.
## 10 escenario.A  28.5  143.  739.
## # ... with 2,006 more rows
hist(x = datos1.1$pCO2, main = "Histograma de frecuencias para pC02", 
     xlab = "pCO2", ylab = "Frecuencia",
     col = "ivory", breaks = "Scott")

  1. Determine si es posible establecer diferencias estadísticamente significativas al 99% para los parámetros asociados a los nutrientes de las hojas. Utilice un ANOVA de dos vías para la estimación de los efectos.
datos1.2 = read_xlsx("C:/Users/GOLLO/Desktop/nutrientes.xlsx", sheet = 2)
## New names:
## * `` -> ...1
datos1.2
## # A tibble: 64 x 8
##    ...1  microcosmo carbon nitrogeno fosforo celulosa lignina hongo
##    <chr> <chr>       <dbl>     <dbl>   <dbl>    <dbl>   <dbl> <dbl>
##  1 1     Control_f    56.6     1.30   0.228      26.9    28.0  56.4
##  2 2     Control_f    55.5     1.72   0.0984     26.9    28.3  22.3
##  3 3     Control_f    50.1     1.24   0.527      27.0    28.4  43.0
##  4 4     Control_f    46.2     1.35   0.167      25.9    28.2  26.9
##  5 5     Control_f    55.7     1.71   0.209      26.7    27.7  37.1
##  6 6     Control_f    42.0     2.17   0.0830     26.9    27.5  42.5
##  7 7     Control_f    57.3     1.55   0.595      27.0    28.0  19.2
##  8 8     Control_f    49.7     0.785  0.307      26.4    27.9  44.9
##  9 9     A_f          56.1     2.64   0.0658     22.2    33.8  26.2
## 10 10    A_f          42.1     2.55   0.141      22.1    33.9  28.1
## # ... with 54 more rows
reg1<-lm(datos1.2$carbon ~ datos1.2$microcosmo+datos1.2$hongo)
reg2<-lm(datos1.2$nitrogeno ~ datos1.2$microcosmo+datos1.2$hongo)
reg3<-lm(datos1.2$fosforo ~ datos1.2$microcosmo+datos1.2$hongo)
reg4<-lm(datos1.2$celulosa ~ datos1.2$microcosmo+datos1.2$hongo)
reg5<-lm(datos1.2$lignina ~ datos1.2$microcosmo+datos1.2$hongo)

a1<-aov(reg1)
a2<-aov(datos1.2$nitrogeno ~ datos1.2$microcosmo+datos1.2$hongo)
a3<-aov(datos1.2$fosforo ~ datos1.2$microcosmo+datos1.2$hongo)
a4<-aov(datos1.2$celulosa ~ datos1.2$microcosmo+datos1.2$hongo)
a5<-aov(datos1.2$lignina ~ datos1.2$microcosmo+datos1.2$hongo)

a1
## Call:
##    aov(formula = reg1)
## 
## Terms:
##                 datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares                100.6           34.2    1390.9
## Deg. of Freedom                   7              1        55
## 
## Residual standard error: 5.029
## Estimated effects may be unbalanced
a2
## Call:
##    aov(formula = datos1.2$nitrogeno ~ datos1.2$microcosmo + datos1.2$hongo)
## 
## Terms:
##                 datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares                48.28           0.01     15.00
## Deg. of Freedom                   7              1        55
## 
## Residual standard error: 0.5223
## Estimated effects may be unbalanced
a3
## Call:
##    aov(formula = datos1.2$fosforo ~ datos1.2$microcosmo + datos1.2$hongo)
## 
## Terms:
##                 datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares                52.40           0.01      7.86
## Deg. of Freedom                   7              1        55
## 
## Residual standard error: 0.378
## Estimated effects may be unbalanced
a4
## Call:
##    aov(formula = datos1.2$celulosa ~ datos1.2$microcosmo + datos1.2$hongo)
## 
## Terms:
##                 datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares               180.04           0.01      5.98
## Deg. of Freedom                   7              1        55
## 
## Residual standard error: 0.3297
## Estimated effects may be unbalanced
a5
## Call:
##    aov(formula = datos1.2$lignina ~ datos1.2$microcosmo + datos1.2$hongo)
## 
## Terms:
##                 datos1.2$microcosmo datos1.2$hongo Residuals
## Sum of Squares                382.8            0.2      12.1
## Deg. of Freedom                   7              1        55
## 
## Residual standard error: 0.4684
## Estimated effects may be unbalanced
  1. Elabore un gráfico de boxplot con el paquete GGPLOT2, para determinar diferencias estadísticamente significativas en la concentración de ergosterol. Considere la separación de la información respecto a la zona (inundado-noinundado) y los microcosmos. Es posible determinar diferencias estadísticamente significativas al 99% para el ergosterol (hongo) para la interacción de microcosmos y tipo de ambiente
datos1.2
## # A tibble: 64 x 8
##    ...1  microcosmo carbon nitrogeno fosforo celulosa lignina hongo
##    <chr> <chr>       <dbl>     <dbl>   <dbl>    <dbl>   <dbl> <dbl>
##  1 1     Control_f    56.6     1.30   0.228      26.9    28.0  56.4
##  2 2     Control_f    55.5     1.72   0.0984     26.9    28.3  22.3
##  3 3     Control_f    50.1     1.24   0.527      27.0    28.4  43.0
##  4 4     Control_f    46.2     1.35   0.167      25.9    28.2  26.9
##  5 5     Control_f    55.7     1.71   0.209      26.7    27.7  37.1
##  6 6     Control_f    42.0     2.17   0.0830     26.9    27.5  42.5
##  7 7     Control_f    57.3     1.55   0.595      27.0    28.0  19.2
##  8 8     Control_f    49.7     0.785  0.307      26.4    27.9  44.9
##  9 9     A_f          56.1     2.64   0.0658     22.2    33.8  26.2
## 10 10    A_f          42.1     2.55   0.141      22.1    33.9  28.1
## # ... with 54 more rows
regre_hongo<-lm(datos1.2$hongo~datos1.2$microcosmo)
regre_hongo
## 
## Call:
## lm(formula = datos1.2$hongo ~ datos1.2$microcosmo)
## 
## Coefficients:
##                   (Intercept)        datos1.2$microcosmoA_nf  
##                         23.97                           1.06  
##        datos1.2$microcosmoB_f        datos1.2$microcosmoB_nf  
##                         19.62                          11.38  
##        datos1.2$microcosmoC_f        datos1.2$microcosmoC_nf  
##                          5.77                          14.52  
##  datos1.2$microcosmoControl_f  datos1.2$microcosmoControl_nf  
##                         12.58                          12.70
summary(regre_hongo)
## 
## Call:
## lm(formula = datos1.2$hongo ~ datos1.2$microcosmo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -17.363  -1.967   0.156   1.498  19.862 
## 
## Coefficients:
##                               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                      23.97       2.05   11.69  < 2e-16 ***
## datos1.2$microcosmoA_nf           1.06       2.90    0.37  0.71523    
## datos1.2$microcosmoB_f           19.62       2.90    6.77  8.4e-09 ***
## datos1.2$microcosmoB_nf          11.38       2.90    3.92  0.00024 ***
## datos1.2$microcosmoC_f            5.77       2.90    1.99  0.05160 .  
## datos1.2$microcosmoC_nf          14.52       2.90    5.01  5.8e-06 ***
## datos1.2$microcosmoControl_f     12.58       2.90    4.34  6.1e-05 ***
## datos1.2$microcosmoControl_nf    12.70       2.90    4.38  5.3e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.8 on 56 degrees of freedom
## Multiple R-squared:  0.581,  Adjusted R-squared:  0.528 
## F-statistic: 11.1 on 7 and 56 DF,  p-value: 1.08e-08
Microcosmo<-datos1.2$microcosmo

ggplot(regre_hongo,aes(datos1.2$microcosmo, datos1.2$hongo, colour = Microcosmo ))+geom_point() + geom_boxplot()+ 
  geom_jitter(position=position_jitter(0.2)) +
  geom_jitter(position=position_jitter(0.2)) +
  theme_classic(base_size = 14) +
  xlab("Microcosmo") +
  ylab("Concentración de ergosterol")

  1. ¿Cuál es el valor de F tabular al 90% para la prueba de significancia de la variable ergosterol?
hongos <- read_xlsx("C:/Users/GOLLO/Desktop/nutrientes.xlsx", sheet = 2)
## New names:
## * `` -> ...1
str(hongos)
## tibble [64 x 8] (S3: tbl_df/tbl/data.frame)
##  $ ...1      : chr [1:64] "1" "2" "3" "4" ...
##  $ microcosmo: chr [1:64] "Control_f" "Control_f" "Control_f" "Control_f" ...
##  $ carbon    : num [1:64] 56.6 55.5 50.1 46.2 55.7 ...
##  $ nitrogeno : num [1:64] 1.3 1.72 1.24 1.35 1.71 ...
##  $ fosforo   : num [1:64] 0.2277 0.0984 0.5267 0.1666 0.2095 ...
##  $ celulosa  : num [1:64] 26.9 26.9 27 25.9 26.7 ...
##  $ lignina   : num [1:64] 28 28.3 28.4 28.2 27.7 ...
##  $ hongo     : num [1:64] 56.4 22.3 43 26.9 37.1 ...
attach(hongos)

modeloergo <- aov(hongo  ~ microcosmo)
modeloergo
## Call:
##    aov(formula = hongo ~ microcosmo)
## 
## Terms:
##                 microcosmo Residuals
## Sum of Squares        2608      1884
## Deg. of Freedom          7        56
## 
## Residual standard error: 5.801
## Estimated effects may be unbalanced
summary(modeloergo)
##             Df Sum Sq Mean Sq F value  Pr(>F)    
## microcosmo   7   2608     373    11.1 1.1e-08 ***
## Residuals   56   1884      34                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
round(qf(0.1, 7, 56, lower.tail = FALSE), 3)
## [1] 1.827
detach(hongos)

# El F tabular al 90% para la prueba de significancia de la variable ergosterol es de 1.827

Investigación 2. Análisis de la influencia de parámetros físico químicos y ambientales en la composición de macroinvertebrados bentónicos en ríos de Costa Rica.

En este estudio, se realizó el levantamiento de información físico química del agua y macroinvertebrados bentónicos en ríos de la zona Atlántica. En el documento “ambiental.xls” se está entregando la base de datos. Responda lo que se solicita a continuación: 1. Elabore un análisis de componentes principales. Indique cuál es la variable con mayor influencia en la composición de los parámetros analizados en el estudio. Además, presente un gráfico biplot para explicar la composición observada.

datos = read.csv("C:/Users/GOLLO/Desktop/ambiental.csv", sep = ";", dec = ",",header = T, row.names = 1)

is.data.frame(datos)
## [1] TRUE
summary(datos)
##   Alcalinidad      Aluminio     Coliformes.Fecales Conductividad   
##  Min.   :41.0   Min.   : 81.8   Min.   :  490      Min.   :  7.38  
##  1st Qu.:45.5   1st Qu.:119.6   1st Qu.: 1875      1st Qu.: 93.50  
##  Median :52.5   Median :193.3   Median : 5150      Median :120.00  
##  Mean   :53.9   Mean   :197.8   Mean   :15528      Mean   :115.94  
##  3rd Qu.:58.8   3rd Qu.:270.1   3rd Qu.:11725      3rd Qu.:142.00  
##  Max.   :70.0   Max.   :342.7   Max.   :70000      Max.   :190.00  
##       DBO             DQO           Fosfatos        Nitratos          OD      
##  Min.   : 1.60   Min.   :  4.0   Min.   :0.000   Min.   :0.00   Min.   :3.25  
##  1st Qu.: 3.38   1st Qu.:  8.0   1st Qu.:0.000   1st Qu.:2.20   1st Qu.:7.15  
##  Median : 4.20   Median : 10.5   Median :0.000   Median :2.98   Median :7.38  
##  Mean   : 8.82   Mean   : 33.7   Mean   :0.184   Mean   :3.02   Mean   :6.67  
##  3rd Qu.: 8.10   3rd Qu.: 19.0   3rd Qu.:0.000   3rd Qu.:3.85   3rd Qu.:7.50  
##  Max.   :36.00   Max.   :210.0   Max.   :1.840   Max.   :7.79   Max.   :7.95  
##        pH       Sólidos.Totales Sólidos.Suspendidos Sólidos.Disueltos
##  Min.   :6.92   Min.   :152      Min.   :35.0         Min.   :112       
##  1st Qu.:7.09   1st Qu.:164      1st Qu.:39.8         1st Qu.:118       
##  Median :7.65   Median :184      Median :47.0         Median :138       
##  Mean   :7.50   Mean   :208      Mean   :47.4         Mean   :160       
##  3rd Qu.:7.71   3rd Qu.:218      3rd Qu.:54.8         3rd Qu.:171       
##  Max.   :8.20   Max.   :376      Max.   :61.0         Max.   :318       
##     Sulfatos      Temperatura  
##  Min.   : 0.00   Min.   :17.0  
##  1st Qu.: 3.86   1st Qu.:20.1  
##  Median : 5.22   Median :21.4  
##  Mean   : 5.76   Mean   :23.0  
##  3rd Qu.: 6.62   3rd Qu.:24.1  
##  Max.   :18.47   Max.   :36.7
str(datos)
## 'data.frame':    10 obs. of  15 variables:
##  $ Alcalinidad         : int  50 44 70 41 44 50 70 55 55 60
##  $ Aluminio            : num  172.2 81.8 214.4 107.8 286.3 ...
##  $ Coliformes.Fecales  : int  49000 490 1700 7900 2400 13000 7900 70000 490 2400
##  $ Conductividad       : num  86 7.38 172 90 104 121 120 190 120 149
##  $ DBO                 : num  3.3 3.3 3.9 3.6 4.5 36 8.2 16 7.8 1.6
##  $ DQO                 : int  8 8 8 10 11 210 21 44 13 4
##  $ Fosfatos            : num  0 0 0 0 0 1.84 0 0 0 0
##  $ Nitratos            : num  0 2.12 2.45 3.98 2.86 0 7.79 3.11 3.47 4.44
##  $ OD                  : num  7.1 7.31 7.32 7.95 7.43 3.25 7.47 3.85 7.51 7.54
##  $ pH                  : num  7.37 8.2 7.86 7.7 7.71 6.92 6.99 7 7.6 7.7
##  $ Sólidos.Totales    : int  152 166 212 198 262 163 170 376 158 220
##  $ Sólidos.Suspendidos: int  39 38 61 56 51 48 35 58 46 42
##  $ Sólidos.Disueltos  : int  113 128 151 142 211 115 135 318 112 178
##  $ Sulfatos            : num  0 0 3.69 7.59 4.75 ...
##  $ Temperatura         : num  21.2 21.7 24.8 17 20.3 36.7 26.7 19.5 20 22.1
prin_comp <- prcomp(datos, scale. = T)
names(prin_comp)
## [1] "sdev"     "rotation" "center"   "scale"    "x"
prin_comp$center
##          Alcalinidad             Aluminio   Coliformes.Fecales 
##               53.900              197.760            15528.000 
##        Conductividad                  DBO                  DQO 
##              115.938                8.820               33.700 
##             Fosfatos             Nitratos                   OD 
##                0.184                3.022                6.673 
##                   pH     Sólidos.Totales Sólidos.Suspendidos 
##                7.505              207.700               47.400 
##   Sólidos.Disueltos             Sulfatos          Temperatura 
##              160.300                5.764               23.000
prin_comp$scale
##          Alcalinidad             Aluminio   Coliformes.Fecales 
##            1.028e+01            9.021e+01            2.403e+04 
##        Conductividad                  DBO                  DQO 
##            5.086e+01            1.041e+01            6.300e+01 
##             Fosfatos             Nitratos                   OD 
##            5.819e-01            2.244e+00            1.666e+00 
##                   pH     Sólidos.Totales Sólidos.Suspendidos 
##            4.239e-01            6.853e+01            8.996e+00 
##   Sólidos.Disueltos             Sulfatos          Temperatura 
##            6.367e+01            5.161e+00            5.527e+00
prin_comp$rotation
##                           PC1      PC2        PC3      PC4      PC5       PC6
## Alcalinidad          -0.04289 -0.09517  0.6204451  0.11206  0.23254 -0.394650
## Aluminio             -0.11454 -0.26460  0.1712697  0.02452  0.46775  0.742862
## Coliformes.Fecales   -0.23170 -0.18660 -0.2172157 -0.49540  0.36184 -0.301469
## Conductividad        -0.25268 -0.24912  0.2915326  0.28240  0.19352 -0.207650
## DBO                  -0.36972  0.22079  0.0049643  0.01468 -0.08816  0.177130
## DQO                  -0.32884  0.29484 -0.0190870  0.07501 -0.11438  0.083381
## Fosfatos             -0.28030  0.34692 -0.0218546  0.13586 -0.09505  0.059298
## Nitratos              0.10857 -0.20258  0.4728741 -0.14463 -0.58149  0.159018
## OD                    0.40415 -0.07637  0.1240784  0.07747  0.00782  0.084970
## pH                    0.33634 -0.01825 -0.2432045  0.39888 -0.05112 -0.102242
## Sólidos.Totales     -0.20543 -0.37491 -0.1684429  0.04665 -0.20345 -0.120343
## Sólidos.Suspendidos -0.16594 -0.21591 -0.1950021  0.65866  0.04661 -0.002418
## Sólidos.Disueltos   -0.19768 -0.37305 -0.1537592 -0.04286 -0.22558 -0.129197
## Sulfatos             -0.30821 -0.27815  0.0003741 -0.05360 -0.30550  0.147217
## Temperatura          -0.22814  0.34220  0.2539280  0.10310 -0.01660 -0.144043
##                            PC7       PC8       PC9      PC10
## Alcalinidad          -0.153819 -0.384140 -0.004946 -0.098426
## Aluminio             -0.281839 -0.051196 -0.056466  0.097790
## Coliformes.Fecales    0.222981 -0.174391 -0.137935  0.336753
## Conductividad         0.163330  0.509086  0.467284  0.080453
## DBO                  -0.015894 -0.205115  0.101445  0.002715
## DQO                   0.001182  0.055545  0.039329 -0.218067
## Fosfatos              0.009680  0.218459  0.084541  0.446308
## Nitratos              0.133337 -0.086710 -0.134630  0.290185
## OD                    0.205137  0.337911 -0.220582  0.038032
## pH                   -0.356170 -0.360522  0.368221  0.291828
## Sólidos.Totales     -0.346779  0.160510 -0.174839  0.449581
## Sólidos.Suspendidos  0.416670 -0.194450 -0.454733 -0.038390
## Sólidos.Disueltos   -0.432154  0.200251 -0.123943 -0.469964
## Sulfatos              0.260585 -0.334644  0.322803 -0.097081
## Temperatura          -0.291398 -0.003574 -0.425604  0.097046
head(prin_comp$x)
##              PC1     PC2     PC3     PC4     PC5     PC6      PC7      PC8
## Sitio_01  1.0312  0.8925 -0.9236 -1.4942  1.7303 -0.5864  0.36167  0.23017
## Sitio_02  2.7507  1.6287 -1.5094 -0.4311 -0.6537 -0.2779 -0.75964 -0.57340
## Sitio_03  0.3897 -0.7650  0.9857  2.1570  0.8905 -0.8647 -0.01819 -0.27282
## Sitio_04  1.3450 -0.4312 -1.2264  0.4552 -1.0722  0.1634  1.35494  0.01716
## Sitio_05  0.5992 -1.1372 -0.9210  0.5095 -0.1333  1.0202 -0.73520  0.55327
## Sitio_06 -4.3885  4.3489 -0.1235  0.4308 -0.2096  0.1108  0.00977  0.08171
##               PC9       PC10
## Sitio_01 -0.10148  2.567e-16
## Sitio_02  0.02717 -1.631e-16
## Sitio_03 -0.20597  4.510e-16
## Sitio_04 -0.07966 -1.943e-16
## Sitio_05 -0.35512  2.359e-16
## Sitio_06  0.01874 -4.163e-16
dim(prin_comp$x)
## [1] 10 10
biplot(x = prin_comp, scale = 0, cex = 0.8, col = c("blue4", "brown3"))

prin_comp$rotation <- -prin_comp$rotation
prin_comp$x        <- -prin_comp$x

#La influencia de las variables en la composición de los parámetros en estudio se puede notar en el gráfico PCA

biplot(x = prin_comp, scale = 0, cex = 0.8,col = c("blue4", "brown3"))

#La variable con mayor influencia es Sólidos Totales, en el sitio 8; seguido de la variable Fosfatos,en el Sitio 6.
  1. Realice un cluster con los datos, interprete si generan algún patrón que pueda ser utilizado o comparable con el análisis de componentes principales.
df <- scale(datos)
head(df, n = 3)
##          Alcalinidad Aluminio Coliformes.Fecales Conductividad     DBO    DQO
## Sitio_01     -0.3794  -0.2833             1.3927       -0.5887 -0.5304 -0.408
## Sitio_02     -0.9631  -1.2854            -0.6257       -2.1346 -0.5304 -0.408
## Sitio_03      1.5663   0.1845            -0.5754        1.1024 -0.4727 -0.408
##          Fosfatos Nitratos     OD      pH Sólidos.Totales Sólidos.Suspendidos
## Sitio_01  -0.3162  -1.3470 0.2563 -0.3185         -0.81277              -0.9337
## Sitio_02  -0.3162  -0.4020 0.3823  1.6397         -0.60849              -1.0449
## Sitio_03  -0.3162  -0.2549 0.3883  0.8376          0.06275               1.5117
##          Sólidos.Disueltos Sulfatos Temperatura
## Sitio_01            -0.7429  -1.1168     -0.3257
## Sitio_02            -0.5073  -1.1168     -0.2352
## Sitio_03            -0.1461  -0.4018      0.3257
set.seed(123)
km.res <- kmeans(df, 4, nstart = 25)

print(km.res)
## K-means clustering with 4 clusters of sizes 1, 5, 3, 1
## 
## Cluster means:
##   Alcalinidad Aluminio Coliformes.Fecales Conductividad     DBO     DQO
## 1     -0.3794  -0.6824            -0.1052       0.09954  2.6115  2.7985
## 2      0.5740   0.4217            -0.5222       0.33550 -0.3478 -0.3540
## 3     -0.8659  -0.8553             0.1499      -1.07779 -0.5208 -0.3974
## 4      0.1070   1.1400             2.2665       1.45633  0.6899  0.1635
##   Fosfatos Nitratos      OD      pH Sólidos.Totales Sólidos.Suspendidos
## 1   2.8460 -1.34696 -2.0544 -1.3802         -0.65226              0.06669
## 2  -0.3162  0.52595  0.4687  0.1581         -0.04815             -0.04446
## 3  -0.3162 -0.44067  0.4683  0.5938         -0.52093             -0.34088
## 4  -0.3162  0.03922 -1.6943 -1.1915          2.45583              1.17826
##   Sólidos.Disueltos Sulfatos Temperatura
## 1           -0.71153   0.1814     2.47887
## 2           -0.04555  -0.1527    -0.03981
## 3           -0.51257  -0.6266    -0.54885
## 4            2.47699   2.4618    -0.63329
## 
## Clustering vector:
## Sitio_01 Sitio_02 Sitio_03 Sitio_04 Sitio_05 Sitio_06 Sitio_07 Sitio_08 
##        3        3        2        3        2        1        2        4 
## Sitio_09 Sitio_10 
##        2        2 
## 
## Within cluster sum of squares by cluster:
## [1]  0.00 24.83 13.38  0.00
##  (between_SS / total_SS =  71.7 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"
aggregate(datos, by=list(cluster=km.res$cluster), mean)
##   cluster Alcalinidad Aluminio Coliformes.Fecales Conductividad  DBO     DQO
## 1       1        50.0    136.2              13000        121.00 36.0 210.000
## 2       2        59.8    235.8               2978        133.00  5.2  11.400
## 3       3        45.0    120.6              19130         61.13  3.4   8.667
## 4       4        55.0    300.6              70000        190.00 16.0  44.000
##   Fosfatos Nitratos    OD    pH Sólidos.Totales Sólidos.Suspendidos
## 1     1.84    0.000 3.250 6.920            163.0                48.00
## 2     0.00    4.202 7.454 7.572            204.4                47.00
## 3     0.00    2.033 7.453 7.757            172.0                44.33
## 4     0.00    3.110 3.850 7.000            376.0                58.00
##   Sólidos.Disueltos Sulfatos Temperatura
## 1              115.0    6.700       36.70
## 2              157.4    4.976       22.78
## 3              127.7    2.530       19.97
## 4              318.0   18.470       19.50
dd <- cbind(datos, cluster = km.res$cluster)
head(dd)
##          Alcalinidad Aluminio Coliformes.Fecales Conductividad  DBO DQO
## Sitio_01          50    172.2              49000         86.00  3.3   8
## Sitio_02          44     81.8                490          7.38  3.3   8
## Sitio_03          70    214.4               1700        172.00  3.9   8
## Sitio_04          41    107.8               7900         90.00  3.6  10
## Sitio_05          44    286.3               2400        104.00  4.5  11
## Sitio_06          50    136.2              13000        121.00 36.0 210
##          Fosfatos Nitratos   OD   pH Sólidos.Totales Sólidos.Suspendidos
## Sitio_01     0.00     0.00 7.10 7.37              152                   39
## Sitio_02     0.00     2.12 7.31 8.20              166                   38
## Sitio_03     0.00     2.45 7.32 7.86              212                   61
## Sitio_04     0.00     3.98 7.95 7.70              198                   56
## Sitio_05     0.00     2.86 7.43 7.71              262                   51
## Sitio_06     1.84     0.00 3.25 6.92              163                   48
##          Sólidos.Disueltos Sulfatos Temperatura cluster
## Sitio_01                113     0.00        21.2       3
## Sitio_02                128     0.00        21.7       3
## Sitio_03                151     3.69        24.8       2
## Sitio_04                142     7.59        17.0       3
## Sitio_05                211     4.75        20.3       2
## Sitio_06                115     6.70        36.7       1
km.res$cluster
## Sitio_01 Sitio_02 Sitio_03 Sitio_04 Sitio_05 Sitio_06 Sitio_07 Sitio_08 
##        3        3        2        3        2        1        2        4 
## Sitio_09 Sitio_10 
##        2        2
head(km.res$cluster, 4)
## Sitio_01 Sitio_02 Sitio_03 Sitio_04 
##        3        3        2        3
km.res$size
## [1] 1 5 3 1
km.res$centers
##   Alcalinidad Aluminio Coliformes.Fecales Conductividad     DBO     DQO
## 1     -0.3794  -0.6824            -0.1052       0.09954  2.6115  2.7985
## 2      0.5740   0.4217            -0.5222       0.33550 -0.3478 -0.3540
## 3     -0.8659  -0.8553             0.1499      -1.07779 -0.5208 -0.3974
## 4      0.1070   1.1400             2.2665       1.45633  0.6899  0.1635
##   Fosfatos Nitratos      OD      pH Sólidos.Totales Sólidos.Suspendidos
## 1   2.8460 -1.34696 -2.0544 -1.3802         -0.65226              0.06669
## 2  -0.3162  0.52595  0.4687  0.1581         -0.04815             -0.04446
## 3  -0.3162 -0.44067  0.4683  0.5938         -0.52093             -0.34088
## 4  -0.3162  0.03922 -1.6943 -1.1915          2.45583              1.17826
##   Sólidos.Disueltos Sulfatos Temperatura
## 1           -0.71153   0.1814     2.47887
## 2           -0.04555  -0.1527    -0.03981
## 3           -0.51257  -0.6266    -0.54885
## 4            2.47699   2.4618    -0.63329