De acuerdo al set de datos, primero se deben cargar al espacio de trabajo:
load("C:/Users/ASUS/Desktop/5 SEMESTRE/Bioestadistica/Moluscos.RData")#Cargo los datos
load("C:/Users/ASUS/Desktop/5 SEMESTRE/Bioestadistica/Salinidad.RData")
require(ggplot2)#Utilizaremos la librería gráfica ggplot2
## Loading required package: ggplot2
require(anova)
## Loading required package: anova
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'anova'
require(agricolae)
## Loading required package: agricolae
## Warning: package 'agricolae' was built under R version 4.0.5
1. Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco
Realice un análisis exploratorio que permita conocer como es el consumo de oxígeno en las distintas concentraciones de agua de mar. y si estas conclusiones son las mismas para cada tipo de molusco.
Estime el modelo de diseño de experimentos el cual permita evaluar el efecto de la concentración de agua de mar y los tipos de molusco sobre el consumo de oxigeno. Interprete los coeficientes del modelo, el valor p y realice un post anova de considerarlo necesario para los factores.
2. Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio)
Realice un análisis de correlaciones que permita identificar de manera bivariada las relaciones entre las covariables y la respuesta (incluir coeficiente de correlación e interpretaciones).
Estime el modelo de regresión lineal múltiple para explicar la biomasa en función de las covariables e interprete el valor p, los coeficientes de las variables significativas y el coeficiente
————————————————————————————————————————————————————————————————————–
Para el caso, es necesario ilustrar los datos, a forma de reconocer las variables como sigue:
Y= BD_moluscos$cons_o
x1=BD_moluscos$c_agua
x2=BD_moluscos$molusco
Primero, se hace un resumen según el promedio del consumo de oxígeno en relación al tipo de molusco y la concentranción de agua de mar. Todo ello se evidencia en la siguiente matriz:
datos=data.frame(BD_moluscos$c_agua,BD_moluscos$molusco)
tapply(Y,datos,mean,na.rm=TRUE)
## BD_moluscos.molusco
## BD_moluscos.c_agua A B
## 50 12.17500 12.32625
## 75 7.89000 6.09500
## 100 9.93625 7.40625
Según esto, en cada columna se representan los promedios de la variable prinicipal (consumo Oxigeno) en relación al tipo de molusco y sus respectivas concentraciones de agua marina aplicada. En el ensayo de someter los moluscos al 50% de concentración, existe una evidente elevación del consumo de Oxígeno tanto en el molusco A como el B.
Para ser más claros, primero se realiza una gráfica de cajas con todos los datos agrupados de la manera siguiente:
BD_moluscos$c_agua=as.factor(BD_moluscos$c_agua)
g1<-ggplot(BD_moluscos, aes (y=cons_o, x=c_agua, fill= c_agua))
g2<-g1+geom_boxplot()+xlab("Concentración Agua Marina")+ylab("consumo de oxígeno")+ ggtitle("Resultados del Ensayo")+facet_grid(~molusco)
ggplot(BD_moluscos,aes(y=cons_o,x=c_agua,fill=molusco))+facet_grid(~molusco)+geom_boxplot()+theme_grey()+ylab("Consumo de oxígeno")+xlab("Concentración de agua")+ggtitle("Resultados del ensayo")
Muy visualmente, en el eje horizontal se indica la concentración de agua marina a la que fueron sometidos los dos tipos de moluscos (A y B), antecediendo en cada letra el valor de la concentración correspondiente al experimento. El diagrama, es más claro al notarse como los moluscos tipo A producen más cantidad de oxígeno en promedio e individualmente. Sin embargo, hay gran solapamiento de los intervalos de confianza e incluso hay medias que se asemejan a otras.
Para sustentar esta afirmación es necesario comprobar si ambas medias independientes son iguales o no con una prueba t de hipótesis para la media. Se sustenta así:
\(H0::\mu_A=\mu_B\)
\(H1::\mu_A \neq \mu_B\)
t.test(Y~x2, alternative='two.sided', conf.level=0.98, var.equal=FALSE,
data=BD_moluscos)#Prueba de t-student para dos muestras independientes
##
## Welch Two Sample t-test
##
## data: Y by x2
## t = 1.3189, df = 44.234, p-value = 0.194
## alternative hypothesis: true difference in means is not equal to 0
## 98 percent confidence interval:
## -1.154727 3.937227
## sample estimates:
## mean in group A mean in group B
## 10.000417 8.609167
Conclusión:no hay diferencias significativas entre los dos tratamientos A y B. Es más, para comprobar que efectivamente no existe diferencias en los estimadores media y varianza, se procede a realizar un test F de dos colas para muestras independientes:
var.test(cons_o ~ molusco, alternative='two.sided', conf.level=.95, data=BD_moluscos)
##
## F test to compare two variances
##
## data: cons_o by molusco
## F = 0.66695, num df = 23, denom df = 23, p-value = 0.3383
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.2885166 1.5417410
## sample estimates:
## ratio of variances
## 0.6669467
Al analizar el p-value tan alto, se procede a concluir que ni las medias, ni las varianzas de ambos tratamientos A y B son iguales; no existen diferencias significativas en el consumo de oxígeno de los moluscos A y B.
Tras conocer los análisis exploratorios del punto 1a, es necesario concer cuál es el intervalo de confianza de la media según el consumo de oxígeno. Para así realizar un modelo de regresión que incluya todas las variables:
n <- 48 # El tamaño válido de la muestra
media <- mean(Y) # la media
desv <- sd(Y) # La desviación estándar
nivel_de_confianza = 0.95 #Suponiendo un error máximo del 5%
error.est <- desv/sqrt(n) # Calculamos el error estándar
margen.error <- qnorm(0.025) * error.est # nivel de confianza de 95%
lim.inf <- media - margen.error # Límite inferior del intervalo
lim.sup <- media + margen.error # Límite superior del intervalo
Intervalo= c(lim.inf,lim.sup)
Intervalo #Para la media
## [1] 10.346601 8.262983
\(8.262983 < \mu < 10.346601\)
Según este, se espera con un 95% de confianza que el consumo de oxígeno de ambos moluscos A y B, ronde entre 8.3 y 10.3 (unidades arbitrarias) ya que al no existir diferencias entre ambas medias del ensayo, se podrían tratar ambas muestras como una sola población.
Haciendo caso al anterior aserto, se procede a modelar las variables Tipo de Moluscos (x2) más la variable Concentración de Agua contra la variable de respuesta principal que es el consumo de oxígeno tanto en los moluscos A como en B:
Mod1=lm(formula = cons_o ~ x1 + x2, data = BD_moluscos)#Regresión lineal de todas las covariables
summary(Mod1)
##
## Call:
## lm(formula = cons_o ~ x1 + x2, data = BD_moluscos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.8092 -2.2945 -0.6798 2.8297 7.3011
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 15.36948 1.91620 8.021 3.22e-10 ***
## x1 -0.07159 0.02384 -3.002 0.00436 **
## x2B -1.39125 0.97343 -1.429 0.15985
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.372 on 45 degrees of freedom
## Multiple R-squared: 0.1972, Adjusted R-squared: 0.1616
## F-statistic: 5.528 on 2 and 45 DF, p-value: 0.007132
Al observar por ejemplo que los p-values de este modelo, se observa que el la concentración de agua es la variable que mejor influye sobre el consumo de oxígeno con hasta dos grados de significancia, en contraste, el tipo de molusco (factor) posee un p-value tan alto (0.159) que se infiere que no es una covariable significativa con el modelo, por lo tanto, se podría descartar. Sin embargo, al obsevar el \(R^2=0.1616\) y el p-value de la regresión de 0.07132, es necesario añadir que un análisis PostAnova podría definir las relaciones fuertes y débiles del modelo.
Primero, se hace un intervalo de confianza para la regresión lineal, en la cual, se puede predecir con un 95% de confianza los valores que puede tomar la variable de respuesta en relación al modelo.
prediccion=predict(Mod1,list(x1),interval = "confidence",level = 0.95) # ¿Bajo que rango de consumo de oxígeno deben estar los datos del ensayo según el modelo planteado?
summary(prediccion)
## fit lwr upr
## Min. : 6.819 Min. :4.986 Min. : 8.653
## 1st Qu.: 8.211 1st Qu.:6.377 1st Qu.: 9.996
## Median : 9.305 Median :7.894 Median :10.716
## Mean : 9.305 Mean :7.620 Mean :10.990
## 3rd Qu.:10.399 3rd Qu.:8.614 3rd Qu.:12.233
## Max. :11.790 Max. :9.956 Max. :13.624
Según este, se concuerda que hay un solapamiento entre los intervalos de confianza dados por el modelo y los que se calcularon en el punto 1a, por lo cual, se realiza una gráfica de todas las variables anteriores con aquellos intervalos presentes:
ggplot(BD_moluscos,aes(y=Y,x=x1,colour=molusco))+geom_point()+theme_bw()+
geom_smooth(method = "lm")+facet_grid(~BD_moluscos$molusco)+xlab("Concentración de Agua de mar")+ylab("Consumo de Oxígeno")
## `geom_smooth()` using formula 'y ~ x'
Existe gran dispersión en los datos, y dada la amplitud de los intervalos de confianza, se puede estimar que no existe homogeneidad y versomilitud en las relaciones de las variables, por lo cual, se puede afirmar que no es necesario un análisis Post-Anova debido a la baja significancia de ambas variables.
Lo que si se pude afirmar, es que el modelo que mejor se adecúa a la descripción de regresión del consumo de oxígeno queda de la siguiente forma:
\[ Cons.de.oxígeno=14.67385 - 0.07159(concentracion.de.agua) \]
La cual posee un coeficiente de correlación \(R^2=0.1426\) el cual no es indicador de fuerte relación e incluso da el certamen de ser un modelo débil para la interpretación de estos ensayos. Además, el corte del eje y más el B1 corresponden a lo esperado del experimento, a mayor concentración de agua marina, menor el consumo de oxígeno de los moluscos.
Para el caso, es necesario ilustrar los datos, a forma de reconocer las variables (todas numéricas) como sigue:
Y1= Salinidad$Biomasa
X0=Salinidad$pH
X1=Salinidad$Zinc
X2=Salinidad$Salinidad
X3=Salinidad$Potasio
Estimando los modelos de correlación bivariados, por ejemplo la biomasa con el pH se tiene que:
REG1=lm(formula = Biomasa ~ pH, data = Salinidad)
summary(REG1) #Resumen de la regresión
##
## Call:
## lm(formula = Biomasa ~ pH, data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -566.28 -89.26 -19.42 142.42 413.28
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -780.18 117.99 -6.612 4.7e-08 ***
## pH 404.08 24.72 16.346 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 205.7 on 43 degrees of freedom
## Multiple R-squared: 0.8614, Adjusted R-squared: 0.8582
## F-statistic: 267.2 on 1 and 43 DF, p-value: < 2.2e-16
Ambas variables poseen relación directa entre sí. El resultado de dicha relación directa, quiere decir que a medida que el suelo es más ácido, la planta forrejera produce mayor cantidad de biomasa en su entorno, sólo en algunos casos los suelos neutros y/o alcalinos (pH > 7) permiten mayor producción de biomasa en las plantas.La variable pH es bastante significativa con respecto la Biomasa. Es más, se realiza una gráfica de la relación para indicar lo fuerte que es.
ggplot(Salinidad,aes(y=Y1,x=X0))+geom_point()+theme_bw()+ geom_smooth(method = "lm",col ="red")+xlab("Acidez del suelo (pH)")+ylab("Biomasa (gr)")
## `geom_smooth()` using formula 'y ~ x'
Al obtener un coeficiente de correlación tan alto de \(R^2=0.8582\) y un p-value de 2.2e-16, se explica que esta es la mejor variable predictora del modelo de regresión, además de proporcionarle sentido a la variable de respuesta. Por cada escala unitaria de pH que incremente el suelo, la biomasa se incrementa en 404.08 gramos menos 780 del intercepto.
Luego, al relacionar la biomasa con la cantidad de Zinc, se obtiene el modelo:
REG2=lm(formula = Biomasa ~ X1, data = Salinidad)
summary(REG2) #Resumen de la regresión
##
## Call:
## lm(formula = Biomasa ~ X1, data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -545.6 -313.3 10.3 234.1 907.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2002.147 123.247 16.245 < 2e-16 ***
## X1 -51.595 6.282 -8.213 2.37e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 344.8 on 43 degrees of freedom
## Multiple R-squared: 0.6107, Adjusted R-squared: 0.6016
## F-statistic: 67.45 on 1 and 43 DF, p-value: 2.373e-10
A lo cual, se infiere que el Zinc es la segunda mejor predictora de la variable de respuesta ya que su \(R^2=0.6016\) es bastante alto pero aún sigue siendo significativo con respecto a la biomasa. El p-value de 2.373e-10 indica muy buena correlación entre ambas variables.
Relacionando ahora con la covariable Salinidad por ejemplo, el modelo indica:
REG3=lm(formula = Biomasa ~ X2, data = Salinidad)
summary(REG3) #Resumen de la regresión
##
## Call:
## lm(formula = Biomasa ~ X2, data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -714.96 -430.58 -81.87 232.77 1296.33
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1378.112 681.333 2.023 0.0494 *
## X2 -9.778 22.347 -0.438 0.6639
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 551.4 on 43 degrees of freedom
## Multiple R-squared: 0.004433, Adjusted R-squared: -0.01872
## F-statistic: 0.1914 on 1 and 43 DF, p-value: 0.6639
Al recibir un p-value tan alto de 0.6639 y un coeficiente de correlación negativo, existe la inferencia directa de que ambas variables se relacionan de forma inversamente proporcional pero débilmente, por lo cual, no es un predictor tan efectivo para el modelo. Más adelante se evidencia por qué.
Por último, cuando se relacionan la biomasa de las plantas respecto al nivel de potasio, se indica que:
REG4=lm(formula = Biomasa ~ X3, data = Salinidad)
summary(REG4) #Resumen de la regresión
##
## Call:
## lm(formula = Biomasa ~ X3, data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -732.60 -450.49 -60.73 284.15 1218.57
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1189.3171 237.3067 5.012 9.74e-06 ***
## X3 -0.1344 0.2792 -0.481 0.633
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 551.1 on 43 degrees of freedom
## Multiple R-squared: 0.005358, Adjusted R-squared: -0.01777
## F-statistic: 0.2316 on 1 and 43 DF, p-value: 0.6328
La covariable Potasio es la que menos se relaciona con la biomasa debido también a un valor p de 0.6328 el cual es demasiado alto en relación a las demás variables, por lo que de nuevo, no es un buen indicador para el modelo final. Además su \(R^2=-0.01777\) es tan bajo e incluso negativo que a grosso modo se concluye que la variable biomasa es inversamente proporcional a la cantidad de potasio.
Añado las gráficas de las demás covariables contra la biomasa para obtener mejor visualización de los datos:
ggplot(Salinidad,aes(y=Y1,x=X1))+geom_point()+theme_bw()+ geom_smooth(method = "lm",col ="black")+xlab("Cantidad de Zinc")+ylab("Biomasa (gr)")
## `geom_smooth()` using formula 'y ~ x'
ggplot(Salinidad,aes(y=Y1,x=X2))+geom_point()+theme_bw()+ geom_smooth(method = "lm",col ="blue")+xlab("Salinidad del suelo")+ylab("Biomasa (gr)")
## `geom_smooth()` using formula 'y ~ x'
ggplot(Salinidad,aes(y=Y1,x=X3))+geom_point()+theme_bw()+ geom_smooth(method = "lm",col ="green")+xlab("Cantidad de Potasio")+ylab("Biomasa (gr)")
## `geom_smooth()` using formula 'y ~ x'
Lo primero, es definir el modelo que incluya a todas las variables de la siguiente forma:
Modelo1 <- lm(Biomasa~pH+Potasio+Salinidad+Zinc, data=Salinidad)
summary(Modelo1)#Resumen
##
## Call:
## lm(formula = Biomasa ~ pH + Potasio + Salinidad + Zinc, data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -293.98 -88.83 -9.48 88.20 387.27
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1492.8076 453.6013 3.291 0.002091 **
## pH 262.8829 33.7304 7.794 1.51e-09 ***
## Potasio -0.1150 0.0819 -1.404 0.167979
## Salinidad -33.4997 8.6525 -3.872 0.000391 ***
## Zinc -28.9727 5.6643 -5.115 8.20e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared: 0.9231, Adjusted R-squared: 0.9154
## F-statistic: 120 on 4 and 40 DF, p-value: < 2.2e-16
Modelo1
##
## Call:
## lm(formula = Biomasa ~ pH + Potasio + Salinidad + Zinc, data = Salinidad)
##
## Coefficients:
## (Intercept) pH Potasio Salinidad Zinc
## 1492.808 262.883 -0.115 -33.500 -28.973
Lo más importante, es analizar que existe un alto grado de significancia directa entre las covariables del experimento, por lo que tal como se dijo anteriormente, las variables pH, Zinc son las que más se relacionan con la biomasa, luego las variables salinidad y potasio son las que débilmente tienen correlación con Y.
Por lo tanto, el modelo de regresión con un \(R^2=0.9154\) queda expresado:
\[ Biomasa = 1492.808 + 262.883(pH) - 28.973(Zinc)-33.500(Salinidad)-0.115(Potasio) \] Efectivamente, al usar esta regresión múltiple, se debe tener en cuenta que existen dos variables quizás no tan relacionadas entre sí como es la salinidad y el potasio pero su inclusión si define y aumenta el valor de correlación.Ese \(R^2=0.9154\) significa efectivamente que el modelo del experimento describe en un 91.5% la variabled de respuesta teniendo en cuenta los demás parámetros.
Se puede usar esta regresión para predecir un valor promedio de la biomasa teniendo en cuenta los valores promedio de cada predictor:
predict(Modelo1,list(pH=7,Zinc=18,Salinidad=30,Potasio=800),interval = "confidence",level = 0.95)
## fit lwr upr
## 1 1714.484 1545.635 1883.333
Para lo cual, se obtiene con un 95% de confianza los valores de la predicción de este modelo propuesto, si se eliminan las dos variables Potasio y Salinidad, se corresponden que el valor de Pearson disminuye, por lo que es mejor dejar todas las 4 covariables intactas.
Ahora, como si hay variables significativas en el modelo, se analiza primero la tabla ANOVA:
anova(Modelo1)
## Analysis of Variance Table
##
## Response: Biomasa
## Df Sum Sq Mean Sq F value Pr(>F)
## pH 1 11310631 11310631 447.9573 < 2.2e-16 ***
## Potasio 1 140077 140077 5.5477 0.0235 *
## Salinidad 1 9648 9648 0.3821 0.5400
## Zinc 1 660588 660588 26.1626 8.203e-06 ***
## Residuals 40 1009974 25249
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
A lo cual existen entonces tres variable signifiativas sobre la biomasa, con lo que se procede a una prueba posteriori como es el test de Duncan para las t-medias, ya que el test LSD descarta las posibles independencias de variables:
duncan.test(Modelo1, "pH",console = TRUE)
##
## Study: Modelo1 ~ "pH"
##
## Duncan's new multiple range test
## for Biomasa
##
## Mean Square Error: 25249.35
##
## pH, means
##
## Biomasa std r Min Max
## 3.2 538.4607 112.54608 3 448.315 664.601
## 3.25 445.5385 58.78568 4 369.823 509.872
## 3.3 545.5380 NA 1 545.538 545.538
## 3.35 555.9440 83.64649 2 496.797 615.091
## 3.45 797.8005 28.74601 2 777.474 818.127
## 3.5 977.5150 NA 1 977.515 977.515
## 3.7 612.4470 NA 1 612.447 612.447
## 3.75 654.8250 NA 1 654.825 654.825
## 3.95 568.4550 NA 1 568.455 568.455
## 4.1 1198.3955 7.31502 2 1193.223 1203.568
## 4.15 991.8290 NA 1 991.829 991.829
## 4.2 827.6860 NA 1 827.686 827.686
## 4.25 821.0690 NA 1 821.069 821.069
## 4.4 755.0720 NA 1 755.072 755.072
## 4.45 1008.8040 NA 1 1008.804 1008.804
## 4.55 1152.3410 NA 1 1152.341 1152.341
## 4.6 1049.3065 13.67474 2 1039.637 1058.976
## 4.7 954.0170 NA 1 954.017 954.017
## 4.75 1398.8850 130.66061 2 1306.494 1491.276
## 4.85 1349.1920 NA 1 1349.192 1349.192
## 5 765.2800 NA 1 765.280 765.280
## 5.2 1331.5390 108.42351 2 1254.872 1408.206
## 5.35 1346.8800 NA 1 1346.880 1346.880
## 5.4 1137.1930 NA 1 1137.193 1137.193
## 5.5 1350.4240 179.86149 3 1145.643 1482.793
## 5.55 896.1760 NA 1 896.176 896.176
## 5.6 1895.9420 NA 1 1895.942 1895.942
## 7.1 2270.2940 NA 1 2270.294 2270.294
## 7.35 2332.2200 NA 1 2332.220 2332.220
## 7.4 2337.3260 NA 1 2337.326 2337.326
## 7.45 2192.5595 42.46671 2 2162.531 2222.588
##
## Groups according to probability of means differences and alpha level( 0.05 )
##
## Means with the same letter are not significantly different.
##
## Biomasa groups
## 7.4 2337.3260 a
## 7.35 2332.2200 a
## 7.1 2270.2940 a
## 7.45 2192.5595 a
## 5.6 1895.9420 a
## 4.75 1398.8850 b
## 5.5 1350.4240 bc
## 4.85 1349.1920 bc
## 5.35 1346.8800 bc
## 5.2 1331.5390 bc
## 4.1 1198.3955 bcd
## 4.55 1152.3410 bcd
## 5.4 1137.1930 bcde
## 4.6 1049.3065 bcdef
## 4.45 1008.8040 bcdefg
## 4.15 991.8290 bcdefg
## 3.5 977.5150 bcdefg
## 4.7 954.0170 bcdefg
## 5.55 896.1760 cdefgh
## 4.2 827.6860 defgh
## 4.25 821.0690 defgh
## 3.45 797.8005 defgh
## 5 765.2800 defgh
## 4.4 755.0720 defgh
## 3.75 654.8250 efgh
## 3.7 612.4470 fgh
## 3.95 568.4550 fgh
## 3.35 555.9440 gh
## 3.3 545.5380 gh
## 3.2 538.4607 gh
## 3.25 445.5385 h
Según este, la covariable pH si indica diferencias significativas en los resultados del ensayo, por lo que hay mucha influencia de la acidez del suelo sobre la biomasa.
veritas vos liberabit