De acuerdo al set de datos, primero se deben cargar al espacio de trabajo:

load("C:/Users/ASUS/Desktop/5 SEMESTRE/Bioestadistica/Moluscos.RData")#Cargo los datos
load("C:/Users/ASUS/Desktop/5 SEMESTRE/Bioestadistica/Salinidad.RData")
require(ggplot2)#Utilizaremos la librería gráfica ggplot2

## Loading required package: ggplot2

require(anova)

## Loading required package: anova

## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'anova'

require(agricolae)

## Loading required package: agricolae

## Warning: package 'agricolae' was built under R version 4.0.5

1er Punto

1. Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco

Realice un análisis exploratorio que permita conocer como es el consumo de oxígeno en las distintas concentraciones de agua de mar. y si estas conclusiones son las mismas para cada tipo de molusco.
Estime el modelo de diseño de experimentos el cual permita evaluar el efecto de la concentración de agua de mar y los tipos de molusco sobre el consumo de oxigeno. Interprete los coeficientes del modelo, el valor p y realice un post anova de considerarlo necesario para los factores.

2do Punto

2. Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio)

Realice un análisis de correlaciones que permita identificar de manera bivariada las relaciones entre las covariables y la respuesta (incluir coeficiente de correlación e interpretaciones).
Estime el modelo de regresión lineal múltiple para explicar la biomasa en función de las covariables e interprete el valor p, los coeficientes de las variables significativas y el coeficiente

————————————————————————————————————————————————————————————————————–

1a. Explotorio de Datos, Caso. Moluscos

Para el caso, es necesario ilustrar los datos, a forma de reconocer las variables como sigue:

Y= BD_moluscos$cons_o
x1=BD_moluscos$c_agua
x2=BD_moluscos$molusco

Primero, se hace un resumen según el promedio del consumo de oxígeno en relación al tipo de molusco y la concentranción de agua de mar. Todo ello se evidencia en la siguiente matriz:

datos=data.frame(BD_moluscos$c_agua,BD_moluscos$molusco)
tapply(Y,datos,mean,na.rm=TRUE)

##                   BD_moluscos.molusco
## BD_moluscos.c_agua        A        B
##                50  12.17500 12.32625
##                75   7.89000  6.09500
##                100  9.93625  7.40625

Según esto, en cada columna se representan los promedios de la variable prinicipal (consumo Oxigeno) en relación al tipo de molusco y sus respectivas concentraciones de agua marina aplicada. En el ensayo de someter los moluscos al 50% de concentración, existe una evidente elevación del consumo de Oxígeno tanto en el molusco A como el B.

Para ser más claros, primero se realiza una gráfica de cajas con todos los datos agrupados de la manera siguiente:

BD_moluscos$c_agua=as.factor(BD_moluscos$c_agua)
g1<-ggplot(BD_moluscos, aes (y=cons_o, x=c_agua, fill= c_agua))
g2<-g1+geom_boxplot()+xlab("Concentración Agua Marina")+ylab("consumo de oxígeno")+ ggtitle("Resultados del Ensayo")+facet_grid(~molusco)
ggplot(BD_moluscos,aes(y=cons_o,x=c_agua,fill=molusco))+facet_grid(~molusco)+geom_boxplot()+theme_grey()+ylab("Consumo de oxígeno")+xlab("Concentración de agua")+ggtitle("Resultados del ensayo")

Muy visualmente, en el eje horizontal se indica la concentración de agua marina a la que fueron sometidos los dos tipos de moluscos (A y B), antecediendo en cada letra el valor de la concentración correspondiente al experimento. El diagrama, es más claro al notarse como los moluscos tipo A producen más cantidad de oxígeno en promedio e individualmente. Sin embargo, hay gran solapamiento de los intervalos de confianza e incluso hay medias que se asemejan a otras.

Para sustentar esta afirmación es necesario comprobar si ambas medias independientes son iguales o no con una prueba t de hipótesis para la media. Se sustenta así:

\(H0::\mu_A=\mu_B\)

\(H1::\mu_A \neq \mu_B\)

t.test(Y~x2, alternative='two.sided', conf.level=0.98, var.equal=FALSE, 
  data=BD_moluscos)#Prueba de t-student para dos muestras independientes

## 
##  Welch Two Sample t-test
## 
## data:  Y by x2
## t = 1.3189, df = 44.234, p-value = 0.194
## alternative hypothesis: true difference in means is not equal to 0
## 98 percent confidence interval:
##  -1.154727  3.937227
## sample estimates:
## mean in group A mean in group B 
##       10.000417        8.609167

Conclusión:no hay diferencias significativas entre los dos tratamientos A y B. Es más, para comprobar que efectivamente no existe diferencias en los estimadores media y varianza, se procede a realizar un test F de dos colas para muestras independientes:

var.test(cons_o ~ molusco, alternative='two.sided', conf.level=.95, data=BD_moluscos)

## 
##  F test to compare two variances
## 
## data:  cons_o by molusco
## F = 0.66695, num df = 23, denom df = 23, p-value = 0.3383
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.2885166 1.5417410
## sample estimates:
## ratio of variances 
##          0.6669467

Al analizar el p-value tan alto, se procede a concluir que ni las medias, ni las varianzas de ambos tratamientos A y B son iguales; no existen diferencias significativas en el consumo de oxígeno de los moluscos A y B.

1b. Estimación del modelo experimental. Caso. Moluscos

Tras conocer los análisis exploratorios del punto 1a, es necesario concer cuál es el intervalo de confianza de la media según el consumo de oxígeno. Para así realizar un modelo de regresión que incluya todas las variables:

n <- 48             # El tamaño válido de la muestra

media <- mean(Y) # la media 

desv <- sd(Y)  # La desviación estándar 

nivel_de_confianza = 0.95 #Suponiendo un error máximo del 5%

error.est <- desv/sqrt(n) # Calculamos el error estándar
margen.error <- qnorm(0.025) * error.est # nivel de confianza de 95% 
lim.inf <- media - margen.error # Límite inferior del intervalo
lim.sup <- media + margen.error # Límite superior del intervalo
Intervalo= c(lim.inf,lim.sup)
Intervalo #Para la media

## [1] 10.346601  8.262983

\(8.262983 < \mu < 10.346601\)

Según este, se espera con un 95% de confianza que el consumo de oxígeno de ambos moluscos A y B, ronde entre 8.3 y 10.3 (unidades arbitrarias) ya que al no existir diferencias entre ambas medias del ensayo, se podrían tratar ambas muestras como una sola población.

Haciendo caso al anterior aserto, se procede a modelar las variables Tipo de Moluscos (x2) más la variable Concentración de Agua contra la variable de respuesta principal que es el consumo de oxígeno tanto en los moluscos A como en B:

Mod1=lm(formula = cons_o ~ x1 + x2, data = BD_moluscos)#Regresión lineal de todas las covariables 
summary(Mod1)

## 
## Call:
## lm(formula = cons_o ~ x1 + x2, data = BD_moluscos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.8092 -2.2945 -0.6798  2.8297  7.3011 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 15.36948    1.91620   8.021 3.22e-10 ***
## x1          -0.07159    0.02384  -3.002  0.00436 ** 
## x2B         -1.39125    0.97343  -1.429  0.15985    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.372 on 45 degrees of freedom
## Multiple R-squared:  0.1972, Adjusted R-squared:  0.1616 
## F-statistic: 5.528 on 2 and 45 DF,  p-value: 0.007132

Al observar por ejemplo que los p-values de este modelo, se observa que el la concentración de agua es la variable que mejor influye sobre el consumo de oxígeno con hasta dos grados de significancia, en contraste, el tipo de molusco (factor) posee un p-value tan alto (0.159) que se infiere que no es una covariable significativa con el modelo, por lo tanto, se podría descartar. Sin embargo, al obsevar el \(R^2=0.1616\) y el p-value de la regresión de 0.07132, es necesario añadir que un análisis PostAnova podría definir las relaciones fuertes y débiles del modelo.

Primero, se hace un intervalo de confianza para la regresión lineal, en la cual, se puede predecir con un 95% de confianza los valores que puede tomar la variable de respuesta en relación al modelo.

prediccion=predict(Mod1,list(x1),interval = "confidence",level = 0.95) # ¿Bajo que rango de consumo de oxígeno deben estar los datos del ensayo según el modelo planteado?
summary(prediccion)

##       fit              lwr             upr        
##  Min.   : 6.819   Min.   :4.986   Min.   : 8.653  
##  1st Qu.: 8.211   1st Qu.:6.377   1st Qu.: 9.996  
##  Median : 9.305   Median :7.894   Median :10.716  
##  Mean   : 9.305   Mean   :7.620   Mean   :10.990  
##  3rd Qu.:10.399   3rd Qu.:8.614   3rd Qu.:12.233  
##  Max.   :11.790   Max.   :9.956   Max.   :13.624

Según este, se concuerda que hay un solapamiento entre los intervalos de confianza dados por el modelo y los que se calcularon en el punto 1a, por lo cual, se realiza una gráfica de todas las variables anteriores con aquellos intervalos presentes:

ggplot(BD_moluscos,aes(y=Y,x=x1,colour=molusco))+geom_point()+theme_bw()+
  geom_smooth(method = "lm")+facet_grid(~BD_moluscos$molusco)+xlab("Concentración de Agua de mar")+ylab("Consumo de Oxígeno")

## `geom_smooth()` using formula 'y ~ x'

Existe gran dispersión en los datos, y dada la amplitud de los intervalos de confianza, se puede estimar que no existe homogeneidad y versomilitud en las relaciones de las variables, por lo cual, se puede afirmar que no es necesario un análisis Post-Anova debido a la baja significancia de ambas variables.

Lo que si se pude afirmar, es que el modelo que mejor se adecúa a la descripción de regresión del consumo de oxígeno queda de la siguiente forma:

\[ Cons.de.oxígeno=14.67385 - 0.07159(concentracion.de.agua) \]

La cual posee un coeficiente de correlación \(R^2=0.1426\) el cual no es indicador de fuerte relación e incluso da el certamen de ser un modelo débil para la interpretación de estos ensayos. Además, el corte del eje y más el B1 corresponden a lo esperado del experimento, a mayor concentración de agua marina, menor el consumo de oxígeno de los moluscos.

2a. Explotorio de Datos, Caso. Biomasa

Para el caso, es necesario ilustrar los datos, a forma de reconocer las variables (todas numéricas) como sigue:

Y1= Salinidad$Biomasa
X0=Salinidad$pH
X1=Salinidad$Zinc
X2=Salinidad$Salinidad
X3=Salinidad$Potasio

Estimando los modelos de correlación bivariados, por ejemplo la biomasa con el pH se tiene que:

REG1=lm(formula = Biomasa ~ pH, data = Salinidad)
summary(REG1) #Resumen de la regresión

## 
## Call:
## lm(formula = Biomasa ~ pH, data = Salinidad)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -566.28  -89.26  -19.42  142.42  413.28 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -780.18     117.99  -6.612  4.7e-08 ***
## pH            404.08      24.72  16.346  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 205.7 on 43 degrees of freedom
## Multiple R-squared:  0.8614, Adjusted R-squared:  0.8582 
## F-statistic: 267.2 on 1 and 43 DF,  p-value: < 2.2e-16

Ambas variables poseen relación directa entre sí. El resultado de dicha relación directa, quiere decir que a medida que el suelo es más ácido, la planta forrejera produce mayor cantidad de biomasa en su entorno, sólo en algunos casos los suelos neutros y/o alcalinos (pH > 7) permiten mayor producción de biomasa en las plantas.La variable pH es bastante significativa con respecto la Biomasa. Es más, se realiza una gráfica de la relación para indicar lo fuerte que es.

ggplot(Salinidad,aes(y=Y1,x=X0))+geom_point()+theme_bw()+ geom_smooth(method = "lm",col ="red")+xlab("Acidez del suelo (pH)")+ylab("Biomasa (gr)")

## `geom_smooth()` using formula 'y ~ x'

Al obtener un coeficiente de correlación tan alto de \(R^2=0.8582\) y un p-value de 2.2e-16, se explica que esta es la mejor variable predictora del modelo de regresión, además de proporcionarle sentido a la variable de respuesta. Por cada escala unitaria de pH que incremente el suelo, la biomasa se incrementa en 404.08 gramos menos 780 del intercepto.

Luego, al relacionar la biomasa con la cantidad de Zinc, se obtiene el modelo:

REG2=lm(formula = Biomasa ~ X1, data = Salinidad)
summary(REG2) #Resumen de la regresión

## 
## Call:
## lm(formula = Biomasa ~ X1, data = Salinidad)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -545.6 -313.3   10.3  234.1  907.8 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 2002.147    123.247  16.245  < 2e-16 ***
## X1           -51.595      6.282  -8.213 2.37e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 344.8 on 43 degrees of freedom
## Multiple R-squared:  0.6107, Adjusted R-squared:  0.6016 
## F-statistic: 67.45 on 1 and 43 DF,  p-value: 2.373e-10

A lo cual, se infiere que el Zinc es la segunda mejor predictora de la variable de respuesta ya que su \(R^2=0.6016\) es bastante alto pero aún sigue siendo significativo con respecto a la biomasa. El p-value de 2.373e-10 indica muy buena correlación entre ambas variables.

Relacionando ahora con la covariable Salinidad por ejemplo, el modelo indica:

REG3=lm(formula = Biomasa ~ X2, data = Salinidad)
summary(REG3) #Resumen de la regresión

## 
## Call:
## lm(formula = Biomasa ~ X2, data = Salinidad)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -714.96 -430.58  -81.87  232.77 1296.33 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept) 1378.112    681.333   2.023   0.0494 *
## X2            -9.778     22.347  -0.438   0.6639  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 551.4 on 43 degrees of freedom
## Multiple R-squared:  0.004433,   Adjusted R-squared:  -0.01872 
## F-statistic: 0.1914 on 1 and 43 DF,  p-value: 0.6639

Al recibir un p-value tan alto de 0.6639 y un coeficiente de correlación negativo, existe la inferencia directa de que ambas variables se relacionan de forma inversamente proporcional pero débilmente, por lo cual, no es un predictor tan efectivo para el modelo. Más adelante se evidencia por qué.

Por último, cuando se relacionan la biomasa de las plantas respecto al nivel de potasio, se indica que:

REG4=lm(formula = Biomasa ~ X3, data = Salinidad)
summary(REG4) #Resumen de la regresión

## 
## Call:
## lm(formula = Biomasa ~ X3, data = Salinidad)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -732.60 -450.49  -60.73  284.15 1218.57 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1189.3171   237.3067   5.012 9.74e-06 ***
## X3            -0.1344     0.2792  -0.481    0.633    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 551.1 on 43 degrees of freedom
## Multiple R-squared:  0.005358,   Adjusted R-squared:  -0.01777 
## F-statistic: 0.2316 on 1 and 43 DF,  p-value: 0.6328

La covariable Potasio es la que menos se relaciona con la biomasa debido también a un valor p de 0.6328 el cual es demasiado alto en relación a las demás variables, por lo que de nuevo, no es un buen indicador para el modelo final. Además su \(R^2=-0.01777\) es tan bajo e incluso negativo que a grosso modo se concluye que la variable biomasa es inversamente proporcional a la cantidad de potasio.

Añado las gráficas de las demás covariables contra la biomasa para obtener mejor visualización de los datos:

ggplot(Salinidad,aes(y=Y1,x=X1))+geom_point()+theme_bw()+ geom_smooth(method = "lm",col ="black")+xlab("Cantidad de Zinc")+ylab("Biomasa (gr)")

## `geom_smooth()` using formula 'y ~ x'

ggplot(Salinidad,aes(y=Y1,x=X2))+geom_point()+theme_bw()+ geom_smooth(method = "lm",col ="blue")+xlab("Salinidad del suelo")+ylab("Biomasa (gr)")

## `geom_smooth()` using formula 'y ~ x'

ggplot(Salinidad,aes(y=Y1,x=X3))+geom_point()+theme_bw()+ geom_smooth(method = "lm",col ="green")+xlab("Cantidad de Potasio")+ylab("Biomasa (gr)")

## `geom_smooth()` using formula 'y ~ x'

2b. Modelo de Regresión Lineal Múltiple. Caso. Biomasa

Lo primero, es definir el modelo que incluya a todas las variables de la siguiente forma:

Modelo1 <- lm(Biomasa~pH+Potasio+Salinidad+Zinc, data=Salinidad)
summary(Modelo1)#Resumen

## 
## Call:
## lm(formula = Biomasa ~ pH + Potasio + Salinidad + Zinc, data = Salinidad)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -293.98  -88.83   -9.48   88.20  387.27 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1492.8076   453.6013   3.291 0.002091 ** 
## pH           262.8829    33.7304   7.794 1.51e-09 ***
## Potasio       -0.1150     0.0819  -1.404 0.167979    
## Salinidad    -33.4997     8.6525  -3.872 0.000391 ***
## Zinc         -28.9727     5.6643  -5.115 8.20e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared:  0.9231, Adjusted R-squared:  0.9154 
## F-statistic:   120 on 4 and 40 DF,  p-value: < 2.2e-16

Modelo1

## 
## Call:
## lm(formula = Biomasa ~ pH + Potasio + Salinidad + Zinc, data = Salinidad)
## 
## Coefficients:
## (Intercept)           pH      Potasio    Salinidad         Zinc  
##    1492.808      262.883       -0.115      -33.500      -28.973

Lo más importante, es analizar que existe un alto grado de significancia directa entre las covariables del experimento, por lo que tal como se dijo anteriormente, las variables pH, Zinc son las que más se relacionan con la biomasa, luego las variables salinidad y potasio son las que débilmente tienen correlación con Y.

Por lo tanto, el modelo de regresión con un \(R^2=0.9154\) queda expresado:

\[ Biomasa = 1492.808 + 262.883(pH) - 28.973(Zinc)-33.500(Salinidad)-0.115(Potasio) \] Efectivamente, al usar esta regresión múltiple, se debe tener en cuenta que existen dos variables quizás no tan relacionadas entre sí como es la salinidad y el potasio pero su inclusión si define y aumenta el valor de correlación.Ese \(R^2=0.9154\) significa efectivamente que el modelo del experimento describe en un 91.5% la variabled de respuesta teniendo en cuenta los demás parámetros.

Se puede usar esta regresión para predecir un valor promedio de la biomasa teniendo en cuenta los valores promedio de cada predictor:

predict(Modelo1,list(pH=7,Zinc=18,Salinidad=30,Potasio=800),interval = "confidence",level = 0.95)

##        fit      lwr      upr
## 1 1714.484 1545.635 1883.333

Para lo cual, se obtiene con un 95% de confianza los valores de la predicción de este modelo propuesto, si se eliminan las dos variables Potasio y Salinidad, se corresponden que el valor de Pearson disminuye, por lo que es mejor dejar todas las 4 covariables intactas.

Ahora, como si hay variables significativas en el modelo, se analiza primero la tabla ANOVA:

anova(Modelo1)

## Analysis of Variance Table
## 
## Response: Biomasa
##           Df   Sum Sq  Mean Sq  F value    Pr(>F)    
## pH         1 11310631 11310631 447.9573 < 2.2e-16 ***
## Potasio    1   140077   140077   5.5477    0.0235 *  
## Salinidad  1     9648     9648   0.3821    0.5400    
## Zinc       1   660588   660588  26.1626 8.203e-06 ***
## Residuals 40  1009974    25249                       
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

A lo cual existen entonces tres variable signifiativas sobre la biomasa, con lo que se procede a una prueba posteriori como es el test de Duncan para las t-medias, ya que el test LSD descarta las posibles independencias de variables:

duncan.test(Modelo1, "pH",console = TRUE)

## 
## Study: Modelo1 ~ "pH"
## 
## Duncan's new multiple range test
## for Biomasa 
## 
## Mean Square Error:  25249.35 
## 
## pH,  means
## 
##        Biomasa       std r      Min      Max
## 3.2   538.4607 112.54608 3  448.315  664.601
## 3.25  445.5385  58.78568 4  369.823  509.872
## 3.3   545.5380        NA 1  545.538  545.538
## 3.35  555.9440  83.64649 2  496.797  615.091
## 3.45  797.8005  28.74601 2  777.474  818.127
## 3.5   977.5150        NA 1  977.515  977.515
## 3.7   612.4470        NA 1  612.447  612.447
## 3.75  654.8250        NA 1  654.825  654.825
## 3.95  568.4550        NA 1  568.455  568.455
## 4.1  1198.3955   7.31502 2 1193.223 1203.568
## 4.15  991.8290        NA 1  991.829  991.829
## 4.2   827.6860        NA 1  827.686  827.686
## 4.25  821.0690        NA 1  821.069  821.069
## 4.4   755.0720        NA 1  755.072  755.072
## 4.45 1008.8040        NA 1 1008.804 1008.804
## 4.55 1152.3410        NA 1 1152.341 1152.341
## 4.6  1049.3065  13.67474 2 1039.637 1058.976
## 4.7   954.0170        NA 1  954.017  954.017
## 4.75 1398.8850 130.66061 2 1306.494 1491.276
## 4.85 1349.1920        NA 1 1349.192 1349.192
## 5     765.2800        NA 1  765.280  765.280
## 5.2  1331.5390 108.42351 2 1254.872 1408.206
## 5.35 1346.8800        NA 1 1346.880 1346.880
## 5.4  1137.1930        NA 1 1137.193 1137.193
## 5.5  1350.4240 179.86149 3 1145.643 1482.793
## 5.55  896.1760        NA 1  896.176  896.176
## 5.6  1895.9420        NA 1 1895.942 1895.942
## 7.1  2270.2940        NA 1 2270.294 2270.294
## 7.35 2332.2200        NA 1 2332.220 2332.220
## 7.4  2337.3260        NA 1 2337.326 2337.326
## 7.45 2192.5595  42.46671 2 2162.531 2222.588
## 
## Groups according to probability of means differences and alpha level( 0.05 )
## 
## Means with the same letter are not significantly different.
## 
##        Biomasa groups
## 7.4  2337.3260      a
## 7.35 2332.2200      a
## 7.1  2270.2940      a
## 7.45 2192.5595      a
## 5.6  1895.9420      a
## 4.75 1398.8850      b
## 5.5  1350.4240     bc
## 4.85 1349.1920     bc
## 5.35 1346.8800     bc
## 5.2  1331.5390     bc
## 4.1  1198.3955    bcd
## 4.55 1152.3410    bcd
## 5.4  1137.1930   bcde
## 4.6  1049.3065  bcdef
## 4.45 1008.8040 bcdefg
## 4.15  991.8290 bcdefg
## 3.5   977.5150 bcdefg
## 4.7   954.0170 bcdefg
## 5.55  896.1760 cdefgh
## 4.2   827.6860  defgh
## 4.25  821.0690  defgh
## 3.45  797.8005  defgh
## 5     765.2800  defgh
## 4.4   755.0720  defgh
## 3.75  654.8250   efgh
## 3.7   612.4470    fgh
## 3.95  568.4550    fgh
## 3.35  555.9440     gh
## 3.3   545.5380     gh
## 3.2   538.4607     gh
## 3.25  445.5385      h

Según este, la covariable pH si indica diferencias significativas en los resultados del ensayo, por lo que hay mucha influencia de la acidez del suelo sobre la biomasa.

veritas vos liberabit

Segundo Parcial Bioestadística