#write.table(BD_moluscos, file = "BD_moluscos.txt")
data <- read.table(file = "BD_moluscos.txt", header = TRUE)
head(data)
## c_agua molusco cons_o
## 1 100 A 7.16
## 2 100 A 8.26
## 3 100 A 6.78
## 4 100 A 14.00
## 5 100 A 13.60
## 6 100 A 11.10
#Boxplot para saber consumo de oxigeno
boxplot(cons_o ~ c_agua+molusco, data = data, col = c("tomato", "lightblue"))
library(RcmdrMisc)
numSummary(data$cons_o, statistics=c("mean", "sd", "quantiles","cv"), type=c("2", "1", "3"),
quantiles=c(0, .25, .5, .75, 1), data$molusco)
## mean sd cv 0% 25% 50% 75% 100% data:n
## A 10.000417 3.268661 0.3268525 5.2 7.180 9.74 11.2825 18.8 24
## B 8.609167 4.002435 0.4649039 1.8 5.685 8.06 10.7000 17.7 24
numSummary(data$cons_o, statistics=c("mean", "sd", "quantiles","cv"), type=c("2", "1", "3"),
quantiles=c(0, .25, .5, .75, 1), data$c_agua)
## mean sd cv 0% 25% 50% 75% 100% data:n
## 50 12.25062 3.199643 0.2611820 6.38 10.085 11.455 14.5000 18.8 16
## 75 6.99250 2.804093 0.4010144 1.80 5.200 6.430 8.7675 13.2 16
## 100 8.67125 3.000940 0.3460792 3.68 6.140 8.595 10.5750 14.0 16
De acuerdo con el boxplot realizado es posible evidenciar que el molusco B a una concentración de agua de mar al 50% tiene un mayor consumo de oxigeno que el molusco A con la misma concentración de agua de mar y al aumentar la concentración de agua de mar al 75% y 100% en el molusco B este consumo de oxigeno se vuelve menor para este molusco y aumenta para el molusco A.
Adicionalmente, se podría indicar que en promedio el molusco A podría llegar consuir más oxigeno que el molusco B dependiendo de la concentración de agua de mar que tenga cada molusco.
Asimismo, es posible evidenciar que para ambos moluscos cuando la concentración de agua es del 75% el consumo de oxigeno tiende a presentar una leve disminución y cuando esta misma concentración pasa a 50% o a 100% el consuo oxigeno presenta algun aumento.
mod = lm(data$cons_o~data$c_agua+data$molusco+data$c_agua*data$molusco)
resumen = summary(mod)
resumen
##
## Call:
## lm(formula = data$cons_o ~ data$c_agua + data$molusco + data$c_agua *
## data$molusco)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.8092 -2.2067 -0.1795 2.2469 7.6802
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 13.35854 2.61316 5.112 6.65e-06 ***
## data$c_agua -0.04477 0.03362 -1.332 0.190
## data$moluscoB 2.63063 3.69556 0.712 0.480
## data$c_agua:data$moluscoB -0.05363 0.04754 -1.128 0.265
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.362 on 44 degrees of freedom
## Multiple R-squared: 0.2198, Adjusted R-squared: 0.1666
## F-statistic: 4.132 on 3 and 44 DF, p-value: 0.01151
fm = aov(mod)
summary(fm)
## Df Sum Sq Mean Sq F value Pr(>F)
## data$c_agua 1 102.5 102.50 9.068 0.0043 **
## data$molusco 1 23.2 23.23 2.055 0.1588
## data$c_agua:data$molusco 1 14.4 14.38 1.272 0.2655
## Residuals 44 497.3 11.30
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Es posible identificar que dentro del modelo ANOVA unicamente es significativa la variable de concentración de agua, la iteración entre c_agua y molusco no resultó siendo estadisticamente significativa.
par(mfrow=c(2,2))
plot(fm)
mean(fm$residuals)
## [1] -1.029653e-16
shapiro.test(fm$residuals)
##
## Shapiro-Wilk normality test
##
## data: fm$residuals
## W = 0.98285, p-value = 0.7005
library(lmtest)
bptest(mod)
##
## studentized Breusch-Pagan test
##
## data: mod
## BP = 0.658, df = 3, p-value = 0.883
Gráficamente es posible evidenciar normalidad en los residuales y posibilidad de homocedasticidad; tambien es posible confirmar lo anteriormente indicado con las pruebas cuantitativas realizadas con el promedio de los residuales y la prueba de Shapiro Wilks el cual tuvo como resultado un p-value de 0.7005 > 0.05 por lo que se acepta la Ho, lo que determina que efetivamente existe normalidad. Finalmente, tenemosla prueba Breusch-Pagan donde la Ho = Homocedasticidad (los residuos se distibuyen con la misma varianza) y Ha = Heterocedasticidad (los residuos no se distribuyen con la misma varianza), indica con un p-value de 0.883 > 0.05 no se rechaza Ho, por lo que se evidencia que la varianza de los residuos es homocedastica.
#write.table(Salinidad, file = "BD_Salinidad.txt")
data2 <- read.table(file = "BD_Salinidad.txt", header = TRUE)
head(data2)
## Biomasa pH Salinidad Zinc Potasio
## 1 765.280 5.00 33 16.4524 1441.67
## 2 954.017 4.70 35 13.9852 1299.19
## 3 827.686 4.20 32 15.3276 1154.27
## 4 755.072 4.40 30 17.3128 1045.15
## 5 896.176 5.55 33 22.3312 521.62
## 6 1422.836 5.50 33 12.2778 1273.02
library(foreign)
library(Factoshiny)
library(factoextra)
library(corrplot)
library(biplotbootGUI)
library(dynBiplotGUI)
library(psych)
pairs.panels(data2)
Es posibe evidenciar que dentro de los diferentes compuestos que componen el suelo para la producción de biomasa en una planta forrajera el PH permite que los gramos de biomasa aumente, sin embargo, un aumento en los componentes como salinidad, zinc y potasio ocasionan una disminusión en la biomasa.
mod2 = lm(data2$Biomasa~data2$pH+data2$Salinidad+data2$Zinc+data2$Potasio)
summary(mod2)
##
## Call:
## lm(formula = data2$Biomasa ~ data2$pH + data2$Salinidad + data2$Zinc +
## data2$Potasio)
##
## Residuals:
## Min 1Q Median 3Q Max
## -293.98 -88.83 -9.48 88.20 387.27
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1492.8076 453.6013 3.291 0.002091 **
## data2$pH 262.8829 33.7304 7.794 1.51e-09 ***
## data2$Salinidad -33.4997 8.6525 -3.872 0.000391 ***
## data2$Zinc -28.9727 5.6643 -5.115 8.20e-06 ***
## data2$Potasio -0.1150 0.0819 -1.404 0.167979
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared: 0.9231, Adjusted R-squared: 0.9154
## F-statistic: 120 on 4 and 40 DF, p-value: < 2.2e-16
La ecuación de regresión es \(biomasa = 1492.80 + 262.88\beta_1 - 33.49\beta_2 - 28.97\beta_3\) y el valor de \(R^2 = 0.9231\).
Es posible evidenciar que todas las variables son estadisticamente significativas debido que su p-valor es menor a 0.05 a excepción de la variable Potasio que resulta no ser estadisticamente significativa con un p-valor de 0.167979.
Adicionalmente, para las variables significativas se puede decir que por el aumento en una unidad de pH la biomasa podría aumentar en 262.88 gramos, el aumento de una unidad de salinidad podría impactar la biomasa con una disminusión en 33.49 gramos y un aumento en una unidad de zinc haría disminuir en 28.97 gramos la biomasa.
Finalmente, existe evidencia estadistica de que el modelo explica en un 92.31% la variabilidad de la biomasa de las plantas forrajeras evaluadas.