Primer punto:
Dos mosluscos (A y B) fueron sometidos a distintas concentraciones de agua de mar (100%,75% 50%) y se observó el consumo de oxígeno por unidad de peso seco del molusco
Punto a: realizar un análisis exploratorio que permita conocer como es el consumo de oxígeno en distintas concentraciones de agua
load("C:/Users/PC/Desktop/La U/Quinto Semestre/Bioestadistica/Parcial 2/Moluscos.RData")
require(ggplot2)
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.0.5
require(plotly)
## Loading required package: plotly
## Warning: package 'plotly' was built under R version 4.0.5
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
attach(BD_moluscos)
summary(cons_o)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.800 6.312 9.700 9.305 11.232 18.800
En cuanto al consumo de oxígeno de todos los moluscos recolectados se sabe que tiene un comsumo promedio de 9.700 unidades de oxígeno por unidad de peso seco del molusco, una mediana de 9.305, un valor mínimo de 1.800, un valor máximo de 18.800. También se calculan los cuartiles indicando que el 25% de los datos son menores o iguales a 6.312 en el caso del cuartil 1, y cuartil 3 indica que el 75% de los datos son menores o iguales a 11.232.
grafico_molusco= ggplot(BD_moluscos,aes(y=cons_o,x=c_agua,fill=molusco))+
geom_boxplot(color="black",position = "dodge")+
facet_grid(molusco~c_agua)+
theme(axis.text.x = element_blank(),axis.ticks.x = element_blank())+
ylab("Consumo de oxígeno por unidad de peso seco del molusco")+xlab("Concetración del agua de mar")+
ggtitle("Relación entre el consumo de oxígeno y la concentración de agua de mar")
grafico_molusco
De la gráfica se observa en general que los moluscos que consumen grandes cantidades de oxígeno por unidad de peso seco son aquellos que se encuentran en aguas donde la concentración de agua de mar es de 50%, los moluscos que menos oxígeno consumen son aquellos que viven en aguas donde la concentración de agua de mar es de 75%. Ya hablando de los dos tipos de moluscos, el molusco A es el que mas consume oxígeno respecto al molusco B, aunque se mantiene el mismo comportamiento esperado.
Punto B: Estimar modelo de diseño de experimentos para evaluar el efecto de la concentración de agua y los tipos de molusco sobre el consumo de oxígeno
load("C:/Users/PC/Desktop/La U/Quinto Semestre/Bioestadistica/Parcial 2/Moluscos.RData")
require(agricolae)
## Loading required package: agricolae
## Warning: package 'agricolae' was built under R version 4.0.5
attach(BD_moluscos)
## The following objects are masked from BD_moluscos (pos = 4):
##
## c_agua, cons_o, molusco
BD_c_agua=as.factor(c_agua)
mod_agua=lm(cons_o~BD_c_agua,data = BD_moluscos)
summary(mod_agua)
##
## Call:
## lm(formula = cons_o ~ BD_c_agua, data = BD_moluscos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.8706 -2.0445 -0.4766 2.2494 6.5494
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 12.2506 0.7515 16.302 < 2e-16 ***
## BD_c_agua75 -5.2581 1.0627 -4.948 1.09e-05 ***
## BD_c_agua100 -3.5794 1.0627 -3.368 0.00156 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.006 on 45 degrees of freedom
## Multiple R-squared: 0.3621, Adjusted R-squared: 0.3338
## F-statistic: 12.77 on 2 and 45 DF, p-value: 4.043e-05
anova(mod_agua)
## Analysis of Variance Table
##
## Response: cons_o
## Df Sum Sq Mean Sq F value Pr(>F)
## BD_c_agua 2 230.82 115.408 12.773 4.043e-05 ***
## Residuals 45 406.59 9.035
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Al realizar en modelo para la concentración de agua a de mar respecto al consumo de oxígeno se observa un nivel de significancia. Esto se observa gracias a que al valor p promedio que es muy bajo siendo 4.043e-05 explicando la significancia que tiene esta variable respecto al consumo de oxígeno. Hablando de la variable en sí la que presenta el mayor grado de significancia es la concentración de agua de mar al 50% con un valor p menor a 2e-16 que va a ser tomada como intercepto para la interpretación. La concentración de agua de mar a 75% tamibién tiene un alto nivel de significancia con un valor p de 1.09e-05 y se observa que al aumentar la concentración de agua de mar a este valor se reduce el consumo de oxígeno en 5.26 respecto al consumo de oxígeno con agua de mar al 50%. Por ultimo está la concentración de agua de mar al 100% que tiene un nivel de significancia menor respecto a los dos ultimos valores con un valor p de 0.00156, se observa que a este nivel de concentración el consumo de oxígeno se reduce en 3.58 respecto al consumo de oxígeno en agua de mar al 50%. Al realizar el anova se observa la significancia previamente obtenida con el comando summary, dando paso a la realización de un postanova para la variable consumo de agua
compara=LSD.test(mod_agua,"c_agua")
compara
## NULL
Al realizar el postanova se observa que el consumo de oxígeno es más alto cuando las concentraciones de agua de mar son 50%, en donde se obtiene una desviación estándar de 3.2 y un intervalo de confianza que se ubica entre 10.53 y 13.96. El consumo de oxígeno en concentraciones de 75% y 100% no presenta mucha diferencia, esto se observa en los intervalos de confianza que se superponen, en el caso del 75% en intervalo de confianza va desde 5.27 a 8.70 mientras que el intervalo de confianza del 100% va desde 6.96 hasta 10. 53.
BD_molusco=as.factor(molusco)
mod_molusco=lm(cons_o~BD_molusco,data = BD_moluscos)
summary(mod_molusco)
##
## Call:
## lm(formula = cons_o ~ BD_molusco, data = BD_moluscos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.8092 -2.8254 -0.2604 1.7930 9.0908
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 10.0004 0.7459 13.408 <2e-16 ***
## BD_moluscoB -1.3913 1.0548 -1.319 0.194
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.654 on 46 degrees of freedom
## Multiple R-squared: 0.03644, Adjusted R-squared: 0.01549
## F-statistic: 1.74 on 1 and 46 DF, p-value: 0.1937
anova(mod_molusco)
## Analysis of Variance Table
##
## Response: cons_o
## Df Sum Sq Mean Sq F value Pr(>F)
## BD_molusco 1 23.23 23.227 1.7396 0.1937
## Residuals 46 614.18 13.352
En el caso del tipo de molusco no se presenta un nivel de significancia, con un valor p de 0.1937, se observa que los moluscos de tipo B consumen 1.39 unidades menos de oxígeno que los moluscos del tipo A, esta variable al no presentar significancia no se realiza un postanova.
Segundo punto:
Se estudia la relación entre ciertas carácteristicas del suelo (pH, Salinidad, Zinc, Potasio) y la producción de Biomasa (gr) en una planta forrajera. Para el estudio se recolectan 45 muestras en diferencites ambientes y en cada una se estima la Biomasa y las características del suelo donde crecía.
Punto a: Realizar un análisis de correlaciones bivariadas entre la Biomasa y cada una de las características del suelo, con su respectivo coeficiente de correlación e interpretación.
load("C:/Users/PC/Desktop/La U/Quinto Semestre/Bioestadistica/Parcial 2/Salinidad.RData")
require(ggplot2)
require(plotly)
attach(Salinidad)
## The following object is masked _by_ .GlobalEnv:
##
## Salinidad
Relación entre Biomasa y pH
Bio_pH=ggplot(Salinidad,aes(x=pH,y = Biomasa))+geom_point(col="red")+
geom_smooth(col="black",method = "loess",formula = y~x)+theme_bw()+xlab("Nivel de pH en el suelo")+
ylab("Cantidad de biomasa producida en gramos")+
ggtitle("Relación entre el nivel de pH y cantidad de biomasa producida")
ggplotly(Bio_pH)
cor(Biomasa,pH)
## [1] 0.9281023
Al observar el grafico de puntos entre la biomasa y el ph, la relación que se obtiene es directa, indicando que al aumentar los niveles de pH en el suelo se espera que la producción de biomasa en gramos aumente alcanzando los máximos valores en suelo con pH neutro y niveles bajos de producción en suelos ácidos cercanos a 3. Además, la correlación obtenida es muy alta con un valor de 0.928 corroborando la relación presentada en el gráfico.
Relación entre Biomasa y Salinidad
BDsalinidad=Salinidad$Salinidad
Bio_salinidad=ggplot(Salinidad,aes(x=BDsalinidad,y=Biomasa))+geom_point(col="pink")+
geom_smooth(col="black",method = "loess",formula = y~x)+theme_bw()+
xlab("Nivel de salinidad en el suelo")+ylab("Cantidad de biomasa producida en gramos")+
ggtitle("Relación entre el nivel de salinidad y cantidad biomasa producida")
ggplotly(Bio_salinidad)
cor(Biomasa,BDsalinidad)
## [1] -0.06657756
No se presenta relación entre el nivel de salinidad en el suelo y la cantidad de biomasa producida por las plantas forrajeras, indicando que al aunmentar o disminuir los niveles de salinidad del suelo no van a suponer un cambio en la cantidad de biomasa que la plantas produce. Esta carencia de relación de las dos variables también se ve representada por el nivel de correlación el cuál es -0.066, pese a indicar una correlación negativa.
Relación entre Biomasa y Zinc
Bio_Zinc=ggplot(Salinidad,aes(x=Zinc,y=Biomasa))+geom_point(col="orange")+
geom_smooth(col="black",method = "loess",formula = y~x)+theme_bw()+
xlab("Nivel de zinc en el suelo")+ylab("Cantidad de biomasa producida en gramos")+
ggtitle("Relación entre el nivel de zinc y cantidad de biomasa producida")
ggplotly(Bio_Zinc)
cor(Biomasa,Zinc)
## [1] -0.7814625
Se observa una relación inversa entre el nivel de zinc en el suelo y la cantidad de biomasa producida, esto quiere decir que al aumentar los niveles de zinc del suelo la cantidad de biomasa producida por la planta forrajera se de drásticamente reducida, se puede interpretar a manera de que el zinc actua como un limitante para este tipo de plantas y no se recomienda utilizarlo como fertilizante. En cuanto a la correlación, se obtuvo un valor negativo de -0.781 que representa un alto nivel de correlación además del comportamiento del gráfico.
Relación entre Biomasa y Potasio
Bio_Potasio=ggplot(Salinidad,aes(x = Potasio,y = Biomasa))+geom_point(col="yellow")+
geom_point()+theme_bw()+
xlab("Nivel de potasio en suelo")+ylab("Cantidad de biomasa producida en gramos")+
ggtitle("Relación entre el nivel de potasio y cantidad de biomasa producida")
ggplotly(Bio_Potasio)
cor(Biomasa,Potasio)
## [1] -0.07319518
No hay relación entre el nivel de potasio en el suelo y la biomasa producida, indicando que los aumentos y disminuciones de potasio en el suelo no van a presentar cambios en la producción de biomasa en la planta. Esto se ve traducido en el poco nivel de correlación que estas dos variables presetan, el cual es -0.073
Conclusión: Se concluye que para obtener la mayor producción de biomasa en las plantas forrajeras se debe reducir la cantidad de Zinc del suelo y mantener un pH cercano a 7. La cantidad de Potasio y salinidad no representan mejoría o detrimento en la producción.
Punto 2: Estimar un modelo de regresión múltiple para explicar la biomasa en función del pH, Salinidad, Zinc y Potasio. Interpretar valores p, coeficientes de variables significativas y el coeficiente R2.
mod_Biomasa=lm(Biomasa~pH+Zinc+Potasio+BDsalinidad,data = Salinidad)
summary(mod_Biomasa)
##
## Call:
## lm(formula = Biomasa ~ pH + Zinc + Potasio + BDsalinidad, data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -293.98 -88.83 -9.48 88.20 387.27
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1492.8076 453.6013 3.291 0.002091 **
## pH 262.8829 33.7304 7.794 1.51e-09 ***
## Zinc -28.9727 5.6643 -5.115 8.20e-06 ***
## Potasio -0.1150 0.0819 -1.404 0.167979
## BDsalinidad -33.4997 8.6525 -3.872 0.000391 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared: 0.9231, Adjusted R-squared: 0.9154
## F-statistic: 120 on 4 and 40 DF, p-value: < 2.2e-16
La variable que presenta mayor grado de significancia es el pH con un valor p de 1.51e-09, esto indica que por cada aumento en el ph se aumenta la producción de biomasa en 262.88 gramos respecto a la producción estimada de biomasa que es 1492.80 gramos. La segunda variable más significativa es el Zinc con un valor p de 8.20e-06, indicando que por cara aumento del Zinc se reduce la producción de biomasa en 28.97 gramos. Esto se ve reflejado en la gráficas del análisis bivariado.
Sin embargo la variable salinidad tambien tiene un nivel de significancia de 0.000391, que no se acerca a los valores p de las dos variables, pero según la gráfica de análisis bivariada entre esta variable y la producción de biomasa estas variables no presentan ninguna relación.
En cuanto a valor de R cuadrado obtenido del modelo lineal entre la biomasa y las covariables, se obtiene un valor R2 ajustado de 0.91 indicando que existe una correlación entre las variables del suelo y la producción de biomasa, aunque se pueden obtener valores de R2 mas cercanos al 1 para mejorar dicha correlación.