load("C:/Users/portatil/Desktop/Semestre 9/Bioestadistica/Parcial 3/moluscos.RData")
BD_moluscos
## c_agua molusco cons_o
## 1 100 A 7.16
## 2 100 A 8.26
## 3 100 A 6.78
## 4 100 A 14.00
## 5 100 A 13.60
## 6 100 A 11.10
## 7 100 A 8.93
## 8 100 A 9.66
## 9 100 B 6.14
## 10 100 B 6.14
## 11 100 B 3.68
## 12 100 B 10.00
## 13 100 B 10.40
## 14 100 B 11.60
## 15 100 B 5.49
## 16 100 B 5.80
## 17 75 A 5.20
## 18 75 A 13.20
## 19 75 A 5.20
## 20 75 A 8.39
## 21 75 A 7.18
## 22 75 A 10.40
## 23 75 A 6.37
## 24 75 A 7.18
## 25 75 B 4.47
## 26 75 B 4.95
## 27 75 B 9.96
## 28 75 B 6.49
## 29 75 B 5.75
## 30 75 B 5.44
## 31 75 B 1.80
## 32 75 B 9.90
## 33 50 A 11.11
## 34 50 A 10.50
## 35 50 A 9.74
## 36 50 A 14.60
## 37 50 A 18.80
## 38 50 A 11.11
## 39 50 A 9.74
## 40 50 A 11.80
## 41 50 B 9.63
## 42 50 B 14.50
## 43 50 B 6.38
## 44 50 B 10.20
## 45 50 B 13.40
## 46 50 B 17.70
## 47 50 B 14.50
## 48 50 B 12.30
\(1.\) Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75%, 50%) y se observó el consumo de oxígeno midiendo la proporción de \(O_2\) por unidad de peso seco del molusco.
\(a.\) Realice un análisis exploratorio que permita conocer cómo es el consumo de oxígeno en las distintas concentraciones de agua de mar y si estas conclusiones son las mismas para cada tipo de molusco.
\(Respuesta:\) En la Figura 1 se puede evidenciar que el consumo de oxígeno varía dependiendo de la concentración de agua de mar en la que se encuentren los moluscos. Se observa que el consumo de oxígeno es más alto cuando la concentración de agua de mar es del 50%, mientras que el consumo de oxígeno es más bajo cuando la concentración de agua de mar es del 75%. Sin embargo, hay que resaltar que el consumo de oxígeno es mayor cuando la concentración de agua de mar es del 100% en comparación con el consumo de oxígeno cuando la concentración de agua de mar es del 75%, esto sugiere que la relación entre el consumo de oxígeno y la concentración de agua de mar no es proporcional.
En la Figura 2 se puede evidenciar que el consumo de oxígeno en relación con la concentración de agua de mar es diferente para los dos tipos de moluscos. Aunque el consumo de oxígeno tiene el mismo patrón en los dos tipos de moluscos (mayor consumo en concentración del 50%, menor consumo en concentración del 75%), se observa que el tipo de molusco que más consume oxígeno es el molusco A.
\(Figura\) \(1.\) Relación entre el consumo de oxígeno y las distintas concentraciones de agua de mar para toda la muestra de moluscos.
require(ggplot2)
require(plotly)
figura1=ggplot(BD_moluscos,aes(x=c_agua,y=cons_o))+geom_point()+theme_bw()+labs(x="Concentración de agua de mar",y="Consumo de oxígeno")
ggplotly(figura1)
\(Figura\) \(2.\) Relación entre el consumo de oxígeno y las distintas concentraciones de agua de mar para los dos tipos de moluscos.
figura2=ggplot(BD_moluscos,aes(x=c_agua,y=cons_o))+geom_point()+facet_grid(~molusco)+theme_bw()+labs(x="Concentración de agua de mar",y="Consumo de oxígeno")
figura2
\(b.\) Estime el modelo de diseño de experimentos el cual permita evaluar el efecto de la concentración de agua de mar y los tipos de moluscos sobre el consumo de oxígeno. Interprete los coeficientes del modelo, el valor p y realice un post anova de considerarlo necesario para los factores.
\(Respuesta:\)
En el Modelo de diseño de experimentos se puede evidenciar que la concentración de agua de mar tiene un efecto significativo en el consumo de oxígeno de los moluscos. Por otro lado, se observa que el tipo de molusco no tiene mayor efecto sobre el consumo de oxígeno. Interpretando el valor p obtenido (4.866e-05) se puede decir que los datos son poco probables con una hipótesis nula verdadera, sugiere que la muestra provee suficiente evidencia de que se puede rechazar la hipótesis nula para toda la población.
\(Modelo\) \(de\) \(diseño\) \(de\) \(experimentos\)
y=BD_moluscos$cons_o
x1=BD_moluscos$c_agua
BD_moluscos$c_agua=as.factor(BD_moluscos$c_agua)
x2=BD_moluscos$molusco
mod=lm(cons_o~c_agua+molusco,BD_moluscos)
summary(mod)
##
## Call:
## lm(formula = cons_o ~ c_agua + molusco, data = BD_moluscos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.1750 -1.9877 -0.7019 2.1244 6.1450
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 12.9463 0.8521 15.193 < 2e-16 ***
## c_agua75 -5.2581 1.0436 -5.038 8.49e-06 ***
## c_agua100 -3.5794 1.0436 -3.430 0.00132 **
## moluscoB -1.3913 0.8521 -1.633 0.10966
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.952 on 44 degrees of freedom
## Multiple R-squared: 0.3986, Adjusted R-squared: 0.3575
## F-statistic: 9.719 on 3 and 44 DF, p-value: 4.866e-05
En el Anova para la concentración de agua de mar se puede evidenciar que existen diferencias significativas entre las concentraciones. Con el Resumen se observa que algunas concentraciones se destacan más que otras. Sin embargo para contrastar todas las combinaciones y obtener las mejores concentraciones se debe usar una prueba postanova.
\(Anova\) - \(Concentración\) \(de\) \(agua\) \(de\) \(mar\)
mod1=lm(cons_o~c_agua,data=BD_moluscos)
anova(mod1)
## Analysis of Variance Table
##
## Response: cons_o
## Df Sum Sq Mean Sq F value Pr(>F)
## c_agua 2 230.82 115.408 12.773 4.043e-05 ***
## Residuals 45 406.59 9.035
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(mod1)
##
## Call:
## lm(formula = cons_o ~ c_agua, data = BD_moluscos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.8706 -2.0445 -0.4766 2.2494 6.5494
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 12.2506 0.7515 16.302 < 2e-16 ***
## c_agua75 -5.2581 1.0627 -4.948 1.09e-05 ***
## c_agua100 -3.5794 1.0627 -3.368 0.00156 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.006 on 45 degrees of freedom
## Multiple R-squared: 0.3621, Adjusted R-squared: 0.3338
## F-statistic: 12.77 on 2 and 45 DF, p-value: 4.043e-05
En el Postanova para la concentración de agua de mar y en la Figura 3 se observa que la concentración del 50% es en la que se requiere mayor consumo de oxígeno, mientras que las concentraciones del 100% y del 75% son las menos favorales para el consumo de oxígeno de los moluscos.
\(Postanova\) - \(Concentración\) \(de\) \(agua\) \(de\) \(mar\)
require(agricolae)
post1=LSD.test(mod1,"c_agua")
post1
## $statistics
## MSerror Df Mean CV t.value LSD
## 9.03543 45 9.304792 32.30485 2.014103 2.14048
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none c_agua 3 0.05
##
## $means
## cons_o std r LCL UCL Min Max Q25 Q50 Q75
## 100 8.67125 3.000940 16 7.157702 10.184798 3.68 14.0 6.140 8.595 10.5750
## 50 12.25062 3.199643 16 10.737077 13.764173 6.38 18.8 10.085 11.455 14.5000
## 75 6.99250 2.804093 16 5.478952 8.506048 1.80 13.2 5.200 6.430 8.7675
##
## $comparison
## NULL
##
## $groups
## cons_o groups
## 50 12.25062 a
## 100 8.67125 b
## 75 6.99250 b
##
## attr(,"class")
## [1] "group"
\(Figura\) \(3.\) Consumo de oxígeno vs Concentración de agua de mar (significancia)
bar.group(post1$group,ylim=c(0,30))
En el Anova para los tipos de moluscos se puede evidenciar que no hay diferencias significativas entre los tipos. Con el resumen se refuerza esta conclusión. No es necesario realizar un prueba postanova.
\(Anova\) - \(tipos\) \(de\) \(moluscos\)
mod2=lm(cons_o~molusco,data=BD_moluscos)
anova(mod2)
## Analysis of Variance Table
##
## Response: cons_o
## Df Sum Sq Mean Sq F value Pr(>F)
## molusco 1 23.23 23.227 1.7396 0.1937
## Residuals 46 614.18 13.352
summary(mod2)
##
## Call:
## lm(formula = cons_o ~ molusco, data = BD_moluscos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.8092 -2.8254 -0.2604 1.7930 9.0908
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 10.0004 0.7459 13.408 <2e-16 ***
## moluscoB -1.3913 1.0548 -1.319 0.194
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.654 on 46 degrees of freedom
## Multiple R-squared: 0.03644, Adjusted R-squared: 0.01549
## F-statistic: 1.74 on 1 and 46 DF, p-value: 0.1937
load("C:/Users/portatil/Desktop/Semestre 9/Bioestadistica/Parcial 3/Salinidad.RData")
Salinidad
## Biomasa pH Salinidad Zinc Potasio
## 1 765.280 5.00 33 16.4524 1441.67
## 2 954.017 4.70 35 13.9852 1299.19
## 3 827.686 4.20 32 15.3276 1154.27
## 4 755.072 4.40 30 17.3128 1045.15
## 5 896.176 5.55 33 22.3312 521.62
## 6 1422.836 5.50 33 12.2778 1273.02
## 7 821.069 4.25 36 17.8225 1346.35
## 8 1008.804 4.45 30 14.3516 1253.88
## 9 1306.494 4.75 38 13.6826 1242.65
## 10 1039.637 4.60 30 11.7566 1282.95
## 11 1193.223 4.10 30 9.8820 553.69
## 12 777.474 3.45 37 16.6752 494.74
## 13 818.127 3.45 33 12.3730 526.97
## 14 1203.568 4.10 36 9.4058 571.14
## 15 977.515 3.50 30 14.9302 408.64
## 16 369.823 3.25 30 31.2865 646.65
## 17 509.872 3.25 27 30.1652 514.03
## 18 448.315 3.20 29 28.5901 350.73
## 19 615.091 3.35 34 17.8795 496.29
## 20 545.538 3.30 36 18.5056 580.92
## 21 436.552 3.25 30 22.1344 535.82
## 22 465.907 3.25 28 28.6101 490.34
## 23 664.601 3.20 31 23.1908 552.39
## 24 502.466 3.20 31 24.6917 661.32
## 25 496.797 3.35 35 22.6758 672.12
## 26 2270.294 7.10 29 0.3729 525.65
## 27 2332.220 7.35 35 0.2703 563.13
## 28 2162.531 7.45 35 0.3205 497.96
## 29 2222.588 7.45 30 0.2648 458.38
## 30 2337.326 7.40 30 0.2105 498.25
## 31 1349.192 4.85 26 18.9875 936.26
## 32 1058.976 4.60 29 20.9687 894.79
## 33 1408.206 5.20 25 23.9841 941.36
## 34 1491.276 4.75 26 19.9727 1038.79
## 35 1254.872 5.20 26 21.3864 898.05
## 36 1152.341 4.55 25 23.7063 989.87
## 37 568.455 3.95 26 30.5589 951.28
## 38 612.447 3.70 26 26.8415 929.83
## 39 654.825 3.75 27 27.7292 925.42
## 40 991.829 4.15 27 21.5699 954.11
## 41 1895.942 5.60 24 19.6531 720.72
## 42 1346.880 5.35 27 20.3295 782.09
## 43 1482.793 5.50 26 19.5880 773.30
## 44 1145.643 5.50 28 20.1328 829.26
## 45 1137.193 5.40 28 19.2420 856.96
\(2.\) Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las carcterísticas (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).
\(a.\) Realice un análisis de correlaciones que permita identificar de manera bivariada las relaciones entre las covariables y la respuesta (incluir coeficiente de correlación e interpretaciones).
\(Respuesta:\) Respecto a las relaciones entre las covariables y la respuesta se puede evidenciar que el pH y la Biomasa tienen una relación que tiende a ser directamente proporcional (Figura 4), es decir que a medida que el pH del suelo aumenta es mayor la producción de Biomasa de la planta forrajera. Por otro lado, se puede observar que la Salinidad y la Biomasa (Figura 5), y el Potasio y la Biomasa (Figura 7) no tienen una relación clara, los datos están dispersos y no hay un patrón particular. Por último, se puede evidenciar que el Zinc y la Biomasa tiene una relación que tiende a ser inversamente proporcional (Figura 6), es decir que a medida que el Zinc del suelo aumenta es menor la producción de Biomasa de la planta forrajera.
Los coeficientes de correlación de todas las covariables vs la Biomasa (Tabla 1) confirman lo expuesto anteriormente. El pH con un coeficiente de correlación de 0.92810235 con la Biomasa demuestra que tienen una relación directa y que la fuerza de esta asociación es alta. Por otro lado, la salinidad con un coeficiente de correlación de -0.06657756 con la Biomasa demuestra que tienen una relación inversa y que la fuerza de esta asociación es baja. El Zinc con un coeficiente de correlación de -0.78146249 con la Biomasa demuestra que tienen una relación inversa y que la fuerza de esta asociación es alta. Por último, el Potasio con un coeficiente de correlación de -0.07319518 con la Biomasa demuestra que tienen una relación inversa y que la fuerza de esta asociación es baja.
\(Figura\) \(4.\) Biomasa vs pH
figura4=ggplot(data=Salinidad,aes(x=pH,y=Biomasa))+geom_point()+theme_bw()
figura4
\(Figura\) \(5.\) Biomasa vs Salinidad
figura5=ggplot(data=Salinidad,aes(x=Salinidad,y=Biomasa))+geom_point()+theme_bw()
figura5
\(Figura\) \(6.\) Biomasa vs Zinc
figura6=ggplot(data=Salinidad,aes(x=Zinc,y=Biomasa))+geom_point()+theme_bw()
figura6
\(Figura\) \(7.\) Biomasa vs Potasio
figura5=ggplot(data=Salinidad,aes(x=Potasio,y=Biomasa))+geom_point()+theme_bw()
figura5
\(Tabla\) \(1.\) Coeficientes de correlación de todas las covariables vs Biomasa
cor(Salinidad,Salinidad$Biomasa)
## [,1]
## Biomasa 1.00000000
## pH 0.92810235
## Salinidad -0.06657756
## Zinc -0.78146249
## Potasio -0.07319518
\(b.\) Estime el modelo de regresión lineal múltiple para explicar la biomasa en función de las covariables e interprete el valor p, los coeficientes de las variables significativas y el coeficiente \(R^2\).
\(Respuesta:\) En el modelo de regresión lineal múltiple se puede evidenciar que las covariables más significativas para la producción de Biomasa de una planta forrajera son el pH, el Zinc y la Salinidad que se encuentra en el suelo. Los datos para el pH indican que por cada nivel adicional que el pH del suelo se incrementa o se vuleve más básico, la biomasa producida por la planta aumenta en 263 gramos. Por otro lado, los datos para la Salinidad indican que por cada unidad adicional de sales en el suelo, la biomasa producida por la planta disminuye en 33 gramos. Por último, los datos para el Zinc indican que por cada unidad adicional de zinc en el suelo, la biomasa producida por la planta disminuye en 29 gramos.
El valor p obtenido en el modelo de regresión lineal múltiple arroja que los datos son poco probables con una hipótesis nula verdadera, sugiere que se rechaza la hipótesis nula y se concluye que existe relación lineal entre las covariables significativas y la variable respuesta.
El coeficiente \(R^2\) permite medir el ajuste del modeLO. En este caso es de 0.9154, es decir que la variabilidad de la producción de Biomasa se explica aproximadamente en un 91% por el modelo.
mod3=lm(Biomasa~pH+Salinidad+Zinc+Potasio,data=Salinidad)
summary(mod3)
##
## Call:
## lm(formula = Biomasa ~ pH + Salinidad + Zinc + Potasio, data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -293.98 -88.83 -9.48 88.20 387.27
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1492.8076 453.6013 3.291 0.002091 **
## pH 262.8829 33.7304 7.794 1.51e-09 ***
## Salinidad -33.4997 8.6525 -3.872 0.000391 ***
## Zinc -28.9727 5.6643 -5.115 8.20e-06 ***
## Potasio -0.1150 0.0819 -1.404 0.167979
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared: 0.9231, Adjusted R-squared: 0.9154
## F-statistic: 120 on 4 and 40 DF, p-value: < 2.2e-16