Datos Moluscos

load("C:/Users/portatil/Desktop/Semestre 9/Bioestadistica/Parcial 3/moluscos.RData")
BD_moluscos
##    c_agua molusco cons_o
## 1     100       A   7.16
## 2     100       A   8.26
## 3     100       A   6.78
## 4     100       A  14.00
## 5     100       A  13.60
## 6     100       A  11.10
## 7     100       A   8.93
## 8     100       A   9.66
## 9     100       B   6.14
## 10    100       B   6.14
## 11    100       B   3.68
## 12    100       B  10.00
## 13    100       B  10.40
## 14    100       B  11.60
## 15    100       B   5.49
## 16    100       B   5.80
## 17     75       A   5.20
## 18     75       A  13.20
## 19     75       A   5.20
## 20     75       A   8.39
## 21     75       A   7.18
## 22     75       A  10.40
## 23     75       A   6.37
## 24     75       A   7.18
## 25     75       B   4.47
## 26     75       B   4.95
## 27     75       B   9.96
## 28     75       B   6.49
## 29     75       B   5.75
## 30     75       B   5.44
## 31     75       B   1.80
## 32     75       B   9.90
## 33     50       A  11.11
## 34     50       A  10.50
## 35     50       A   9.74
## 36     50       A  14.60
## 37     50       A  18.80
## 38     50       A  11.11
## 39     50       A   9.74
## 40     50       A  11.80
## 41     50       B   9.63
## 42     50       B  14.50
## 43     50       B   6.38
## 44     50       B  10.20
## 45     50       B  13.40
## 46     50       B  17.70
## 47     50       B  14.50
## 48     50       B  12.30

\(1.\) Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75%, 50%) y se observó el consumo de oxígeno midiendo la proporción de \(O_2\) por unidad de peso seco del molusco.

\(a.\) Realice un análisis exploratorio que permita conocer cómo es el consumo de oxígeno en las distintas concentraciones de agua de mar y si estas conclusiones son las mismas para cada tipo de molusco.

\(Respuesta:\) En la Figura 1 se puede evidenciar que el consumo de oxígeno varía dependiendo de la concentración de agua de mar en la que se encuentren los moluscos. Se observa que el consumo de oxígeno es más alto cuando la concentración de agua de mar es del 50%, mientras que el consumo de oxígeno es más bajo cuando la concentración de agua de mar es del 75%. Sin embargo, hay que resaltar que el consumo de oxígeno es mayor cuando la concentración de agua de mar es del 100% en comparación con el consumo de oxígeno cuando la concentración de agua de mar es del 75%, esto sugiere que la relación entre el consumo de oxígeno y la concentración de agua de mar no es proporcional.

En la Figura 2 se puede evidenciar que el consumo de oxígeno en relación con la concentración de agua de mar es diferente para los dos tipos de moluscos. Aunque el consumo de oxígeno tiene el mismo patrón en los dos tipos de moluscos (mayor consumo en concentración del 50%, menor consumo en concentración del 75%), se observa que el tipo de molusco que más consume oxígeno es el molusco A.

\(Figura\) \(1.\) Relación entre el consumo de oxígeno y las distintas concentraciones de agua de mar para toda la muestra de moluscos.

require(ggplot2)
require(plotly)
figura1=ggplot(BD_moluscos,aes(x=c_agua,y=cons_o))+geom_point()+theme_bw()+labs(x="Concentración de agua de mar",y="Consumo de oxígeno")
ggplotly(figura1)

\(Figura\) \(2.\) Relación entre el consumo de oxígeno y las distintas concentraciones de agua de mar para los dos tipos de moluscos.

figura2=ggplot(BD_moluscos,aes(x=c_agua,y=cons_o))+geom_point()+facet_grid(~molusco)+theme_bw()+labs(x="Concentración de agua de mar",y="Consumo de oxígeno")
figura2

\(b.\) Estime el modelo de diseño de experimentos el cual permita evaluar el efecto de la concentración de agua de mar y los tipos de moluscos sobre el consumo de oxígeno. Interprete los coeficientes del modelo, el valor p y realice un post anova de considerarlo necesario para los factores.

\(Respuesta:\)

En el Modelo de diseño de experimentos se puede evidenciar que la concentración de agua de mar tiene un efecto significativo en el consumo de oxígeno de los moluscos. Por otro lado, se observa que el tipo de molusco no tiene mayor efecto sobre el consumo de oxígeno. Interpretando el valor p obtenido (4.866e-05) se puede decir que los datos son poco probables con una hipótesis nula verdadera, sugiere que la muestra provee suficiente evidencia de que se puede rechazar la hipótesis nula para toda la población.

\(Modelo\) \(de\) \(diseño\) \(de\) \(experimentos\)

y=BD_moluscos$cons_o
x1=BD_moluscos$c_agua
BD_moluscos$c_agua=as.factor(BD_moluscos$c_agua)
x2=BD_moluscos$molusco

mod=lm(cons_o~c_agua+molusco,BD_moluscos)
summary(mod)
## 
## Call:
## lm(formula = cons_o ~ c_agua + molusco, data = BD_moluscos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.1750 -1.9877 -0.7019  2.1244  6.1450 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  12.9463     0.8521  15.193  < 2e-16 ***
## c_agua75     -5.2581     1.0436  -5.038 8.49e-06 ***
## c_agua100    -3.5794     1.0436  -3.430  0.00132 ** 
## moluscoB     -1.3913     0.8521  -1.633  0.10966    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.952 on 44 degrees of freedom
## Multiple R-squared:  0.3986, Adjusted R-squared:  0.3575 
## F-statistic: 9.719 on 3 and 44 DF,  p-value: 4.866e-05

En el Anova para la concentración de agua de mar se puede evidenciar que existen diferencias significativas entre las concentraciones. Con el Resumen se observa que algunas concentraciones se destacan más que otras. Sin embargo para contrastar todas las combinaciones y obtener las mejores concentraciones se debe usar una prueba postanova.

\(Anova\) - \(Concentración\) \(de\) \(agua\) \(de\) \(mar\)

mod1=lm(cons_o~c_agua,data=BD_moluscos)
anova(mod1)
## Analysis of Variance Table
## 
## Response: cons_o
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## c_agua     2 230.82 115.408  12.773 4.043e-05 ***
## Residuals 45 406.59   9.035                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(mod1)
## 
## Call:
## lm(formula = cons_o ~ c_agua, data = BD_moluscos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.8706 -2.0445 -0.4766  2.2494  6.5494 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  12.2506     0.7515  16.302  < 2e-16 ***
## c_agua75     -5.2581     1.0627  -4.948 1.09e-05 ***
## c_agua100    -3.5794     1.0627  -3.368  0.00156 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.006 on 45 degrees of freedom
## Multiple R-squared:  0.3621, Adjusted R-squared:  0.3338 
## F-statistic: 12.77 on 2 and 45 DF,  p-value: 4.043e-05

En el Postanova para la concentración de agua de mar y en la Figura 3 se observa que la concentración del 50% es en la que se requiere mayor consumo de oxígeno, mientras que las concentraciones del 100% y del 75% son las menos favorales para el consumo de oxígeno de los moluscos.

\(Postanova\) - \(Concentración\) \(de\) \(agua\) \(de\) \(mar\)

require(agricolae)
post1=LSD.test(mod1,"c_agua")
post1
## $statistics
##   MSerror Df     Mean       CV  t.value     LSD
##   9.03543 45 9.304792 32.30485 2.014103 2.14048
## 
## $parameters
##         test p.ajusted name.t ntr alpha
##   Fisher-LSD      none c_agua   3  0.05
## 
## $means
##       cons_o      std  r       LCL       UCL  Min  Max    Q25    Q50     Q75
## 100  8.67125 3.000940 16  7.157702 10.184798 3.68 14.0  6.140  8.595 10.5750
## 50  12.25062 3.199643 16 10.737077 13.764173 6.38 18.8 10.085 11.455 14.5000
## 75   6.99250 2.804093 16  5.478952  8.506048 1.80 13.2  5.200  6.430  8.7675
## 
## $comparison
## NULL
## 
## $groups
##       cons_o groups
## 50  12.25062      a
## 100  8.67125      b
## 75   6.99250      b
## 
## attr(,"class")
## [1] "group"

\(Figura\) \(3.\) Consumo de oxígeno vs Concentración de agua de mar (significancia)

bar.group(post1$group,ylim=c(0,30))

En el Anova para los tipos de moluscos se puede evidenciar que no hay diferencias significativas entre los tipos. Con el resumen se refuerza esta conclusión. No es necesario realizar un prueba postanova.

\(Anova\) - \(tipos\) \(de\) \(moluscos\)

mod2=lm(cons_o~molusco,data=BD_moluscos)
anova(mod2)
## Analysis of Variance Table
## 
## Response: cons_o
##           Df Sum Sq Mean Sq F value Pr(>F)
## molusco    1  23.23  23.227  1.7396 0.1937
## Residuals 46 614.18  13.352
summary(mod2)
## 
## Call:
## lm(formula = cons_o ~ molusco, data = BD_moluscos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.8092 -2.8254 -0.2604  1.7930  9.0908 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  10.0004     0.7459  13.408   <2e-16 ***
## moluscoB     -1.3913     1.0548  -1.319    0.194    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.654 on 46 degrees of freedom
## Multiple R-squared:  0.03644,    Adjusted R-squared:  0.01549 
## F-statistic:  1.74 on 1 and 46 DF,  p-value: 0.1937

Datos Plantas

load("C:/Users/portatil/Desktop/Semestre 9/Bioestadistica/Parcial 3/Salinidad.RData")
Salinidad
##     Biomasa   pH Salinidad    Zinc Potasio
## 1   765.280 5.00        33 16.4524 1441.67
## 2   954.017 4.70        35 13.9852 1299.19
## 3   827.686 4.20        32 15.3276 1154.27
## 4   755.072 4.40        30 17.3128 1045.15
## 5   896.176 5.55        33 22.3312  521.62
## 6  1422.836 5.50        33 12.2778 1273.02
## 7   821.069 4.25        36 17.8225 1346.35
## 8  1008.804 4.45        30 14.3516 1253.88
## 9  1306.494 4.75        38 13.6826 1242.65
## 10 1039.637 4.60        30 11.7566 1282.95
## 11 1193.223 4.10        30  9.8820  553.69
## 12  777.474 3.45        37 16.6752  494.74
## 13  818.127 3.45        33 12.3730  526.97
## 14 1203.568 4.10        36  9.4058  571.14
## 15  977.515 3.50        30 14.9302  408.64
## 16  369.823 3.25        30 31.2865  646.65
## 17  509.872 3.25        27 30.1652  514.03
## 18  448.315 3.20        29 28.5901  350.73
## 19  615.091 3.35        34 17.8795  496.29
## 20  545.538 3.30        36 18.5056  580.92
## 21  436.552 3.25        30 22.1344  535.82
## 22  465.907 3.25        28 28.6101  490.34
## 23  664.601 3.20        31 23.1908  552.39
## 24  502.466 3.20        31 24.6917  661.32
## 25  496.797 3.35        35 22.6758  672.12
## 26 2270.294 7.10        29  0.3729  525.65
## 27 2332.220 7.35        35  0.2703  563.13
## 28 2162.531 7.45        35  0.3205  497.96
## 29 2222.588 7.45        30  0.2648  458.38
## 30 2337.326 7.40        30  0.2105  498.25
## 31 1349.192 4.85        26 18.9875  936.26
## 32 1058.976 4.60        29 20.9687  894.79
## 33 1408.206 5.20        25 23.9841  941.36
## 34 1491.276 4.75        26 19.9727 1038.79
## 35 1254.872 5.20        26 21.3864  898.05
## 36 1152.341 4.55        25 23.7063  989.87
## 37  568.455 3.95        26 30.5589  951.28
## 38  612.447 3.70        26 26.8415  929.83
## 39  654.825 3.75        27 27.7292  925.42
## 40  991.829 4.15        27 21.5699  954.11
## 41 1895.942 5.60        24 19.6531  720.72
## 42 1346.880 5.35        27 20.3295  782.09
## 43 1482.793 5.50        26 19.5880  773.30
## 44 1145.643 5.50        28 20.1328  829.26
## 45 1137.193 5.40        28 19.2420  856.96

\(2.\) Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las carcterísticas (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).

\(a.\) Realice un análisis de correlaciones que permita identificar de manera bivariada las relaciones entre las covariables y la respuesta (incluir coeficiente de correlación e interpretaciones).

\(Respuesta:\) Respecto a las relaciones entre las covariables y la respuesta se puede evidenciar que el pH y la Biomasa tienen una relación que tiende a ser directamente proporcional (Figura 4), es decir que a medida que el pH del suelo aumenta es mayor la producción de Biomasa de la planta forrajera. Por otro lado, se puede observar que la Salinidad y la Biomasa (Figura 5), y el Potasio y la Biomasa (Figura 7) no tienen una relación clara, los datos están dispersos y no hay un patrón particular. Por último, se puede evidenciar que el Zinc y la Biomasa tiene una relación que tiende a ser inversamente proporcional (Figura 6), es decir que a medida que el Zinc del suelo aumenta es menor la producción de Biomasa de la planta forrajera.

Los coeficientes de correlación de todas las covariables vs la Biomasa (Tabla 1) confirman lo expuesto anteriormente. El pH con un coeficiente de correlación de 0.92810235 con la Biomasa demuestra que tienen una relación directa y que la fuerza de esta asociación es alta. Por otro lado, la salinidad con un coeficiente de correlación de -0.06657756 con la Biomasa demuestra que tienen una relación inversa y que la fuerza de esta asociación es baja. El Zinc con un coeficiente de correlación de -0.78146249 con la Biomasa demuestra que tienen una relación inversa y que la fuerza de esta asociación es alta. Por último, el Potasio con un coeficiente de correlación de -0.07319518 con la Biomasa demuestra que tienen una relación inversa y que la fuerza de esta asociación es baja.

\(Figura\) \(4.\) Biomasa vs pH

figura4=ggplot(data=Salinidad,aes(x=pH,y=Biomasa))+geom_point()+theme_bw()
figura4

\(Figura\) \(5.\) Biomasa vs Salinidad

figura5=ggplot(data=Salinidad,aes(x=Salinidad,y=Biomasa))+geom_point()+theme_bw()
figura5

\(Figura\) \(6.\) Biomasa vs Zinc

figura6=ggplot(data=Salinidad,aes(x=Zinc,y=Biomasa))+geom_point()+theme_bw()
figura6

\(Figura\) \(7.\) Biomasa vs Potasio

figura5=ggplot(data=Salinidad,aes(x=Potasio,y=Biomasa))+geom_point()+theme_bw()
figura5

\(Tabla\) \(1.\) Coeficientes de correlación de todas las covariables vs Biomasa

cor(Salinidad,Salinidad$Biomasa)
##                  [,1]
## Biomasa    1.00000000
## pH         0.92810235
## Salinidad -0.06657756
## Zinc      -0.78146249
## Potasio   -0.07319518

\(b.\) Estime el modelo de regresión lineal múltiple para explicar la biomasa en función de las covariables e interprete el valor p, los coeficientes de las variables significativas y el coeficiente \(R^2\).

\(Respuesta:\) En el modelo de regresión lineal múltiple se puede evidenciar que las covariables más significativas para la producción de Biomasa de una planta forrajera son el pH, el Zinc y la Salinidad que se encuentra en el suelo. Los datos para el pH indican que por cada nivel adicional que el pH del suelo se incrementa o se vuleve más básico, la biomasa producida por la planta aumenta en 263 gramos. Por otro lado, los datos para la Salinidad indican que por cada unidad adicional de sales en el suelo, la biomasa producida por la planta disminuye en 33 gramos. Por último, los datos para el Zinc indican que por cada unidad adicional de zinc en el suelo, la biomasa producida por la planta disminuye en 29 gramos.

El valor p obtenido en el modelo de regresión lineal múltiple arroja que los datos son poco probables con una hipótesis nula verdadera, sugiere que se rechaza la hipótesis nula y se concluye que existe relación lineal entre las covariables significativas y la variable respuesta.

El coeficiente \(R^2\) permite medir el ajuste del modeLO. En este caso es de 0.9154, es decir que la variabilidad de la producción de Biomasa se explica aproximadamente en un 91% por el modelo.

mod3=lm(Biomasa~pH+Salinidad+Zinc+Potasio,data=Salinidad)
summary(mod3)
## 
## Call:
## lm(formula = Biomasa ~ pH + Salinidad + Zinc + Potasio, data = Salinidad)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -293.98  -88.83   -9.48   88.20  387.27 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1492.8076   453.6013   3.291 0.002091 ** 
## pH           262.8829    33.7304   7.794 1.51e-09 ***
## Salinidad    -33.4997     8.6525  -3.872 0.000391 ***
## Zinc         -28.9727     5.6643  -5.115 8.20e-06 ***
## Potasio       -0.1150     0.0819  -1.404 0.167979    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared:  0.9231, Adjusted R-squared:  0.9154 
## F-statistic:   120 on 4 and 40 DF,  p-value: < 2.2e-16