## Warning: Continuous x aesthetic -- did you forget aes(group=...)?
De acuerdo con la primera gráfica, el consumo de oxígeno por parte de los moluscos tiende a ser mayor cuando la concentración de agua de mar no es tan alta (50%), ya que se observa que la mayoría de los datos se encuentra por encima de 10. Por otro lado, el grupo de los moluscos que fueron tratados en una concentración del 100% fue el segundo grupo con más consumo de oxígeno, estando la mitad de los datos por encima de 8.6. Finalmente, el grupo de moluscos con concentraciones del 75% presentó una tendencia a un consumo menor, pues el rango de valores en el que se ubican los datos es el más bajo (valor máximo=13.2 y mediana=6.43), por lo que no hay una clara relación inversa entre la concentración de agua y el consumo de oxígeno.
Ahora bien, si dividimos los resultados según el tipo de molusco, se evidencia que todavía persiste esa tendencia de: 50% mayor consumo, luego 100% y por último 75%. No obstante, se pueden detallar algunas diferencias entre el tipo A y B, por ejemplo la variación en los datos de los moluscos tipo A no es tan alta como en los tipo B, además, el valor máximo de todos los datos pertenece a un molusco A mientras que el más bajo es de uno B. También cabe resaltar que la mediana en los moluscos B tanto de 75% como de 100% son bastante cercanos.
##
## Call:
## lm(formula = cons_o ~ BD_moluscos$c_agua + molusco)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.1750 -1.9877 -0.7019 2.1244 6.1450
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 12.9463 0.8521 15.193 < 2e-16 ***
## BD_moluscos$c_agua75 -5.2581 1.0436 -5.038 8.49e-06 ***
## BD_moluscos$c_agua100 -3.5794 1.0436 -3.430 0.00132 **
## moluscoB -1.3913 0.8521 -1.633 0.10966
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.952 on 44 degrees of freedom
## Multiple R-squared: 0.3986, Adjusted R-squared: 0.3575
## F-statistic: 9.719 on 3 and 44 DF, p-value: 4.866e-05
Modelo de regresión lineal: \(y=12.9463-5.2581x_1-3.5794x_2-1.3913x_3\)
Para la estimación de este modelo se usaron como datos base la concentración de 50% y los moluscos tipo A ya que los valores de dichas variables se deben de tomar como factores. Teniendo en cuenta lo anterior, el valor del intercepto (12.9463) representa la media en el consumo de oxígeno cuando un molusco A está en una concentración de agua de mar del 50%, el cual es muy significativo porque el valor p es menor a 2e-16. Por otra parte, el \(\beta\) para c_agua75 quiere decir que al 75% de concentración el consumo de oxígeno se reduce en -5.2581 con respecto al 50% y su valor p (8.49e-06) confirma que es altamente influyente en la variable respuesta del modelo. Sobre c_agua100, la interpretación en similar pues da a entender que el consumo baja en -3.5794 con una concentración de 100% en comparación con 50% y su valor p (0.00132) demuestra que tiene un buen nivel de significancia pero no tan alto como el de los casos anteriores.
Por último, el estimado para molusco B es -1.3913 y denota que en moluscos tipo B el consumo disminuye en -1.3913 con respecto a los moluscos A, sin embargo, en este caso el valor de p es muy elevado (0.10966), lo cual quiere decir que el tipo de molusco se trata de una variable que no supone un cambio muy significativo en el modelo, en otras palabras, no hay mucha diferencia entre un molusco A y uno B que estén bajo los mismos tratamientos.
## Analysis of Variance Table
##
## Response: cons_o
## Df Sum Sq Mean Sq F value Pr(>F)
## BD_moluscos$c_agua 2 230.82 115.408 13.2457 3.14e-05 ***
## molusco 1 23.23 23.227 2.6658 0.1097
## Residuals 44 383.37 8.713
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## $statistics
## MSerror Df Mean CV t.value LSD
## 8.712897 44 9.304792 31.72303 2.015368 2.103248
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none BD_moluscos$c_agua 3 0.05
##
## $means
## cons_o std r LCL UCL Min Max Q25 Q50 Q75
## 100 8.67125 3.000940 16 7.184029 10.158471 3.68 14.0 6.140 8.595 10.5750
## 50 12.25062 3.199643 16 10.763404 13.737846 6.38 18.8 10.085 11.455 14.5000
## 75 6.99250 2.804093 16 5.505279 8.479721 1.80 13.2 5.200 6.430 8.7675
##
## $comparison
## NULL
##
## $groups
## cons_o groups
## 50 12.25062 a
## 100 8.67125 b
## 75 6.99250 b
##
## attr(,"class")
## [1] "group"
Debido a que el análisis ANOVA indicó que hay una diferencia significativa entre las medias del consumo de oxígeno según la concentración de agua de mar, es pertinente realizar un post-ANOVA de este tratamiento, el cual reúne en un mismo grupo a 75 y 100 mientras que el de 50 quedó solo en otro grupo, esto da a entender que 75 y 100 tienen una similitud alta en cuanto a valores de consumo de oxígeno se refiere y que 50 está más distanciado de ellos.
## The following object is masked _by_ .GlobalEnv:
##
## Salinidad
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Para el caso del pH: 0.9281023
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Para el caso de la salinidad: -0.06657756
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Para el caso del potasio: -0.07319518
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Para el caso del zinc: -0.7814625
En la primera gráfica se evidencia una relación aproximadamente lineal entre el tratamiento de pH y la variable de respuesta (biomasa), lo cual se confirma mediante el coeficiente de correlación (0.928), pues este indica el grado de relación que existe entre dos variables cuantitativas. Para el caso de la salinidad, la relación con la biomasa es bastante débil, ya que la distribución de los puntos no es muy clara y esto se interpreta en el coeficiente como un valor cercano a cero.
De igual forma, tampoco existe una relación bien definida con la variable potasio, esto se refleja en el coeficiente de correlación como un valor de -0.073. En cambio, el caso del zinc se asemeja un poco más al del pH, puesto que la correlación es de 0.781, es decir, la relación es más fuerte y la línea de tendencia de la gráfica está mejor definida que la del potasio y salinidad aunque no tanto como la del pH.
##
## Call:
## lm(formula = Biomasa ~ pH + Sali + Zinc + Potasio)
##
## Residuals:
## Min 1Q Median 3Q Max
## -293.98 -88.83 -9.48 88.20 387.27
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1492.8076 453.6013 3.291 0.002091 **
## pH 262.8829 33.7304 7.794 1.51e-09 ***
## Sali -33.4997 8.6525 -3.872 0.000391 ***
## Zinc -28.9727 5.6643 -5.115 8.20e-06 ***
## Potasio -0.1150 0.0819 -1.404 0.167979
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared: 0.9231, Adjusted R-squared: 0.9154
## F-statistic: 120 on 4 and 40 DF, p-value: < 2.2e-16
Modelo: \(biomasa=1492.807+262.8829*pH-33.4997*Salinidad-28.9727*Zinc-0.1150*Potasio\)
En primer lugar, al revisar el valor de \(R^2\) (0.9231) se puede decir que la estimación del modelo es bastante cofiable, pues la función generada se ajusta a los datos en un 92.31%, es decir, sirve para predecir los valores con una buena precisión.
En cuanto al nivel de significancia de las variables independientes, el modelo señala que el pH, el zinc y la salinidad son las más significativas en ese mismo orden, pues el valor p en cada caso es menor a 0.05 (1.51e-09, 8.20e-06 y 0.000391 respectivamente) mientras que el potasio no representa una variable altamente influyente en el modelo (p-value=0.167979).
Sobre el \(\beta\) que acompaña cada variable significativa, el del pH muestra que la biomasa aumenta 262.8829 por cada unidad que incrementa el pH (relación positiva), por el contrario, la salinidad y el zinc presentan relaciones negativas, debido a que por cada unidad que suba la salinidad, la biomasa disminuye 33.4997 y también se reduce en 28.9727 cuando el nivel de zinc aumenta una unidad.