Punto 1: Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de O2 por unidad de peso seco del molusco.

Literal a: Realice un análisis exploratorio que permita conocer como es el consumo de oxígeno en las distintas concentraciones de agua de mar. y si estas conclusiones son las mismas para cada tipo de molusco.

#write.table(BD_moluscos, file = "BD_moluscos.txt")
data <- read.table(file = "BD_moluscos.txt", header = TRUE)
head(data)
##   c_agua molusco cons_o
## 1    100       A   7.16
## 2    100       A   8.26
## 3    100       A   6.78
## 4    100       A  14.00
## 5    100       A  13.60
## 6    100       A  11.10
#Boxplot para saber consumo de oxigeno
boxplot(cons_o ~ c_agua+molusco, data = data, col = c("tomato", "lightblue"))

library(RcmdrMisc)
numSummary(data$cons_o, statistics=c("mean", "sd", "quantiles","cv"), type=c("2", "1", "3"), 
           quantiles=c(0, .25, .5, .75, 1), data$molusco)
##        mean       sd        cv  0%   25%  50%     75% 100% data:n
## A 10.000417 3.268661 0.3268525 5.2 7.180 9.74 11.2825 18.8     24
## B  8.609167 4.002435 0.4649039 1.8 5.685 8.06 10.7000 17.7     24
numSummary(data$cons_o, statistics=c("mean", "sd", "quantiles","cv"), type=c("2", "1", "3"), 
           quantiles=c(0, .25, .5, .75, 1), data$c_agua)
##         mean       sd        cv   0%    25%    50%     75% 100% data:n
## 50  12.25062 3.199643 0.2611820 6.38 10.085 11.455 14.5000 18.8     16
## 75   6.99250 2.804093 0.4010144 1.80  5.200  6.430  8.7675 13.2     16
## 100  8.67125 3.000940 0.3460792 3.68  6.140  8.595 10.5750 14.0     16

Análisis:

De acuerdo con el boxplot realizado es posible evidenciar que el molusco B a una concentración de agua de mar al 50% tiene un mayor consumo de oxigeno que el molusco A con la misma concentración de agua de mar y al aumentar la concentración de agua de mar al 75% y 100% en el molusco B este consumo de oxigeno se vuelve menor para este molusco y aumenta para el molusco A.

Adicionalmente, se podría indicar que en promedio el molusco A podría llegar consuir más oxigeno que el molusco B dependiendo de la concentración de agua de mar que tenga cada molusco.

Asimismo, es posible evidenciar que para ambos moluscos cuando la concentración de agua es del 75% el consumo de oxigeno tiende a presentar una leve disminución y cuando esta misma concentración pasa a 50% o a 100% el consuo oxigeno presenta algun aumento.

Literal b: Estime el modelo de diseño de experimentos el cual permita evaluar el efecto de la concentración de agua de mar y los tipos de molusco sobre el consumo de oxigeno. Interprete los coeficientes del modelo, el valor p y realice un post anova de considerarlo necesario para los factores.

mod = lm(data$cons_o~data$c_agua+data$molusco+data$c_agua*data$molusco)
resumen = summary(mod)
resumen
## 
## Call:
## lm(formula = data$cons_o ~ data$c_agua + data$molusco + data$c_agua * 
##     data$molusco)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.8092 -2.2067 -0.1795  2.2469  7.6802 
## 
## Coefficients:
##                           Estimate Std. Error t value Pr(>|t|)    
## (Intercept)               13.35854    2.61316   5.112 6.65e-06 ***
## data$c_agua               -0.04477    0.03362  -1.332    0.190    
## data$moluscoB              2.63063    3.69556   0.712    0.480    
## data$c_agua:data$moluscoB -0.05363    0.04754  -1.128    0.265    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.362 on 44 degrees of freedom
## Multiple R-squared:  0.2198, Adjusted R-squared:  0.1666 
## F-statistic: 4.132 on 3 and 44 DF,  p-value: 0.01151
fm = aov(mod)
summary(fm)
##                          Df Sum Sq Mean Sq F value Pr(>F)   
## data$c_agua               1  102.5  102.50   9.068 0.0043 **
## data$molusco              1   23.2   23.23   2.055 0.1588   
## data$c_agua:data$molusco  1   14.4   14.38   1.272 0.2655   
## Residuals                44  497.3   11.30                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Análisis:

Es posible identificar que dentro del modelo ANOVA unicamente es significativa la variable de concentración de agua, la iteración entre c_agua y molusco no resultó siendo estadisticamente significativa.

par(mfrow=c(2,2))
plot(fm)

mean(fm$residuals)
## [1] -1.029653e-16
shapiro.test(fm$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  fm$residuals
## W = 0.98285, p-value = 0.7005
library(lmtest)
bptest(mod)
## 
##  studentized Breusch-Pagan test
## 
## data:  mod
## BP = 0.658, df = 3, p-value = 0.883

Análisis:

Gráficamente es posible evidenciar normalidad en los residuales y posibilidad de homocedasticidad; tambien es posible confirmar lo anteriormente indicado con las pruebas cuantitativas realizadas con el promedio de los residuales y la prueba de Shapiro Wilks el cual tuvo como resultado un p-value de 0.7005 > 0.05 por lo que se acepta la Ho, lo que determina que efetivamente existe normalidad. Finalmente, tenemosla prueba Breusch-Pagan donde la Ho = Homocedasticidad (los residuos se distibuyen con la misma varianza) y Ha = Heterocedasticidad (los residuos no se distribuyen con la misma varianza), indica con un p-value de 0.883 > 0.05 no se rechaza Ho, por lo que se evidencia que la varianza de los residuos es homocedastica.

Punto 2: Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).

Literal a: Realice un análisis de correlaciones que permita identificar de manera bivariada las relaciones entre las covariables y la respuesta (incluir coeficiente de correlación e interpretaciones).

#write.table(Salinidad, file = "BD_Salinidad.txt")
data2 <- read.table(file = "BD_Salinidad.txt", header = TRUE)
head(data2)
##    Biomasa   pH Salinidad    Zinc Potasio
## 1  765.280 5.00        33 16.4524 1441.67
## 2  954.017 4.70        35 13.9852 1299.19
## 3  827.686 4.20        32 15.3276 1154.27
## 4  755.072 4.40        30 17.3128 1045.15
## 5  896.176 5.55        33 22.3312  521.62
## 6 1422.836 5.50        33 12.2778 1273.02
library(foreign)
library(Factoshiny)
library(factoextra)
library(corrplot)
library(biplotbootGUI)
library(dynBiplotGUI)
library(psych)

pairs.panels(data2)

Análisis:

Es posibe evidenciar que dentro de los diferentes compuestos que componen el suelo para la producción de biomasa en una planta forrajera el PH permite que los gramos de biomasa aumente, sin embargo, un aumento en los componentes como salinidad, zinc y potasio ocasionan una disminusión en la biomasa.

Literal b: Estime el modelo de regresión lineal múltiple para explicar la biomasa en función de las covariables e interprete el valor p, los coeficientes de las variables significativas y el coeficiente R2.

mod2 = lm(data2$Biomasa~data2$pH+data2$Salinidad+data2$Zinc+data2$Potasio)
summary(mod2)
## 
## Call:
## lm(formula = data2$Biomasa ~ data2$pH + data2$Salinidad + data2$Zinc + 
##     data2$Potasio)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -293.98  -88.83   -9.48   88.20  387.27 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     1492.8076   453.6013   3.291 0.002091 ** 
## data2$pH         262.8829    33.7304   7.794 1.51e-09 ***
## data2$Salinidad  -33.4997     8.6525  -3.872 0.000391 ***
## data2$Zinc       -28.9727     5.6643  -5.115 8.20e-06 ***
## data2$Potasio     -0.1150     0.0819  -1.404 0.167979    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared:  0.9231, Adjusted R-squared:  0.9154 
## F-statistic:   120 on 4 and 40 DF,  p-value: < 2.2e-16

Análisis

La ecuación de regresión es \(biomasa = 1492.80 + 262.88\beta_1 - 33.49\beta_2 - 28.97\beta_3\) y el valor de \(R^2 = 0.9231\).

Es posible evidenciar que todas las variables son estadisticamente significativas debido que su p-valor es menor a 0.05 a excepción de la variable Potasio que resulta no ser estadisticamente significativa con un p-valor de 0.167979.

Adicionalmente, para las variables significativas se puede decir que por el aumento en una unidad de pH la biomasa podría aumentar en 262.88 gramos, el aumento de una unidad de salinidad podría impactar la biomasa con una disminusión en 33.49 gramos y un aumento en una unidad de zinc haría disminuir en 28.97 gramos la biomasa.

Finalmente, existe evidencia estadistica de que el modelo explica en un 92.31% la variabilidad de la biomasa de las plantas forrajeras evaluadas.