Biomasa

Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).

load("E:/Data Science/Estadistica/Salinidad.RData")
Salinidad <- Salinidad
head(Salinidad)
##    Biomasa   pH Salinidad    Zinc Potasio
## 1  765.280 5.00        33 16.4524 1441.67
## 2  954.017 4.70        35 13.9852 1299.19
## 3  827.686 4.20        32 15.3276 1154.27
## 4  755.072 4.40        30 17.3128 1045.15
## 5  896.176 5.55        33 22.3312  521.62
## 6 1422.836 5.50        33 12.2778 1273.02

A. Realice un análisis de correlaciones que permita identificar de manera bivariada las relaciones entre las covariables y la respuesta (incluir coeficiente de correlación e interpretaciones)

##     Biomasa             pH          Salinidad          Zinc        
##  Min.   : 369.8   Min.   :3.200   Min.   :24.00   Min.   : 0.2105  
##  1st Qu.: 654.8   1st Qu.:3.450   1st Qu.:27.00   1st Qu.:13.9852  
##  Median : 991.8   Median :4.450   Median :30.00   Median :19.2420  
##  Mean   :1082.2   Mean   :4.609   Mean   :30.27   Mean   :17.8308  
##  3rd Qu.:1346.9   3rd Qu.:5.350   3rd Qu.:33.00   3rd Qu.:22.6758  
##  Max.   :2337.3   Max.   :7.450   Max.   :38.00   Max.   :31.2865  
##     Potasio      
##  Min.   : 350.7  
##  1st Qu.: 527.0  
##  Median : 773.3  
##  Mean   : 797.4  
##  3rd Qu.: 954.1  
##  Max.   :1441.7

##              Biomasa         pH  Salinidad       Zinc    Potasio
## Biomasa   1.00000000 0.92810235 0.06657756 0.78146249 0.07319518
## pH        0.92810235 1.00000000 0.04458851 0.72046995 0.03236212
## Salinidad 0.06657756 0.04458851 1.00000000 0.42663388 0.01963288
## Zinc      0.78146249 0.72046995 0.42663388 1.00000000 0.07877268
## Potasio   0.07319518 0.03236212 0.01963288 0.07877268 1.00000000

De acuerdo con los graficos de correlacion se encuentra una correlacion positiva de Biomasa con PH (0,93) y altas correlaciones negativas entre Zinc con Biomasa (-0,78) y Zinc con PH (-0,72). entre Zinc y salinidad hay un correlación media negativa (-0,43)

B. Estime el modelo de regresión lineal múltiple para explicar la biomasa en función de las covariables e interprete el valor p, los coeficientes de las variables significativas y el coeficiente R2.

ModBiomasa <- lm (Biomasa ~. , data=Salinidad)
summary(ModBiomasa)
## 
## Call:
## lm(formula = Biomasa ~ ., data = Salinidad)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -293.98  -88.83   -9.48   88.20  387.27 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1492.8076   453.6013   3.291 0.002091 ** 
## pH           262.8829    33.7304   7.794 1.51e-09 ***
## Salinidad    -33.4997     8.6525  -3.872 0.000391 ***
## Zinc         -28.9727     5.6643  -5.115 8.20e-06 ***
## Potasio       -0.1150     0.0819  -1.404 0.167979    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared:  0.9231, Adjusted R-squared:  0.9154 
## F-statistic:   120 on 4 and 40 DF,  p-value: < 2.2e-16

se encuentra en el modelo con todas las variables que el potasion no presenta significancia, por se plantea el siguiente modelo sin considerar esta variable

ModBiomasa2 <- lm (Biomasa ~pH+Salinidad+Zinc , data=Salinidad)
summary(ModBiomasa2)
## 
## Call:
## lm(formula = Biomasa ~ pH + Salinidad + Zinc, data = Salinidad)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -363.42 -107.14    8.51   78.33  398.36 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1502.349    458.894   3.274  0.00216 ** 
## pH           255.008     33.653   7.578 2.55e-09 ***
## Salinidad    -34.800      8.704  -3.998  0.00026 ***
## Zinc         -30.408      5.637  -5.394 3.13e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 160.8 on 41 degrees of freedom
## Multiple R-squared:  0.9193, Adjusted R-squared:  0.9134 
## F-statistic: 155.7 on 3 and 41 DF,  p-value: < 2.2e-16

El modelo presentando es el siguiente:

\(Biomasa=1502,349 + 255,008*pH -34,8*Salinidad -30,408*Zinc\)

de acuerdo con los coeficientes no es posible interpretar el intercepto de 1502 puesto que las variables como el pH, salinidad no consideran el valor cero en los datos utilizados. \(beta_1=255\) nos indica que por cada unidad que aumenta el ph, la biomasa se incrementa en 255 \(beta_2=.34,8\) indica que por cada unidad que aumenta la salinidad, la biomasa disminuye en 34,8 \(beta_3=.30,4\) Indica que por cada unidad que aumenta el Zinc, la Biomasa disminuye 30,4

par(mfrow=c(2,2))
plot(ModBiomasa2)