Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (gr) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (respuesta Y) y se registraron las características (covariables X) del suelo en el que crecía (pH, Salinidad, Zinc y Potasio).
load("E:/Data Science/Estadistica/Salinidad.RData")
Salinidad <- Salinidad
head(Salinidad)
## Biomasa pH Salinidad Zinc Potasio
## 1 765.280 5.00 33 16.4524 1441.67
## 2 954.017 4.70 35 13.9852 1299.19
## 3 827.686 4.20 32 15.3276 1154.27
## 4 755.072 4.40 30 17.3128 1045.15
## 5 896.176 5.55 33 22.3312 521.62
## 6 1422.836 5.50 33 12.2778 1273.02
A. Realice un análisis de correlaciones que permita identificar de manera bivariada las relaciones entre las covariables y la respuesta (incluir coeficiente de correlación e interpretaciones)
## Biomasa pH Salinidad Zinc
## Min. : 369.8 Min. :3.200 Min. :24.00 Min. : 0.2105
## 1st Qu.: 654.8 1st Qu.:3.450 1st Qu.:27.00 1st Qu.:13.9852
## Median : 991.8 Median :4.450 Median :30.00 Median :19.2420
## Mean :1082.2 Mean :4.609 Mean :30.27 Mean :17.8308
## 3rd Qu.:1346.9 3rd Qu.:5.350 3rd Qu.:33.00 3rd Qu.:22.6758
## Max. :2337.3 Max. :7.450 Max. :38.00 Max. :31.2865
## Potasio
## Min. : 350.7
## 1st Qu.: 527.0
## Median : 773.3
## Mean : 797.4
## 3rd Qu.: 954.1
## Max. :1441.7
## Biomasa pH Salinidad Zinc Potasio
## Biomasa 1.00000000 0.92810235 0.06657756 0.78146249 0.07319518
## pH 0.92810235 1.00000000 0.04458851 0.72046995 0.03236212
## Salinidad 0.06657756 0.04458851 1.00000000 0.42663388 0.01963288
## Zinc 0.78146249 0.72046995 0.42663388 1.00000000 0.07877268
## Potasio 0.07319518 0.03236212 0.01963288 0.07877268 1.00000000
De acuerdo con los graficos de correlacion se encuentra una correlacion positiva de Biomasa con PH (0,93) y altas correlaciones negativas entre Zinc con Biomasa (-0,78) y Zinc con PH (-0,72). entre Zinc y salinidad hay un correlación media negativa (-0,43)
B. Estime el modelo de regresión lineal múltiple para explicar la biomasa en función de las covariables e interprete el valor p, los coeficientes de las variables significativas y el coeficiente R2.
ModBiomasa <- lm (Biomasa ~. , data=Salinidad)
summary(ModBiomasa)
##
## Call:
## lm(formula = Biomasa ~ ., data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -293.98 -88.83 -9.48 88.20 387.27
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1492.8076 453.6013 3.291 0.002091 **
## pH 262.8829 33.7304 7.794 1.51e-09 ***
## Salinidad -33.4997 8.6525 -3.872 0.000391 ***
## Zinc -28.9727 5.6643 -5.115 8.20e-06 ***
## Potasio -0.1150 0.0819 -1.404 0.167979
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 158.9 on 40 degrees of freedom
## Multiple R-squared: 0.9231, Adjusted R-squared: 0.9154
## F-statistic: 120 on 4 and 40 DF, p-value: < 2.2e-16
se encuentra en el modelo con todas las variables que el potasion no presenta significancia, por se plantea el siguiente modelo sin considerar esta variable
ModBiomasa2 <- lm (Biomasa ~pH+Salinidad+Zinc , data=Salinidad)
summary(ModBiomasa2)
##
## Call:
## lm(formula = Biomasa ~ pH + Salinidad + Zinc, data = Salinidad)
##
## Residuals:
## Min 1Q Median 3Q Max
## -363.42 -107.14 8.51 78.33 398.36
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1502.349 458.894 3.274 0.00216 **
## pH 255.008 33.653 7.578 2.55e-09 ***
## Salinidad -34.800 8.704 -3.998 0.00026 ***
## Zinc -30.408 5.637 -5.394 3.13e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 160.8 on 41 degrees of freedom
## Multiple R-squared: 0.9193, Adjusted R-squared: 0.9134
## F-statistic: 155.7 on 3 and 41 DF, p-value: < 2.2e-16
El modelo presentando es el siguiente:
\(Biomasa=1502,349 + 255,008*pH -34,8*Salinidad -30,408*Zinc\)
de acuerdo con los coeficientes no es posible interpretar el intercepto de 1502 puesto que las variables como el pH, salinidad no consideran el valor cero en los datos utilizados. \(beta_1=255\) nos indica que por cada unidad que aumenta el ph, la biomasa se incrementa en 255 \(beta_2=.34,8\) indica que por cada unidad que aumenta la salinidad, la biomasa disminuye en 34,8 \(beta_3=.30,4\) Indica que por cada unidad que aumenta el Zinc, la Biomasa disminuye 30,4
par(mfrow=c(2,2))
plot(ModBiomasa2)