Tarea - Regresión lineal simple

Repetir los puntos del 1 al 3 con x=pH y x=Zinc

  1. Ajuste un modelo para la variable y=Biomasa en función de x.
  2. Interpretar b1. ¿Se puede interpretar b0?
  3. Construir un intervalo de confianza para b1 al 95%, interpretarlo y concluir si x es significativa en el modelo.
load("C:/Users/Claudia Gallo/Desktop/Bioestadistica/Salinidad.RData")
Salinidad
##     Biomasa   pH Salinidad    Zinc Potasio
## 1   765.280 5.00        33 16.4524 1441.67
## 2   954.017 4.70        35 13.9852 1299.19
## 3   827.686 4.20        32 15.3276 1154.27
## 4   755.072 4.40        30 17.3128 1045.15
## 5   896.176 5.55        33 22.3312  521.62
## 6  1422.836 5.50        33 12.2778 1273.02
## 7   821.069 4.25        36 17.8225 1346.35
## 8  1008.804 4.45        30 14.3516 1253.88
## 9  1306.494 4.75        38 13.6826 1242.65
## 10 1039.637 4.60        30 11.7566 1282.95
## 11 1193.223 4.10        30  9.8820  553.69
## 12  777.474 3.45        37 16.6752  494.74
## 13  818.127 3.45        33 12.3730  526.97
## 14 1203.568 4.10        36  9.4058  571.14
## 15  977.515 3.50        30 14.9302  408.64
## 16  369.823 3.25        30 31.2865  646.65
## 17  509.872 3.25        27 30.1652  514.03
## 18  448.315 3.20        29 28.5901  350.73
## 19  615.091 3.35        34 17.8795  496.29
## 20  545.538 3.30        36 18.5056  580.92
## 21  436.552 3.25        30 22.1344  535.82
## 22  465.907 3.25        28 28.6101  490.34
## 23  664.601 3.20        31 23.1908  552.39
## 24  502.466 3.20        31 24.6917  661.32
## 25  496.797 3.35        35 22.6758  672.12
## 26 2270.294 7.10        29  0.3729  525.65
## 27 2332.220 7.35        35  0.2703  563.13
## 28 2162.531 7.45        35  0.3205  497.96
## 29 2222.588 7.45        30  0.2648  458.38
## 30 2337.326 7.40        30  0.2105  498.25
## 31 1349.192 4.85        26 18.9875  936.26
## 32 1058.976 4.60        29 20.9687  894.79
## 33 1408.206 5.20        25 23.9841  941.36
## 34 1491.276 4.75        26 19.9727 1038.79
## 35 1254.872 5.20        26 21.3864  898.05
## 36 1152.341 4.55        25 23.7063  989.87
## 37  568.455 3.95        26 30.5589  951.28
## 38  612.447 3.70        26 26.8415  929.83
## 39  654.825 3.75        27 27.7292  925.42
## 40  991.829 4.15        27 21.5699  954.11
## 41 1895.942 5.60        24 19.6531  720.72
## 42 1346.880 5.35        27 20.3295  782.09
## 43 1482.793 5.50        26 19.5880  773.30
## 44 1145.643 5.50        28 20.1328  829.26
## 45 1137.193 5.40        28 19.2420  856.96

x=pH

attach(Salinidad)
## The following object is masked _by_ .GlobalEnv:
## 
##     Salinidad
plot(pH,Biomasa)+title("Relación entre la biomasa y el pH del suelo")
## integer(0)
modelo_pH=lm(Biomasa~pH)
abline(modelo_pH,col="red")

summary(modelo_pH)
## 
## Call:
## lm(formula = Biomasa ~ pH)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -566.28  -89.26  -19.42  142.42  413.28 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -780.18     117.99  -6.612  4.7e-08 ***
## pH            404.08      24.72  16.346  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 205.7 on 43 degrees of freedom
## Multiple R-squared:  0.8614, Adjusted R-squared:  0.8582 
## F-statistic: 267.2 on 1 and 43 DF,  p-value: < 2.2e-16
x1=pH
y1=Biomasa
b1_pH=404.08
Sxx1=sum((x1-mean(x1))^2)
sigma2_pH=sum((y1-modelo_pH$fitted.values)^2)/43
t=qt(p=0.975,df=43)

error_estandar_1=t*sqrt(sigma2_pH/Sxx1)

b1_pH=404.08 representa que por cada nivel adicional que el pH del suelo se incrementa o se vuleve más básico, la biomasa producida por la planta aumenta en 404.08 gramos. Teniendo en cuenta la gráfica de puntos obtenida no se puede interpretar b0 porque no hay un valor igual a cero (0).

limite_inferior_pH=b1_pH-error_estandar_1
limite_superior_pH=b1_pH+error_estandar_1
c(limite_inferior_pH,limite_superior_pH)
## [1] 354.2262 453.9338

El intervalo de confianza obtenido generaliza el resultado de b1_pH. Esto quiere decir que el valor real de b1_pH se encuentra entre 354.2262 y 453.9338. Este intervalo de confianza representa que por cada nivel adicional que el pH del suelo se incrementa o se vuelve más básico, la biomasa producida por la planta aumenta entre 354.2262 y 453.9338 gramos. Como en el intervalo de confianza no se encuentra el cero (0) se concluye que b1_pH no puede ser cero (0), es decir que el pH es significativo en el modelo (sí se relaciona con la biomasa).

x=Zinc

attach(Salinidad)
## The following object is masked _by_ .GlobalEnv:
## 
##     Salinidad
## The following objects are masked from Salinidad (pos = 3):
## 
##     Biomasa, pH, Potasio, Salinidad, Zinc
plot(Zinc,Biomasa)+title("Relación entre la biomasa y el zinc presente en el suelo")
## integer(0)
modelo_Zinc=lm(Biomasa~Zinc)
abline(modelo_Zinc,col="red")

summary(modelo_Zinc)
## 
## Call:
## lm(formula = Biomasa ~ Zinc)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -545.6 -313.3   10.3  234.1  907.8 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 2002.147    123.247  16.245  < 2e-16 ***
## Zinc         -51.595      6.282  -8.213 2.37e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 344.8 on 43 degrees of freedom
## Multiple R-squared:  0.6107, Adjusted R-squared:  0.6016 
## F-statistic: 67.45 on 1 and 43 DF,  p-value: 2.373e-10
x2=Zinc
y2=Biomasa
b1_Zinc=-51.595
Sxx2=sum((x2-mean(x2))^2)
sigma2_Zinc=sum((y2-modelo_Zinc$fitted.values)^2)/43
t=qt(p=0.975,df=43)

error_estandar_2=t*sqrt(sigma2_Zinc/Sxx2)

b1_Zinc=-51.595 representa que por cada gramo adicional que el zinc se incrementa en el suelo, la biomasa producida por la planta disminuye en 51.595 gramos. Teniendo en cuenta la gráfica de puntos obtenida no se puede interpretar b0 porque no hay un valor igual a cero (0).

limite_inferior_Zinc=b1_Zinc-error_estandar_2
limite_superior_Zinc=b1_Zinc+error_estandar_2
c(limite_inferior_Zinc,limite_superior_Zinc)
## [1] -64.26433 -38.92567

El intervalo de confianza obtenido generaliza el resultado de b1_Zinc. Esto quiere decir que el valor real de b1_Zinc se encuentra entre -64.26433 y -38.92567. Este intervalo de confianza representa que por cada gramo adicional que el zinc se incrementa en el suelo, la biomasa producida por la planta disminuye entre 64.26433 y 38.92567 gramos. Como en el intervalo de confianza no se encuentra el cero (0) se concluye que b1_Zinc no puede ser cero (0), es decir que el Zinc es significativo en el modelo (sí se relaciona con la biomasa).