require(faraway)
## Loading required package: faraway
require(ggplot2)
## Loading required package: ggplot2
require(plotly)
## Loading required package: plotly
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
data("cornnit")
cornnit
## yield nitrogen
## 1 115 0
## 2 128 75
## 3 136 150
## 4 135 300
## 5 97 0
## 6 150 75
## 7 154 150
## 8 156 300
## 9 95 0
## 10 121 75
## 11 120 150
## 12 134 300
## 13 91 0
## 14 124 75
## 15 145 150
## 16 135 300
## 17 105 0
## 18 140 50
## 19 138 100
## 20 139 200
## 21 47 0
## 22 140 50
## 23 132 100
## 24 151 200
## 25 66 0
## 26 109 50
## 27 136 100
## 28 144 200
## 29 86 0
## 30 135 50
## 31 139 100
## 32 150 200
## 33 100 0
## 34 146 50
## 35 148 100
## 36 168 200
## 37 68 0
## 38 116 50
## 39 146 100
## 40 122 200
## 41 104 0
## 42 142 50
## 43 140 100
## 44 141 200
#Datos sobre la relación que se tiene en la producción de maíz a partir de la concentración de nitrógeno
Se presentan dos variabales: yield (respuesta) y nitrogen (predictora)
g1=ggplot(data=cornnit,aes(x=nitrogen,y=yield))+geom_point()+theme_bw()
g1
g2=ggplot(data=cornnit,aes(x=nitrogen,y=yield))+geom_point()+theme_bw()+geom_smooth()
g2
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
g3=ggplot(data=cornnit,aes(x=nitrogen,y=yield))+geom_point()+theme_bw()+geom_smooth(method = "lm")
g3
## `geom_smooth()` using formula 'y ~ x'
ggplotly(g3)
## `geom_smooth()` using formula 'y ~ x'
cor(cornnit)
## yield nitrogen
## yield 1.0000000 0.6294562
## nitrogen 0.6294562 1.0000000
Se observa una relación directa entre la aplicación de nitrógeno y el rendimiento o producción de maíz, aunque no se haya presentado una regresión totalmente lineal. El coeficiente de correlación arrojó un valor de 0.629, lo cual indica una relación medianamente fuerte.
mod= lm(yield~nitrogen,data = cornnit)
summary(mod)
##
## Call:
## lm(formula = yield ~ nitrogen, data = cornnit)
##
## Residuals:
## Min 1Q Median 3Q Max
## -60.439 -10.939 1.534 14.082 29.697
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 107.43864 4.66622 23.02 < 2e-16 ***
## nitrogen 0.17730 0.03377 5.25 4.71e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.53 on 42 degrees of freedom
## Multiple R-squared: 0.3962, Adjusted R-squared: 0.3818
## F-statistic: 27.56 on 1 and 42 DF, p-value: 4.713e-06
Ecuación general de la regresión \(y_i=\beta_0+\beta_1*x_i+e_i\)
Ecuación presentada para este modelo \(y_i= 107.43+0.177*nitrogen+e_i\)
El \(\beta_0=0.177\) indica que por cada adición de nitrógeno, la producción de maíz aumenta en 0.177 El \(\beta_1=107.43\) se puede interpretar y por lo tanto, no indica cuando no se aplica nitrógeno el rendimiento es de 107.43
El \(\beta_0 y \beta_1\) son significativos. La variable nitrógeno sí explica el rendimiento
El ajuste del modelo lanza un indicador denominado R cuadrado ( \(R^2=0.396\)).Por lo tanto, se dice que el modelo explica el 40%, aproximadamente, de los datos presentados.
De acuerdo con el modelo, ¿ cuál es el rendimiento promedio del maíz si aplicamos 210 de nitrógeno?
predict(mod, list(nitrogen=210))
## 1
## 144.6709
predict(mod, list(nitrogen=210), interval = "confidence", level= 0.95) #Se utiliza para hacer un aproximado de la variación que puede tomar dicho valor
## fit lwr upr
## 1 144.6709 135.0908 154.2511
Se espera que el rendimiento promedio sea de 144.6 o pueda estar entre 135 y 154.2 con un intervalo de confianza de 95%.