Regresi Linear Sederhana adalah sebuah regresi linear dengan satu penjelasan variabel. Untuk mempelajari materi ini, kita akan menggunakan data set “Boston” yang berasal dari package MASS di R. Data set Boston memiliki 506 data observasi dari rumah-rumah yang berada di area Boston. Kita upload data set tersebut.
library(MASS)
data(Boston)
kita coba untuk memproses data dibawah
Boston2 <- Boston[1:100,]
fit2 <- lm(medv ~ rm, data=Boston2)
summary(fit2)
##
## Call:
## lm(formula = medv ~ rm, data = Boston2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.7668 -1.9506 0.3969 2.2360 5.8490
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -41.4283 4.0616 -10.20 <2e-16 ***
## rm 10.2235 0.6495 15.74 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.172 on 98 degrees of freedom
## Multiple R-squared: 0.7166, Adjusted R-squared: 0.7137
## F-statistic: 247.8 on 1 and 98 DF, p-value: < 2.2e-16
Kita dapat menampilkan diagram plot dari Summary tersebut dengan menggunakan package ggplot2
require(ggplot2)
## Loading required package: ggplot2
require(ggthemes)
## Loading required package: ggthemes
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'ggthemes'
fit2 <- lm(medv ~ rm, data=Boston2)
ggplot2 <- ggplot() + geom_point(aes(x = Boston2$rm, y = fit2$fitted.values), shape = 1,
alpha = 0.2) + geom_line(data = fortify(fit2),
aes(x = rm, y = .fitted), color = "green") +
geom_segment(aes(x = Boston2$rm, xend = Boston2$rm,
y = fit2$fitted.values, yend = Boston2$medv)) +
geom_point(data = Boston2, aes(x = rm, y = medv), color = "red")
ggplot2