Regresi Linear Sederhana adalah sebuah regresi linear dengan satu penjelasan variabel. Untuk mempelajari materi ini, kita akan menggunakan data set “Boston” yang berasal dari package MASS di R. Data set Boston memiliki 506 data observasi dari rumah-rumah yang berada di area Boston. Kita upload data set tersebut.

library(MASS)
data(Boston)

kita coba untuk memproses data dibawah

Boston2 <- Boston[1:100,]
fit2 <- lm(medv ~ rm, data=Boston2)
summary(fit2)
## 
## Call:
## lm(formula = medv ~ rm, data = Boston2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.7668 -1.9506  0.3969  2.2360  5.8490 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -41.4283     4.0616  -10.20   <2e-16 ***
## rm           10.2235     0.6495   15.74   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.172 on 98 degrees of freedom
## Multiple R-squared:  0.7166, Adjusted R-squared:  0.7137 
## F-statistic: 247.8 on 1 and 98 DF,  p-value: < 2.2e-16

Kita dapat menampilkan diagram plot dari Summary tersebut dengan menggunakan package ggplot2

require(ggplot2)
## Loading required package: ggplot2
require(ggthemes)
## Loading required package: ggthemes
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'ggthemes'
fit2 <- lm(medv ~ rm, data=Boston2)
ggplot2 <- ggplot() + geom_point(aes(x = Boston2$rm, y = fit2$fitted.values), shape = 1,
alpha = 0.2) + geom_line(data = fortify(fit2),
aes(x = rm, y = .fitted), color = "green") +
geom_segment(aes(x = Boston2$rm, xend = Boston2$rm,
y = fit2$fitted.values, yend = Boston2$medv)) +
geom_point(data = Boston2, aes(x = rm, y = medv), color = "red") 

ggplot2