Regresi Linear Sederhana adalah sebuah regresi linear dengan satu penjelasan variabel. Untuk mempelajari materi ini, kita akan menggunakan data set “Boston” yang berasal dari package MASS di R. Data set Boston memiliki 506 data observasi dari rumah-rumah yang berada di area Boston. Kita upload data set tersebut.

library(MASS)
data(Boston)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3

kita coba untuk memproses data dibawah

Boston2 <- Boston[1:100,]
fit2 <- lm(medv ~ rm, data=Boston2)
summary(fit2)
## 
## Call:
## lm(formula = medv ~ rm, data = Boston2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.7668 -1.9506  0.3969  2.2360  5.8490 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -41.4283     4.0616  -10.20   <2e-16 ***
## rm           10.2235     0.6495   15.74   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.172 on 98 degrees of freedom
## Multiple R-squared:  0.7166, Adjusted R-squared:  0.7137 
## F-statistic: 247.8 on 1 and 98 DF,  p-value: < 2.2e-16

kita dapat menampilkan diagram plot dari summary tersebut dengan menggunakan package ggplot2

require(ggplot2)
require(ggthemes)
## Loading required package: ggthemes
## Warning: package 'ggthemes' was built under R version 4.2.3
fit2 <- lm(medv ~ rm, data=Boston2)
ggplot2 <- ggplot() +
geom_point(aes(x = Boston2$rm, y = fit2$fitted.values), shape = 1,
alpha = 0.2) + geom_line(data = fortify(fit2),
aes(x = rm, y = .fitted), color = "green") +
geom_segment(aes(x = Boston2$rm, xend = Boston2$rm,
y = fit2$fitted.values, yend = Boston2$medv)) +
geom_point(data = Boston2, aes(x = rm, y = medv), color = "red") +
theme_tufte()
ggplot2