Laporan ini bertujuan untuk menganalisis hubungan antara
kecepatan mobil (speed) dan jarak
berhenti (dist) menggunakan dataset bawaan R yaitu
cars.
data(cars)
head(cars)
## speed dist
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
Struktur data:
str(cars)
## 'data.frame': 50 obs. of 2 variables:
## $ speed: num 4 4 7 7 8 9 10 10 10 11 ...
## $ dist : num 2 10 4 22 16 10 18 26 34 17 ...
Ringkasan statistik:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
Rata-rata kecepatan mobil adalah 15.4 mph.
Rata-rata jarak berhenti adalah 42.98 feet.
plot(cars$speed, cars$dist,
main = "Scatter Plot Speed vs Stopping Distance",
xlab = "Kecepatan (mph)",
ylab = "Jarak Berhenti (feet)",
pch = 19,
col = "blue")
Dari scatter plot terlihat adanya kecenderungan hubungan positif antara kecepatan dan jarak berhenti.
Menghitung koefisien korelasi Pearson:
cor(cars$speed, cars$dist)
## [1] 0.8068949
Uji signifikansi korelasi:
cor.test(cars$speed, cars$dist)
##
## Pearson's product-moment correlation
##
## data: cars$speed and cars$dist
## t = 9.464, df = 48, p-value = 1.49e-12
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.6816422 0.8862036
## sample estimates:
## cor
## 0.8068949
Model regresi linear sederhana secara teoritis dituliskan sebagai:
\[ Y = \beta_0 + \beta_1 X_1 + \varepsilon \]
Dimana:
model <- lm(dist ~ speed, data = cars)
summary(model)
##
## Call:
## lm(formula = dist ~ speed, data = cars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -29.069 -9.525 -2.272 9.215 43.201
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -17.5791 6.7584 -2.601 0.0123 *
## speed 3.9324 0.4155 9.464 1.49e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 15.38 on 48 degrees of freedom
## Multiple R-squared: 0.6511, Adjusted R-squared: 0.6438
## F-statistic: 89.57 on 1 and 48 DF, p-value: 1.49e-12
Persamaan regresi yang diperoleh adalah:
\[ \hat{Y} = -17.58 + 3.93X \]
Artinya:
plot(cars$speed, cars$dist,
main = "Regresi Linear Speed vs Distance",
xlab = "Kecepatan (mph)",
ylab = "Jarak Berhenti (feet)",
pch = 19,
col = "darkgreen")
abline(model, col = "red", lwd = 2)
Nilai R-squared dari model adalah:
0.651
Artinya, sebesar 65.1% variasi jarak berhenti dapat dijelaskan oleh kecepatan mobil.
Berdasarkan hasil analisis korelasi dan regresi, terdapat hubungan positif antara kecepatan mobil dan jarak berhenti. Semakin tinggi kecepatan mobil, semakin besar jarak yang dibutuhkan untuk berhenti.