Seorang peneliti melakukan penelitian untuk melihat ada tidaknya pengaruh ukuran rumah (x1) dan umur bangunan rumah (x2) terhadap harga jual rumah (y) tersebut. berikut merupakan data yang berhasil didapatkan :
| Rumah ke- | Ukuran Rumah (x1) | Umur Bangunan (x2) | Harga Jual Rumah (y) |
|---|---|---|---|
| 1 | 1.8 | 30 | 32 |
| 2 | 1.0 | 33 | 24 |
| 3 | 1.7 | 25 | 27 |
| 4 | 2.8 | 12 | 47 |
| 5 | 2.2 | 26 | 35 |
| 6 | 0.8 | 25 | 17 |
| 7 | 3.6 | 28 | 52 |
| 8 | 1.1 | 29 | 20 |
| 9 | 2.0 | 25 | 38 |
| 10 | 2.6 | 2 | 45 |
| 11 | 2.3 | 30 | 44 |
| 12 | 0.9 | 23 | 19 |
| 13 | 1.2 | 12 | 25 |
| 14 | 3.4 | 33 | 50 |
| 15 | 1.7 | 1 | 30 |
| 16 | 2.5 | 12 | 43 |
| 17 | 1.4 | 17 | 27 |
| 18 | 3.3 | 16 | 50 |
| 19 | 2.2 | 22 | 37 |
| 20 | 1.5 | 29 | 28 |
Sebelum melakukan analisis lebih jauh lagi, pertama-tama yang akan dilakukan ialah mendeskripsikan data agar kita tahu bagaimana karakteristik data yang telah diperoleh. Pertama-tama panggil data terlebih dahulu.
datarumah=read.csv("D:/Belajar/Semester 7/Bisnis Analitik/Kumpulan Tugas/datarumah.csv",sep=";",header=TRUE)
Langkah pertama yang dilakukan dalam analisis regresi sederhana ialah mendeskripsikan karakteristik data.
summary(datarumah)
## UkuranRumah UmurBangunan HargaJualRumah
## Min. :0.800 Min. : 1.0 Min. :17.00
## 1st Qu.:1.350 1st Qu.:15.0 1st Qu.:26.50
## Median :1.900 Median :25.0 Median :33.50
## Mean :2.000 Mean :21.5 Mean :34.50
## 3rd Qu.:2.525 3rd Qu.:29.0 3rd Qu.:44.25
## Max. :3.600 Max. :33.0 Max. :52.00
Berdasarkan visualisasi diatas dapat kita lihat bahwa :
Diduga variabel Ukuran Rumah dengan Variabel Harga Jual Rumah memiliki hubungan yang linier ditinjau dari bentuk plot yang membentuk garis lurus
Diduga tidak terdapat hubungan yang linier antara variabel Umur Bangunan dengan variabel Harga Jual Rumah karena plot tidak acak atau tidak menyerupai garis lurus.
Diduga tidak terdapat hubungan antar variabel prediktor yaitu variabel Ukuran Rumah dengan Umur Bangunan sehingga dapat dikatakan tidak terdapat kasus multikolinieritas melihat scatterplot antara variabel Ukuran Rumah dengan variabel Umur bangunan yang acak dan tidak berpola.
Selanjutnya dengan menggunakan scatterplot, secara visualisasi akan dilakukan identifikasi terhadap adanya hubungan atau tidak antara variabel respon dengan masing-masing variabel prediktornya.
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.5.0
## Warning in fun(libname, pkgname): bytecode version mismatch; using eval
g=ggplot(datarumah,aes(UkuranRumah,HargaJualRumah))
g+geom_point()+geom_smooth(method="lm",se=T)
Berdasarkan pola diatas dimana titik-titik membentuk suatu garis lurus, diduga variabel Ukuran Rumah memiliki hubungan dengan Variabel Harga Jual Rumah dengan standar error yang kecil.
library(ggplot2)
g=ggplot(datarumah,aes(UmurBangunan,HargaJualRumah))
g+geom_point()+geom_smooth(method="lm",se=T)
Berdasarkan pola diatas, sapat dilihat bahwa plot yang random menandakan tidak ada hubungan antara variabel Umur Bangunan dengan Harga Jual Rumah dan standar error nya juga cukup besar.
Analisis korelasi merupakan salah satu analisis yang penting dilakukan untuk mengetahui apakah tiap variabel prediktor berpengaruh signifikan terhadap variabel respon. berikut merupakan hasil analisisnya.
Untuk Variabel Ukuran Rumah :
\(\text{H}_0: \rho=0\) Tidak Terdapat Hubungan yang Signfikan antara variabel Ukuran Rumah dengan Harga Jual Rumah
\(\text{H}_1: \rho \neq0\) Terdapat Hubungan yang Signfikan antara variabel Ukuran Rumah dengan Harga Jual Rumah
Untuk Variabel Umur Bangunan :
\(\text{H}_0: \rho=0\) Tidak Terdapat Hubungan yang Signfikan antara variabel Umur Bangunan dengan Harga Jual Rumah
\(\text{H}_1: \rho \neq0\) Terdapat Hubungan yang Signfikan antara variabel Umur Bangunan dengan Harga Jual Rumah
\(\alpha =5\%\)
\(\text{t} = \frac{r^2\sqrt{\text{n}-2}}{\sqrt{1-r^2}}\)
\(r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}}\)
Tolak \(\text{H}_0\) jika:
\(t_{hitung} > t_{\alpha,n-2}\) dengan \(t_{\alpha,n-2}\) adalah nilai kritis dari tabel distribusi t dengan derajat bebas \(n-2\).
Nilai \(|r|\) > 0,5
cor.test(datarumah$UkuranRumah, datarumah$HargaJualRumah)
##
## Pearson's product-moment correlation
##
## data: datarumah$UkuranRumah and datarumah$HargaJualRumah
## t = 18.622, df = 18, p-value = 3.292e-13
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9366055 0.9902695
## sample estimates:
## cor
## 0.9750145
cor.test(datarumah$UmurBangunan, datarumah$HargaJualRumah)
##
## Pearson's product-moment correlation
##
## data: datarumah$UmurBangunan and datarumah$HargaJualRumah
## t = -0.62162, df = 18, p-value = 0.542
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.5520734 0.3179487
## sample estimates:
## cor
## -0.1449691
Untuk Variabel Ukuran Rumah :
Tolak \(\text{H}_0\) karena \(t_{hitung}\) (18,622) > \(t_{0.05,18}\) (1,734)
Tolak \(\text{H}_0\) karena Nilai \(r\) \(|(0,9750145)|\) > 0,5
Untuk Variabel Umur Bangunan :
Gagal Tolak \(\text{H}_0\) karena \(t_{hitung}\) (-0,62162) < \(t_{0.05,18}\) (1,734)
Gagal Tolak \(\text{H}_0\) karena Nilai \(r\) \(|(-0,1449691)|\) < 0,5
Variabel Ukuran Rumah memiliki Pengaruh atau hubungan yang kuat yang signifikan terhadap Harga Jual Rumah
Variabel Umur Bangunan tidak memiliki hubungan yang signifikan terhadap Harga Jual Rumah
Sehingga untuk analisis selanjutnya, variabel Umur Bangunan tidak dimasukkan dalam analisis regresi sederhana karena tidak memiliki pengaruh yang signifikan terhadap Harga Jual Rumah.
Setelah dilakukan analisis korelasi dan mendapatkan variabel prediktor yang berpengaruh signifikan terhadap variabel Harga Jual Rumah. Selanjutnya dilakukan analisis regresi untuk mendapatkan persamaan model untuk menjelaskan keragaman Harga Jual Rumah.
Sebelum melakukan analisis regresi, terdapat asumsi yang harus terpenuhi agar mendapatkan hasil estimasi yang baik. yaitu dengan dilakukan uji asumsi normalitas.
\(\text{H}_0:\) Variabel Ukuran Rumah Berdistribusi Normal
\(\text{H}_1:\) Variabel Ukuran Rumah Tidak Berdistribusi Normal
\(\alpha =5\%\)
\(\text{p-value}\)
Tolak \(\text{H}_0\ jika\ \text{p-value} \leq \alpha\)
shapiro.test(datarumah$UkuranRumah)
##
## Shapiro-Wilk normality test
##
## data: datarumah$UkuranRumah
## W = 0.9535, p-value = 0.4233
Gagal Tolak \(\text{H}_0\) karena \(\text{p-value}\) (0,4233) > \(\alpha\) (0,05)
Variabel Ukuran Rumah Berdistribusi Normal
Setelah dilakukan uji normalitas, dilanjutkan dengan analisis regresi.
Analsis Regresi linier sederhana itu sendiri memiliki model sebagai berikut.
\(f(x) = a + b x\)
dimana :
f(x) = variabel respon
a = konstanta
b = Koefisien Variabel X
x = variabel prediktor
regresi=lm(datarumah$HargaJualRumah~datarumah$UkuranRumah, datarumah)
summary(regresi)
##
## Call:
## lm(formula = datarumah$HargaJualRumah ~ datarumah$UkuranRumah,
## data = datarumah)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.6305 -2.0365 -0.0653 2.0835 5.6305
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.7035 1.4981 5.81 1.67e-05 ***
## datarumah$UkuranRumah 12.8982 0.6926 18.62 3.29e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.551 on 18 degrees of freedom
## Multiple R-squared: 0.9507, Adjusted R-squared: 0.9479
## F-statistic: 346.8 on 1 and 18 DF, p-value: 3.292e-13
Diperoleh persamaan model sebagai berikut :
\(f(x) = 8,7035 + 12,8982 x\)
dengan besar \({R}^2\) = 0,9507 yang artinya keragaman variabel Harga Jual Rumah yang dapat dijelaskan oleh variabel Ukuran Rumah sebesar 95,07%. sedangkan untuk 4,93% sisanya dijelaskan oleh variabel lain diluar model.