Dataset yang digunakan merupakan data harga rumah yang memuat beberapa faktor yang mempengaruhi harga rumah.
Variabel yang digunakan adalah:
## price size_m2 bedrooms age_years
## 1 236840 134.9 3 2
## 2 199391 115.9 1 7
## 3 277636 139.4 5 13
## 4 263532 165.7 4 23
## 5 211102 113.0 2 17
## 6 190027 113.0 3 14
Statistik deskriptif digunakan untuk memberikan gambaran umum mengenai data yang digunakan.
## price size_m2 bedrooms age_years
## Min. : 93654 Min. : 41.4 Min. :1.0 Min. : 0.00
## 1st Qu.:177400 1st Qu.:102.8 1st Qu.:1.0 1st Qu.: 8.00
## Median :201577 Median :117.8 Median :3.0 Median :16.50
## Mean :200970 Mean :117.6 Mean :2.9 Mean :15.57
## 3rd Qu.:224296 3rd Qu.:131.5 3rd Qu.:4.0 3rd Qu.:23.00
## Max. :321500 Max. :193.9 Max. :5.0 Max. :29.00
Rata-rata harga rumah adalah 2.0097032^{5}
Rata-rata luas rumah adalah 117.62m²
Rata-rata jumlah kamar adalah 2.9 kamar
Rata-rata umur rumah adalah 15.57 tahun
Berdasarkan statistik deskriptif tersebut, dapat dilihat bahwa data memiliki variasi nilai pada setiap variabel yang dapat digunakan untuk menganalisis hubungan antara karakteristik rumah dan harga rumah.
Model regresi linear berganda digunakan untuk mengetahui pengaruh beberapa variabel independen terhadap harga rumah.
Bentuk umum model regresi adalah:
\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \beta_3X_3 + \epsilon \]
Dimana:
##
## Call:
## lm(formula = price ~ size_m2 + bedrooms + age_years, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -48439 -10326 476 12584 46011
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 47534.62 7817.86 6.080 1.58e-08 ***
## size_m2 1195.84 56.53 21.153 < 2e-16 ***
## bedrooms 8275.03 1111.35 7.446 1.85e-11 ***
## age_years -720.34 178.79 -4.029 1e-04 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 17090 on 116 degrees of freedom
## Multiple R-squared: 0.8181, Adjusted R-squared: 0.8134
## F-statistic: 173.9 on 3 and 116 DF, p-value: < 2.2e-16
Model regresi yang diperoleh adalah:
\[ Price = 4.7534625\times 10^{4} + 1195.837Size + 8275.0334Bedrooms + -720.337Age \] Berdasarkan hasil estimasi parameter, variabel luas rumah memiliki pengaruh positif terhadap harga rumah. Hal ini menunjukkan bahwa semakin besar luas rumah maka harga rumah cenderung meningkat. Variabel jumlah kamar juga memiliki pengaruh positif terhadap harga rumah, yang berarti semakin banyak jumlah kamar maka harga rumah akan meningkat.
Sementara itu, variabel umur rumah memiliki koefisien negatif yang menunjukkan bahwa semakin tua umur rumah maka harga rumah cenderung menurun.
Selain itu, nilai Adjusted R-squared pada model menunjukkan bahwa sebagian besar variasi harga rumah dapat dijelaskan oleh variabel luas rumah, jumlah kamar, dan umur rumah.
Uji normalitas dilakukan untuk mengetahui apakah residual model berdistribusi normal.
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: error
## D = 0.03805, p-value = 0.995
## alternative hypothesis: two-sided
Jika nilai p-value lebih besar dari 0.05 maka residual dapat dianggap berdistribusi normal.
Uji autokorelasi digunakan untuk mengetahui apakah terdapat korelasi antar residual.
##
## Durbin-Watson test
##
## data: model
## DW = 1.8897, p-value = 0.2698
## alternative hypothesis: true autocorrelation is greater than 0
Jika nilai p-value lebih besar dari 0.05 maka dapat disimpulkan bahwa tidak terdapat autokorelasi pada model.
Uji multikolinearitas dilakukan untuk mengetahui apakah terdapat korelasi yang tinggi antar variabel independen.
## size_m2 bedrooms age_years
## 1.003814 1.001563 1.003059
Jika nilai VIF lebih kecil dari 10 maka dapat disimpulkan bahwa tidak terdapat masalah multikolinearitas pada model.
Uji heteroskedastisitas digunakan untuk mengetahui apakah variansi residual bersifat konstan.
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 0.6063, df = 3, p-value = 0.895
Jika nilai p-value lebih besar dari 0.05 maka dapat disimpulkan bahwa tidak terdapat masalah heteroskedastisitas pada model.
Scatter plot digunakan untuk melihat hubungan antara luas rumah dan harga rumah.
plot(data$size_m2,data$price,
main="Hubungan Luas Rumah dan Harga Rumah",
xlab="Luas Rumah",
ylab="Harga Rumah",
pch=19,
col="steelblue")
abline(lm(price ~ size_m2, data=data), col="red", lwd=2)Plot diagnostik digunakan untuk mengevaluasi apakah model regresi memenuhi asumsi dasar regresi.
Plot diagnostik membantu dalam melihat pola residual, normalitas residual, serta potensi adanya pengaruh observasi tertentu terhadap model.
Berdasarkan hasil analisis regresi linear berganda yang telah dilakukan, diperoleh bahwa variabel luas rumah, jumlah kamar, dan umur rumah memiliki pengaruh terhadap harga rumah. Variabel luas rumah dan jumlah kamar memiliki pengaruh positif terhadap harga rumah, sedangkan umur rumah memiliki pengaruh negatif.
Selain itu, berdasarkan pengujian asumsi klasik yang meliputi uji normalitas, uji autokorelasi, uji multikolinearitas, dan uji heteroskedastisitas, model regresi yang diperoleh telah memenuhi asumsi dasar regresi sehingga model dapat digunakan untuk menjelaskan hubungan antara karakteristik rumah dengan harga rumah.