Import Data

Dataset yang digunakan merupakan data harga rumah yang memuat beberapa faktor yang mempengaruhi harga rumah.

Variabel yang digunakan adalah:

  • price : harga rumah
  • size_m2 : luas rumah (m²)
  • bedrooms : jumlah kamar
  • age_years : umur rumah (tahun)
data <- read.csv("data_regresi_berganda.csv")

head(data)
##    price size_m2 bedrooms age_years
## 1 236840   134.9        3         2
## 2 199391   115.9        1         7
## 3 277636   139.4        5        13
## 4 263532   165.7        4        23
## 5 211102   113.0        2        17
## 6 190027   113.0        3        14

Deskripsi Data

Statistik deskriptif digunakan untuk memberikan gambaran umum mengenai data yang digunakan.

summary(data)
##      price           size_m2         bedrooms     age_years    
##  Min.   : 93654   Min.   : 41.4   Min.   :1.0   Min.   : 0.00  
##  1st Qu.:177400   1st Qu.:102.8   1st Qu.:1.0   1st Qu.: 8.00  
##  Median :201577   Median :117.8   Median :3.0   Median :16.50  
##  Mean   :200970   Mean   :117.6   Mean   :2.9   Mean   :15.57  
##  3rd Qu.:224296   3rd Qu.:131.5   3rd Qu.:4.0   3rd Qu.:23.00  
##  Max.   :321500   Max.   :193.9   Max.   :5.0   Max.   :29.00

Rata-rata harga rumah adalah 2.0097032^{5}

Rata-rata luas rumah adalah 117.62m²

Rata-rata jumlah kamar adalah 2.9 kamar

Rata-rata umur rumah adalah 15.57 tahun

Berdasarkan statistik deskriptif tersebut, dapat dilihat bahwa data memiliki variasi nilai pada setiap variabel yang dapat digunakan untuk menganalisis hubungan antara karakteristik rumah dan harga rumah.

Model Regresi Linear Berganda

Model regresi linear berganda digunakan untuk mengetahui pengaruh beberapa variabel independen terhadap harga rumah.

Bentuk umum model regresi adalah:

\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \beta_3X_3 + \epsilon \]

Dimana:

  • Y : harga rumah
  • X1 : luas rumah
  • X2 : jumlah kamar
  • X3 : umur rumah

Estimasi Parameter Model

model <- lm(price ~ size_m2 + bedrooms + age_years, data=data)

summary(model)
## 
## Call:
## lm(formula = price ~ size_m2 + bedrooms + age_years, data = data)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -48439 -10326    476  12584  46011 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 47534.62    7817.86   6.080 1.58e-08 ***
## size_m2      1195.84      56.53  21.153  < 2e-16 ***
## bedrooms     8275.03    1111.35   7.446 1.85e-11 ***
## age_years    -720.34     178.79  -4.029    1e-04 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 17090 on 116 degrees of freedom
## Multiple R-squared:  0.8181, Adjusted R-squared:  0.8134 
## F-statistic: 173.9 on 3 and 116 DF,  p-value: < 2.2e-16

Model regresi yang diperoleh adalah:

\[ Price = 4.7534625\times 10^{4} + 1195.837Size + 8275.0334Bedrooms + -720.337Age \] Berdasarkan hasil estimasi parameter, variabel luas rumah memiliki pengaruh positif terhadap harga rumah. Hal ini menunjukkan bahwa semakin besar luas rumah maka harga rumah cenderung meningkat. Variabel jumlah kamar juga memiliki pengaruh positif terhadap harga rumah, yang berarti semakin banyak jumlah kamar maka harga rumah akan meningkat.

Sementara itu, variabel umur rumah memiliki koefisien negatif yang menunjukkan bahwa semakin tua umur rumah maka harga rumah cenderung menurun.

Selain itu, nilai Adjusted R-squared pada model menunjukkan bahwa sebagian besar variasi harga rumah dapat dijelaskan oleh variabel luas rumah, jumlah kamar, dan umur rumah.

Pengujian Asumsi Klasik

Uji Normalitas Residual

Uji normalitas dilakukan untuk mengetahui apakah residual model berdistribusi normal.

error <- model$residuals
ks.test(error,"pnorm",mean(error),sd(error))
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  error
## D = 0.03805, p-value = 0.995
## alternative hypothesis: two-sided

Jika nilai p-value lebih besar dari 0.05 maka residual dapat dianggap berdistribusi normal.

Uji Autokorelasi

Uji autokorelasi digunakan untuk mengetahui apakah terdapat korelasi antar residual.

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.8897, p-value = 0.2698
## alternative hypothesis: true autocorrelation is greater than 0

Jika nilai p-value lebih besar dari 0.05 maka dapat disimpulkan bahwa tidak terdapat autokorelasi pada model.

Uji Multikolinearitas

Uji multikolinearitas dilakukan untuk mengetahui apakah terdapat korelasi yang tinggi antar variabel independen.

vif(model)
##   size_m2  bedrooms age_years 
##  1.003814  1.001563  1.003059

Jika nilai VIF lebih kecil dari 10 maka dapat disimpulkan bahwa tidak terdapat masalah multikolinearitas pada model.

Uji Heteroskedastisitas

Uji heteroskedastisitas digunakan untuk mengetahui apakah variansi residual bersifat konstan.

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 0.6063, df = 3, p-value = 0.895

Jika nilai p-value lebih besar dari 0.05 maka dapat disimpulkan bahwa tidak terdapat masalah heteroskedastisitas pada model.

Visualisasi Model

Scatter plot digunakan untuk melihat hubungan antara luas rumah dan harga rumah.

plot(data$size_m2,data$price,
     main="Hubungan Luas Rumah dan Harga Rumah",
     xlab="Luas Rumah",
     ylab="Harga Rumah",
     pch=19,
     col="steelblue")

abline(lm(price ~ size_m2, data=data), col="red", lwd=2)

Plot Diagnostik

Plot diagnostik digunakan untuk mengevaluasi apakah model regresi memenuhi asumsi dasar regresi.

par(mfrow=c(2,2))
plot(model)

Plot diagnostik membantu dalam melihat pola residual, normalitas residual, serta potensi adanya pengaruh observasi tertentu terhadap model.

Kesimpulan

Berdasarkan hasil analisis regresi linear berganda yang telah dilakukan, diperoleh bahwa variabel luas rumah, jumlah kamar, dan umur rumah memiliki pengaruh terhadap harga rumah. Variabel luas rumah dan jumlah kamar memiliki pengaruh positif terhadap harga rumah, sedangkan umur rumah memiliki pengaruh negatif.

Selain itu, berdasarkan pengujian asumsi klasik yang meliputi uji normalitas, uji autokorelasi, uji multikolinearitas, dan uji heteroskedastisitas, model regresi yang diperoleh telah memenuhi asumsi dasar regresi sehingga model dapat digunakan untuk menjelaskan hubungan antara karakteristik rumah dengan harga rumah.