Pemodelan Analisis Regresi Linier Berganda Untuk Mengetahui Pengaruh Ukuran Rumah dan Umur Bangunan Terhadap Harga Jual Rumah

Dimas Prayogi

Mei 2022


Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

     Rumah merupakan kebutuhan penting dalam kehidupan. Rumah menjadi tempat yang harus dimiliki oleh masing-masing individu agar bisa tidur dan beristirahat dengan tenang. Selain itu, tidak sedikit juga seseorang menggunakan rumah untuk bisnis jual beli. Hal ini dikarenakan rumah memang aset yang tidak dapat dimungkiri dibutuhkan banyak orang. Mengingat pentingnya peran rumah dalam kehidupan, tak heran permintaan akan rumah meningkat dari tahun ke tahun.
     Peningkatan permintaan rumah dari tahun ke tahun , juga menyebabkan harga rumah cenderung tinggi setiap tahunnya. Ada banyak faktor yang menyebabkan harga rumah menjadi tinggi, seperti lokasi yang strategis, design, dan masih banyak faktor-faktor lain. Namun, dari sekian banyak faktor ini belum terdapat hal pasti terkait apa yang menentukan tingginya harga sebuah rumah.
     Dalam penelitian kali ini, ingin diketahui hubungan dari beberapa variabel atau penentu tingginya rumah yaitu Ukuran rumah dan umur bangunan. Pemilihan 2 variabel ini dikarenakan luas bangunan menjadi salah satu pertimbangan seseorang untuk membeli rumah dikarenakan bisa menampung kapasitas yang besar. Umur bangunan juga menjadi pertimbangan lain karena berhubungan dengan kekokohan rumah. Penelitian ini hadir untuk membuktikan apakah benar luas bangunan dan umur bangunan mempengaruhi harga rumah.

1.2 Tinjauan Pustaka

1.2.1 Uji Linieritas

    Uji Linieritas merupakan uji yang dilakukan untuk mengetahui apakah variabel prediktor dan variabel respon mempunyai hubungan linier secara signifikan atau tidak. uji linieritas dapat diperiksa melalui tabel anova dimana signifikan Linearity memberikan hasil tolak H0 (p < 0.05) maka model linier cocok diterapkan pada hubungan model tersebut

1.2.2 Analisis Regresi Linier Berganda

     Analisis Regresi Linier Berganda merupakan model persamaan yang menjelaskan hubungan satu variabel Respon (Y) dengan dua atau lebih variabel prediktor (X1,X2, … ,Xn). Tujuan dari uji regresi linier berganda adalah untuk mengetahui seberapa besar penagruh variabel prediktor terhadap variabel respon dan untuk meramalkan nilai variabel respon jika seluruh variabel bebas telah diketahui nilainya.
     Persamaan Regresi Linier Berganda secara matematika dapat dituliskan sebagai berikut :

\[ Y=\beta_{0} +\beta_{1}X_{1}+\beta_{2}X_{2}+ ... + \beta_{n}X_{n}+\epsilon \]
dimana :
Y :variabel Respon \(\beta_{0}\) :intersep
\(\beta_{i}\) :koefisien regresi (i=1,2,…,n)
Xi:Variabel prediktor (i=1,2,…,n)
\(\epsilon\) : error yang menyebar bebas dan normal

1.2.3 Uji Asumsi Klasik

     Pengujian asumsi klasik ditujukan agar membentuk model regresi yang baik yaitu berdistribusi normal. Jika data tidak berdistribusi norma, perlu dilakukan transformasi data terlebih dahulu. Selanjutnya, model regresi yang baik adalah tidak terjadi multikolinieritas, heteroskedastisitas, dan autokorelasi (nduru, Situmorang, & Tarigan, 2014).
  • Asumsi Normalitas
    Uji normalitas bertujuan untuk menguji apakah dalam model regresi, nilai residual atau variabel pengganggu terdistribusi secara normal atau tidak (Sulisyono, 2018). Uji normalitas yang diterapkan pada regresi dalam rangka menghasilkan model yang optimal (BLUE) yaitu salah satunya pengujian normalitas pada faktor gangguan ui (disturbance) yang dihasilkan dari model regresi, regresi linier normal klasik mengasumsikan bahwa tiap distribusi probabilitas gangguan (ui­) didistribusikan secara normal dengan rata-rata nol dan varians \(\sigma^2\) (Richie, 2017).

  • Asumsi Homoskedastisitas
    Homoskedastisitas merupakan suatu keadaan di mana error variance adalah sama atau konstan pada setiap level variabel independen. Sebaliknya, apabila tidak sama disebut heteroskedastisitas. Homoskedastisitas digunakan juga untuk mengetahui adanya penyimpangan asumsi klasik heteroskedastisitas yaitu ketidaksamaan varian pada pengamatan residual pada model regresi.

  • Asumsi Non-Autokorelasi
    Autokorelasi merupakan keadaan dimana pada model regresi ada korelasi antara residual pada periode t dengan residual pada periode sebelumnya. Uji nonautokorelasi digunakan untuk menguji apakah terdapat korelasi antar kesalahan pengganggu (residual) dalam suatu model regresi linier. Pengujian asumsi ini dapat melalui Uji Durbin Watson.

  • Asumsi Nonmultikolinieritas
    Multikolinieritas merupakan keadaan dimana terjadi hubungan linier yang sempurna atau mendekati antar variabel independen dalam model regresi. Uji non multikolinearitas digunakan untuk melihat keadaan apakah terjadi hubungan linear yang sempurna atau mendekati antar variabel independen dalam model regresi (Sulisyono, 2018). Pengujian multikolinearitas dilihat dari besaran VIF (Variance Inflation Factor) dan tolerance. Nilai VIF < 5 mencerminkan tidak ada multikolinieritas. Nilai tolerance dan VIF menunjukkan bagaimana setiap variabel bebas dijelaskan oleh variabel independen lainnya, dimana setiap variabel bebas akan diperlakukan sebagai variabel terikat dan diregresi terhadap variabel bebas lainnya. Sedangkan nilai tolerance mengukur sejauh mana variabel bebas yang terpilih tidak dijelaskan oleh variabel bebas lainnya, dimana nilai tolerance yang rendah sama dengan nilai VIF yang tinggi (IPTEKIN, 2013).

1.2.4 Uji Simultan (Uji F)

     Uji F bertujuan untuk mencari apakah variabel prediktor secara bersama – sama (simultan) mempengaruhi variabel dependen. Uji F dilakukan untuk melihat pengaruh dari seluruh variabel bebas secara bersama-sama terhadap variabel terikat. Tingakatan yang digunakan adalah sebesar 0.5 atau 5%, jika nilai signifikan F < 0.05 maka dapat diartikan bahwa variabel independent secara simultan mempengaruhi variabel respon dan sebaliknya (Ghozali, 2016).

1.2.5 Uji Parsial (Uji t)

     Pada pengujian parsial, uji statistik yang dipakai yaitu uji statistik t. Uji statistik t digunakan untuk mengetahui ada tidaknya pengaruh dari masing-masing variabel bebas terhadap variabel terikat (Hasanah 2008). Uji parsial digunakan untuk menguji signifikasi variabel prediktor terhadap variabel respon secara individu, jika uji serentak signifikan.

1.3 Data

   Data yang digunakan pada analisis ini adalah data sekunder dengan skala datanya adalah kuantitatif.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # install.packages("knitr")
>  #install.packages("rmarkdown")
>  #install.packages("prettydoc")
>  #install.packages("equatiomatic")
>  #install.packages("car")
>  #install.packages("lmtest")
> 

2.2 Membangkitkan Data dengan membentuk data frame

> Rumah = c(1:20)
> X1= c(1.8,1,1.7,2.8,2.2,0.8,3.6,1.1,2,2.6,2.3,0.9,1.2,3.4,1.7,2.5,1.4,3.3,2.2,1.5)
> X2= c(30,33,25,12,26,25,28,29,25,2,30,23,12,33,1,12,17,16,22,29)
> Y= c(32,24,27,47,35,17,52,20,38,45,44,19,25,50,30,43,27,50,37,28)
> 
> data_komstat=data.frame(Rumah,X1,X2,Y)

##Menampilkan data frame

> data_komstat
   Rumah  X1 X2  Y
1      1 1.8 30 32
2      2 1.0 33 24
3      3 1.7 25 27
4      4 2.8 12 47
5      5 2.2 26 35
6      6 0.8 25 17
7      7 3.6 28 52
8      8 1.1 29 20
9      9 2.0 25 38
10    10 2.6  2 45
11    11 2.3 30 44
12    12 0.9 23 19
13    13 1.2 12 25
14    14 3.4 33 50
15    15 1.7  1 30
16    16 2.5 12 43
17    17 1.4 17 27
18    18 3.3 16 50
19    19 2.2 22 37
20    20 1.5 29 28

2.3 Pembentukan Model Regresi Linier Berganda

 pembentukan model dapat dilakukan dengan menggunakan matriks

\[ \beta = (X'X)^{-1} (X'Y) \]

> #Memanggil Y dari data frame
> Y= matrix(data_komstat[,4],nrow=20)
> Y
      [,1]
 [1,]   32
 [2,]   24
 [3,]   27
 [4,]   47
 [5,]   35
 [6,]   17
 [7,]   52
 [8,]   20
 [9,]   38
[10,]   45
[11,]   44
[12,]   19
[13,]   25
[14,]   50
[15,]   30
[16,]   43
[17,]   27
[18,]   50
[19,]   37
[20,]   28
> #Membentuk matriks X dari data frame yang kita buat 
> X= matrix(c(rep(1,20), X1, X2),nrow=20, ncol=3)
> X
      [,1] [,2] [,3]
 [1,]    1  1.8   30
 [2,]    1  1.0   33
 [3,]    1  1.7   25
 [4,]    1  2.8   12
 [5,]    1  2.2   26
 [6,]    1  0.8   25
 [7,]    1  3.6   28
 [8,]    1  1.1   29
 [9,]    1  2.0   25
[10,]    1  2.6    2
[11,]    1  2.3   30
[12,]    1  0.9   23
[13,]    1  1.2   12
[14,]    1  3.4   33
[15,]    1  1.7    1
[16,]    1  2.5   12
[17,]    1  1.4   17
[18,]    1  3.3   16
[19,]    1  2.2   22
[20,]    1  1.5   29
> #Mendapatkan beta
> beta= solve(t(X) %*% X) %*% (t(X) %*% Y)
> beta
            [,1]
[1,] 10.04633921
[2,] 12.83445400
[3,] -0.05652313

Sehingga didapatkan hasil \[ \beta_{0} = 10.04633921, \beta_{1} = 12.83445400, \beta_{2} = -0.05652313 \]

> #mencari menggunakan fungsi bawaan R
> reg<-lm(Y~X1+X2, data = data_komstat)
> summary(reg)

Call:
lm(formula = Y ~ X1 + X2, data = data_komstat)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.4518 -1.8140 -0.0462  1.5832  6.1301 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 10.04634    2.09960   4.785 0.000172 ***
X1          12.83445    0.69919  18.356 1.21e-12 ***
X2          -0.05652    0.06164  -0.917 0.371940    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.562 on 17 degrees of freedom
Multiple R-squared:  0.953, Adjusted R-squared:  0.9474 
F-statistic: 172.3 on 2 and 17 DF,  p-value: 5.181e-12

Didapatkan persamaan regresi :
\[\widehat{Y}=10.04634+12.83445X_{1}-0.05652X_{2}\] hasil pendugaan regresi menggunakan matriks dan menggunakan function bawaan R (lm) memberikan hasil yang sama

> #mencari sisaan
> sisa<-residuals(reg)
> sisa
          1           2           3           4           5           6 
 0.54733737  2.98446994 -3.45183286  1.69546711 -1.81253673 -1.90082427 
          7           8           9          10          11          12 
-2.66772608 -2.52506796  3.69783094  1.69712666  6.13011037 -1.29731592 
         13          14          15          16          17          18 
 0.23059350 -1.81821965 -1.80838787  1.54580331 -0.05368167 -1.49566738 
         19          20 
-0.03862924  0.34115044 
> smoothScatter(x, xlab = "x1", ylab = "x2", main = "Gambar 1. Smooth Scatter Plot")
Error in xy.coords(x, y, xlabel, ylabel): object 'x' not found

2.4 Uji Asumsi Klasik

2.4.1 Asumsi Normalitas

Hipotesis:
H0 : Galat menyebar Normal
H1 : Galat tidak menyebar Normal

> shapiro.test(sisa) 

    Shapiro-Wilk normality test

data:  sisa
W = 0.93571, p-value = 0.1987

2.4.2 Asumsi Homoskedastisitas

Hipotesis:
H0 = Tidak terdapat gejala Heteroskedastisitas (Ragam Galat sama)
H1 = Terdapat gejala Heteroskedastisitas (Ragam Galat tidak sama)

> bptest(reg)
Error in bptest(reg): could not find function "bptest"

2.4.3 Asumsi Non-Multikolinieritas

Hipotesis:
H0= Tidak Terdapat Multikolinieritas
H1= Terdapat Multikolinieritas

> vif(reg)
Error in vif(reg): could not find function "vif"

2.4.4 Asumsi Non-Autokorelasi

Hipotesis: H0: Tidak terdapat autokorelasi pada model Regresi
H1: Terdapat autokorelasi pada model Regresi

> dwtest(reg)
Error in dwtest(reg): could not find function "dwtest"

2.5 Uji Simultan

H0 : Ukuran rumah dan umur rumah secara simultan tidak berpengaruh terhadap harga rumah
H1 : Ukuran rumah dan umur rumah secara simultan berpengaruh terhadap harga rumah

> summary(reg)

Call:
lm(formula = Y ~ X1 + X2, data = data_komstat)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.4518 -1.8140 -0.0462  1.5832  6.1301 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 10.04634    2.09960   4.785 0.000172 ***
X1          12.83445    0.69919  18.356 1.21e-12 ***
X2          -0.05652    0.06164  -0.917 0.371940    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.562 on 17 degrees of freedom
Multiple R-squared:  0.953, Adjusted R-squared:  0.9474 
F-statistic: 172.3 on 2 and 17 DF,  p-value: 5.181e-12

Uji Simultan dilihat dari nilai p-value output di atas
## UJi Parsial
- Untuk \(\beta_{1}\)
H0:\(\beta_{1}\)=0
H1:\(\beta_{1}\ne\)=0
- Untuk \(\beta_{2}\)
H0:\(\beta_{2}\)=0
H1:\(\beta_{2}\ne\)=0

> Model <- summary(reg)
> Koef <- Model$coefficients
> Koef
               Estimate Std. Error    t value     Pr(>|t|)
(Intercept) 10.04633921 2.09960300  4.7848756 1.722793e-04
X1          12.83445400 0.69919316 18.3560920 1.209830e-12
X2          -0.05652313 0.06163527 -0.9170581 3.719396e-01

2.6 Koefisien Determinasi

> Model$r.squared
[1] 0.9529795

3 HASIL DAN PEMBAHASAN

3.1 Model Regresi Linier Berganda

Model persamaan regresinya adalah
\[\widehat{Y}=10.04634+12.83445X_{1}-0.05652X_{2}\]

dari hasil diatas dapat disimpulkan :
- Jika variabel ukuran rumah (X1)dan umur bangunan (X2) bernilai nol maka harga jual rumah sebesar 10.04634 - setiap penambahan ukuran rumah sebanyak 1 satuan luas , akan mengakibatkan harga jual yang meningkat sebesar 12,83445 juta - setiap kenaikan umur bangunan sebanyak 1 satuan akan mengakibatkan harga jual rumah turun 0,05652 juta rupiah

3.2 Uji Asumsi Klasik

3.2.1 Uji Normalitas

Hipotesis:
H0 : Galat menyebar Normal
H1 : Galat tidak menyebar Normal

> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.93571, p-value = 0.1987

dari hasil output diatas diperoleh keputusan trima H0 karena p-value> \(\alpha\) (0.05)
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa galat menyebar normal. Tidak ditemukan adanya asumsi normalitas galat pada data ukuran rumah dan umur rumah Sehingga asumsi normalitas terpenuhi.

3.2.2 Uji Homoskedastisitas

Hipotesis:
H0 = Tidak terdapat gejala Heteroskedastisitas (Ragam Galat sama)
H1 = Terdapat gejala Heteroskedastisitas (Ragam Galat tidak sama)

> bptest(reg)
Error in bptest(reg): could not find function "bptest"

dari hasil Output diatas diperoleh keputusan terima H0 karena p-value (0.3225) > \(\alpha\) (0.05) Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat gejala heteroskedastisitas pada data ukuran rumah dan umur rumah sehingga asumsi homoskedastisitas terpenuhi.

3.2.3 Asumsi Non-AUtokorelasi

Hipotesis: H0: Tidak terdapat autokorelasi pada model Regresi
H1: Terdapat autokorelasi pada model Regresi

> dwtest(reg)
Error in dwtest(reg): could not find function "dwtest"

Dilihat dari output diatas diperoleh keputusan terima H0 karena p-value (0.5984) > \(\alpha\) (0.05) Sehingga dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat gejala autokorelasi pada data umur rummah dan luas rumah. Sehingga asumsi terpenuhi. Artinya masing masing variabel hanya memiliki hubungan dengan variabel respon.

3.2.4 Asumsi Non-Multikolinieritas

Hipotesis:
H0= Tidak Terdapat Multikolinieritas
H1= Terdapat Multikolinieritas

> vif(reg)
Error in vif(reg): could not find function "vif"

Dari output diatas, karena nilai VIF masing masing variabel prediktor kurang dari 10 sehingga mdapat ditarik kesimpulan bahwa tidak terdapat multikolinieritas pada data luas rumah dan umur rumah.

3.3 Uji SImultan (Uji F)

H0 : Ukuran rumah dan umur rumah secara simultan tidak berpengaruh terhadap harga rumah
H1 : Ukuran rumah dan umur rumah secara simultan berpengaruh terhadap harga rumah

> summary(reg)

Call:
lm(formula = Y ~ X1 + X2, data = data_komstat)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.4518 -1.8140 -0.0462  1.5832  6.1301 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 10.04634    2.09960   4.785 0.000172 ***
X1          12.83445    0.69919  18.356 1.21e-12 ***
X2          -0.05652    0.06164  -0.917 0.371940    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.562 on 17 degrees of freedom
Multiple R-squared:  0.953, Adjusted R-squared:  0.9474 
F-statistic: 172.3 on 2 and 17 DF,  p-value: 5.181e-12

Berdasarkan output diatas diperoleh keputusan tolak H0 karena nilai p-value< \(\alpha\)
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa Umur rumah dan luas rumah secara bersama sama mempengaruhi harga jual rumah. ## Uji Parsial (Uji t)
Hipotesis : - Untuk \(\beta_{1}\)
H0:\(\beta_{1}\)=0
H1:\(\beta_{1}\ne\)=0
- Untuk \(\beta_{2}\)
H0:\(\beta_{2}\)=0
H1:\(\beta_{2}\ne\)=0

> Model <- summary(reg)
> Koef <- Model$coefficients
> Koef
               Estimate Std. Error    t value     Pr(>|t|)
(Intercept) 10.04633921 2.09960300  4.7848756 1.722793e-04
X1          12.83445400 0.69919316 18.3560920 1.209830e-12
X2          -0.05652313 0.06163527 -0.9170581 3.719396e-01

interpretasi :
- untuk \(\beta_{1}\), karena nilai p-value (1.20983e-12)<\(\alpha\) (0.05) sehingga tolak H0.
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa terdapat hubungan secara parsial yaitu antara luas rumah dengan harga jual rumah.
- untuk \(\beta_{2}\), karena nilai p-value (3.719396e-01)<\(\alpha\) (0.05) sehingga tolak H0.
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa terdapat hubungan secara parsial yaitu antara umur bangunan dengan harga jual rumah

3.4 Koefisien Determinasi

> Model$r.squared
[1] 0.9529795

Nilai koefisien determinasi sebesar 0.9529795, berarti bahwa variabel luas rumah dan ukuran rumah dapat menjelaskan harga jual rumah 95% dan sisanya adalah dijelaskan variabel lain.

3.5 Kesimpulan

Persamaan regresi hubungan antara umur bangunan dan luas rumah dengan harga jual rumah adalah sebagai berikut :

\[\widehat{Y}=10.04634+12.83445X_{1}-0.05652X_{2}\] Dengan uji Parsial dan Uji simultan diperolah kesimpulan bahwa baik variabel umur rumah dan luas rumah berpengaruh terhadap harga Jual Rumah. variabel luas rumah dan umur bangunan dapat menjelaskan harga jual rumah 95% dan sisanya adalah dijelaskan variabel lain.
* Jika variabel ukuran rumah (X1)dan umur bangunan (X2) bernilai nol maka harga jual rumah sebesar 10.04634 setiap penambahan ukuran rumah sebanyak 1 satuan luas , akan mengakibatkan harga jual yang meningkat sebesar 12,83445 juta
* setiap kenaikan umur bangunan sebanyak 1 satuan akan mengakibatkan harga jual rumah turun 0,05652 juta rupiah

4 DAFTAR PUSTAKA


Ndruru, R. E., Situmorang, M., & Tarigan,G. 2014. “Analisa Faktor-faktor yang Mempengaruhi Hasil-hasil Produksi Padi di Deli Serdang”. Saintia Matematika. Vol.2 (1), pp:71-83

Ghozali, I. (2016) Aplikasi Analisis Multivariete Dengan Program IBM SPSS 23. Edisi 8. Semarang: Badan Penerbit Universitas Diponegoro

Richie. (2017, September 04). Asumsi Normalitas Dalam Regresi. Diakses dari https://www.mobilestatistik.com/asumsi-normalitas-dalam-regresi

Sulistyono, S., & Sulistiyowati, W. (2018). Peramalan Produksi dengan Metode Regresi Linier Berganda. PROZIMA (Productivity, Optimization and Manufacturing System Engineering), 1(2), 82. https://doi.org/10.21070/prozima.v1i2.1350

IPTEKIN. (2013). Mengurai Stagnasi Inovasi Berbasis Litbang di Indonesia. Diakses dari https://123dok.com/article/uji-asumsi-dasar-uji-normalitas-hasil-diskusi.qodpg47z