Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")\[
Y=\beta_{0} +\beta_{1}X_{1}+\beta_{2}X_{2}+ ... + \beta_{n}X_{n}+\epsilon
\]
dimana :
Y :variabel Respon \(\beta_{0}\) :intersep
\(\beta_{i}\) :koefisien regresi (i=1,2,…,n)
Xi:Variabel prediktor (i=1,2,…,n)
\(\epsilon\) : error yang menyebar bebas dan normal
Asumsi Normalitas
Uji normalitas bertujuan untuk menguji apakah dalam model regresi, nilai residual atau variabel pengganggu terdistribusi secara normal atau tidak (Sulisyono, 2018). Uji normalitas yang diterapkan pada regresi dalam rangka menghasilkan model yang optimal (BLUE) yaitu salah satunya pengujian normalitas pada faktor gangguan ui (disturbance) yang dihasilkan dari model regresi, regresi linier normal klasik mengasumsikan bahwa tiap distribusi probabilitas gangguan (ui) didistribusikan secara normal dengan rata-rata nol dan varians \(\sigma^2\) (Richie, 2017).
Asumsi Homoskedastisitas
Homoskedastisitas merupakan suatu keadaan di mana error variance adalah sama atau konstan pada setiap level variabel independen. Sebaliknya, apabila tidak sama disebut heteroskedastisitas. Homoskedastisitas digunakan juga untuk mengetahui adanya penyimpangan asumsi klasik heteroskedastisitas yaitu ketidaksamaan varian pada pengamatan residual pada model regresi.
Asumsi Non-Autokorelasi
Autokorelasi merupakan keadaan dimana pada model regresi ada korelasi antara residual pada periode t dengan residual pada periode sebelumnya. Uji nonautokorelasi digunakan untuk menguji apakah terdapat korelasi antar kesalahan pengganggu (residual) dalam suatu model regresi linier. Pengujian asumsi ini dapat melalui Uji Durbin Watson.
Asumsi Nonmultikolinieritas
Multikolinieritas merupakan keadaan dimana terjadi hubungan linier yang sempurna atau mendekati antar variabel independen dalam model regresi. Uji non multikolinearitas digunakan untuk melihat keadaan apakah terjadi hubungan linear yang sempurna atau mendekati antar variabel independen dalam model regresi (Sulisyono, 2018). Pengujian multikolinearitas dilihat dari besaran VIF (Variance Inflation Factor) dan tolerance. Nilai VIF < 5 mencerminkan tidak ada multikolinieritas. Nilai tolerance dan VIF menunjukkan bagaimana setiap variabel bebas dijelaskan oleh variabel independen lainnya, dimana setiap variabel bebas akan diperlakukan sebagai variabel terikat dan diregresi terhadap variabel bebas lainnya. Sedangkan nilai tolerance mengukur sejauh mana variabel bebas yang terpilih tidak dijelaskan oleh variabel bebas lainnya, dimana nilai tolerance yang rendah sama dengan nilai VIF yang tinggi (IPTEKIN, 2013).
> # install.packages("knitr")
> #install.packages("rmarkdown")
> #install.packages("prettydoc")
> #install.packages("equatiomatic")
> #install.packages("car")
> #install.packages("lmtest")
> > Rumah = c(1:20)
> X1= c(1.8,1,1.7,2.8,2.2,0.8,3.6,1.1,2,2.6,2.3,0.9,1.2,3.4,1.7,2.5,1.4,3.3,2.2,1.5)
> X2= c(30,33,25,12,26,25,28,29,25,2,30,23,12,33,1,12,17,16,22,29)
> Y= c(32,24,27,47,35,17,52,20,38,45,44,19,25,50,30,43,27,50,37,28)
>
> data_komstat=data.frame(Rumah,X1,X2,Y)##Menampilkan data frame
> data_komstat
Rumah X1 X2 Y
1 1 1.8 30 32
2 2 1.0 33 24
3 3 1.7 25 27
4 4 2.8 12 47
5 5 2.2 26 35
6 6 0.8 25 17
7 7 3.6 28 52
8 8 1.1 29 20
9 9 2.0 25 38
10 10 2.6 2 45
11 11 2.3 30 44
12 12 0.9 23 19
13 13 1.2 12 25
14 14 3.4 33 50
15 15 1.7 1 30
16 16 2.5 12 43
17 17 1.4 17 27
18 18 3.3 16 50
19 19 2.2 22 37
20 20 1.5 29 28\[ \beta = (X'X)^{-1} (X'Y) \]
> #Memanggil Y dari data frame
> Y= matrix(data_komstat[,4],nrow=20)
> Y
[,1]
[1,] 32
[2,] 24
[3,] 27
[4,] 47
[5,] 35
[6,] 17
[7,] 52
[8,] 20
[9,] 38
[10,] 45
[11,] 44
[12,] 19
[13,] 25
[14,] 50
[15,] 30
[16,] 43
[17,] 27
[18,] 50
[19,] 37
[20,] 28> #Membentuk matriks X dari data frame yang kita buat
> X= matrix(c(rep(1,20), X1, X2),nrow=20, ncol=3)
> X
[,1] [,2] [,3]
[1,] 1 1.8 30
[2,] 1 1.0 33
[3,] 1 1.7 25
[4,] 1 2.8 12
[5,] 1 2.2 26
[6,] 1 0.8 25
[7,] 1 3.6 28
[8,] 1 1.1 29
[9,] 1 2.0 25
[10,] 1 2.6 2
[11,] 1 2.3 30
[12,] 1 0.9 23
[13,] 1 1.2 12
[14,] 1 3.4 33
[15,] 1 1.7 1
[16,] 1 2.5 12
[17,] 1 1.4 17
[18,] 1 3.3 16
[19,] 1 2.2 22
[20,] 1 1.5 29> #Mendapatkan beta
> beta= solve(t(X) %*% X) %*% (t(X) %*% Y)
> beta
[,1]
[1,] 10.04633921
[2,] 12.83445400
[3,] -0.05652313Sehingga didapatkan hasil \[ \beta_{0} = 10.04633921, \beta_{1} = 12.83445400, \beta_{2} = -0.05652313 \]
> #mencari menggunakan fungsi bawaan R
> reg<-lm(Y~X1+X2, data = data_komstat)
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = data_komstat)
Residuals:
Min 1Q Median 3Q Max
-3.4518 -1.8140 -0.0462 1.5832 6.1301
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.04634 2.09960 4.785 0.000172 ***
X1 12.83445 0.69919 18.356 1.21e-12 ***
X2 -0.05652 0.06164 -0.917 0.371940
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.562 on 17 degrees of freedom
Multiple R-squared: 0.953, Adjusted R-squared: 0.9474
F-statistic: 172.3 on 2 and 17 DF, p-value: 5.181e-12Didapatkan persamaan regresi :
\[\widehat{Y}=10.04634+12.83445X_{1}-0.05652X_{2}\] hasil pendugaan regresi menggunakan matriks dan menggunakan function bawaan R (lm) memberikan hasil yang sama
> #mencari sisaan
> sisa<-residuals(reg)
> sisa
1 2 3 4 5 6
0.54733737 2.98446994 -3.45183286 1.69546711 -1.81253673 -1.90082427
7 8 9 10 11 12
-2.66772608 -2.52506796 3.69783094 1.69712666 6.13011037 -1.29731592
13 14 15 16 17 18
0.23059350 -1.81821965 -1.80838787 1.54580331 -0.05368167 -1.49566738
19 20
-0.03862924 0.34115044 > smoothScatter(x, xlab = "x1", ylab = "x2", main = "Gambar 1. Smooth Scatter Plot")
Error in xy.coords(x, y, xlabel, ylabel): object 'x' not foundHipotesis:
H0 : Galat menyebar Normal
H1 : Galat tidak menyebar Normal
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.93571, p-value = 0.1987Hipotesis:
H0 = Tidak terdapat gejala Heteroskedastisitas (Ragam Galat sama)
H1 = Terdapat gejala Heteroskedastisitas (Ragam Galat tidak sama)
> bptest(reg)
Error in bptest(reg): could not find function "bptest"Hipotesis:
H0= Tidak Terdapat Multikolinieritas
H1= Terdapat Multikolinieritas
> vif(reg)
Error in vif(reg): could not find function "vif"Hipotesis: H0: Tidak terdapat autokorelasi pada model Regresi
H1: Terdapat autokorelasi pada model Regresi
> dwtest(reg)
Error in dwtest(reg): could not find function "dwtest"H0 : Ukuran rumah dan umur rumah secara simultan tidak berpengaruh terhadap harga rumah
H1 : Ukuran rumah dan umur rumah secara simultan berpengaruh terhadap harga rumah
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = data_komstat)
Residuals:
Min 1Q Median 3Q Max
-3.4518 -1.8140 -0.0462 1.5832 6.1301
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.04634 2.09960 4.785 0.000172 ***
X1 12.83445 0.69919 18.356 1.21e-12 ***
X2 -0.05652 0.06164 -0.917 0.371940
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.562 on 17 degrees of freedom
Multiple R-squared: 0.953, Adjusted R-squared: 0.9474
F-statistic: 172.3 on 2 and 17 DF, p-value: 5.181e-12Uji Simultan dilihat dari nilai p-value output di atas
## UJi Parsial
- Untuk \(\beta_{1}\)
H0:\(\beta_{1}\)=0
H1:\(\beta_{1}\ne\)=0
- Untuk \(\beta_{2}\)
H0:\(\beta_{2}\)=0
H1:\(\beta_{2}\ne\)=0
> Model <- summary(reg)
> Koef <- Model$coefficients
> Koef
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.04633921 2.09960300 4.7848756 1.722793e-04
X1 12.83445400 0.69919316 18.3560920 1.209830e-12
X2 -0.05652313 0.06163527 -0.9170581 3.719396e-01> Model$r.squared
[1] 0.9529795Model persamaan regresinya adalah
\[\widehat{Y}=10.04634+12.83445X_{1}-0.05652X_{2}\]
dari hasil diatas dapat disimpulkan :
- Jika variabel ukuran rumah (X1)dan umur bangunan (X2) bernilai nol maka harga jual rumah sebesar 10.04634 - setiap penambahan ukuran rumah sebanyak 1 satuan luas , akan mengakibatkan harga jual yang meningkat sebesar 12,83445 juta - setiap kenaikan umur bangunan sebanyak 1 satuan akan mengakibatkan harga jual rumah turun 0,05652 juta rupiah
Hipotesis:
H0 : Galat menyebar Normal
H1 : Galat tidak menyebar Normal
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.93571, p-value = 0.1987dari hasil output diatas diperoleh keputusan trima H0 karena p-value> \(\alpha\) (0.05)
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa galat menyebar normal. Tidak ditemukan adanya asumsi normalitas galat pada data ukuran rumah dan umur rumah Sehingga asumsi normalitas terpenuhi.
Hipotesis:
H0 = Tidak terdapat gejala Heteroskedastisitas (Ragam Galat sama)
H1 = Terdapat gejala Heteroskedastisitas (Ragam Galat tidak sama)
> bptest(reg)
Error in bptest(reg): could not find function "bptest"dari hasil Output diatas diperoleh keputusan terima H0 karena p-value (0.3225) > \(\alpha\) (0.05) Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat gejala heteroskedastisitas pada data ukuran rumah dan umur rumah sehingga asumsi homoskedastisitas terpenuhi.
Hipotesis: H0: Tidak terdapat autokorelasi pada model Regresi
H1: Terdapat autokorelasi pada model Regresi
> dwtest(reg)
Error in dwtest(reg): could not find function "dwtest"Dilihat dari output diatas diperoleh keputusan terima H0 karena p-value (0.5984) > \(\alpha\) (0.05) Sehingga dengan tingkat kepercayaan 95% dapat disimpulkan bahwa tidak terdapat gejala autokorelasi pada data umur rummah dan luas rumah. Sehingga asumsi terpenuhi. Artinya masing masing variabel hanya memiliki hubungan dengan variabel respon.
Hipotesis:
H0= Tidak Terdapat Multikolinieritas
H1= Terdapat Multikolinieritas
> vif(reg)
Error in vif(reg): could not find function "vif"Dari output diatas, karena nilai VIF masing masing variabel prediktor kurang dari 10 sehingga mdapat ditarik kesimpulan bahwa tidak terdapat multikolinieritas pada data luas rumah dan umur rumah.
H0 : Ukuran rumah dan umur rumah secara simultan tidak berpengaruh terhadap harga rumah
H1 : Ukuran rumah dan umur rumah secara simultan berpengaruh terhadap harga rumah
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = data_komstat)
Residuals:
Min 1Q Median 3Q Max
-3.4518 -1.8140 -0.0462 1.5832 6.1301
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.04634 2.09960 4.785 0.000172 ***
X1 12.83445 0.69919 18.356 1.21e-12 ***
X2 -0.05652 0.06164 -0.917 0.371940
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.562 on 17 degrees of freedom
Multiple R-squared: 0.953, Adjusted R-squared: 0.9474
F-statistic: 172.3 on 2 and 17 DF, p-value: 5.181e-12Berdasarkan output diatas diperoleh keputusan tolak H0 karena nilai p-value< \(\alpha\)
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa Umur rumah dan luas rumah secara bersama sama mempengaruhi harga jual rumah. ## Uji Parsial (Uji t)
Hipotesis : - Untuk \(\beta_{1}\)
H0:\(\beta_{1}\)=0
H1:\(\beta_{1}\ne\)=0
- Untuk \(\beta_{2}\)
H0:\(\beta_{2}\)=0
H1:\(\beta_{2}\ne\)=0
> Model <- summary(reg)
> Koef <- Model$coefficients
> Koef
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.04633921 2.09960300 4.7848756 1.722793e-04
X1 12.83445400 0.69919316 18.3560920 1.209830e-12
X2 -0.05652313 0.06163527 -0.9170581 3.719396e-01interpretasi :
- untuk \(\beta_{1}\), karena nilai p-value (1.20983e-12)<\(\alpha\) (0.05) sehingga tolak H0.
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa terdapat hubungan secara parsial yaitu antara luas rumah dengan harga jual rumah.
- untuk \(\beta_{2}\), karena nilai p-value (3.719396e-01)<\(\alpha\) (0.05) sehingga tolak H0.
Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa terdapat hubungan secara parsial yaitu antara umur bangunan dengan harga jual rumah
> Model$r.squared
[1] 0.9529795Nilai koefisien determinasi sebesar 0.9529795, berarti bahwa variabel luas rumah dan ukuran rumah dapat menjelaskan harga jual rumah 95% dan sisanya adalah dijelaskan variabel lain.
Persamaan regresi hubungan antara umur bangunan dan luas rumah dengan harga jual rumah adalah sebagai berikut :
\[\widehat{Y}=10.04634+12.83445X_{1}-0.05652X_{2}\] Dengan uji Parsial dan Uji simultan diperolah kesimpulan bahwa baik variabel umur rumah dan luas rumah berpengaruh terhadap harga Jual Rumah. variabel luas rumah dan umur bangunan dapat menjelaskan harga jual rumah 95% dan sisanya adalah dijelaskan variabel lain.
* Jika variabel ukuran rumah (X1)dan umur bangunan (X2) bernilai nol maka harga jual rumah sebesar 10.04634 setiap penambahan ukuran rumah sebanyak 1 satuan luas , akan mengakibatkan harga jual yang meningkat sebesar 12,83445 juta
* setiap kenaikan umur bangunan sebanyak 1 satuan akan mengakibatkan harga jual rumah turun 0,05652 juta rupiah
Ndruru, R. E., Situmorang, M., & Tarigan,G. 2014. “Analisa Faktor-faktor yang Mempengaruhi Hasil-hasil Produksi Padi di Deli Serdang”. Saintia Matematika. Vol.2 (1), pp:71-83
Ghozali, I. (2016) Aplikasi Analisis Multivariete Dengan Program IBM SPSS 23. Edisi 8. Semarang: Badan Penerbit Universitas Diponegoro
Richie. (2017, September 04). Asumsi Normalitas Dalam Regresi. Diakses dari https://www.mobilestatistik.com/asumsi-normalitas-dalam-regresi
Sulistyono, S., & Sulistiyowati, W. (2018). Peramalan Produksi dengan Metode Regresi Linier Berganda. PROZIMA (Productivity, Optimization and Manufacturing System Engineering), 1(2), 82. https://doi.org/10.21070/prozima.v1i2.1350
IPTEKIN. (2013). Mengurai Stagnasi Inovasi Berbasis Litbang di Indonesia. Diakses dari https://123dok.com/article/uji-asumsi-dasar-uji-normalitas-hasil-diskusi.qodpg47z