Contoh kasus

Seorang peneliti melakukan penelitian untuk melihat ada tidaknya pengaruh ukuran rumah (x1) dan umur bangunan rumah (x2) terhadap harga jual rumah (y) tersebut. berikut merupakan data yang berhasil didapatkan :

Rumah ke- Ukuran Rumah (x1) Umur Bangunan (x2) Harga Jual Rumah (y)
1 1.8 30 32
2 1.0 33 24
3 1.7 25 27
4 2.8 12 47
5 2.2 26 35
6 0.8 25 17
7 3.6 28 52
8 1.1 29 20
9 2.0 25 38
10 2.6 2 45
11 2.3 30 44
12 0.9 23 19
13 1.2 12 25
14 3.4 33 50
15 1.7 1 30
16 2.5 12 43
17 1.4 17 27
18 3.3 16 50
19 2.2 22 37
20 1.5 29 28

Memanggil Data

Sebelum melakukan analisis lebih jauh lagi, pertama-tama yang akan dilakukan ialah mendeskripsikan data agar kita tahu bagaimana karakteristik data yang telah diperoleh. Pertama-tama panggil data terlebih dahulu.

datarumah=read.csv("D:/Belajar/Semester 7/Bisnis Analitik/Kumpulan Tugas/datarumah.csv",sep=";",header=TRUE)

Langkah-langkah analisis :

1. Deskripsi Data

Langkah pertama yang dilakukan dalam analisis regresi sederhana ialah mendeskripsikan karakteristik data.

summary(datarumah)
##   UkuranRumah     UmurBangunan  HargaJualRumah 
##  Min.   :0.800   Min.   : 1.0   Min.   :17.00  
##  1st Qu.:1.350   1st Qu.:15.0   1st Qu.:26.50  
##  Median :1.900   Median :25.0   Median :33.50  
##  Mean   :2.000   Mean   :21.5   Mean   :34.50  
##  3rd Qu.:2.525   3rd Qu.:29.0   3rd Qu.:44.25  
##  Max.   :3.600   Max.   :33.0   Max.   :52.00

2. Visualisasi Data

Berdasarkan visualisasi diatas dapat kita lihat bahwa :

  1. Diduga variabel Ukuran Rumah dengan Variabel Harga Jual Rumah memiliki hubungan yang linier ditinjau dari bentuk plot yang membentuk garis lurus

  2. Diduga tidak terdapat hubungan yang linier antara variabel Umur Bangunan dengan variabel Harga Jual Rumah karena plot tidak acak atau tidak menyerupai garis lurus.

  3. Diduga tidak terdapat hubungan antar variabel prediktor yaitu variabel Ukuran Rumah dengan Umur Bangunan sehingga dapat dikatakan tidak terdapat kasus multikolinieritas melihat scatterplot antara variabel Ukuran Rumah dengan variabel Umur bangunan yang acak dan tidak berpola.

Selanjutnya dengan menggunakan scatterplot, secara visualisasi akan dilakukan identifikasi terhadap adanya hubungan atau tidak antara variabel respon dengan masing-masing variabel prediktornya.

2.1 Variabel Ukuran Rumah dengan Variabel Harga Jual Rumah

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.5.0
## Warning in fun(libname, pkgname): bytecode version mismatch; using eval
g=ggplot(datarumah,aes(UkuranRumah,HargaJualRumah))
g+geom_point()+geom_smooth(method="lm",se=T)

Berdasarkan pola diatas dimana titik-titik membentuk suatu garis lurus, diduga variabel Ukuran Rumah memiliki hubungan dengan Variabel Harga Jual Rumah dengan standar error yang kecil.

2.2 Variabel Umur Bangunan dengan Variabel Harga Jual Rumah

library(ggplot2)
g=ggplot(datarumah,aes(UmurBangunan,HargaJualRumah))
g+geom_point()+geom_smooth(method="lm",se=T)

Berdasarkan pola diatas, sapat dilihat bahwa plot yang random menandakan tidak ada hubungan antara variabel Umur Bangunan dengan Harga Jual Rumah dan standar error nya juga cukup besar.

3. ANALISIS KORELASI

Analisis korelasi merupakan salah satu analisis yang penting dilakukan untuk mengetahui apakah tiap variabel prediktor berpengaruh signifikan terhadap variabel respon. berikut merupakan hasil analisisnya.

HIPOTESIS :

Untuk Variabel Ukuran Rumah :

\(\text{H}_0: \rho=0\) Tidak Terdapat Hubungan yang Signfikan antara variabel Ukuran Rumah dengan Harga Jual Rumah

\(\text{H}_1: \rho \neq0\) Terdapat Hubungan yang Signfikan antara variabel Ukuran Rumah dengan Harga Jual Rumah

Untuk Variabel Umur Bangunan :

\(\text{H}_0: \rho=0\) Tidak Terdapat Hubungan yang Signfikan antara variabel Umur Bangunan dengan Harga Jual Rumah

\(\text{H}_1: \rho \neq0\) Terdapat Hubungan yang Signfikan antara variabel Umur Bangunan dengan Harga Jual Rumah

TARAF SIGNIFIKANSI :

\(\alpha =5\%\)

STATISTIK UJI :

\(\text{t} = \frac{r^2\sqrt{\text{n}-2}}{\sqrt{1-r^2}}\)

\(r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}}\)

DAERAH PENOLAKAN:

Tolak \(\text{H}_0\) jika:

  1. \(t_{hitung} > t_{\alpha,n-2}\) dengan \(t_{\alpha,n-2}\) adalah nilai kritis dari tabel distribusi t dengan derajat bebas \(n-2\).

  2. Nilai \(|r|\) > 0,5

PERHITUNGAN STATISTIK UJI:
cor.test(datarumah$UkuranRumah, datarumah$HargaJualRumah)
## 
##  Pearson's product-moment correlation
## 
## data:  datarumah$UkuranRumah and datarumah$HargaJualRumah
## t = 18.622, df = 18, p-value = 3.292e-13
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9366055 0.9902695
## sample estimates:
##       cor 
## 0.9750145
cor.test(datarumah$UmurBangunan, datarumah$HargaJualRumah)
## 
##  Pearson's product-moment correlation
## 
## data:  datarumah$UmurBangunan and datarumah$HargaJualRumah
## t = -0.62162, df = 18, p-value = 0.542
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.5520734  0.3179487
## sample estimates:
##        cor 
## -0.1449691
KEPUTUSAN:

Untuk Variabel Ukuran Rumah :

  1. Tolak \(\text{H}_0\) karena \(t_{hitung}\) (18,622) > \(t_{0.05,18}\) (1,734)

  2. Tolak \(\text{H}_0\) karena Nilai \(r\) \(|(0,9750145)|\) > 0,5

Untuk Variabel Umur Bangunan :

  1. Gagal Tolak \(\text{H}_0\) karena \(t_{hitung}\) (-0,62162) < \(t_{0.05,18}\) (1,734)

  2. Gagal Tolak \(\text{H}_0\) karena Nilai \(r\) \(|(-0,1449691)|\) < 0,5

KESIMPULAN:
  1. Variabel Ukuran Rumah memiliki Pengaruh atau hubungan yang kuat yang signifikan terhadap Harga Jual Rumah

  2. Variabel Umur Bangunan tidak memiliki hubungan yang signifikan terhadap Harga Jual Rumah

Sehingga untuk analisis selanjutnya, variabel Umur Bangunan tidak dimasukkan dalam analisis regresi sederhana karena tidak memiliki pengaruh yang signifikan terhadap Harga Jual Rumah.

4. ANALISIS REGRESI

Setelah dilakukan analisis korelasi dan mendapatkan variabel prediktor yang berpengaruh signifikan terhadap variabel Harga Jual Rumah. Selanjutnya dilakukan analisis regresi untuk mendapatkan persamaan model untuk menjelaskan keragaman Harga Jual Rumah.

Sebelum melakukan analisis regresi, terdapat asumsi yang harus terpenuhi agar mendapatkan hasil estimasi yang baik. yaitu dengan dilakukan uji asumsi normalitas.

UJI NORMALITAS

HIPOTESIS :

\(\text{H}_0:\) Variabel Ukuran Rumah Berdistribusi Normal

\(\text{H}_1:\) Variabel Ukuran Rumah Tidak Berdistribusi Normal

TARAF SIGNIFIKANSI :

\(\alpha =5\%\)

STATISTIK UJI :

\(\text{p-value}\)

DAERAH PENOLAKAN:

Tolak \(\text{H}_0\ jika\ \text{p-value} \leq \alpha\)

PERHITUNGAN STATISTIK UJI:
shapiro.test(datarumah$UkuranRumah)
## 
##  Shapiro-Wilk normality test
## 
## data:  datarumah$UkuranRumah
## W = 0.9535, p-value = 0.4233
KEPUTUSAN:

Gagal Tolak \(\text{H}_0\) karena \(\text{p-value}\) (0,4233) > \(\alpha\) (0,05)

KESIMPULAN:

Variabel Ukuran Rumah Berdistribusi Normal

Setelah dilakukan uji normalitas, dilanjutkan dengan analisis regresi.

Analsis Regresi linier sederhana itu sendiri memiliki model sebagai berikut.

\(f(x) = a + b x\)

dimana :

f(x) = variabel respon

a = konstanta

b = Koefisien Variabel X

x = variabel prediktor

regresi=lm(datarumah$HargaJualRumah~datarumah$UkuranRumah, datarumah)
summary(regresi)
## 
## Call:
## lm(formula = datarumah$HargaJualRumah ~ datarumah$UkuranRumah, 
##     data = datarumah)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.6305 -2.0365 -0.0653  2.0835  5.6305 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             8.7035     1.4981    5.81 1.67e-05 ***
## datarumah$UkuranRumah  12.8982     0.6926   18.62 3.29e-13 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.551 on 18 degrees of freedom
## Multiple R-squared:  0.9507, Adjusted R-squared:  0.9479 
## F-statistic: 346.8 on 1 and 18 DF,  p-value: 3.292e-13

Diperoleh persamaan model sebagai berikut :

\(f(x) = 8,7035 + 12,8982 x\)

dengan besar \({R}^2\) = 0,9507 yang artinya keragaman variabel Harga Jual Rumah yang dapat dijelaskan oleh variabel Ukuran Rumah sebesar 95,07%. sedangkan untuk 4,93% sisanya dijelaskan oleh variabel lain diluar model.