Analisis Usia HP vivo Y30i dan Harga jualnya dalam software R

wenny

2022-05-20

1 PENDAHULUAN

1.1 Latar Belakang

Harga jual barang elektronik seperti HP seringkali menjadi masalah bagi seseorang yang ingin menjualnya karena tidaka ada harga tetap yang ditentukan oleh pasar. Tentu saja banyak faktor yang dilihat ketika akan menjual HP bekas atau membeli Hp bekas seperti lama pemakaian, kerusakan fisik HP, model, dan lain-lain. Dalam artikel ini dibahas mengenai pengaruh salah satu faktor tersbut yaitu usia HP. Dilihat pengaruh melaui analisis regresi sederhana menggunakan software R untuk mengetahui hubungan antara usia Hp dengan merk vivo Y30i dengan harga jualnya.

1.2 Statistika Deskriptif

Statistika deskriptif merupakan metode-metode yang berkaitan dengan pengumpulan dan penyajian dari suda gugus data sehingga memberikan informasi yang sempurna (Walpole, 1982). Perlu diketahui bahwa statistika deskriptif memberikan informasi hanya mengenai dat ayang dipunyai dan sama seklai tidak menarik kesimpulan tentang data induknya yang lebih besar. Tujuan utamanya yaitu menggunkan statistik untuk mendapat kesimpulan dari data yang diamati. Dalam kasus ini akan dibahas tentang sebagian dari statistika deskriptif seperti rata-rata, jummlah suatu vektor, median, ragam, simpangan baku, quartil 1, quartil 3, nilai min, nilai maksimum serta beberapa plot maupun grafik0. Data dalam kasus berupa data yang dibangkitkan dari distribusi nirmal menggunakan fungsi rnorm.

1.3 Statistika Inferensia

statistika inferensia merupakan semua metode yang berhubungan analisis sebagian data untuk kemudian sampai kepada peramalan atau penarikan kesimpulan mengenai keseluruhan gugus data induknya (Walpole, 1982).statistika inferensia terbagi menjadi dua yaitu:

  1. statistika Parametrik statistika parametrik merupakan salah satu metode pengujian data yang ada di dalam statistik inferensial, dimana akan digunakan untuk menguji hipotesis yang telah dibuat. Hasil pengujian data sampel ini akan dijadikan kesimpulan untuk populasi. Beberapa jenis uji parametrik sebagai berikut:
  • Uji-T
  • ANOVA
  • Regresi
  • Korelasi
  1. Statistika Non Parametrik
    merupakan bagian dari statistik yang parameter populasinya tidak mengikuti suatu distribusi tertentu dan variansnya tidak perlu homogen. Jenis Statistika Non Parametrik, antara lain:
  • chi-square
  • Run Test
  • Kolmogorov Smirnov
  • Mc Nemar
  • Wilcoxon
  • Mann-Whitney
  • Spearman
  • Korelasi Kendall-Tau
  • uji Binomial
  • dan lainnya.

Dalam kasus ini akan dibahas menegenai bagian dari statistika inferensia yaitu analisis regresi sederhana menggunakan R dengan variabel x yaitu usia HP merk vivo y30i dan variabel y yaitu harga jula HP. Analisis regresi bertujuan untuk menentukan bentuk hubungan ketergantungan dari suatu variabel tak bebas/respons (x) kepada satu atau lebih peubah penjelas atau prediktor (Y)

1.4 Asumsi Regresi

Dalam Analisis Regresi perlu dilakukan uji asumsi untuk uji hipotesis dan analisis kebaikan model. Asumsi yang perlu dilakukan yaitu:

  1. UJi Non Multikolinearitas
    Non Multikolinearitas memiliki arti bahwa tidak ada hubungan linear anatar prediktor sehingga diperlukan uji asumsi ini agar kontribusi efek perubahan setiap variabel prediktor terhadap variabel respons dapat dianalisis secara terpisah. Apabila terjadi masalah multikolinearitas maka asumsi ini terlanggar.

  2. UJi Normalitas
    Uji ini digunakan untuk mengetahui apakah nilai residual dari data berdistribusi normal. Model regresi yang baik adalah memiliki nilai yang berdistribusi normal. Uji Normalitas dapat dilakukan dengan berbagai uji, diantaranya yaitu uji jarque bera dan shapiro wilk.

  3. Uji Homokedastisitas
    Model regresi perlu memenuhi homogenitas galat, hal tersebut dikarenakan heterokedastisitas dapat meningkatkan ragam dari sebaran beta duga sehingga beta duga bukan lagi menjadi penduga yang efisien. Asumsi ini dapat diketahui terpenuhi atau tidak melalui Uji Breusch Pagan.

  4. Uji Non Autokorelasi
    Non Autokorelasi adalah asumsi kebabasan antar galat. Pelanggaran dari asumsi ini sebut juga masalah autokorelasi, akbibat dari kesalahan spesifikasi model atau tidak digunakannya variabel prediktor yang penting. Uji yang digunakan untuk mengetahui terpenuhinya asumsi ini adalah Uji Durbin Waston.

1.5 Data

> data <- read.table("clipboard", header=T, dec=",")
> data
   Usia_HP_vivo_Y30i.bulan. Harga_jual_HP
1                        12       1800000
2                         6       2000000
3                         7       1950000
4                         9       1900000
5                         4       2200000
6                        10       1925000
7                        24       1500000
8                        18       1450000
9                        12       1800000
10                       10       1925000
11                        6       2000000
12                       18       1450000

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # Library
> library(tseries)
> library(lmtest)

2.2 Statistika Deskriptif

Rata-rata

  • Rata-rata Variabel X (usia HP)
> X<-c(12,6,7,9,4,10,24,18,12,10,6,18)
> X
 [1] 12  6  7  9  4 10 24 18 12 10  6 18
> 
> Xbar<- mean(X)
> Xbar
[1] 11.33333
  • Rata-rata Variabel X (harga jual HP)
> Y<-c(1800000,2000000,1950000,1900000,2200000,1925000,1500000,1450000,1800000, 1925000,2000000,1450000)
> Y
 [1] 1800000 2000000 1950000 1900000 2200000 1925000 1500000 1450000 1800000
[10] 1925000 2000000 1450000
> 
> Ybar<- mean(Y)
> Ybar
[1] 1825000

2.3 Statistika Inferensia

  • Analisis Regresi (Manual)
> #analisis pendahuluan
> scatter.smooth(X,Y,main="HUbungan usia dengan harga HP", xlab = "x", ylab="y")

> #Penduga parameter dan sisaan
> n<-12
> k<-2
> x<-matrix(c(rep(1,12), data$Usia_HP_vivo_Y30i.bulan),nrow=12,ncol=2)
> x
      [,1] [,2]
 [1,]    1   12
 [2,]    1    6
 [3,]    1    7
 [4,]    1    9
 [5,]    1    4
 [6,]    1   10
 [7,]    1   24
 [8,]    1   18
 [9,]    1   12
[10,]    1   10
[11,]    1    6
[12,]    1   18
> b_topi<-solve(t(x)%*%x)%*%(t(x)%*%Y)
> b_topi
           [,1]
[1,] 2255102.92
[2,]  -37950.26
> y_topi<-x%*%b_topi
> y_topi
         [,1]
 [1,] 1799700
 [2,] 2027401
 [3,] 1989451
 [4,] 1913551
 [5,] 2103302
 [6,] 1875600
 [7,] 1344297
 [8,] 1571998
 [9,] 1799700
[10,] 1875600
[11,] 2027401
[12,] 1571998
> sisa<-Y-y_topi
> sisa
              [,1]
 [1,]     300.1715
 [2,]  -27401.3722
 [3,]  -39451.1149
 [4,]  -13550.6003
 [5,]   96698.1132
 [6,]   49399.6569
 [7,]  155703.2590
 [8,] -121998.2847
 [9,]     300.1715
[10,]   49399.6569
[11,]  -27401.3722
[12,] -121998.2847
> #Uji F (manual)
> Ybarkuad<-Ybar^2
> Ybar
[1] 1825000
> JKR<-(t(b_topi)%*%t(x)%*%Y)-(n*Ybarkuad)
> JKR
             [,1]
[1,] 559766295026
> JKT<-(t(Y)%*%Y)-(n*Ybarkuad)
> JKT
           [,1]
[1,] 6.3125e+11
> JKG<-JKT-JKR
> JKG
            [,1]
[1,] 71483704974
> JK<-c(JKR,JKG,JKT)
> 
> dbreg<-k-1
> dbreg
[1] 1
> dbreg
[1] 1
> dbtotal<-n-1
> dbtotal
[1] 11
> dbgalat<-dbtotal-dbreg
> dbgalat
[1] 10
> db<-c(dbreg,dbgalat,dbtotal)
> db
[1]  1 10 11
> 
> KT<-JK/db
> KT
[1] 559766295026   7148370497  57386363636
> Sk<-c("Regresi","galat","total")
> Sk
[1] "Regresi" "galat"   "total"  
> anreg<-data.frame(Sk,JK,db,KT)
> anreg
       Sk           JK db           KT
1 Regresi 559766295026  1 559766295026
2   galat  71483704974 10   7148370497
3   total 631250000000 11  57386363636
> 
> F_hit<-anreg$KT[1]/anreg$KT[2]
> F_hit
[1] 78.30684
  • Analisis Regresi (built in)
> reg<-lm(Harga_jual_HP~Usia_HP_vivo_Y30i.bulan., data=data)
> reg

Call:
lm(formula = Harga_jual_HP ~ Usia_HP_vivo_Y30i.bulan., data = data)

Coefficients:
             (Intercept)  Usia_HP_vivo_Y30i.bulan.  
                 2255103                    -37950  
> 
> summary(reg)

Call:
lm(formula = Harga_jual_HP ~ Usia_HP_vivo_Y30i.bulan., data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-121998  -30414   -6625   49400  155703 

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               2255103      54388  41.463 1.60e-12 ***
Usia_HP_vivo_Y30i.bulan.   -37950       4289  -8.849 4.82e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 84550 on 10 degrees of freedom
Multiple R-squared:  0.8868,    Adjusted R-squared:  0.8754 
F-statistic: 78.31 on 1 and 10 DF,  p-value: 4.816e-06
  • Koefisien determinasi (manual)
> R_kuad<-anreg$JK[1]/anreg$JK[3]
> R_kuad
[1] 0.8867585
  • Uji Asumsi
  1. Uji Normalitas
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.95133, p-value = 0.6565
  1. Uji Homogenitas galat
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 7.5215, df = 1, p-value = 0.006097
  1. Uji Non autokorelasi
> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 1.911, p-value = 0.3917
alternative hypothesis: true autocorrelation is greater than 0

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

  • Untuk mencari rata-rata digunakan fungsi average(nama data). Pada variabel X (Usia HP Vivo Y30i) diperoleh rata-rata sebagai berikut: \[ \mu=11.33333 \] Pada variabel Y (Harga Jual) diperoleh rata-rata sebagai berikut: \[ \mu=1825000 \] Berdasarkan hasil tersebut diperoleh rata-rata Usia HP Vivo Y30i sebesar 11.3333 dan rata-rata harga jual sebesar 1825000 yang dapat digunakan untuk perhitungan analsis regresi sederhana.

3.2 Statistika Inferensia

Analsis Regresi

  1. Analsis awal
> scatter.smooth(X,Y,main="Hubungan usia dengan harga HP",xlab = "x",ylab = "y")

Sebelum analisis regresi terlebih dahulu mencari hubungan antara keduanya dengan diagram pencar menggunakan perintah scatter.smooth dengan argumen x dan y yang sudah ada sebelummnya, judul, dan nama sumbu. Pada output diatas terlihat adanya hubungan linier antar variabel usia HP vivo Y30i dengan harga jual.

  1. Model Penduga parameter dan sisaan Model regresi dapat diketahui melalui perhitungan manual dengan perhitungan matriks sesuai rumus sehingga didapatkan model sebagai berikut: \[ \beta_0 = 2255102.92 \] \[ \beta_1 = -37950.26 \] \[ \hat{y} = \beta_0 + \beta_1x + \varepsilon \] \[ \hat{y} = 2255102.92 + -37950.26x + \varepsilon \]

  2. Uji F (simultan) Untuk mengetahui hubungan antara kedua variabel x dan y dilakukan uji F seperti diatas menggunakan perhitungan manual ataupun menggunakan fungsi lm() sebagai berikut:

Hipotesis:
H0 : Terdapat pengaruh antara Usia dan harga HP
H1 : Tidak terdapat pengaruh antara usia dan harga HP

Statistik uji \[ F~hit~ = 78.30684 \] \[ F~tab~ = 5.117 \]

Keputusan : Terima H0 karena F~hit > Ftab Kesimpulan : Berdasarkan keputusan tersebut dapat diketahui bahwa usia Hp Vivo Y30i berpengaruh terhadap harga jualnya.

nilai F hirung diatas dapat dilihat dari perhitungan manual uji F sesuai rumus perhitungan matriks dan dapat diketagui dari output fungsi lm() dan untuk nilai pembandingnya dapat dilihat pada tabel F.

  1. Uji Asumsi
  • Uji Normalitas Uji ini digunakan untuk mengetahui apakah data berdistribusi normal atau tidak karena model regresi yang baik memiliki nilai yang berdistribusi normal. Beberapa uji yang digunakan yaitu uji jarque bera dan shapiro wilk.

\[ p-value(ShapiroWilk) = 0.6565 \] Berdasarkan p-value dari uji shapiro wilk diatas dapat diketahui bahwa p-value > 0.05 sehingga asumsi ini terpenuhi atau tidak terbukti ada pelanggaran asumsi normalitas galat.

  • Uji Homogenitas Galat Uji ini digunakan untuk melihat kehomogenitas galat karena heterokesdastisitas dapat meningkatkan ragam dari sebaran beta duga sehingga beta bukan lagi menjadi penduga yang baik. asumsi ini dapat diketahui melaui uji Breunch pagan sebagai berikut: \[ p-value(breunchpagan) = 0.06 \] Berdasarkan p-value dari uji Breunch pagan diatas dapat diketahui bahwa p-value > 0.05 sehingga asumsi ini terpenuhi atau tidak terbukti ada pelanggaran asumsi homogenitas galat.

  • Uji Non Autokorelasi Uji ini digunakan untuk kebebasan antar galat dapat diketahui melalui uji Durbin Watson sebagai berikut: \[ p-value(DurbinWatson) = 0.3917 \] Berdasarkan p-value dari uji Durbin Watson diatas dapat diketahui bahwa p-value > 0.05 sehingga asumsi ini terpenuhi atau tidak terbukti ada pelanggaran asumsi non autokorelasis.

4 Daftar Pustaka

Walpole, Ronald E. 1995.Pengantar Statistika Edisi ke-3. Jakarta. Penerbit PT. Gramedia Pustaka Utama.

Suntoyo,Yitnosumarto. 1990.Dasar-dasar Statistika. Jakarta. Penerbit CV. Rajawali