Pemodelan Regresi Berganda Pada Kualitas CPU untuk Teknologi Product Apple Inc.

Athifah Fauzia Afiz

20-05-2022

1 PENDAHULUAN

1.1 Latar Belakang

Perkembangan teknologi yang sangat pesat di era globalisasi saat ini memberikan banyak manfaat untuk aktivitas yang dilakukan oleh manusia. Tidak hanya komunikasi saja, namun teknologi saat ini bisa membantu manusia untuk membuat visualisasi dari berbagai ide yang dimiliki ataupun membantu memenuhi kebutuhan di berbagai aspek bidang. Untuk mencapai tujuan tersebut, maka dibutuhkannya kualitas teknologi yang terbaik untuk mencapai hasil yang maksimal dan memuaskan bagi penggunanya.

Nama brand teknologi yang terkenal di dunia saat ini yaitu brand milik perusahaan Apple Inc. yang berasal dari negara Amerika Serikat. Pengguna teknologi ini dimulai dari kalangan anak remaja sampai orangtua dengan kepentingan yang berbeda-beda seperti belajar dan bekerja. Karena ekspetasi pengguna semakin tinggi terhadap teknologi produk Apple Inc., maka para pengembang teknologi perusahaan tersebut harus menciptakan kualitas teknologi yang terbaik. Salah satu aspek penting yang dilihat yaitu kualitas komponen CPU dari tiap device yang dibuat oleh Apple. Untuk mengetahui seberapa pengaruh Core dan Clock Speed terhadap CPU Score dalam mencapai kualitas CPU yang terbaik, salah satu metode statistika yang dapat diterapkan adalah Analisis Regresi Linier Berganda.

Analisis Regresi Linier Berganda dapat menunjukkan apakah Core dan Clock Speed berpengaruh terhadap CPU Score untuk mencapai kualitas CPU yang terbaik dan mengetahui seberapa besar pengaruhnya. Oleh karena itu melalui penelitian ini, dilakukan analisis dengan metode tersebut dengan tujuan menguji pengaruh komponen CPU device dalam mencapai hasil kualitas produk Apple Inc. yang terbaik.

1.2 Analisis Regresi Linier Berganda

Regresi linear berganda digunakan untuk penelitian yang memiliki lebih dari satu variabel independen. Menurut Ghozali (2018), analisis ini digunakan untuk mengetahui arah dan seberapa besar pengaruh variabel independen terhadap variabel dependen.

Persamaan Regresi Linier Berganda dinyatakan dalam bentuk : \[ Y = β_0 + β_1 X_1+β_2X_2+...+β_kX_k+ε \]

1.3 Plot Pemeriksaan Sisaan

Pemeriksaan Sisaan (Residuals Diagnostic) adalah langkah awal untuk memeriksa secara visual apaka terdapat pelanggaran asumsi dari model regresi yang sudah terbentuk. Khan, Mahzabin (2021).

  1. Sisaan vs Fitted

    Sisaan pada sumbu Y dan nilai duga apda sumbu X. Plot dengan pola horizontal mengindikasikan ketepatan model

  2. Normal Q-Q

    Kuantil sebaran normal secara teori pada sumbu X, Kuantil dari sisaan yang dibakukan pada sumbu Y. Titik-titik yang jatuh di sekitar garis.

  3. Scale-Location

    Nilai duga (fitted value) pada sumbu X dan akar dai pembakuan sisaan pada sumbu Y. Sebaran sisaan di setiap nilai duga menggambarkan ragam, ragam yang homogen dicirikan dengan pola horizontal.

1.4 Uji Asumsi

1.4.1 Asumsi Normalitas

Uji Normalitas merupakan pengujian yang digunakan untuk mengetahui apakah variabel prediktor maupun respon berdistribusi normal atau tidak dengan cara uji normalitas pada galat. Untuk melakukan uji normalitas ini dapat menggunakan uji Jarque Berra, Saphiro Wilk, Kolmogorov Smirnov ataupun menggunakan Q-Q Plot.

Hipotesis:

H0 : Residual berdistribusi normal

H1 : Residual tidak berdistribusi normal

Kriteria :

  • Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa data yang digunakan sudah berdistribusi normal

  • Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa data yang digunakan tidak berdistribusi normal

1.4.2 Asumsi Homoskedastisitas

Uji Homoskedastisitas merupakan pengujian yang digunakan untuuk mengetahui apakah dalam sebuah model regresi terjadi ketidaksamaan varians dari residual antara satu pengamatan dengan pengamatan yang lain. Untuk melakukan uji Homoskedastisitas ini dapat menggunakan uji Breusch Pagan

Hipotesis:

H0 : δ2 = δ3 = 0

H1 : Paling tidak terdapat satu δj ≠ 2,3

Kriteria :

  • Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa varian residual bersifat homoskedastisitas.

  • Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa varian residual tidak bersifat homoskedastisitas.

1.4.3 Asumsi Non Autokorelasi

Uji Non Autokorelasi merupakan merupakan pengujian yang digunakan untuk mengetahui korelasi antara residual. Untuk mendeteksi autokorelasi dapat menggunakan uji Durbin Watson.

Hipotesis:

H0 : ρ = 0

H1 : ρ ≠ 0

Kriteria :

  • Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa tidak terjadi autokorelasi sehingga asumsi sudah terpenuhi.

  • Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa terjadi autokorelasi sehingga asumsi belum terpenuhi.

1.4.4 Pendeteksian Multikolinearitas

Uji Pendeteksian Multikolinieritas merupakan pengujian yang digunakan untuk mengetahui kondisi dimana terdapat hubungan linier antar variabel prediktor dalam model regresi. Untuk mendeteksi adanya multikolinieritas adalah menghitung nilai Varians Inflation Factor (VIF)/

Kriteria : Jika Nilai VIF > 10 maka terjadi multikolinieritas.

1.5 Uji Hipotesis

1.5.1 Uji Simultan

Uji Simultan digunakan untuk mengetahui apakah seluruh variabel prediktor mempunyai pengaruh secara bersama – sama terhadap variabel respon.

Hipotesis:

H0 : β0 = β1 = β2 = 0

H1 : minimal terdapat β dimana βi ≠ 0,i = 0,1,2

Kriteria :

  • Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa secara simultan variabel prediktor berpengaruh terhadap variabel respon.

  • Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa secara simultan variabel prediktor tidak berpengaruh terhadap variabel respon.

1.5.2 Uji Parsial

Uji Parsial digunakan untuk menguji pengaruh masing – masing variabel prediktor secara individual terhadap variabel respon. Uji parsial atau uji t ini dapat dilakukan dengan melihat nilai signifikansi t yang terdapat pada hasil output pemodelan analisis regresi.

Hipotesis:

H0 : βi = 0

H1 : βi ≠ 0

Kriteria :

  • Apabila P-Value < α, maka keputusan H0 ditolak. Disimpulkan bahwa secara parsial variabel prediktor berpengaruh terhadap variabel respon.

  • Apabila P-Value > α, maka keputusan H0 diterima. Disimpulkan bahwa secara parsial variabel prediktor tidak berpengaruh terhadap variabel respon.

1.5.3 Koefisien Determinasi

Koefisien determinasi digunakan untuk melihat seberapa besar nilai variabel prediktor memberikan perngatuh terhadap variabel respon.

\[ R^2 = \frac {JKR}{JKT} \]

1.6 Data

Data yang digunakan pada pemodelan ini merupakan data sekunder yang diperoleh dari website kaggle dengan pengambilan data yang bersumber dari Geekbench dan AnTuTu. Variabel yang digunakan adalah CPU Score (Y), Cores (X1), dan Clock Speed (X2)

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> library("knitr")
> library("rmarkdown")
> library("prettydoc")
> library("equatiomatic")
> library("car")
> library("tseries")
> library("readxl")
> library("lmtest")

2.2 Mengimport Data Excel

> Data_Product_Apple <- read_excel("C:/Users/Admin/OneDrive/Documents/Komputasi Statistika/Data Product Apple Inc.xlsx")

Mengimport Data Excel yang sudah tersimpan menggunakan package library(readxl) dan perintah fungsi read_excel, argumen yang digunakan yaitu lokasi penyimpanan file Data Excel tersebut.

2.3 Menampilkan Data

> Data_Product_Apple
# A tibble: 20 x 4
   Devices                             Cores ClockSpeed CPUScore
   <chr>                               <dbl>      <dbl>    <dbl>
 1 iPhone 13 Pro Max                       6       3230      935
 2 iPhone 13 Pro                           6       3230      931
 3 iPhone 13 mini                          6       3230      924
 4 iPad Pro (12.9-inch 5th generation)     8       3190     1013
 5 iPad Pro (11-inch 3rd generation)       8       3190     1011
 6 iPhone 13                               6       3230      916
 7 iPad mini (6th generation)              6       2920      899
 8 iPad Air (4th generation)               6       2990      881
 9 iPhone 12                               6       2990      859
10 iPhone 12 Mini                          6       2990      856
11 iPhone 12 Pro Max                       6       2990      866
12 iPhone 12 Pro                           6       2990      848
13 iPhone 11 Pro Max                       6       2660      697
14 iPhone 11                               6       2660      683
15 iPhone 11 Pro                           6       2660      696
16 iPhone SE (2nd generation)              6       2660      673
17 iPad Pro (12.9-inch 3rd Generation)     8       2490      694
18 iPad Pro 12.9-inch (4th generation)     8       2490      681
19 iPad Pro 11-inch (2nd generation)       8       2490      680
20 iPad Pro (11-inch)                      8       2490      678

2.4 Pendefinisian Vektor

> Data_Product_Apple$Cores -> X1
> Data_Product_Apple$ClockSpeed -> X2
> Data_Product_Apple$CPUScore -> Y

Mendefinisikan tiap variabel yaitu variabel Cores menjadi Vektor X1, variabel Clock Speed menjadi Vektor X2, dan variabel CPU Score sebagai vektor Y.

2.5 Analisis Regresi Berganda

> reg <-lm(Y~X1+X2, data=Data_Product_Apple)
> summary(reg)

Call:
lm(formula = Y ~ X1 + X2, data = Data_Product_Apple)

Residuals:
    Min      1Q  Median      3Q     Max 
-37.821 -17.251  -3.228  10.638  83.370 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -680.65495  101.07113  -6.734 3.50e-06 ***
X1            32.43626    7.45262   4.352 0.000433 ***
X2             0.44578    0.02458  18.138 1.47e-12 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 28.14 on 17 degrees of freedom
Multiple R-squared:  0.9521,    Adjusted R-squared:  0.9464 
F-statistic: 168.8 on 2 and 17 DF,  p-value: 6.107e-12

Melakukan Analisis Regresi Berganda menggunakan function lm dengan argumen formula sebagai rumus untuk pernyataan model regresi dan Data_Product_Apple digunakan pada argument data. Nilai X1, X2, dan Y sudah tersimpan pada data tersebut sehingga dapat dinotasikan dengan Y~X1+X2. Hasil perhitungan lm ini disimpan ke obyek reg kemudian summary digunakan untuk menyajikan hasil analisis dari reg secara lengkap.

2.6 Plot Pemeriksaan Sisaan

Function plot digunakan sebagai perintah menyajikan plot dari data yang dituliskan argumen which = 1 untuk Residuals vs Fitted, which = 2 Normal Q-Q, which = 3 Scale-Location, kemudian ketiga plot tersebut disajikan dengan par(mfrow) untuk menjadikan 3 plot sekaligus ditampilkan pada satu layer dengan 2 baris dan tiap barisnya berisi dua plot.

> par(mfrow=c(2,2))
> plot(reg,1)
> plot(reg,2)
> plot(reg,3)

  1. Plot 1 : Tidak bebentuk pola tertentu maka asumsi linearitas terpenuhi.
  2. Plot 2 : Tidak terlihat adanya pelanggaran normalitas dikarenakan sebaran plot mendekati model (garis lurus).
  3. Plot 3 : Penyebaran titik-titik data tidak membentuk pola bergelombang melebar kemudian menyempit dan melebar kembali, penyebaran titik-titik data tidak berpola, dan tidak mengumpul hanya di atas atau dibawah saja, maka dapat disimpulkan tidak terdapat gejala heteroskedastisitas.

2.7 Uji Asumsi

> #Uji Normalitas Residual
> sisa<-residuals(reg)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 14.156, df = 2, p-value = 0.0008435
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.88592, p-value = 0.02264
> 
> #Uji Homoskedastisitas
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 1.3633, df = 2, p-value = 0.5058
> 
> #Uji Non Autokorelasi
> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 1.8019, p-value = 0.1882
alternative hypothesis: true autocorrelation is greater than 0
> 
> #Pendektesian Multikolinieritas
> car::vif(reg)
      X1       X2 
1.178356 1.178356 
  1. Function residuals digunakan untuk meng-extract hasil residual dari model pada argumen object reg kemudian disimpan dalam object sisa.
  • jarque.bera.test digunakan untuk melakukan uji Jarque Bera untuk mencari Normalitas Residual dari data sisa
  • shapiro.test digunakan untuk melakukan uji Shapiro Wilk untuk mencari Normalitas Residual dari data sisa
  1. Function bptest digunakan untuk melakukan uji Breusch Pagan untuk mengetahui terpenuhi atau tidaknya asumsi Homoskedastisitas
  2. Function dwtest digunakan untuk melakukan uji Durbin Watson untuk mengetahui apakah terjadi autokorelasi atau tidak
  3. Function car::vif digunakan untuk melakukan pendeteksian Multikolinieritas

3 HASIL DAN PEMBAHASAN

3.1 Persamaan Regresi

Hasil Koefisien Analisis Regresi
Variabel Penduga Parameter
Konstanta -680.65
Cores (X1) 32.44
Clock (X2) 0.45

Diperoleh bentuk persamaan dari hasil analisis regresi berganda diatas yaitu : \[ Ŷ = -680.85 + 32.44(X_1)+0.45(X_2) \] Interpretasi:

  1. Apabila Cores bernilai konstan, maka setiap peningkatan 1% Clock Speed akan menaikkan CPU Score sebesar 32.44%
  2. Apabila Clock Speed bernilai konstan, maka setiap peningkatan 1% Clock Speed akan menaikkan CPU Score sebesar 0.45%
  3. Apabila nilai Cores dan Clock Speed 0, maka nilai CPU Score -680.85

3.2 Uji Asumsi

Hasil Uji Asumsi
Uji Asumsi P-Value
Normalitas (Jarque) 0.0008435
Normalitas (Shapiro) 0.02264
Homoskedastisitas 0.5058
Non Autokorelasi 0.1882
Multikolinieritas Nilai VIF
Cores (X1) 1.178356
Clock (X2) 1.178356

Interpretasi Hasil Uji Asumsi

  1. Uji Normalitas Residual Jarque

    Hipotesis:

    H0 : Residual berdistribusi normal

    H1 : Residual tidak berdistribusi normal

    P-Value (0.0008435) < α (0.05) maka keputusan H0 ditolak. Dapat disimpulkan bahwa residual berdistribusi tidak normal

  2. Uji Normalitas Residual Shapiro

    Hipotesis:

    H0 : Residual berdistribusi normal

    H1: Residual tidak berdistribusi normal

    P-Value (0.02264) < α (0.05) maka keputusan H0 ditolak. Dapat disimpulkan bahwa residual berdistribusi tidak normal

  3. Uji Homoskedastisitas

    Hipotesis:

    H0 : δ2 = δ3 = 0

    H1 : Paling tidak terdapat satu δj ≠ 2,3

    P-Value (0.5058) > α (0.05) maka keputusan H0 diterima. Dapat disimpulkan bahwa varian residual bersifat homoskedastisitas.

  4. Uji Non Autokorelasi

    Hipotesis:

    H0 : ρ = 0

    H1 : ρ ≠ 0

    P-Value (0.1882) > α (0.05) maka keputusan H0 diterima. Dapat disimpulkan bahwa tidak terjadi autokorelasi sehingga asumsi sudah terpenuhi.

  5. Pendeteksian Multikolinieritas

    Karena nilai VIF < 10, maka asumsi non-multikolinieritas sudah terpenuhi.

3.3 Uji Hipotesis

Hasil Uji Hipotesis Parsial
Variabel P Value
Cores (X1) 0.000433
Clock (X2) 0.000000
  1. Uji Simultan

    Hipotesis:

    H0 : β0 = β1 = β2 = 0

    H1 : minimal terdapat β dimana βi ≠ 0,i = 0,1,2

    P-Value (0.000) < α (0.05) maka keputusan H0 ditolak. Dapat disimpulkan bahwa secara bersamaan terdapat pengaruh antara variabel Cores dan Clock Speed terhadap CPU Score.

  2. Uji Parsial

    Hipotesis:

    H0 : βi = 0

    H1 : βi ≠ 0

    Kesimpulan :

    • P-Value Variabel Cores (0.000433) < α (0.05) maka keputusan H0 ditolak. Dapat disimpulkan bahwa secara parsial terdapat pengaruh antara variabel Cores terhadap CPU Score.

    • P-Value Variabel Clock Speed (0.0000) < α (0.05) maka keputusan H0 ditolak. Dapat disimpulkan bahwa secara parsial terdapat pengaruh antara variabel Clock Speed terhadap CPU Score.

  3. Koefisien Determinasi

    Diperoleh nilai koefisien determinasi pada summary(reg) sebesar 95.21%. Dapat disimpulkan bahwa variabel cores dan clock speed dapat menjelaskan hubungan terhadap CPU Score sebesar 95.21% sedangkan 4.79% dipengaruhi oleh variabel lain di luar model.

4 DAFTAR PUSTAKA

Jo, Alan. Smartphone Processor Ranking & Scores. (2022). Diakses pada 20 Mei,2022. https://www.kaggle.com/datasets/alanjo/smartphone-processors-ranking

Ghozali, Imam. 2018. Aplikasi Analisis Multivariate Dengan Program IBM SPSS 25 Semarang: Universitas Dipenogoro

Khan, Mahzabin. A Basic Guide to Testing the Assumptions of Linear Regression in R. (2017). Diakses pada 20 Mei,2022. https://www.godatadrive.com/blog/basic-guide-to-test-assumptions-of-linear-regression-in-r

Sugiyono. 2014. Statistik untuk Penelitian. Bandung: Alfabeta.