Analisis Regresi Berganda pada Hubungan antara Skor Tes Kecerdasan dan Frekuensi Membaca dengan Nilai Ujian

Fanuel Putra Anugrah

5/18/2022

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 Pendahuluan

1.1 Latar Belakang

Keberhasilan akademik seorang siswa secara umum dilihat berdasarkan nilai yang didapatkan. Nilai yang didapatkan pada semester tertentu. Nilai yang didapatkan umumnya dinotasikan dengan selang nilai yang telah ditetapkan.Penulis ingin mengetahui hubungan antara skor tes kecerdasan dan frekuensi membaca dengan nilai yang didapat siswa. Data yang diamati terdiri atas 45 siswa sekolah SMA N 1` Klaten. Data tersebut akan dianalisis dengan menggunakan analisis regresi linier berganda dengan melakukan uji asumsi klasik terlebih dahulu. Pendugaan awal besarnya nilai ujian bergantung pada besarnya skor tes kecerdasan dan frekuensi membaca. Tujuan akhir yang diinginkan adalah apakah besarnya nilai ujian bergantung pada besarnya skor tes kecerdasan dan frekuensi membaca

1.2 Regresi Linier Berganda

Regresi linier berganda adalah perluasan dari regresi linier sederhana. Pada regresi linier sederhana, model yang didapatkan hanya melibatkan satu variabel prediktor saja. Sementara itu, pada regresi linier berganda, model yang terbentuk melibatkan lebih dari satu variabel prediktor. Regresi linier berganda digunakan untuk mengetahui hubungan antara dua atau lebih variabel prediktor terhadap variabel respons dengan skala data yang digunakan adalah interval atau rasio. Model regresi linier berganda adalah sebagai berikut : \[ Y = \beta_{0} + \beta_{1} X_{1} + \beta_{2}X_{2}+ ...+\beta_{n}X_{n}+\epsilon{n}, n= 1,2,3,dst \]

1.3 Uji Asumsi Klasik

Menurut Imam Ghozali (2011), uji asumsi klasik terhadap model regresi linier yang digunakan untuk dilakukan agar dapat diketahui apakah model regresi baik atau tidak. Tujuan pengujian asumsi klasik adalah untuk memberikan kepastian bahwa persamaan regresi yang diperoleh memiliki ketepatan dalam estimasi, tidak bias, dan konsisten. Sebelum melakukan analisis regresi terlebih dahulu dilakukan pengujian asumsi. Asumsi-asumsi yang harus dipenuhi dalam analisis regresi, antara lain Normalitas, Homoskedastisitas, Non Multikolinieritas, dan Non Autokorelasi.

1.3.1 Normalitas

Uji normalitas bertujuan menguji residual memiliki distribusi yang normal atau tidak. Suatu model regresi yang baik adalah dimana datanya berdistribusi normal atau mendekati normal. Untuk uji statistik dalam normalitas dibagi dua yaitu uji statistik sederhana dengan melihat nilai kurtosis dan skewness dari residual dan uji statistik non parametrik Kolmogorov-Smirnov. Hipotesis dari Uji Normalitas:  H0 : Galat tersebar Normal
 H1 : Galat tersebar tidak Normal

1.3.2 Homokedastisitas

Homoskedastisitas artinya ragam sisaan di setiap nilai X bersifat homogen atau bernilai sama. pelanggaran dari asumsi ini disebut heteroskedastisitas. Apabila asumsi ini terlanggar berakibat pada meningkatnya ragam dari sebaran bukan lagi penduga yang efisien. Asumsi yang menyatakan bahwa varian setiap sisaan masih tetap sama baik untuk nilai-nilai pada variabel independen yang kecil maupun besar. Asumsi ini dapat ditulis sebagai berikut: \[ var(\varepsilon_{i})= \sigma^{2} , i=1,2,...,n \]

1.3.3 Non Multikolinieritas

Digunakan untuk mengetahui ada atau tidaknya hubungan linier antar variabel prediktor. Data dapat digunakan pada regresi linier apabila antar variabel prediktor tidak terdapat hubungan linier. Untuk mengetahui adanya multikolinieritas atau tidak, salah satunya dapat dengan menggunakan nilai VIF (Variance Inflation Factor). Perhitungan VIF adalah sebagai berikut : \[ VIF = \frac{1}{1-r_{s}^{2}} \] Hipotesis:  H0= Tidak Terdapat Multikolinieritas
 H1= Terdapat Multikolinieritas

Kriteria pengambilan keputusan : VIF < 10 maka tidak terdapat multikolinieritas (Terima H0)

1.3.4 Non Autokorelasi

Autokorelasi bertujuan untuk menguji apakah model regresi yang ditemukan adanya korelasi antara residual pada periode t dengan periode sebelumnya. Autokorelasi terjadi karena observasi yang berurutan sepanjang waktu berkaitan satu sama lain. Masalah ini timbul karena residual tidak bebas dari satu observasi ke observasi lainnya. Salah satu uji yang dapat digunakan adalah Uji Durbin Watson didapat keputusan sebagai berikut :

 * jika d < dL atau d>4-dL maka terjadi autokorelasi
 * jika dU < d < 4-dU maka tidak terjadi autokorelasi
 * jika dL <= d <= dU atau 4-dU <= d <= 4-dL maka tidak dapat disimpulkan apakah ada autokorelasi atau tidak

1.4 Uji Simultan (Uji F)

Dengan melakukan uji F, dapat diambil informasi mengenai Peubah-peubah penjelas (seluruh prediktor) yang ada dalam model berpengaruh secara serempak terhadap respon atau tidak. Uji simultan digunakan untuk mengetahui apakah variabel independen secara bersama-sama atau simultan mempengaruhi variabel dependen. Nilai uji F juga dapat dilihat dari output regresi yang dihasilkan oleh SPSS. Jika tingkat signifikansi < 0,05 (tingkat kepercayaan yang dipilih) maka H0 ditolak dan H1 diterima.

1.5 Uji Parsial

Digunakan untuk mengetahui apakah variabel independen secara parsial berpengaruh terhadap variabel dependen. Hipotesis yang digunakan dalam uji parsial adalah sebagai berikut:
 H0= variabel independen bukan merupakan penjelas yang signifikan terhadap variabel dependen.
 H1= variabel independen merupakan penjelas yang signifikan terhadap variabel dependen.

1.6 Data

Data yang digunakan adalah data Skor Tes Kecerdasan, Frekuensi Membaca dan Hasil Ujian pada siswa SMA N 1 Klaten

X1 X2 Y
86 76 86
86 76 90
76 81 96
81 81 90
81 67 81
76 81 76
76 81 76
76 62 98
76 57 76
86 76 86
81 81 86
76 81 89
81 67 76
81 76 81
76 76 76
76 80 76
71 62 81
86 81 90
86 67 90
86 81 90
71 81 80
67 81 70
76 67 81
81 76 91
86 67 86
81 81 81
76 81 76
81 62 81
75 57 76
81 76 81
71 76 86
76 81 86
76 57 76
86 62 86
81 81 81
86 86 86
81 76 81
76 76 91
86 81 86
81 81 81
81 67 81
81 81 81
76 81 76
76 62 76
76 62 76

 X1 = Skor Tes Kecerdasan
 X2 = Frekuensi Membaca
 Y = Nilai Ujian

2 Source Code

2.1 Library yang Dibutuhkan

> library("car")
> library("tseries")
> library("readxl")
> library("lmtest")

2.2 Mengimport Data Excel

> Data <- read_excel("Laprak.xlsx")

Mengimport Data Excel yang sudah tersimpan menggunakan package library(readxl) dan perintah fungsi read_excel, argumen yang digunakan yaitu lokasi penyimpanan file Data Excel tersebut.

2.3 Menampilkan Data

> Data
# A tibble: 45 x 3
      X1    X2     Y
   <dbl> <dbl> <dbl>
 1    86    76    86
 2    86    76    90
 3    76    81    96
 4    81    81    90
 5    81    67    81
 6    76    81    76
 7    76    81    76
 8    76    62    98
 9    76    57    76
10    86    76    86
# ... with 35 more rows

2.4 Pendefinisian Vektor

> Y <- Data$Y
> X1 <- Data$X1
> X2 <- Data$X2

Mendefinisikan tiap variabel yaitu variabel Skor Tes Kecerdasan menjadi Vektor X1, variabel Frekuensi Membaca menjadi Vektor X2, dan variabel Hasil Ujian sebagai vektor Y.

2.5 Analisis Regresi Berganda

> regresi <-lm(Y~X1+X2, data=Data)
> summary(regresi)

Call:
lm(formula = Y ~ X1 + X2, data = Data)

Residuals:
   Min     1Q Median     3Q    Max 
-7.071 -3.412 -1.613  2.905 18.130 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) 32.49662   15.14968   2.145  0.03778 * 
X1           0.54872    0.17591   3.119  0.00327 **
X2           0.09146    0.10144   0.902  0.37238   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.642 on 42 degrees of freedom
Multiple R-squared:  0.2112,    Adjusted R-squared:  0.1737 
F-statistic: 5.624 on 2 and 42 DF,  p-value: 0.006852

Analisis Regresi Berganda menggunakan function lm dengan argumen formula sebagai rumus untuk pernyataan model regresi dan Data digunakan pada argument data. Nilai X1, X2, dan Y sudah tersimpan pada data tersebut sehingga dapat dinotasikan dengan Y~X1+X2. Hasil perhitungan lm ini disimpan ke obyek regresi kemudian summary digunakan untuk menyajikan hasil analisis dari regresi secara lengkap.

2.6 Plot Pemeriksaan Sisaan

Untuk mellakukan pemeriksaan sisaan, dapat dilakukan dengan melihat plot Residual vs Fitted, Q-Q Plot, Scale-Location, Cook’s Distance, dan Leverage vs Sisaan.Function plot digunakan sebagai perintah menyajikan plot dari data yang dituliskan argumen 1 untuk Residuals vs Fitted, 2 Normal untuk Q-Q, 3 untuk Scale-Location, par(mfrow) untuk menjadikan 3 plot sekaligus ditampilkan pada satu layer dengan 2 baris dan tiap barisnya berisi dua plot.

> par(mfrow=c(2,2))
> plot(regresi,1)
> plot(regresi,2)
> plot(regresi,3)

 Plot 1 : Tidak terbentuk pola tertentu maka linieritas terpenuhi
 Plot 2 : Tidak terlihat adanya pelanggaran normalitas dikarenakan sebaran plot mendekati garis lurus.
 Plot 3 : Penyebaran titik-titik data tidak membentuk pola bergelombang melebar kemudian menyempit dan melebar kembali, penyebaran titik-titik data tidak berpola, dan tidak mengumpul hanya di atas atau dibawah saja, juga garis merah masi dapat dikategorikan normal, maka dapat disimpulkan tidak terdapat gejala heteroskedastisitas.

2.7 Uji Asumsi

> #Uji Normalitas
> sisa<-residuals(regresi)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 17.495, df = 2, p-value = 0.0001589
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.88723, p-value = 0.0003884
> 
> #Uji Homoskedastisitas
> bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 3.706, df = 2, p-value = 0.1568
> 
> #Uji Non Autokorelasi
> dwtest(regresi)

    Durbin-Watson test

data:  regresi
DW = 1.8279, p-value = 0.2649
alternative hypothesis: true autocorrelation is greater than 0
> 
> #Non Multikolinieritas
> car::vif(regresi)
      X1       X2 
1.010898 1.010898 

 a.) Function residuals digunakan untuk mengextract hasil residual dari model pada argumen object regresi kemudian disimpan dalam object sisa. - jarque.bera.test digunakan untuk melakukan uji Jarque Bera untuk mencari Normalitas Residual dari data sisa - shapiro.test digunakan untuk melakukan uji Shapiro Wilk untuk mencari Normalitas Residual dari data sisa
 b.) Function bptest digunakan untuk melakukan uji Breusch Pagan untuk mengetahui terpenuhi atau tidaknya asumsi Homoskedastisitas
 c.) Function dwtest digunakan untuk melakukan uji Durbin Watson untuk mengetahui apakah terjadi autokorelasi atau tidak
 d.) Function car::vif digunakan untuk melakukan pendeteksian Multikolinieritas

3 Hasil dan Pembahasan

3.1 Persamaan Regresi

Variabel Penduga Parameter
Konstanta 32.49662
SkorTes (X1) 0.54872
FrekuensiBaca(X2) 0.09146

Tabel: Hasil Koefisien Analisis Regresi

Bentuk persamaan dari hasil analisis regresi berganda diatas yaitu : \[ Ŷ = 32.49662 + 0.54872(X_1)+ 0.09146(X_2) \]

Interpretasi:  1. Apabila Skor Tes Kecerdasan bernilai konstan, maka setiap peningkatan 1% Clock Speed akan menaikkan Nilai Ujian sebesar 0.548%%
 2. Apabila Frekuensi Membaca bernilai konstan, maka setiap peningkatan 1% Clock Speed akan menaikkan Nilai Ujian sebesar 0.09146%
 3. Apabila nilai Skor Tes Kecerdasan dan Frekuensi Membaca Speed 0, maka nilai ujian 32.39662

3.2 Uji Asumsi

Hasil Uji Asumsi
Uji Asumsi P-Value
Normalitas (Jarque) 0.0002589
Normalitas (Shapiro) 0.0003884
Homoskedastisitas 0.1568
Non Autokorelasi 0.2649
Multikolinieritas Nilai VIF
SkorTes (X1) 1.010898
FrekuensiBaca (X2) 1.010898'

Interpretasi Hasil Uji Asumsi

 - Uji Normalitas Residual Jarque

Hipotesis:

H~0~ : Residual berdistribusi normal

H~1~ : Residual tidak berdistribusi normal

P-Value (0.0002589) < α (0.05) maka keputusan H~0~ ditolak. Dapat disimpulkan bahwa residual berdistribusi tidak normal\ 

 - Uji Normalitas Residual Shapiro

Hipotesis:

H~0~ : Residual berdistribusi normal

H~1~ : Residual tidak berdistribusi normal

P-Value (0.0003884) < α (0.05) maka keputusan H~0~ ditolak. Dapat disimpulkan bahwa residual berdistribusi tidak normal\

 - Uji Homoskedastisitas

Hipotesis:

H~0~ : δ~2~ = δ~3~ = 0

H~1~ : Paling tidak terdapat satu δ~j~ ≠ 2,3

P-Value (0.1568) > α (0.05) maka keputusan H~0~ diterima. Dapat disimpulkan bahwa varian residual bersifat homoskedastisitas.

 - Uji Non Autokorelasi

Hipotesis:

H~0~ : ρ = 0

H~1~ : ρ ≠ 0

P-Value (0.2649) > α (0.05) maka keputusan H~0~ diterima. Dapat disimpulkan bahwa tidak terjadi autokorelasi sehingga asumsi sudah terpenuhi.\

 - Uji Non Multikolinieritas

Nilai VIF < 10, maka asumsi non-multikolinieritas sudah terpenuhi\

3.3 Uji Hipotesis

 - Uji Simultan

Hipotesis:

H~0~ : β~0~ = β~1~ = β~2~ = 0

H~1~ : minimal terdapat β dimana β~i~ ≠ 0,i = 0,1,2

Dari perhitungan diatas, diketahui F hitung = 5.624 \> F Tabel = 0,0564 dan p-value = 0,06852 \> alpha 0,05 sehingga Tolak H0. Dapat disimpulkan bahwa secara simultan terdapat hubungan antara variabel Skor Tes Kecerdasan, Frekuensi Membaca, dan Nilai Ujian.\

 - Uji Parsial Hipotesis:

H~0~ : β~i~ =  0

H~1~ : β~i~ ≠  0 
  • Variabel Nilai Impor Dari perhitungan di atas, diketahui T hitung = 3.119 > T Tabel = 1,183 dan P-Value = 0,0327 > alpha 0,05 sehingga Tolak H0. Dapat disimpulkan bahwa secara parsial terdapat hubungan antara Skor Tes Kecerdasan dengan Nilai Ujian.

  • Variabel Nilai Ekspor Dari perhitungan di atas, diketahui T hitung = 0.902 > T Tabel = 1,183 dan P-Value = 0,37238 > alpha 0,05 sehingga Tolak H0. Dapat disimpulkan bahwa secara parsial terdapat hubungan antara Frekuensi Membaca dengan Nilai Ujian.

4 Daftar Pustaka

Ghozali, Imam. 2018.Aplikasi Analisis Multivariate Dengan Program IBM SPSS 25 Semarang: Universitas Dipenogoro

Lisa, Ni Putu (2019). ANALISIS DETERMINAN MINAT MAHASISWA AKUNTANSI     DALAM BERWIRAUSAHA. Bali : Jurnal Ilmiah Manajemen & Bisnis.

Montgomery, D.C., Peck, E.A., & Vining, G.G. (1992). Introduction to Linear Regression  Analysis. Toronto: John Wiley & Sons

Priyatno, Duwi. (2010). Paham Analisa Statistik Data dengan SPSS. Yogyakarta.   MediaKom.

Siegel, Sidney. (1990). Terjemahan : Statistik Non Parametrik Untuk Ilmu-ilmu Sosial.   Jakarta : P. T. Gramedia.

Yuliara. 2016. Modul Regresi Linier Berganda. Universitas Udayana.