Prestasi akademik siswa dipengaruhi oleh berbagai faktor, baik yang berasal dari dalam diri maupun dari lingkungan. Dua faktor yang sering menjadi sorotan adalah kecerdasan intelektual (IQ) dan tingkat kehadiran di kelas. IQ menggambarkan kemampuan kognitif siswa dalam memahami materi, mengolah informasi, serta menyelesaikan permasalahan, sedangkan kehadiran mencerminkan tingkat partisipasi siswa dalam kegiatan pembelajaran dan interaksi selama di kelas.

Dalam hal ini, tersedia data mengenai IQ dan tingkat kehadiran dari sepuluh siswa di suatu kelas yang diduga berpengaruh terhadap nilai UAS mereka.

Siswa IQ..X2. Tingkat.Kehadiran……X1. Nilai.UAS..Y.
1 110 60 65
2 120 70 70
3 115 75 75
4 130 80 75
5 110 80 80
6 120 90 80
7 120 95 85
8 125 95 95
9 110 100 90
10 120 100 98

Analisis dalam penelitian ini menggunakan metode regresi linier berganda, di mana tingkat kehadiran (X1) dan IQ (X2) berperan sebagai variabel independen, sedangkan nilai UAS (Y) sebagai variabel dependen. Adapun tujuan dari analisis ini meliputi:

  1. Menentukan model persamaan regresi linier berganda yang mampu menggambarkan hubungan antara tingkat kehadiran, IQ, dan nilai UAS.
  2. Mengetahui pengaruh kedua variabel independen terhadap variabel dependen secara bersama-sama (simultan).
  3. Menilai pengaruh masing-masing variabel independen terhadap variabel dependen secara terpisah (parsial).
  4. Menghitung nilai koefisien determinasi (R²) guna mengetahui seberapa besar variasi nilai UAS yang dapat dijelaskan oleh tingkat kehadiran dan IQ.
  5. Menguji terpenuhinya asumsi-asumsi dalam regresi linier agar hasil analisis yang diperoleh dapat diinterpretasikan secara tepat dan dapat dipercaya.

Persamaan Regresi Linier Berganda

Model regresi linier berganda digunakan untuk menganalisis hubungan antara satu variabel dependen (Y) dengan dua atau lebih variabel independen (X). Secara matematis, model tersebut dapat dinyatakan sebagai:

Y = β₀ + β₁X₁ + β₂X₂ + … + βₖXₖ + ϵ

dengan keterangan: Y : variabel dependen Xₖ : variabel independen ke-k βₖ : koefisien regresi dari variabel Xₖ

Selain itu, persamaan regresi linier berganda juga digunakan untuk memperkirakan atau memprediksi nilai variabel dependen berdasarkan nilai variabel independen yang diketahui, yang dituliskan sebagai:

Ŷ = β̂₀ + β̂₁X₁ + β̂₂X₂ + … + β̂ₖXₖ

dengan keterangan: Ŷ : nilai taksiran dari Y β̂ₖ : koefisien regresi hasil estimasi

Pada analisis ini, pemodelan dilakukan melalui dua pendekatan, yaitu secara manual menggunakan perhitungan matriks, serta menggunakan fungsi lm pada R.

Menggunakan Cara Manual

Untuk pendekatan manual, model regresi dinyatakan dalam bentuk matriks sebagai berikut:

Y = Xβ + ϵ

dengan: Y : vektor kolom variabel dependen berukuran n×1 X : matriks variabel independen, di mana kolom pertama berisi angka 1 sebagai konstanta (intercept), berukuran n×k β : vektor kolom koefisien regresi yang akan diestimasi, berukuran k×1 ϵ : vektor kolom galat atau residual, berukuran n×1

Estimasi koefisien regresi (β̂) yang meminimalkan jumlah kuadrat residual menggunakan metode Ordinary Least Squares (OLS) dapat diperoleh melalui rumus:

β̂ = (X′X)⁻¹ X′Y

dengan: X′ : transpose dari matriks X (X′X)⁻¹ : invers dari hasil perkalian X′ dengan X X′Y : hasil perkalian antara X′ dan Y

Berikut merupakan langkah penyelesaian secara manual menggunakan R:

##          X1  X2
##  [1,] 1  60 110
##  [2,] 1  70 120
##  [3,] 1  75 115
##  [4,] 1  80 130
##  [5,] 1  80 110
##  [6,] 1  90 120
##  [7,] 1  95 120
##  [8,] 1  95 125
##  [9,] 1 100 110
## [10,] 1 100 120
##       [,1]
##  [1,]   65
##  [2,]   70
##  [3,]   75
##  [4,]   75
##  [5,]   80
##  [6,]   80
##  [7,]   85
##  [8,]   95
##  [9,]   90
## [10,]   98
##    [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
##       1    1    1    1    1    1    1    1    1     1
## X1   60   70   75   80   80   90   95   95  100   100
## X2  110  120  115  130  110  120  120  125  110   120
##     [,1]
##      813
## X1 69925
## X2 96060
##            X1     X2
##      10   845   1180
## X1  845 73075  99900
## X2 1180 99900 139650
##                           X1            X2
##    34.62208967 -0.0188185492 -0.2790840870
## X1 -0.01881855  0.0006311333 -0.0002924764
## X2 -0.27908409 -0.0002924764  0.0025745622
##          [,1]
##    23.0544545
## X1  0.7372330
## X2 -0.0343275

Berdasarkan hasil perhitungan, diperoleh nilai koefisien regresi yaitu intercept (β₀^) sebesar 23,0544, koefisien untuk variabel X₁ (β₁^) sebesar 0,7372, dan koefisien untuk variabel X₂ (β₂^) sebesar -0,0343. Oleh karena itu, persamaan regresi linier berganda yang terbentuk dapat dituliskan sebagai:

Ŷ = 23,0544 + 0,7372X₁ − 0,0343X₂

Menggunakan Fungsi lm

Fungsi lm() dalam R digunakan untuk mengestimasi parameter model secara otomatis dengan metode Ordinary Least Squares (OLS), sehingga tidak perlu lagi melakukan perhitungan matriks secara manual seperti pada metode sebelumnya. Hasil estimasi tersebut kemudian ditampilkan dalam bentuk ringkasan model melalui fungsi summary(), yang berisi informasi mengenai koefisien regresi, pengujian signifikansi, serta ukuran goodness of fit dari model.

## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
## Call:
## lm(formula = Y ~ X1 + X2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## X1           0.73723    0.10918   6.752 0.000264 ***
## X2          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Berdasarkan model regresi yang diperoleh, didapatkan nilai koefisien yaitu intercept (β₀^) sebesar 23,0544, koefisien X₁ (β₁^) sebesar 0,7372, dan koefisien X₂ (β₂^) sebesar -0,0343. Dengan demikian, persamaan regresi yang terbentuk adalah:

Ŷ = 23,0544 + 0,7372X₁ − 0,0343X₂

Dari persamaan tersebut dapat diinterpretasikan bahwa setiap kenaikan 1% tingkat kehadiran (X₁) akan meningkatkan nilai UAS (Y) sebesar 0,7372, dengan asumsi IQ (X₂) tetap. Sementara itu, setiap kenaikan 1 satuan IQ (X₂) akan menurunkan nilai UAS (Y) sebesar 0,0343, dengan asumsi tingkat kehadiran (X₁) konstan.

Nilai intercept sebesar 23,0544 menunjukkan perkiraan nilai UAS ketika tingkat kehadiran dan IQ bernilai nol.

Uji Simultan dan Parsial

Dalam analisis regresi linier berganda, dilakukan pengujian secara simultan dan parsial untuk mengetahui apakah variabel independen berpengaruh terhadap variabel dependen. Uji simultan (uji F) bertujuan untuk melihat apakah seluruh variabel independen dalam model secara bersama-sama memberikan pengaruh yang signifikan terhadap variabel dependen. Sedangkan uji parsial (uji t) digunakan untuk menilai pengaruh masing-masing variabel independen secara individu terhadap variabel dependen.

Adapun hipotesis yang digunakan adalah sebagai berikut:

Hipotesis uji simultan (uji F): H₀: β₁ = β₂ = 0 (variabel X₁ dan X₂ secara bersama-sama tidak berpengaruh terhadap Y) H₁: minimal terdapat satu βₖ ≠ 0 (setidaknya ada satu variabel independen yang berpengaruh terhadap Y)

Hipotesis uji parsial (uji t): H₀: βₖ = 0 (variabel independen tidak berpengaruh terhadap Y) H₁: βₖ ≠ 0 (variabel independen berpengaruh terhadap Y)

## 
## Call:
## lm(formula = Y ~ X1 + X2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## X1           0.73723    0.10918   6.752 0.000264 ***
## X2          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Berdasarkan hasil pengujian, diperoleh nilai F-statistic sebesar 23,82 dengan p-value sebesar 0,0007523. Karena nilai p-value lebih kecil dari taraf signifikansi 0,05, maka H₀ ditolak. Hal ini menunjukkan bahwa variabel independen X₁ dan X₂ secara bersama-sama memiliki pengaruh terhadap variabel dependen Y.

Pada uji parsial (uji t), variabel X₁ menghasilkan nilai t sebesar 6,752 dengan p-value sebesar 0,000264. Karena p-value lebih kecil dari 0,05, maka H₀ ditolak, sehingga dapat disimpulkan bahwa variabel X₁ berpengaruh signifikan terhadap Y.

Sebaliknya, variabel X₂ memiliki nilai t sebesar -0,156 dengan p-value sebesar 0,880686. Nilai p-value yang lebih besar dari 0,05 menunjukkan bahwa H₀ tidak dapat ditolak, sehingga variabel X₂ tidak memiliki pengaruh yang signifikan terhadap Y.

Dengan demikian, secara parsial hanya variabel X₁ yang terbukti memberikan pengaruh signifikan dalam model regresi.

Koefisien Determinasi

Koefisien determinasi (R²) merupakan ukuran statistik yang digunakan untuk melihat seberapa besar kemampuan variabel independen dalam menjelaskan variasi variabel dependen pada suatu model regresi. Nilai R² berada pada rentang 0 hingga 1.

Secara matematis, koefisien determinasi dirumuskan sebagai:

\(R^2 = \frac{SSR}{SST}\)

dengan keterangan: SSR : jumlah kuadrat regresi SST : jumlah kuadrat total

Namun, R² memiliki keterbatasan karena nilainya cenderung meningkat atau setidaknya tidak berkurang ketika variabel independen baru ditambahkan, meskipun variabel tersebut tidak memberikan pengaruh yang signifikan terhadap model. Oleh sebab itu, digunakan adjusted R² sebagai bentuk penyesuaian dari R².

Nilai adjusted R² dapat mengalami kenaikan atau penurunan tergantung pada apakah penambahan variabel independen benar-benar memberikan kontribusi yang berarti terhadap model atau tidak.

Secara matematis, adjusted R² dirumuskan sebagai:

\(R^2 = 1 − \frac{(1 − R^2)(n − 1)}{(n − k − 1}\)

dengan keterangan: n : jumlah observasi k : jumlah variabel independen

## 
## Call:
## lm(formula = Y ~ X1 + X2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## X1           0.73723    0.10918   6.752 0.000264 ***
## X2          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Berdasarkan hasil analisis, diperoleh nilai koefisien determinasi (R²) sebesar 0,8719. Hal ini menunjukkan bahwa sebesar 87,19% variasi pada variabel dependen dapat dijelaskan oleh variabel independen dalam model, sedangkan sisanya sebesar 12,81% dipengaruhi oleh faktor lain di luar model yang tidak diteliti.

Adapun nilai adjusted R² sebesar 0,8353 mengindikasikan bahwa setelah mempertimbangkan jumlah variabel dalam model, variabel independen mampu menjelaskan sekitar 83,53% variasi variabel dependen. Hasil ini menunjukkan bahwa model regresi yang digunakan sudah cukup baik dalam menggambarkan hubungan antar variabel.

Uji Asumsi

Uji asumsi klasik dilakukan untuk memastikan bahwa model regresi yang digunakan telah memenuhi asumsi-asumsi dasar, sehingga hasil estimasi yang diperoleh bersifat valid, tidak bias, dan dapat diinterpretasikan dengan tepat. Adapun beberapa asumsi dasar dalam regresi linier berganda meliputi:

  1. Hubungan antara variabel independen dan variabel dependen harus bersifat linear.
  2. Residual harus berdistribusi normal.
  3. Varians residual harus konstan (tidak terjadi heteroskedastisitas).
  4. Residual harus saling independen (tidak terjadi autokorelasi).
  5. Antar variabel independen tidak saling berkorelasi tinggi (tidak terjadi multikolinearitas).

Uji Linieritas

Uji linearitas bertujuan untuk mengetahui apakah hubungan antara variabel independen dan variabel dependen bersifat linear. Salah satu metode yang umum digunakan untuk menguji hal tersebut adalah Uji Ramsey RESET. Dalam R, pengujian ini dapat dilakukan dengan menggunakan fungsi resettest().

Hipotesis yang digunakan dalam uji ini adalah sebagai berikut: H₀: Hubungan antara variabel independen dan variabel dependen bersifat linear. H₁: Hubungan antara variabel independen dan variabel dependen tidak bersifat linear.

## 
##  RESET test
## 
## data:  model
## RESET = 0.35787, df1 = 4, df2 = 3, p-value = 0.8269

Berdasarkan hasil pengujian, diperoleh nilai p-value sebesar 0,8269 yang lebih besar dari taraf signifikansi 0,05, sehingga H₀ tidak dapat ditolak. Hal ini menunjukkan bahwa hubungan antara variabel independen dan variabel dependen dalam model bersifat linear.

Uji Normalitas

Uji normalitas dilakukan untuk mengetahui apakah residual dalam model mengikuti distribusi normal atau tidak. Pada analisis ini, pengujian dilakukan menggunakan uji Shapiro-Wilk dan Anderson-Darling. Dalam R, uji Shapiro-Wilk dapat dilakukan dengan fungsi shapiro.test(), sedangkan uji Anderson-Darling menggunakan fungsi ad.test().

Hipotesis yang digunakan dalam pengujian ini adalah: H₀: Residual berdistribusi normal. H₁: Residual tidak berdistribusi normal.

## 
##  Shapiro-Wilk normality test
## 
## data:  galat
## W = 0.95125, p-value = 0.6833
## 
##  Anderson-Darling normality test
## 
## data:  galat
## A = 0.2268, p-value = 0.7482

Berdasarkan hasil pengujian, kedua metode menghasilkan nilai p-value yang lebih besar dari taraf signifikansi 0,05, yaitu p-value Shapiro-Wilk sebesar 0,6833 dan p-value Anderson-Darling sebesar 0,7482. Oleh karena itu, H₀ tidak dapat ditolak, sehingga dapat disimpulkan bahwa residual dalam model berdistribusi normal secara statistik.

Uji Heteroskedastisitas

Uji heteroskedastisitas bertujuan untuk mengetahui apakah terdapat ketidaksamaan varians residual dalam model regresi. Salah satu metode yang umum digunakan adalah uji Breusch-Pagan. Dalam R, pengujian ini dapat dilakukan menggunakan fungsi bptest().

Hipotesis yang digunakan dalam uji ini adalah: H₀: Varians residual bersifat konstan (homoskedastisitas). H₁: Varians residual tidak konstan (heteroskedastisitas).

## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.905, df = 2, p-value = 0.05221

Berdasarkan hasil pengujian, diperoleh nilai p-value sebesar 0,05221 yang lebih besar dari taraf signifikansi 0,05, sehingga H₀ tidak dapat ditolak. Hal ini menunjukkan bahwa varians residual bersifat konstan (homogen) dan tidak terdapat gejala heteroskedastisitas dalam model.

Uji Autokorelasi

Uji autokorelasi bertujuan untuk mengetahui apakah terdapat hubungan atau korelasi antar residual dalam model. Salah satu metode yang umum digunakan untuk mendeteksi hal tersebut adalah uji Durbin-Watson. Dalam R, pengujian ini dapat dilakukan menggunakan fungsi dwtest().

Hipotesis yang digunakan dalam uji ini adalah: H₀: Tidak terdapat autokorelasi antar residual. H₁: Terdapat autokorelasi antar residual.

## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.594, p-value = 0.3974
## alternative hypothesis: true autocorrelation is not 0

Berdasarkan hasil pengujian, diperoleh nilai p-value sebesar 0,3974 yang lebih besar dari taraf signifikansi 0,05, sehingga H₀ tidak dapat ditolak. Hal ini menunjukkan bahwa tidak terdapat autokorelasi pada residual dalam model.

Uji Multikolinearitas

Uji multikolinearitas bertujuan untuk mengetahui apakah terdapat hubungan yang kuat antar variabel independen dalam model. Pengujian ini dilakukan dengan melihat nilai Variance Inflation Factor (VIF) dan nilai Tolerance. Kriteria pengambilan keputusan adalah jika nilai VIF kurang dari 10 dan nilai Tolerance lebih dari 0,10, maka dapat disimpulkan tidak terjadi multikolinearitas. Sebaliknya, jika nilai VIF lebih besar atau sama dengan 10 dan nilai Tolerance kurang dari atau sama dengan 0,10, maka menunjukkan adanya multikolinearitas antar variabel independen. Dalam R, nilai VIF dapat dihitung menggunakan fungsi vif().

Hipotesis yang digunakan dalam pengujian ini adalah: H₀: Tidak terdapat multikolinearitas. H₁: Terdapat multikolinearitas.

## Loading required package: carData
##       X1       X2 
## 1.055571 1.055571
##       X1       X2 
## 0.947355 0.947355

Berdasarkan hasil pengujian, diperoleh nilai VIF sebesar 1,055571 dan nilai Tolerance sebesar 0,947355. Nilai VIF yang jauh di bawah batas yang ditentukan menunjukkan bahwa antar variabel independen tidak memiliki korelasi yang kuat. Oleh karena itu, H₀ tidak dapat ditolak, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas dalam model.