Pengaruh Antara Lama Belajar Siswa terhadap Nilai Matematika dan Nilai Bahasa dengan Analisis Regresi Linear Berganda

Rakan Sulthan Ali

2022-05-22

1 PENDAHULUAN

1.1 Latar Belakang

Pendidikan adalah salah satu bentuk interaksi manusia, sekaligus tindakan sosial yang dimungkinkan berlaku melalui suatu jaringan hubungan kemanusiaan melalui peranan-peranan individu di dalamnya yang diterapkan melalui proses pembelajaran. Belajar dan pembelajaran adalah suatu kegiatan yang tidak terpisahkan dari kehidupan manusia. Dengan belajar manusia dapat mengembangkan potensi-potensi yang dibawanya sejak lahir. Tanpa belajar manusia tidak mungkin dapat memenuhi kebutuhannya.

Belajar yang efektif dapat membantu siswa untuk meningkatkan kemampuan yang diharapkan sesuai dengan tujuan yang ingin dicapai. Selain itu lama belajar siswa juga mempengaruhi nilai siswa ketika disekolah. Siswa dengan lama belajar yang lama cenderung memiliki nilai yang lebih tinggi daripada siswa yang lama belajar nya sedikit atau tidak sama sekali. Untuk menguji pernyataan tersebut apakah benar atau tidak akan dilakukan pengujian terhadapa 15 siswa dengan lama belajar setiap hari yang berbeda-bedala dalam jam terhadap nilai MTK dan nilai bahasa. Uji yang dilakukan menggunakan uji regresi dengan bantuan software R

1.2 Statistika Deskriptif

Statistika deskriptif merupakan suatu metode bagaimana cara mengumpulkan angka-angka, menabelkan angka-angka, menggambarkannya, mengolah dan menganalisis angka-angka, serta menginterpretasikannya dengan memberi penafsiran-penafsiran atau dengan kata lain merupakan metode tentang bagaimana cara untuk mengumpulkan angka-angka dalam bentuk catatan untuk selanjutnya bagaimana cara menyajikan angka-angka tersebut dalam bentuk grafik untuk diannalisis dan ditafsirkan dengan mengambil kesimpulan.

Dalam menyajikan data dengan menggunakan statistika deskriptif dapat menggunakan beberapa cara sebagai berikut:

  1. Grafik atau diagram
  2. Ukuran pemusatan dan ukuran penyebaran data
  3. Tabel
  4. Ukuran nilai tempat

1.3 Statistika Inferensia

Statistika inferensia merupakan statistik yang dapat diartikan lebi luas, di samping pengertiannya sebagai cara mengumpulkan berbagai angka-angka dalam bentuk catatan, seperti yang didefinisikan dalam pengertian statistika deskriptif, juga merupakan suatu metode bagaimana cara untuk mengambil keputusan berdasarkan angka-angka yang dikumpulkan dan dianalisis tersebut.

Statistika Inferensia memiliki 2 jenis yaitu;

  1. Statisika parametrik Dimana merupakan statistika yang mempertimbangkan jenis sebaran atau distribusi data yang berdistribusi normal dan memiliki varians yang homogen.
  2. Statistika nonparametrik Dimana merupakan bagian dari statistik yang parameter populasinya tidak mengikuti suatu distribusi tertentu danvarian tidak harus homogen

1.4 Asumsi Regresi

Ketika melakukan analisis regresi perlu memperhatikan beberapa asumsi untuk uji hipotesis dan analisi dari kebaikan model. asumsi regresi yang perlu diperhatikan yaitu;

  1. Uji Normalitas Uji ini digunakan untuk mengetahui apakah nilai residual dari data berdistribusi normal. Uji ini dapat dilakukan dengan berbagai cara yaitu; uji Shapiro wilk dan uji jarque bera.
  2. Deteksi Multikolinieritas Non multikolinieritas adalah tidak adanya hubungan lonier antar variabel prediktor. deteksi ini diperlukan agar kontribusi efek perubahan setiap variabel prediktor terhadap variabel respon dapat dianalisis secara terpisah. Jika terdapat masalah multikolinieritas yang serius, dapat digunaka: regresi dengan komponen utama dan regresi ridge.
  3. Uji Homokedastisitas Homoskedastisitas artinya ragam galat ang sama di setiap nilai X. pelanggaran dari asumsi ini dinamakan Heteroskedastisitas. Jika tidak terdeteksi adanya homokedastisitas ragam galat mengakibatkan statistik uji t atau statistik uji F menjadi lebih besar dari yang sebenarnya, Lebih sering terjadi penolakan H0 pada uji koefisien parameter, dan uji-uji tersebut menjadi kurang terpercaya. Cara mengatasi jika terdapat pelanggaran homoskedastisitas galat dapat digunakan salah satu metode berikut yaitu; Weighted Least Square (WLS) atau White Method.
  4. Uji Non Autokorelasi Non autokorelasi artinya kebebasan antar galat.pelanggaran dari asumsi ini disebut sebagai masalah autokorelasi, akibat kesalahan spesifikasi model, atau tidak digunakannya variabel prediktor yang penting. Pelanggaran non autokorelasi sering terjadi pada data deret waktu karena urutan pengaatan mempunyai makna, galat pada suatu periode mempengaruhi galat pada periode berikutnya. Efek dari pelanggaran asumsi ini yaitu penduga tidak lagi efisien (ragam besar). Terpenuhi tidaknya asumsi dapat diuji menggunakan uji Durbin Watson (DW).

1.5 Data

Berikut merupakan data lama belajar dari 15 siswa terhadap nilai Matematika dan Nilai bahasa di sekolah.

> data<-read.table("clipboard",header=T,dec=".")
> data
   Lama_Belajar Nilai_MTK Nilai_Bahasa
1           2.0        78           80
2           3.0        84           83
3           1.0        75           72
4           1.5        76           77
5           2.5        81           82
6           4.0        90           92
7           3.0        85           87
8           2.0        80           79
9           2.0        77           77
10          1.0        74           76
11          4.5        95           90
12          3.0        82           83
13          2.0        79           82
14          3.5        86           88
15          3.0        85           85

2 Source Code

2.1 Library

> library(car)
> library(lmtest)
> library(tseries)
> library(tidyr)
> library(dplyr)

2.2 Statistika Deskriptif

Rata-rata \[ \mu_{x} = \frac{x_1 + x_2 + \dots + x_n}{n} \]

Mencari rata-rata dengan cara manual yaitu:

> rata2_x1 = sum(data$Nilai_MTK)/15
> rata2_x1
[1] 81.8
> rata2_x2 = sum(data$Nilai_Bahasa)/15
> rata2_x2
[1] 82.2
> rata2_y  = sum(data$Lama_Belajar)/15
> rata2_y
[1] 2.533333

Mencari rata-rata dengan built in

> rata2_x1 = mean(data$Nilai_MTK)
> rata2_x1
[1] 81.8
> rata2_x2 = mean(data$Nilai_Bahasa)
> rata2_x2
[1] 82.2
> rata2_y  = mean(data$Lama_Belajar)
> rata2_y
[1] 2.533333

2.3 Statistika Inferensia

Analisis Regresi dengan cara manual

> #Bentuk dataframe
> y<-data[,1]
> x<-data[,-1]
> x<-cbind(cons = 1, x) %>% as.matrix()
> 
> #Pendugaan Parameter 
> beta<-solve(t(x) %*% x) %*% (t(x) %*% y)
> beta
                     [,1]
cons         -12.07501318
Nilai_MTK      0.12168229
Nilai_Bahasa   0.05662695
> 
> #Sisaan 
> y_duga<-x %*% beta
> sisa<-y-y_duga
> 
> #Varian dan Covarian dan SE
> n=15-2
> mse<-sum(sisa^2)/(n-1)
> varcov<-mse*solve(t(x) %*% x)
> varcov
                     cons     Nilai_MTK  Nilai_Bahasa
cons          0.661428103 -0.0013074792 -0.0067112504
Nilai_MTK    -0.001307479  0.0006465949 -0.0006275424
Nilai_Bahasa -0.006711250 -0.0006275424  0.0007061340
> SE<-varcov %>% diag() %>% sqrt()
> SE
        cons    Nilai_MTK Nilai_Bahasa 
  0.81328230   0.02542823   0.02657318 
> 
> #Uji Parsial
> p<-ncol(x)
> su<-beta/SE
> pval<-c(2*pt(abs(su[1]),n-1,lower.tail=F),
+         2*pt(abs(su[-1]),n-p,lower.tail=F))
> 
> data.frame(koef=beta %>% rownames(),
+            pendparam = beta %>% round(4),
+            std_error=SE %>% round(3),
+            statistik_uji=su %>% round(3),
+            pval=pval %>% round(3),
+            sig=ifelse(pval<0.001,"***",
+                       ifelse(pval<0.01,"**",
+                              ifelse(pval<0.05,"*",
+                                     ifelse(pval<0.1,".","")))))
                     koef pendparam std_error statistik_uji  pval sig
cons                 cons  -12.0750     0.813       -14.847 0.000 ***
Nilai_MTK       Nilai_MTK    0.1217     0.025         4.785 0.001 ***
Nilai_Bahasa Nilai_Bahasa    0.0566     0.027         2.131 0.059   .
> 
> #Koefisien Determinasi(R2)
> JKG<-sum(sisa^2)
> JKT<-sum((y-rata2_y)^2)
> R2 <-1-(JKG/JKT)
> R2
[1] 0.9656512
> R2a<-1-mse/(JKT/(n-2))
> R2a
[1] 0.9685136
> 
> #Uji Simultan
> fhit<-(R2/(p-1)/(1-R2)/(n-p+3))
> pval<-pf(fhit,p-1,n-p+3,lower.tail=F)
> fhit:pval
[1] 1.081271

Analisis Regresi dengan sistem built in

> reg=lm(data$Lama_Belajar~data$Nilai_MTK+data$Nilai_Bahasa)
> summary(reg)

Call:
lm(formula = data$Lama_Belajar ~ data$Nilai_MTK + data$Nilai_Bahasa)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.23312 -0.13070 -0.08123  0.10125  0.39703 

Coefficients:
                   Estimate Std. Error t value Pr(>|t|)    
(Intercept)       -12.07501    0.81328 -14.847 4.37e-09 ***
data$Nilai_MTK      0.12168    0.02543   4.785 0.000445 ***
data$Nilai_Bahasa   0.05663    0.02657   2.131 0.054460 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.2054 on 12 degrees of freedom
Multiple R-squared:  0.9657,    Adjusted R-squared:  0.9599 
F-statistic: 168.7 on 2 and 12 DF,  p-value: 1.642e-09
> anova(reg)
Analysis of Variance Table

Response: data$Lama_Belajar
                  Df  Sum Sq Mean Sq  F value    Pr(>F)    
data$Nilai_MTK     1 14.0358 14.0358 332.8156 4.069e-10 ***
data$Nilai_Bahasa  1  0.1915  0.1915   4.5411   0.05446 .  
Residuals         12  0.5061  0.0422                       
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

2.4 Uji Asumsi

  1. Deteksi Multikolinieritas
> vif(reg)
   data$Nilai_MTK data$Nilai_Bahasa 
         7.273526          7.273526 
  1. Uji normalitas
> sisaan=residuals(reg)
> jarque.bera.test(sisaan)

    Jarque Bera Test

data:  sisaan
X-squared = 1.8066, df = 2, p-value = 0.4052
> shapiro.test(sisaan)

    Shapiro-Wilk normality test

data:  sisaan
W = 0.90675, p-value = 0.1207
  1. Uji homokesdasitas
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 0.77915, df = 2, p-value = 0.6773
  1. Uji non autokorelasi
> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 2.8455, p-value = 0.9508
alternative hypothesis: true autocorrelation is greater than 0

2.5 Plot

> #Histogram
> #1. Data Lama Belajar
> lb=hist(data$Lama_Belajar,xlab='Lama Belajar (jam)', main='Histogram Lama Belajar', col='blue')

> #2. Data Nilai Matematika
> nm=hist(data$Nilai_MTK,xlab='Nilai Matematika', main='Histogram Nilai Matematika', col='Red')

> #3. Data Nilai Bahasa
> nb=hist(data$Nilai_Bahasa,xlab='Nilai Bahasa', main='Histogram Nilai Bahasa', col='dark orange')

> #Grafik Hubungan X dan Y
> scatter.smooth(x=data$Nilai_MTK+data$Nilai_Bahasa, y=data$Lama_Belajar, main="Scatter Plot Hubungan Lama Belajar dengan Nilai Matematika dan Nilai Bahasa", xlab="Nilai Matematika dan Bahasa", ylab="Lama Belajar")

> #Grafik Pemeriksaan Sisaan
> par(mfrow=c(2,2))
> plot(reg)

3 Hasil dan Pembahasan

3.1 Statistika Deskriptif

1. Rata-rata Nilai Matematika \[ \mu=81.8 \] Dari hasil tersebut dapat disimpulkan bahwa rata-rata nilai matematika siswa yaitu 81.8.

2. Rata-rata Nilai Bahasa \[ \mu=82.2 \] Dari hasil tersebut dapat disimpulkan bahwa rata-rata nilai Bahasa siswa yaitu 82.2.

3. Rata-rata Lama Belajar \[ \mu=2.533333 \] Dari hasil tersebut dapat disimpulkan bahwa rata-rata lama belajar siswa yaitu 2.533333 jam setiap hari.

3.2 Statistika Inferensia

Model Regresi \[ \hat{y} = \beta_0 + \beta_1x_1 + \beta_2x_2 + \varepsilon \] Dari hasil yang telah didapatkan sebelumnya, dengan mensubtitusi nilai-nilai tersebut didapatkan model negeresi sebagai berikut yaitu; \[ \hat{y} = -12.07501 + 0.12168 x_1 + 0.05663 x_2 + \varepsilon \] Dari model regresi tersebut dapat di tarik kesimpulan bahwa: 1. Kenaikan Nilai Matematika sebesar 1 satuan maka lama belajar juga naik sebesar 0.12168 jam 2. Kenaikan Nilai Bahasa sebesar 1 satuan maka lama belajar juga naik sebesar 0.05663 jam

P-value Variabel Prediktor dari Analisis Regresi

Hipotesis H_0~ : Terdapat korelasi antara x dan y H_1~ : Tidak terdapat korelasi antara x dan y

Dari Hasil analisis yang telah dilakukan sebelumnya dapat diketahui nilai P-value yaitu; \[ p-value (Nilai Matematika) = 0.001 \] \[ p-value (Nilai Bahasa) = 0.059 \] Dari kedua nilai p-value didapatkan hasil: 1. nilai p-value Nilai matematika < 0.05 , maka H0 Diterima, artinya Nilai matematika berpengaruh terhdapa lama belajar siswa. 2. Nilai p-value nilai bahasa > 0.05, maka H0 ditolak, artinya nilai bahasa tidak berpengaruh terhadap lama belajar siswa.

Nilai p-value uji simultan ANOVA

Hipotesis: H_0~ : Terdapat korelasi antara x dan y H_1~ : Tidak terdapat korelasi antara x dan y

Dari Hasil analisis yang telah dilakukan sebelumnya dapat diketahui nilai P-value yaitu;

\[ p-value (Nilai Matematika) = 0.000445 \] \[ p-value (Nilai Bahasa) = 0.05446 \] Dari kedua nilai p-value didapatkan hasil: 1. nilai p-value Nilai matematika < 0.05 , maka H0 Diterima, artinya Nilai matematika berpengaruh terhdapa lama belajar siswa. 2. Nilai p-value nilai bahasa > 0.05, maka H0 ditolak, artinya nilai bahasa tidak berpengaruh terhadap lama belajar siswa.

3.3 Uji Asumsi Regresi

1. Uji Normalitas Uji ini digunakan untuk mengetahui apakah nilai residual dari data berdistribusi normal. Uji ini dapat dilakukan dengan berbagai cara yaitu; uji Shapiro wilk dan uji jarque bera. \[ p-value (jarque bera) = 0.4052 \] \[ p-value (Shapiro Wilk) = 0.1207 \] nilai p-value dari kedua uji tersebut > 0.05, sehingga dapat menjadi bukti bahwa tidak adanya pelanggaran normalitas galat pada model.

2. Deteksi Multikolinieritas Non multikolinieritas adalah tidak adanya hubungan lonier antar variabel prediktor. deteksi ini diperlukan agar kontribusi efek perubahan setiap variabel prediktor terhadap variabel respon dapat dianalisis secara terpisah. Jika terdapat masalah multikolinieritas yang serius, dapat digunaka: regresi dengan komponen utama dan regresi ridge. \[ VIF (Nilai Matematika) = 7.273526 \] \[ VIF (Nilai Bahasa) = 7.273526 \] Berdasalkan hasil VIF dari nilai matematika dan nilai Bahasa tidak ada satupun nilai VIF yang > 10, maka dapat disimpulkan bahwa tidak adanya multikolinieritas pada model sehingga asumsi non multikolinieritas terpenuhi.

3. Uji Homokedastisitas Homoskedastisitas artinya ragam galat ang sama di setiap nilai X. pelanggaran dari asumsi ini dinamakan Heteroskedastisitas. Jika tidak terdeteksi adanya homokedastisitas ragam galat mengakibatkan statistik uji t atau statistik uji F menjadi lebih besar dari yang sebenarnya, Lebih sering terjadi penolakan H0 pada uji koefisien parameter, dan uji-uji tersebut menjadi kurang terpercaya. Cara mengatasi jika terdapat pelanggaran homoskedastisitas galat dapat digunakan salah satu metode berikut yaitu; Weighted Least Square (WLS) atau White Method. \[ p-value = 0.6773 \] Dari Uji Breusch-Pagan menghasilkan nilai p-value sebesar 0.6773 dimana nilai tersebut > 0.05 sehingga tidak adanya pelanggaran homokedastisitas ragam galat.

4. Uji Non Autokorelasi Non autokorelasi artinya kebebasan antar galat.pelanggaran dari asumsi ini disebut sebagai masalah autokorelasi, akibat kesalahan spesifikasi model, atau tidak digunakannya variabel prediktor yang penting. Pelanggaran non autokorelasi sering terjadi pada data deret waktu karena urutan pengaatan mempunyai makna, galat pada suatu periode mempengaruhi galat pada periode berikutnya. Efek dari pelanggaran asumsi ini yaitu penduga tidak lagi efisien (ragam besar). Terpenuhi tidaknya asumsi dapat diuji menggunakan uji Durbin Watson (DW). \[ p-value = 0.9508 \] Berdasarkan uji Durbin-watson nilai p-value > 0.05, sehingga hal tersebut dapat membuktikan bahwa asumsi non autokorelasi terpenuhi.

3.4 Plot

1. Histogram

  • Histogram Lama Belajar
> lb=hist(data$Lama_Belajar,xlab='Lama Belajar (jam)', main='Histogram Lama Belajar', col='blue')

Berdasarkan histogram Lama belajar dapat diketahui lama belajar terbanyak dari 15 siswa berkisar antara 1.5-2 jam dan 2.5-3 jam masing-masing sebanyak 4 siswa.

  • Histogram Nilai Matematika
> nm=hist(data$Nilai_MTK,xlab='Nilai Matematika', main='Histogram Nilai Matematika', col='Red')

Berdasarkan histogram Lama belajar dapat diketahui Nilai Matematika terbanyak berkisar antara 75-85 sebanyak 10 siswa.

  • Histogram Nilai Bahasa
> nb=hist(data$Nilai_Bahasa,xlab='Nilai Bahasa', main='Histogram Nilai Bahasa', col='dark orange')

Berdasarkan histogram Lama belajar dapat diketahui Nilai Bahasa terbanyak berkisar antara 75-85 sebanyak 10 siswa.

2. Diagram Pencar

> scatter.smooth(x=data$Nilai_MTK+data$Nilai_Bahasa, y=data$Lama_Belajar, main="Scatter Plot Hubungan Lama Belajar dengan Nilai Matematika dan Nilai Bahasa", xlab="Nilai Matematika dan Bahasa", ylab="Lama Belajar")

Berdasarkan diagram pencar tersebut dapat diketahui bahwa Nilai Matematika dan Nilai Bahasa memiliki hubungan yang positif dengan lama belajar, artinya semakin lama waktu belajar maka semakin tinggi Nilai Matematika dan Nilai Bahasa

3. Grafik Sisaan

> par(mfrow=c(2,2))
> plot(reg)

Interpretasi: 1. dari plot 1 (Residuals vs Fitted) dapat diketahui bahwa garis merah masih dapat dikategorikan dalam bentuk horizontal, maka model regresi dianggap sudah tepat. 2. Dari Plot 2 (Normal Q-Q), dapat diketahui bahwa semua titik berada pada sekitar garis 45 derajat sehingga dapat dikatakan bahwa data tersebut berdistribusi normal. 3. Dari Plot 3 (Scale-Location), dapat diketahui bahwa garis merah masih bisa dianggap membentuk horizontal sehingga dapat disimpulkan bahwa tida adanya masalah heterokedastisitas. 4. Dari plot 4 (Residuals vs Leverage), dapat diketahui bahwa ada titik yang melewati jarak cook sehingga titik tersebut dapat berpotensi sebagai amatan yang berpengaruh.

4 Daftar Pustaka

  1. Anonim.2018.”KONSEP BELAJAR (TERMA, TEORI, DAN FAKTOR IMPLIKATIF)”
  2. Muhammad Thobroni dan Arif Mustofa, Belajar dan Pembelajaran, Arruz Media, Jogjakarta, 2011, hal. 18
  3. Walpole, Ronald E.1995. “Pengantar Statistika Ed.3”. PT Gramedia Pustaka: Jakarta.