Analisis Regresi dan Korelasi antara IQ dan Tingkat Kehadiran Siswa terhadap Nilai UAS

Farhah Farida Millah

19 Mei 2022

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Pendidikan sangatlah penting bagi kehidupan setiap orang. Orang yang berpendidikan memiliki pemikiran yang lebih luas dan cenderung berorientasi ke masa depan. Dalam meningkatkan pendidikan di Indonesia, pemerintah menerapkan wajib belajar 12 tahun atau setara dengan SMA sederajat.
Kecerdasan merupakan kemampuan yang dimiliki oleh seseorang dalam berpikir memecahkan masalah. Kecerdasan manusia meliputi IQ, AQ, EQ, SQ, dan TQ. Salah satu yang banyak diketahui masyarakat pada umumnya, yaitu IQ. Kecerdasan intelektual atau IQ merupakan ukuran kemampuan intelektual, analisis, logika, dan rasio seseorang.IQ mengukur kecepatan seseorang untuk mempelajari hal-hal baru, namun IQ tidak menjamin kecerdasan seseorang. IQ dapat ditingkatkan dengan melakukan beberapa latihan kecerdasan otak. Besarnya IQ tidak menjamin prestasi akademik seseorang. Namun, dengan kecerdasan IQ yang tinggi, bisa menjadi modal untuk bisa berpikir cepat dan menangkap segala hal dengan baik.
Selain kecerdasan, faktor lain yang mempengaruhi prestasi akademik seseorang yaitu persentase tingkat kehadiran kelas. Setiap siswa memiliki daya tangkap yang berbeda-beda. Ada siswa yang hanya dijelaskan sekali langsung mengerti, namun ada juga yang harus dijelaskan berulang kali baru mengerti. Kehadiran di kelas menjadi cara untuk bisa mendengarkan penjelasan materi dengan baik dan juga bertanya. Pada umumnya, siswa yang selalu hadir akan lebih paham materi dibandingkan siswa yang beberapa kali tidak hadir. Oleh karena itu, dilakukan analisis regresi dan korelasi untuk mengetahui pengaruh tingkat kehadiran siswa dan IQ siswa terhadap perolehan nilai UAS.

1.2 Analisis Regresi

Analisis regresi merupakan suatu metode atau teknik analsisi hipotesis penelitian untuk menguji ada atau tidaknya pegaruh antara variabel satu dengan variabel lainnya, yang dinyatakan dalam bentuk persamaan matematik. Terdapat dua jenis dasar regresi, yaitu regresi linier sederhana dan regresi linier berganda. Analisis regresi linier sederhana menggunakan satu variabel untuk memprediksi hasil variabel dependen. Analisis regresi linier berganda untuk mencari pengaruh dari dua atau lebih variabel prediktor terhadap variabel respon. Analisis regresi berfungsi untuk meramalkan pengaruh variabel prediktor terhadap variabel respon untuk membuktikan ada atau tidaknya hubungan fungsional antarvariabel. Persamaan regresi dilambangkan sebagai berikut : \[ Y = a +bX+\epsilon \]

Dimana a merupakan intersep dan b adalah koefisien beta. sedangkan x adalah variabel bebas dan epsilon merupakan galat dari model.

1.3 Korelasi

Korelasi merupakan cara untuk mencari hubungan antara dua variabel. Korelasi biasa digunakan untuk menunjukksn kekuatan dan arah hubungan linier dua peubah acak. Terdapat 3 macam korelasi, yaitu korelasi sederhana, korelasi parsial, dan korelasi ganda. Korelasi sederhana digunakan untuk mengukur kekuatan hubungan antara dua variabel dan mencari tahu bentuk hubungan antara keduanya yang bersifat kuantitatif.Korelasi parsial digunakan untuk mengukur keeratan hubungan antara dua variabel bebas dan variabel tak bebas. Korelasi ganda digunakan untuk melihat hubungan antara 3 atau lebih variabel.

1.4 Data

Data diperoleh dari pengamatan yang dilakukan oleh peneliti di sebuah sekolah dan diolah sedemikian hingga mendapatkan data yang terdapat di bab 2.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # Library(readxl)  #Untuk membaca data excel
> # Library(magritrr)  
> # Library(summarytools)  #untuk menampilkan statistika deskriptif
> # Library(car)    #Untuk pemeriksaan asumsi
> # Library(tseries)  #untuk pemeriksaan asumsi
> # Library(lmtest)   #untuk pemeriksaan asumsi
> # Library(GGally)   #untuk menampilkan korelasi

2.2 Membangkitkan Data

Data Hasil Survey Terdahulu :

> library(readxl)
> Datareg<-read_excel("C:/Users/user/Documents/Data IQ dan Tingkat Kehadiran.xlsx")
> head(Datareg)
# A tibble: 6 x 3
  `Nilai_UAS(Y)` `Tingkat_Kehadiran(%)`    IQ
           <dbl>                  <dbl> <dbl>
1             65                     60   110
2             70                     70   120
3             75                     75   115
4             75                     80   130
5             80                     80   110
6             80                     90   120

Y :Nilai UAS Siswa X1:Tingkat Kehadiran siswa (%) X2:IQ siswa(%)

Function Library(readxl) digunakan untuk memanggil packages readxl yang telah di install sebelumnya.

Function read_excel() digunakan untuk membaca file dengan format xlsx.

Function head() digunakan untuk menampilkan 6 data teratas.

2.3 Plot

> smoothScatter(Datareg$`Tingkat_Kehadiran(%)`,Datareg$`Nilai_UAS(Y)`, xlab = "Tingkat Kehadiran (%)", ylab = "Nilai UAS", main = "Gambar 1. Smooth Scatter Plot antara Tingkat Kehadiran dengan Nilai UAS")

Function smoothscatter digunakan untuk membuat plot yang menunjukkan korelasi antarvariabel.

> smoothScatter(Datareg$IQ,Datareg$`Nilai_UAS(Y)`, xlab = "IQ", ylab = "Nilai UAS", main = "Gambar 2. Smooth Scatter Plot antara IQ dengan Nilai UAS")

Function smoothscatter digunakan untuk membuat plot yang menunjukkan korelasi antarvariabel.
xlab digunakan untuk memberikan informasi mengenai sumbu x.
ylab digunakan untuk memberikan informasi mengenai sumbu y.
main digunakan untuk memberikan judul plot.

2.4 Pendugaan Parameter

> y<-Datareg$`Nilai_UAS(Y)`
> x<-Datareg[,-1]
> library(magrittr)
> x<-cbind(cons=1,x) %>% as.matrix()
> 
> beta<-solve(t(x)%*%x)%*%(t(x)%*%y)
> round(beta,4)
                        [,1]
cons                 23.0545
Tingkat_Kehadiran(%)  0.7372
IQ                   -0.0343

y<-Datareg$Nilai_UAS(Y) : digunakan untuk mendefinisikan nilai UAS sebagai variabel y.
x<-Datareg[,-1]: digunakan untuk mendefinisikan selain variabel 1 pada excel merupakan variabel x.
Function library(magritrr) digunakan untuk memanggil packages magritrr yang telah diinstall yang digunakan saat ingin melakukan operasi menggunakan %>%.
Function beta<-solve(t(x)%*%x)%*%(t(x)%*%y)round(beta,4) digunakan untuk mencari beta sesuai dengan rumus: \[ \beta=(X'X)^- X'Y \] Y-duga dan Sisaan

> y_duga<-x%*%beta
> e<-y-y_duga

y_duga<-x%*%beta digunakan untuk mencari yduga dengan mengalikan matriks x dan matriks beta yang telah didefinisikan sebelumnya.
e<-y-y_duga digunakan untuk mencari sisaan dengan mengurangi y dengan y_duga yang telah didefinisikan sebelumnya.

Standar Error

> n<-nrow(Datareg)
> MSE<-sum(e^2)/(n-1)
> VarCov<-MSE*solve(t(x)%*%x)
> se<-VarCov %>% diag() %>% sqrt()

2.5 UJi Parsial

> p<-ncol(x)
> SU<-beta/se
> pVal<-c(2*pt(abs(SU[1]),n-1,lower.tail=F), 
+         2*pt(abs(SU[-1]),n-p,lower.tail=F))

sehingga dapat dirangkum dalam tabel sebagai berikut :

> data.frame(
+   koefisien =beta %>% rownames(),
+   Pend.Param=beta %>% round(4),
+   Std.Error =se%>%round(3),
+   Stat.Uji  =SU%>%round(3),
+   pValue    =pVal%>%round(3),
+   sig       =ifelse(pVal<0.001, "***",
+                     ifelse(pVal<0.01, "**",
+                            ifelse(pVal<0.05, "*",
+                                   ifelse(pVal<0.1, ".",""))))
+ )
                                koefisien Pend.Param Std.Error Stat.Uji pValue
cons                                 cons    23.0545    22.552    1.022  0.333
Tingkat_Kehadiran(%) Tingkat_Kehadiran(%)     0.7372     0.096    7.657  0.000
IQ                                     IQ    -0.0343     0.194   -0.177  0.865
                     sig
cons                    
Tingkat_Kehadiran(%) ***
IQ                      

Koefisien Determinasi

> JK_Error<-sum(e^2)
> JKT<-sum((y-mean(y))^2)
> R2<-1-(JK_Error/JKT)
> R2a<-1-MSE/(JKT/(n+2))

2.6 Uji Simultan

> Fhit<-(R2/(p-1))/((1-R2)/(n-p+3))
> pVal<-pf(Fhit,p-1,n-p+3,lower.tail=F)
> Fhit;pVal
[1] 34.0329
[1] 3.44902e-05

2.7 Fungsi Build in

> reg<-lm(Datareg$`Nilai_UAS(Y)`~Datareg$`Tingkat_Kehadiran(%)`+Datareg$IQ, data=Datareg)
> summary(reg)

Call:
lm(formula = Datareg$`Nilai_UAS(Y)` ~ Datareg$`Tingkat_Kehadiran(%)` + 
    Datareg$IQ, data = Datareg)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.2861 -2.8939  0.0296  1.6791  6.1993 

Coefficients:
                               Estimate Std. Error t value Pr(>|t|)    
(Intercept)                    23.05445   25.57161   0.902 0.397247    
Datareg$`Tingkat_Kehadiran(%)`  0.73723    0.10918   6.752 0.000264 ***
Datareg$IQ                     -0.03433    0.22051  -0.156 0.880686    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.346 on 7 degrees of freedom
Multiple R-squared:  0.8719,    Adjusted R-squared:  0.8353 
F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

reg<-lm(Datareg$Nilai_UAS(Y)~Datareg$Tingkat_Kehadiran(%)+Datareg$IQ, data=Datareg) digunakan untuk melakukan analisis regresi berganda di mana Y sebagai fungsi dari X1 dan X2.
Function Summary digunakan untuk menampilkan output analisis regresi yang telah didefinisikan sebelumnya.

2.8 Pemodelan Regresi

> reg<-lm(Datareg$`Nilai_UAS(Y)`~Datareg$`Tingkat_Kehadiran(%)`+Datareg$IQ, data=Datareg)
> print(reg)

Call:
lm(formula = Datareg$`Nilai_UAS(Y)` ~ Datareg$`Tingkat_Kehadiran(%)` + 
    Datareg$IQ, data = Datareg)

Coefficients:
                   (Intercept)  Datareg$`Tingkat_Kehadiran(%)`  
                      23.05445                         0.73723  
                    Datareg$IQ  
                      -0.03433  

2.9 Pemeriksaan Asumsi

> par(mfrow=c(2,2))
> plot(reg)

> plot(reg, 4)
> plot(reg, 5)

Function par(mfrow=c(2,2)) digunakan untuk menyajikan empat plot tampil dalam satu layar di mana setiap baris ada dua plot.
Function plot(reg) digunakan untuk menampilkan plot analisis regresi yang telah didefinisikan sebelumnya.

2.9.1 Multikolinieritas

> library(car)
> vif(reg)
Datareg$`Tingkat_Kehadiran(%)`                     Datareg$IQ 
                      1.055571                       1.055571 

Function Vif() digunakan untuk melakukan perhitungan vif pada regresi yang menjadi dasar pendeteksi keberadaan multikolinieritas.

2.9.2 Uji Normalitas Galat

> sisa<-residuals(reg)
> library(tseries)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 0.58528, df = 2, p-value = 0.7463
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.95125, p-value = 0.6833

Function residuals() digunakan untuk mencari sisa dari fungsi regresi.

2.9.3 Homoskedastisitas

> library(lmtest)
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 5.905, df = 2, p-value = 0.05221

Function bptest() dogunakan untuk melakukan uji breusch pagan dengan obyek lm reg yang telah didefinisikan sebelumnya.

2.9.4 Non autokorelasi

> library(lmtest)
> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 2.594, p-value = 0.8013
alternative hypothesis: true autocorrelation is greater than 0

Function dwtest() digunakan untuk melakukan uji durbin watson dengan obyek lm reg yang telah didefinisikan sebelumnya.

2.10 Korelasi

> cor(Datareg) %>% round(3)
                     Nilai_UAS(Y) Tingkat_Kehadiran(%)    IQ
Nilai_UAS(Y)                1.000                0.934 0.194
Tingkat_Kehadiran(%)        0.934                1.000 0.229
IQ                          0.194                0.229 1.000
> library(GGally)
> Datareg%>%ggpairs(progress=F)

cor(Datareg) %>% round(3) digunakan untuk menghitung korelasi dari datareg.
Datareg%>%ggpairs(progress=F) digunakan untuk menampilkan plot korelasi dari datareg.

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

> library(summarytools)
> library(magrittr)
> Datareg %>% dfSummary() %>% view()

Berdasarkan Data yang digunakan, pada nilai UAS siswa diperoleh rata-rata 81.3 dengan nilai UAS terkecil 65 dan nilai UAS tertinggi 98. Kemudian pada variabel Tingkat Kehadiran diperoleh rata-rata 84.5% dengan persentase terendah 60% dan persentase tertinggi 100%. variabel terakhir, yaitu IQ memperoleh rata-rata 118 dengan IQ terendah 110 dan IQ tertinggi 130.

3.2 Plot

Berdasarkan Smooth Scatter Plot pada Gambar 1, dapat dilihat bahwa cenderung membentuk garis linier sehingga terdapat hubungan linier antara Tingkat Kehadiran siswa dengan Nilai UAS yang diperoleh.
Berdasarkan Smooth Scatter Plot pada Gambar 2, dapat dilihat bahwa cenderung menyebar secara acak sehingga tidak terdapat hubungan linier antara IQ siswa dengan Nilai UAS yang diperoleh.

3.3 Uji Parsial

Uji ini dilakukan untuk menguji signifikansi masing-masing penduga parameter.
Hipotesis:
\[ H_0 : \beta_i=0 \,vs\,H_1:\beta_i\ne0 \] Keputusan : Tolak H0 karena Pvalue < 0.05
Terima H0 karena Pvalue > 0.05

Kesimpulan : Pada taraf nyata 5% dapat disimpulkan bahwa variabel tingkat kehadiran mempengaruhi perolehan nilai UAS sedangkan variabel IQ tidak mempengaruhi perolehan nilai UAS.

3.4 Uji Simultan

Uji ini digunakan untuk menguji signifikansi parameter secara serempak (bersama-sama).

\[ H_0:\forall\beta_i=0\,vs \,H_1:\exists\beta_i\ne0 \] Keputusan : Tolak H0 karena pvalue <0.05
Kesimpulan : Pada taraf nyata 5% dapat disimpulkan bahwa variabel prediktor mempengaruhi variabel respons yaitu nilai UAS.

3.5 Pemodelan Regresi

Berdasarkan perhitungan, model regresi kasus ini adalah sebagai berikut :
\[ Y = 23.05445 + 0.73723X_1-0.03433X_2 \] Interpretasi :
- Variabel X1 dan X2 merupakan variabel prediktor
- Variabel Y merupakan variabel respons
- Setiap kenaikan satu satuan X1 akan menyebabkan nilai Y bertambah 0.73723 dan variabel lain dianggap konstan
- Setiap kenaikan satu satuan variabel X2 akan menyebabkan nilai Y turun 0.03433 dan variabel lain dianggap konstan.

3.6 Pemeriksaan Asumsi

  • Berdasarkan plot 1 yaitu residuals vs fitted : terlihat bahwa plot tidak horizontal sehingga model dianggap belum tepat.
  • Berdasarkan plot 2 yaitu QQ plot : titik-titik masih menyebar secara normal dan jatuh di sekitar garis sehingga tidak melanggar normalitas.
  • Berdasarkan plot 3 yaitu scale location : terlihat bahwa garis merah tidak membentuk horizontal sehingga ragam tidak homogen atau terdapat masalah heteroskedastisitas.
  • Berdasarkan plot 5 yaitu residual vs leverage : seluruh titik berada di dalam jarak Cook sehingga dapat dibentuk regresi dengan seluruh titik atau sampel.

3.6.1 Multikolinieritas

Berdasarkan perhitungan, menghasilkan vif sebagai berikut: \[ Vif_x1= 1.055571 \] dan
\[ Vif_x2= 1.05571 \] Kedua Vif berada dibawah 10 sehingga tidak ada multikolinieritas.

3.6.2 Uji Normalitas Galat

Hipotesis : \[ H_0 : galat\, menyebar\, normal \, vs \, H_1 : galat\,tidak\,menyebar\,normal \] Berdasarkan hasil Jarque Bera Test, dapat dilihat bahwa p-value = 0.7463 maka terima H0.
Kesimpulan : tidak terbukti adanya pelanggaran asumsi normalitas galat pada model Y debagai fungsi dari X1 dan X2.
Berdasarkan hasil Shapiro-wilk test dapat dilihat bahwa p-value = 0.6833 maka terima H0.
Kesimpulan : tidak terbukti adanya pelanggaran asumsi normalitas galat pada model Y debagai fungsi dari X1 dan X2.

3.6.3 Homoskedastisitas

Untuk mnguji asumsi ini, dilakukan uji Breusch Pagan.
Hipotesis :
\[ H_0 : var(u|x)=E(u^2|x)=\sigma^2 \, vs\, H_1 : var(u|x)=E(u^2|x)\ne \sigma^2 \]
Keputusan : p-value > 0.05 maka terima H0.
Kesimpulan : pada taraf nyata 5% tidak ada pelanggaran asumsi homogenitas ragam galat, namun mendekati pelanggaran model.

3.6.4 Non autokorelasi

Uji yang dilakukan yaitu uji Durbin Watson.
Hipotesis :
\[ H_0 : \rho = 0 \, vs\, H_1:\rho\ne0 \]
Keputusan : pvalue > 0.05 maka terima H0.
Kesimpulan : tidak terdapat masalah autokorelasi.

3.7 Korelasi

Berdasarkan tabel tersebut dapat terlihat bahwa variabel yang memiliki korelasi terkuat yaitu antara variabel X1 dengan Y yaitu antara persentase tingkat kehadiran dengan nilai UAS siswa.

4 DAFTAR PUSTAKA

  • Yuliara, I Made. Regresi Linier Berganda. Bali : Universitas Udayana,2016.
  • Hidayat, Syarif. Hubungan antara Kecerdasan, Durasi Belajar dan Nilai Penjasorkes dengan Prestasi Akademik Siswa Kelas X Tahun Ajaran 2015/2016 di SMA N 1 Piyungan Bantul Daerah Istimewa Yogyakarta. Yogyakarta: Universitas Negeri Yogyakarta, 2016.
  • Salmaa.2021.”Pengertian Korelasi Menurut Para Ahli dan Bentuk Analisisnya”.penerbitdeepublish.com, diakses pada 20 Mei 2022.
  • Aji, Muhammad. 2021. “Mengenal 5 Jenis Kecerdasan Manusia IQ, AQ, EQ, SQ dan TQ, Begini Penjelasannya”,diakses pada 20 Mei 2022.