Analisis Regresi Jumlah Kursus yang Diikuti dan Lama Waktu Belajar Terhadap Nilai Akhir Siswa

Faisal Khoirudin

2023-06-01

library(knitr)
opts_chunk$set(echo = TRUE)
opts_chunk$set(message = FALSE)
opts_chunk$set(warning = FALSE)
opts_chunk$set(comment = "")
opts_chunk$set(collapse = TRUE)
opts_chunk$set(error = TRUE)
opts_chunk$set(prompt = TRUE)
opts_chunk$set(fig.align = "center")

1 PENDAHULUAN

1.1 Latar Belakang

Pada bidang disiplin pendidikan formal, prestasi akan nilai akhir menjadi salah satu poin penting dalam subcapaian pembelajaran. Prestasi siswa menjadi pilar utama dalam evaluasi keberhasilan suatu instansi pendidikan maupun siswa itu sendiri. Siswa mempunyai andil besar dalam penentuan prestasinya. Siswa memiliki tanggung jawab penuh akan tugasnya menjadi seorang pelajar, yakni bertanggung jawab untuk menuntut ilmu sebaik mungkin. Namun, adakalanya siswa juga ikut berpartisipasi secara aktif dalam kegiatan-kegiatan lain di luar kewajibannya tersebut, seperti mengikuti kursus.

Penggunaan sumber daya dan waktu yang efektif tentu menjadi tantangan terbesar seorang siswa. Apapun yang terjadi siswa dituntut untuk dapat membagi waktu dengan bijak antara kursus yang diikuti dan waktu belajar. Hal ini dilakukan agar subcapaian pembelajaran dapat tercapai secara maksimal. Berdasarkan permasalahan ini maka dilakukanlah analisis untuk mengidentifikasi hubungan antara jumlah kursus yang diikuti dan waktu belajar terhadap prestasi siswa.

1.2 Rumusan Masalah

  1. Apakah terdapat hubungan antara jumlah kursus yang diikuti (Number of Courses) dan lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained)?
  2. Apakah terdapat hubungan antara jumlah kursus yang diikuti (Number of Courses) terhadap nilai akhir siswa (Marks Obtained)?
  3. Apakah terdapat hubungan antara lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained)?

1.3 Tujuan

  1. Untuk mengetahui hubungan antara jumlah kursus yang diikuti (Number of Courses) dan lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained).
  2. Untuk mengetahui hubungan antara jumlah kursus yang diikuti (Number of Courses) terhadap nilai akhir siswa (Marks Obtained).
  3. Untuk mengetahui hubungan antara lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained).

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan atau penyajian data hingga memberi informasi yang berguna. Data yang dilihat adalah jumlah data, nilai minimum, nilai maksimum, nilai rata-rata (mean), dan standar deviasi. (Ghozali, 2018:19)

2.2 Analisis Regresi

Konsep analisis regresi adalah menemukan hubungan terbaik antara variabel prediktor dan variabel respons, mengukur kekuatan hubungan, dan menggunakan metode yang memungkinkan prediksi nilai variabel respons yang diberikan oleh nilai variabel prediktor. Namun, dalam sebagian besar penelitian yang menerapkan analisis regresi terdapat lebih dari satu variabel prediktor dalam pemodelan regresi. Oleh karena itu, model analisis regresi berganda diperlukan untuk dapat memprediksi nilai variabel respons. Secara umum, model regresi linier berganda sebagai berikut.

\[ \bar{Y}\ =\ \beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_kX_k + \varepsilon \]

Di mana:

\(\bar{Y}:\) variabel respons duga.

\(\beta_0:\) intercept.

\(X_1,X_2,…,X_k:\) variabel-variabel prediktor.

\(\beta_1,\beta_2,...,\beta_k:\) koefisien-koefisien regresi yang menunjukkan hubungan antara variabel prediktor dengan variabel respons.

\(\varepsilon:\) galat.

2.3 Asumsi Klasik

2.3.1 Asumsi Normalitas

\(H_0:\) Galat berdistribusi normal (Asumsi normalitas terpenuhi).

\(H_1:\) Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi).

Asumsi normalitas adalah analisis regresi yang mengacu pada asumsi bahwa galat (error) model regresi harus berdistribusi normal. Asumsi ini harus terpenuhi agar hasil estimasi model menjadi valid. Uji statistik dapat menggunakan uji Jarque-Berra atau uji Shapiro-Wilk bagi sampel kecil dan uji Kolmogorov-Smirnov bagi sampel besar. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi normalitas terpenuhi.

2.3.2 Asumsi Homoskedastisitas

\(H_0:\sigma_i^2=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas terpenuhi).

\(H_1:\sigma_i^2\not=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas tidak terpenuhi).

Asumsi homoskedastisitas adalah asumsi bahwa varians dari galat (error) model regresi sama atau konstan di semua tingkat nilai variabel prediktor. Asumsi ini menyatakan bahwa sebaran galat model regresi tidak berubah secara sistematis seiring perubahan nilai variabel prediktor. Uji statistik dapat menggunakan uji White atau uji Breuch-Pagan. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi homoskedastisitas terpenuhi.

2.3.3 Asumsi Non-Multikolinieritas

Asumsi non-multikolinieritas mangacu pada ada atau tidaknya korelasi yang tinggi antara dua atau lebih variabel prediktor dalam model regresi. Asumsi ini harus terpenuhi agar hasil estimasi model menjadi valid. Untuk menguji asumsi ini, dapat menggunakan Variance Inflation Factor (VIF) dengan rumus sebagai berikut.

\[ VIF(\hat\beta_j) =\ \frac{1}{1-R_j^2}\ ,\ j\ =\ 1,2,...,k \]

Perhitungan VIF dilakukan untuk setiap variabel prediktor dalam model regresi. Apabila nilai VIF lebih besar dari 10 dapat menunjukkan adanya multikolinieritas.

2.3.4 Asumsi Non-Autokorelasi

\(H_0:\) Tidak terjadi autokorelasi.

\(H_1:\) Terjadi autokorelasi.

Asumsi non-autokorelasi mengacu pada ada atau tidaknya korelasi antara galat (error) model regresi pada waktu yang berbeda. Uji statistik dapat menggunakan uji Durbin-Watson. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi non-autokorelasi terpenuhi.

2.4 Pengujian Hipotesis

2.4.1 Tabel ANOVA pada Regresi

Sumber Jumlah Kuadrat db Kuadrat Tengah \(F_{hitung}\)
Regresi JKR \(db_R\) KTR \(F_{db_R,db_G;\alpha}\)
Galat JKG \(db_G\) KTG
Total JKT \(db_T\)

Di mana:

\(db_T\ =\ n\ -\ 1\\db_R\ =\ k\ -\ 1\\db_G\ =\ db_T\ -\ db_R\\JKT\ =\ n\Sigma_{i=1}^n(y_i-\bar{y})^2\\JKR\ =\ \Sigma_{i=1}^n(\hat{y_i}-\bar{y})^2\\JKG\ =\ JKT\ -\ JKR\\KTR\ =\ \frac{JKR}{db_R}\\KTG\ =\ \frac{JKG}{db_G}\\F_{db_R,db_G;\alpha}\ =\ \frac{KTR}{KTG}\)

2.4.2 Uji Simultan

\(H_0:\beta_1=\beta_2=...=\beta_k=0\)

\(H_1:\) Terdapat minimal satu \(\beta_i\not=0\) dimana \(i=1,2,...,k\)

Uji simultan dalam regresi mengacu pada uji hipotesis secara serentak terhadap satu atau lebih koefisien regresi dalam model. Hal ini digunakan untuk mengetahui hubungan signifikan keseluruhan variabel prediktor terhadap variabel respons. Untuk pengujian simultan dapat menggunakan rumus sebagai berikut.

\[ F\ =\ \frac{KTR}{KTG} \]

Apabila nilai F (p-value) uji lebih kecil dari tingkat signifikasi yang ditentukan, maka dapat disimpulkan bahwa terdapat hubungan linier yang signifikan antara variabel prediktor dan variabel respons.

2.4.3 Uji Parsial

\(H_0:\) \(\beta_j=0\)

\(H_1:\) \(\beta_j\not=0\)

Uji parsial dalam regresi mengacu pada uji hipotesis terhadap satu koefisien regresi tertentu dalam model dengan mengabaikan pengaruh variabel prediktor lain. Hal ini digunakan untuk mengetahui hubungan signifikan variabel prediktor secara individual terhadap variabel respons. Untuk pengujian simultan dapat menggunakan rumus sebagai berikut.

\[ t\ =\ \frac{\hat\beta_j-\beta_{j0}}{s_d} \]

Apabila nilai t (p-value) uji lebih kecil dari tingkat signifikasi yang ditentukan, maka dapat disimpulkan bahwa terdapat hubungan linier yang signifikan antara variabel prediktor tersebut dan variabel respons.

3 DATA

Data yang digunakan merupakan data yang diarsip oleh UCI Machine Learning Repository dan tersedia di Kaggle. Data hubungan antara Number of Courses Opted dan Average Time Studied terhadap Marks Obtained.

Number of Courses Avg Time Study Marks Obtained
3 4.058 19.202
4 0.096 7.734
4 3.133 13.811
6 7.909 53.018
8 7.811 55.299
6 3.211 17.822
3 6.063 29.889
5 3.413 17.264
4 4.41 20.348
3 6.173 30.862
3 7.353 42.036
7 0.423 12.132
7 4.218 24.318
3 4.274 17.672
3 2.908 11.397
4 4.26 19.466
5 5.719 30.548
8 6.08 38.49
6 7.711 50.986
8 3.977 25.133
4 4.733 22.073
6 6.126 35.939
5 2.051 12.209
7 4.875 28.043
4 3.635 16.517
3 1.407 6.623
7 0.508 12.647
8 4.378 26.532
5 0.156 9.333
4 1.299 8.837
8 3.864 24.172
3 1.923 8.1
8 0.932 15.038
6 6.594 39.965
3 4.083 17.171
3 7.543 43.978
4 2.966 13.119
6 7.283 46.453
7 6.533 41.358
6 7.775 51.142
4 0.14 7.336
6 2.754 15.725
6 3.591 19.771
5 1.557 10.429
4 1.954 9.742
3 2.061 8.924
4 3.797 16.703
4 4.779 22.701
3 5.635 26.882
5 3.913 19.106
6 6.703 40.602
6 4.13 22.184
4 0.771 7.892
7 6.049 36.653
8 7.591 53.158
7 2.913 18.238
8 7.641 53.359
7 7.649 51.583
3 6.198 31.236
8 7.468 51.343
6 0.376 10.522
4 2.438 10.844
6 3.606 19.59
3 4.869 21.379
7 0.13 12.591
6 2.142 13.562
4 5.473 27.569
3 0.55 6.185
4 1.395 8.92
6 3.948 21.4
4 3.736 16.606
5 2.518 13.416
3 4.633 20.398
3 1.629 7.014
4 6.954 39.952
3 0.803 6.217
5 6.379 36.746
8 5.985 38.278
7 7.451 49.544
3 0.805 6.349
7 7.957 54.321
8 2.262 17.705
4 7.41 44.099
5 3.197 16.106
8 1.982 16.461
8 6.201 39.957
7 4.067 23.149
3 1.033 6.053
5 1.803 11.253
7 6.376 40.024
7 4.182 24.394
8 2.73 19.564
4 5.027 23.916
8 6.471 42.426
8 3.919 24.451
6 3.561 19.128
3 0.301 5.609
4 7.163 41.444
7 0.309 12.027
3 6.335 32.357

4 SOURCE CODE

4.1 Library yang Dibutuhkan

> library(rmarkdown)
> library(knitr)
> library(tinytex)
> library(prettydoc)
> library(readxl)
> library(lmtest)
> library(car)

4.2 Memanggil Data dan Menampilkan Struktur Data

Pemanggilan data dapat memanfaatkan fungsi impor yang tersedia di dalam RStudio. Salah satu caranya adalah memanfaatkan file bertipe .xlsx.

> data = read_excel("C:/Users/FAISAL/Downloads/Statistika Semester 4/Komputasi Statistika/Marks.xlsx")
> str(data)
tibble [100 × 3] (S3: tbl_df/tbl/data.frame)
 $ NumberofCourses: num [1:100] 3 4 4 6 8 6 3 5 4 3 ...
 $ AvgTimeStudy   : num [1:100] 4.508 0.096 3.133 7.909 7.811 ...
 $ MarksObtained  : num [1:100] 19.2 7.73 13.81 53.02 55.3 ...

Struktur dari data dapat diidentifikasi berupa tibble dengan 100 observasi dan terdapat variabel. Variabel Number of Courses, Average Time Study, dan Marks Obtained merupakan variabel bertipe numerik.

Function read_excel() berfungsi agar R dapat mengakses file bertipe .xlsx dengan argument berupa file path dari data Microsoft Excel. Function str() berfungsi untuk menampilkan deskripsi singkat jenis data yang tersedia.

4.3 Scatterplot

> smoothScatter(x = data$NumberofCourses, y = data$MarksObtained, xlab = "Number of Courses", ylab = "Marks Obtained", main = "Gambar 1. Marks Obtained~Vertical Length")
> smoothScatter(x = data$AvgTimeStudy, y = data$MarksObtained, xlab = "Average Time Study", ylab = "Marks Obtained", main = "Gambar 2. Marks Obtained~Average Time Study")

Function smoothScatter() berfungsi untuk membentuk grafik sebar yang dimuluskan yang menunjukkan hubungan antara dua variabel. Argument berupa variabel x, variabel y, label untuk variabel x dan y, serta judul dari grafik yang dibentuk. Adanya scatterplot ini berguna untuk mendeteksi pola hubungan yang mungkin dari variabel prediktor dan variabel respons.

4.4 Analisis Model Regresi Linier Berganda

> regresi = lm(MarksObtained~NumberofCourses+AvgTimeStudy, data = data)
> regresi

Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy, 
    data = data)

Coefficients:
    (Intercept)  NumberofCourses     AvgTimeStudy  
         -7.456            1.864            5.399  

Function lm() berfungsi untuk membuat model regresi yang sesuai. Argument berupa model atau formula yaitu Respons~Prediktor dengan data = [namadata]. Pada analisis ini, variabel respons adalah Marks Obtained, sedangkan variabel prediktor adalah Number of Courses dan Average Time Study.

4.5 Statistika Deskriptif

> summary(regresi)

Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy, 
    data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5617 -3.1023 -0.8361  3.6051  7.2158 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)      -7.4563     1.1745  -6.349 6.98e-09 ***
NumberofCourses   1.8641     0.2017   9.243 5.78e-15 ***
AvgTimeStudy      5.3992     0.1529  35.303  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared:  0.9404,    Adjusted R-squared:  0.9391 
F-statistic: 764.8 on 2 and 97 DF,  p-value: < 2.2e-16

Function summary() berfungsi untuk menampilkan penjelasan ringkas suatu model dengan argument berupa model yang telah didefinisikan sebelumnya.

4.6 Asumsi Klasik

4.6.1 Asumsi Normalitas

> ks.test(regresi$residuals, "pnorm")

    Asymptotic one-sample Kolmogorov-Smirnov test

data:  regresi$residuals
D = 0.40505, p-value = 1.121e-14
alternative hypothesis: two-sided

Function ks.test() berfungsi untuk melakukan uji Kolmogorov-Smirnov sebagai pengujian asumsi normalitas model regresi pada sampel besar (50-100 sampel). Argument berupa residuals dari model yang telah didefinisikan sebelumnya dengan pnorm sebagai pembanding distribusi data.

4.6.2 Asumsi Homoskedastisitas

> bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 2.9348, df = 2, p-value = 0.2305

Function bptest() berfungsi untuk melakukan uji Breusch-Pagan sebagai pengujian asumsi homoskedastisitas. Argument berupa model yang telah didefinisikan sebelumnya.

4.6.3 Asumsi Non-Multikolinieritas

> vif(regresi)
NumberofCourses    AvgTimeStudy 
       1.043799        1.043799 

Function vif() berfungsi untuk melakukan pengujian asumsi non-multikolinieritas. Argument berupa model yang telah didefinisikan sebelumnya.

4.6.4 Asumsi Non-Autokorelasi

> dwtest(regresi)

    Durbin-Watson test

data:  regresi
DW = 1.9779, p-value = 0.4517
alternative hypothesis: true autocorrelation is greater than 0

Function dwtest() berfungsi untuk melakukan uji Durbin-Watson sebagai pengujian asumsi non-autokorelasi. Argument berupa model yang telah didefinisikan sebelumnya.

5 HASIL DAN PEMBAHASAN

5.1 Scatterplot

Berikut scatterplot yang terbentuk berdasarkan output R, hanya pada Gambar 2 yang terindikasi adanya hubungan linier antara variabel prediktor Average Time Study \((X_2)\) dan variabel respons Marks \((Y)\)

5.2 Model Regresi Linier Berganda

                 Estimate Std. Error   t value     Pr(>|t|)
(Intercept)     -7.456346  1.1744582 -6.348754 6.982054e-09
NumberofCourses  1.864051  0.2016715  9.243007 5.783861e-15
AvgTimeStudy     5.399179  0.1529395 35.302700 3.678846e-57

Model regresi linier berganda berdasarkan output R sebagai berikut:

\[ \bar{Y}\ =\ -7,456346 + 1,864051X_1 + 5,399179X_2 \]

Interpretasi:

  • \(\beta_0\ =\ -7,456346\)

Jika variabel \(X_1\) (Number of Courses) dan \(X_2\) (Average Time Study) bernilai nol, maka variabel \(\bar{Y}\) (Marks Obtained) bernilai sebesar \(-7,456346\).

  • \(\beta_1\ =\ 1,864051\)

Jika variabel \(X_1\) (Number of Courses) naik satu satuan dengan asumsi variabel \(X_2\) (Average Time Study) bernilai konstan, maka variabel \(\bar{Y}\) (Marks Obtained) akan mengalami kenaikan sebesar \(1,864051\).

  • \(\beta_2\ =\ 5,399179\)

Jika variabel \(X_2\) (Average Time Study) naik satu satuan dengan asumsi variabel \(X_1\) (Number of Courses) bernilai konstan, maka variabel \(\bar{Y}\) (Marks Obtained) akan mengalami kenaikan sebesar \(5,399179\).

5.3 Statistika Deskriptif


Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy, 
    data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5617 -3.1023 -0.8361  3.6051  7.2158 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)      -7.4563     1.1745  -6.349 6.98e-09 ***
NumberofCourses   1.8641     0.2017   9.243 5.78e-15 ***
AvgTimeStudy      5.3992     0.1529  35.303  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared:  0.9404,    Adjusted R-squared:  0.9391 
F-statistic: 764.8 on 2 and 97 DF,  p-value: < 2.2e-16

Ringkasan lima angka residual berdasarkan output R sebagai berikut:

  • \(Min\ =\ -4,5617\)

Interpretasi: Data penelitian memiliki residual terkecil sebesar \(-4,5617\).

  • \(Q_1\ =\ -3,1023\)

Interpretasi: Data penelitian memiliki residual kuartil pertama sebesar \(-3,1023\).

  • \(Median\ =\ -0,8361\)

Interpretasi: Data penelitian memiliki residual median sebesar \(-0,8361\).

  • \(Q_3\ =\ 3,6051\)

Interpretasi: Data penelitian memiliki residual kuartil ketiga sebesar \(3,6051\).

  • \(Max\ =\ 7,2158\)

Interpretasi: Data penelitian memiliki residual terbesar sebesar \(7,2158\).

5.4 Asumsi Klasik

5.4.1 Asumsi Normalitas

Hipotesis:

\(H_0:\) Galat berdistribusi normal (Asumsi normalitas terpenuhi).

\(H_1:\) Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi).


    Asymptotic one-sample Kolmogorov-Smirnov test

data:  regresi$residuals
D = 0.40505, p-value = 1.121e-14
alternative hypothesis: two-sided

Uji Kolmogorov-Smirnov berdasarkan output R diperoleh \(p-value\ =\ 1,121 \cdot 10^{-14}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (1,121 \cdot 10^{-14})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data belum cukup bukti untuk memenuhi asumsi normalitas. Pada data ini, galat tidak berdistribusi normal.

5.4.2 Asumsi Homoskedastisitas

\(H_0:\sigma_i^2=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas terpenuhi).

\(H_1:\sigma_i^2\not=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas tidak terpenuhi).


    studentized Breusch-Pagan test

data:  regresi
BP = 2.9348, df = 2, p-value = 0.2305

Uji Breusch-Pagan berdasarkan output R diperoleh \(p-value\ =\ 0,2305\). Hal tersebut menghasilkan keputusan gagal tolak \(H_0\), karena \(p-value\ (0,2305)\ >\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data sudah cukup bukti untuk memenuhi asumsi homoskedastisitas. Pada penelitian ini, ragam memiliki nilai yang sama untuk setiap amatan pada nilai \(X_i\) yang sama.

5.4.3 Asumsi Non-Multikolinieritas

NumberofCourses    AvgTimeStudy 
       1.043799        1.043799 

Nilai VIF masing-masing variabel berdasarkan output R secara independen antara lain, Number of Courses \(=\ 1,043799\) dan Average Time Study \(=\ 1,043799\). Nilai VIF memberikan informasi adanya peubah yang menyebabkan ragam galat menjadi besar. Pada output R setiap variabel memiliki nilai \(VIF < 10\). Dengan demikian, data sudah cukup bukti untuk memenuhi asumsi non-multikolinieritas. Pada data ini, tidak terjadi multikolinieritas.

5.4.4 Asumsi Non-Autokorelasi

\(H_0:\) Tidak terjadi autokorelasi.

\(H_1:\) Terjadi autokorelasi.


    Durbin-Watson test

data:  regresi
DW = 1.9779, p-value = 0.4517
alternative hypothesis: true autocorrelation is greater than 0

Uji Durbin-Watson berdasarkan output R diperoleh \(p-value\ =\ 0,4517\). Hal tersebut menghasilkan keputusan gagal tolak \(H_0\), karena \(p-value\ (0,01522)\ >\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data sudah cukup bukti untuk memenuhi asumsi non-autokorelasi. Pada data ini, antar residual tidak terindikasi terjadi korelasi.

5.5 Pengujian Hipotesis


Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy, 
    data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5617 -3.1023 -0.8361  3.6051  7.2158 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)      -7.4563     1.1745  -6.349 6.98e-09 ***
NumberofCourses   1.8641     0.2017   9.243 5.78e-15 ***
AvgTimeStudy      5.3992     0.1529  35.303  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared:  0.9404,    Adjusted R-squared:  0.9391 
F-statistic: 764.8 on 2 and 97 DF,  p-value: < 2.2e-16

5.5.1 Uji Simultan

\(H_0:\beta_1=\beta_2=...=\beta_k=0\)

\(H_1:\) Terdapat minimal satu \(\beta_i\not=0\) dimana \(i=1,2,...,k\)

Uji simultan berdasarkan output R diperoleh \(p-value\ <\ 2,2 \cdot 10^{-16}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (2,2 \cdot 10^{-16})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa seluruh variabel prediktor secara simultan berpengaruh terhadap variabel respons.

5.5.2 Uji Parsial

\(H_0:\beta_j=0\)

\(H_1:\beta_j\not=0\)

Uji parsial berdasarkan output R diperoleh sebagai berikut:

  • Variabel Number of Courses \((X_1)\)

Berdasarkan output R diperoleh \(p-value\ =\ 5,78 \cdot 10^{-15}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (5,78 \cdot 10^{-15})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa variabel prediktor Number of Courses \((X_1)\) secara parsial berpengaruh terhadap variabel respons Marks Obtained \((Y)\).

  • Variabel Average Time Study \((X_2)\)

Berdasarkan output R diperoleh \(p-value\ <\ 2 \cdot 10^{-16}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (2 \cdot 10^{-16})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa variabel prediktor Average Time Study \((X_2)\) secara parsial berpengaruh terhadap variabel respons Marks Obtained \((Y)\).

5.6 Koefisien Determinasi

Koefisien determinasi \((R^{2})\) berdasarkan output R diperoleh \(Adjusted\ R-squared\ =\ 0,9391\). Hal tersebut memiliki arti bahwa variabilitas dalam variabel respons dapat dijelaskan oleh variabel-variabel prediktor sebesar \(93,91\%\). Sementara \(6,09\%\) sisanya dijelaskan oleh variabel lain yang tidak dibahas pada penelitian.

6 KESIMPULAN DAN SARAN

6.1 Kesimpulan

Berdasarkan hasil dan pembahasan, dapat ditarik kesimpulan bahwa model regresi yang terbentuk sebagai berikut:

\[ \bar{Y}\ =\ -7,456346 + 1,864051X_1 + 5,399179X_2 \]

Dimana pada uji simultan dan uji parsial, variabel-variabel prediktor baik secara simultan maupun parsial berpengaruh siginifikan terhadap variabel respons. Selain itu pada koefisien determinasi \((R^{2})\), tingkat variabilitas dalam variabel respons dapat dijelaskan oleh variabel-variabel prediktor sebesar \(93,91\%\). Namun, terdapat asumsi yang tidak terpenuhi yakni asumsi normalitas.

6.2 Saran

Data penelitian yang telah dilakukan belum sepenuhnya sempurna. Hal ini dikarenakan, saat pengujian asumsi klasik masih terdapat asumsi yang belum terpenuhi yakni asumsi normalitas. Hal ini dapat menjadikan kesimpulan tidak valid atau komprehensif terhadap model regresi yang ada. Oleh karena itu, saran untuk penelitian selanjutnya dapat melakukan pengambilan data ulang dan memberikan informasi mengenai dasa tersebut secara lengkap.

7 DAFTAR PUSTAKA

Ghozali, Imam. (2018). Aplikasi Analisis Multivariate dengan Program IBM SPSS 25. Edisi 9. Semarang: Universitas Diponegoro.

Nofianti, A. I. (2019). Pengaruh Kegiatan Ekstrakurikuler dan Motivasi Belajar Terhadap Prestasi Belajar Siswa. JDMP (Jurnal Dinamika Manajemen Pendidikan). https://doi.org/10.26740/jdmp.v2n2.p120-129

Situmorang, Z. R. D., & Latifah, M. (2014). Pengaruh Dukungan Sosial, Konsep Diri, dan Strategi Pengaturan Diri dalam Belajar terhadap Prestasi Akademik. Jurnal Ilmu Keluarga Dan Konsumen. https://doi.org/10.24156/jikk.2014.7.3.154

Student Marks Dataset. (2022, January 4). Kaggle. https://www.kaggle.com/datasets/yasserh/student-marks-dataset

Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. E. (2010). Probability and statistics for engineers and scientists (9th ed.). Pearson.