library(knitr)
opts_chunk$set(echo = TRUE)
opts_chunk$set(message = FALSE)
opts_chunk$set(warning = FALSE)
opts_chunk$set(comment = "")
opts_chunk$set(collapse = TRUE)
opts_chunk$set(error = TRUE)
opts_chunk$set(prompt = TRUE)
opts_chunk$set(fig.align = "center")1 PENDAHULUAN
1.1 Latar Belakang
Pada bidang disiplin pendidikan formal, prestasi akan nilai akhir menjadi salah satu poin penting dalam subcapaian pembelajaran. Prestasi siswa menjadi pilar utama dalam evaluasi keberhasilan suatu instansi pendidikan maupun siswa itu sendiri. Siswa mempunyai andil besar dalam penentuan prestasinya. Siswa memiliki tanggung jawab penuh akan tugasnya menjadi seorang pelajar, yakni bertanggung jawab untuk menuntut ilmu sebaik mungkin. Namun, adakalanya siswa juga ikut berpartisipasi secara aktif dalam kegiatan-kegiatan lain di luar kewajibannya tersebut, seperti mengikuti kursus.
Penggunaan sumber daya dan waktu yang efektif tentu menjadi tantangan terbesar seorang siswa. Apapun yang terjadi siswa dituntut untuk dapat membagi waktu dengan bijak antara kursus yang diikuti dan waktu belajar. Hal ini dilakukan agar subcapaian pembelajaran dapat tercapai secara maksimal. Berdasarkan permasalahan ini maka dilakukanlah analisis untuk mengidentifikasi hubungan antara jumlah kursus yang diikuti dan waktu belajar terhadap prestasi siswa.
1.2 Rumusan Masalah
- Apakah terdapat hubungan antara jumlah kursus yang diikuti (Number of Courses) dan lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained)?
- Apakah terdapat hubungan antara jumlah kursus yang diikuti (Number of Courses) terhadap nilai akhir siswa (Marks Obtained)?
- Apakah terdapat hubungan antara lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained)?
1.3 Tujuan
- Untuk mengetahui hubungan antara jumlah kursus yang diikuti (Number of Courses) dan lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained).
- Untuk mengetahui hubungan antara jumlah kursus yang diikuti (Number of Courses) terhadap nilai akhir siswa (Marks Obtained).
- Untuk mengetahui hubungan antara lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained).
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan atau penyajian data hingga memberi informasi yang berguna. Data yang dilihat adalah jumlah data, nilai minimum, nilai maksimum, nilai rata-rata (mean), dan standar deviasi. (Ghozali, 2018:19)
2.2 Analisis Regresi
Konsep analisis regresi adalah menemukan hubungan terbaik antara variabel prediktor dan variabel respons, mengukur kekuatan hubungan, dan menggunakan metode yang memungkinkan prediksi nilai variabel respons yang diberikan oleh nilai variabel prediktor. Namun, dalam sebagian besar penelitian yang menerapkan analisis regresi terdapat lebih dari satu variabel prediktor dalam pemodelan regresi. Oleh karena itu, model analisis regresi berganda diperlukan untuk dapat memprediksi nilai variabel respons. Secara umum, model regresi linier berganda sebagai berikut.
\[ \bar{Y}\ =\ \beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_kX_k + \varepsilon \]
Di mana:
\(\bar{Y}:\) variabel respons duga.
\(\beta_0:\) intercept.
\(X_1,X_2,…,X_k:\) variabel-variabel prediktor.
\(\beta_1,\beta_2,...,\beta_k:\) koefisien-koefisien regresi yang menunjukkan hubungan antara variabel prediktor dengan variabel respons.
\(\varepsilon:\) galat.
2.3 Asumsi Klasik
2.3.1 Asumsi Normalitas
\(H_0:\) Galat berdistribusi normal (Asumsi normalitas terpenuhi).
\(H_1:\) Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi).
Asumsi normalitas adalah analisis regresi yang mengacu pada asumsi bahwa galat (error) model regresi harus berdistribusi normal. Asumsi ini harus terpenuhi agar hasil estimasi model menjadi valid. Uji statistik dapat menggunakan uji Jarque-Berra atau uji Shapiro-Wilk bagi sampel kecil dan uji Kolmogorov-Smirnov bagi sampel besar. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi normalitas terpenuhi.
2.3.2 Asumsi Homoskedastisitas
\(H_0:\sigma_i^2=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas terpenuhi).
\(H_1:\sigma_i^2\not=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas tidak terpenuhi).
Asumsi homoskedastisitas adalah asumsi bahwa varians dari galat (error) model regresi sama atau konstan di semua tingkat nilai variabel prediktor. Asumsi ini menyatakan bahwa sebaran galat model regresi tidak berubah secara sistematis seiring perubahan nilai variabel prediktor. Uji statistik dapat menggunakan uji White atau uji Breuch-Pagan. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi homoskedastisitas terpenuhi.
2.3.3 Asumsi Non-Multikolinieritas
Asumsi non-multikolinieritas mangacu pada ada atau tidaknya korelasi yang tinggi antara dua atau lebih variabel prediktor dalam model regresi. Asumsi ini harus terpenuhi agar hasil estimasi model menjadi valid. Untuk menguji asumsi ini, dapat menggunakan Variance Inflation Factor (VIF) dengan rumus sebagai berikut.
\[ VIF(\hat\beta_j) =\ \frac{1}{1-R_j^2}\ ,\ j\ =\ 1,2,...,k \]
Perhitungan VIF dilakukan untuk setiap variabel prediktor dalam model regresi. Apabila nilai VIF lebih besar dari 10 dapat menunjukkan adanya multikolinieritas.
2.3.4 Asumsi Non-Autokorelasi
\(H_0:\) Tidak terjadi autokorelasi.
\(H_1:\) Terjadi autokorelasi.
Asumsi non-autokorelasi mengacu pada ada atau tidaknya korelasi antara galat (error) model regresi pada waktu yang berbeda. Uji statistik dapat menggunakan uji Durbin-Watson. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi non-autokorelasi terpenuhi.
2.4 Pengujian Hipotesis
2.4.1 Tabel ANOVA pada Regresi
| Sumber | Jumlah Kuadrat | db | Kuadrat Tengah | \(F_{hitung}\) |
|---|---|---|---|---|
| Regresi | JKR | \(db_R\) | KTR | \(F_{db_R,db_G;\alpha}\) |
| Galat | JKG | \(db_G\) | KTG | |
| Total | JKT | \(db_T\) |
Di mana:
\(db_T\ =\ n\ -\ 1\\db_R\ =\ k\ -\ 1\\db_G\ =\ db_T\ -\ db_R\\JKT\ =\ n\Sigma_{i=1}^n(y_i-\bar{y})^2\\JKR\ =\ \Sigma_{i=1}^n(\hat{y_i}-\bar{y})^2\\JKG\ =\ JKT\ -\ JKR\\KTR\ =\ \frac{JKR}{db_R}\\KTG\ =\ \frac{JKG}{db_G}\\F_{db_R,db_G;\alpha}\ =\ \frac{KTR}{KTG}\)
2.4.2 Uji Simultan
\(H_0:\beta_1=\beta_2=...=\beta_k=0\)
\(H_1:\) Terdapat minimal satu \(\beta_i\not=0\) dimana \(i=1,2,...,k\)
Uji simultan dalam regresi mengacu pada uji hipotesis secara serentak terhadap satu atau lebih koefisien regresi dalam model. Hal ini digunakan untuk mengetahui hubungan signifikan keseluruhan variabel prediktor terhadap variabel respons. Untuk pengujian simultan dapat menggunakan rumus sebagai berikut.
\[ F\ =\ \frac{KTR}{KTG} \]
Apabila nilai F (p-value) uji lebih kecil dari tingkat signifikasi yang ditentukan, maka dapat disimpulkan bahwa terdapat hubungan linier yang signifikan antara variabel prediktor dan variabel respons.
2.4.3 Uji Parsial
\(H_0:\) \(\beta_j=0\)
\(H_1:\) \(\beta_j\not=0\)
Uji parsial dalam regresi mengacu pada uji hipotesis terhadap satu koefisien regresi tertentu dalam model dengan mengabaikan pengaruh variabel prediktor lain. Hal ini digunakan untuk mengetahui hubungan signifikan variabel prediktor secara individual terhadap variabel respons. Untuk pengujian simultan dapat menggunakan rumus sebagai berikut.
\[ t\ =\ \frac{\hat\beta_j-\beta_{j0}}{s_d} \]
Apabila nilai t (p-value) uji lebih kecil dari tingkat signifikasi yang ditentukan, maka dapat disimpulkan bahwa terdapat hubungan linier yang signifikan antara variabel prediktor tersebut dan variabel respons.
3 DATA
Data yang digunakan merupakan data yang diarsip oleh UCI Machine Learning Repository dan tersedia di Kaggle. Data hubungan antara Number of Courses Opted dan Average Time Studied terhadap Marks Obtained.
| Number of Courses | Avg Time Study | Marks Obtained |
|---|---|---|
| 3 | 4.058 | 19.202 |
| 4 | 0.096 | 7.734 |
| 4 | 3.133 | 13.811 |
| 6 | 7.909 | 53.018 |
| 8 | 7.811 | 55.299 |
| 6 | 3.211 | 17.822 |
| 3 | 6.063 | 29.889 |
| 5 | 3.413 | 17.264 |
| 4 | 4.41 | 20.348 |
| 3 | 6.173 | 30.862 |
| 3 | 7.353 | 42.036 |
| 7 | 0.423 | 12.132 |
| 7 | 4.218 | 24.318 |
| 3 | 4.274 | 17.672 |
| 3 | 2.908 | 11.397 |
| 4 | 4.26 | 19.466 |
| 5 | 5.719 | 30.548 |
| 8 | 6.08 | 38.49 |
| 6 | 7.711 | 50.986 |
| 8 | 3.977 | 25.133 |
| 4 | 4.733 | 22.073 |
| 6 | 6.126 | 35.939 |
| 5 | 2.051 | 12.209 |
| 7 | 4.875 | 28.043 |
| 4 | 3.635 | 16.517 |
| 3 | 1.407 | 6.623 |
| 7 | 0.508 | 12.647 |
| 8 | 4.378 | 26.532 |
| 5 | 0.156 | 9.333 |
| 4 | 1.299 | 8.837 |
| 8 | 3.864 | 24.172 |
| 3 | 1.923 | 8.1 |
| 8 | 0.932 | 15.038 |
| 6 | 6.594 | 39.965 |
| 3 | 4.083 | 17.171 |
| 3 | 7.543 | 43.978 |
| 4 | 2.966 | 13.119 |
| 6 | 7.283 | 46.453 |
| 7 | 6.533 | 41.358 |
| 6 | 7.775 | 51.142 |
| 4 | 0.14 | 7.336 |
| 6 | 2.754 | 15.725 |
| 6 | 3.591 | 19.771 |
| 5 | 1.557 | 10.429 |
| 4 | 1.954 | 9.742 |
| 3 | 2.061 | 8.924 |
| 4 | 3.797 | 16.703 |
| 4 | 4.779 | 22.701 |
| 3 | 5.635 | 26.882 |
| 5 | 3.913 | 19.106 |
| 6 | 6.703 | 40.602 |
| 6 | 4.13 | 22.184 |
| 4 | 0.771 | 7.892 |
| 7 | 6.049 | 36.653 |
| 8 | 7.591 | 53.158 |
| 7 | 2.913 | 18.238 |
| 8 | 7.641 | 53.359 |
| 7 | 7.649 | 51.583 |
| 3 | 6.198 | 31.236 |
| 8 | 7.468 | 51.343 |
| 6 | 0.376 | 10.522 |
| 4 | 2.438 | 10.844 |
| 6 | 3.606 | 19.59 |
| 3 | 4.869 | 21.379 |
| 7 | 0.13 | 12.591 |
| 6 | 2.142 | 13.562 |
| 4 | 5.473 | 27.569 |
| 3 | 0.55 | 6.185 |
| 4 | 1.395 | 8.92 |
| 6 | 3.948 | 21.4 |
| 4 | 3.736 | 16.606 |
| 5 | 2.518 | 13.416 |
| 3 | 4.633 | 20.398 |
| 3 | 1.629 | 7.014 |
| 4 | 6.954 | 39.952 |
| 3 | 0.803 | 6.217 |
| 5 | 6.379 | 36.746 |
| 8 | 5.985 | 38.278 |
| 7 | 7.451 | 49.544 |
| 3 | 0.805 | 6.349 |
| 7 | 7.957 | 54.321 |
| 8 | 2.262 | 17.705 |
| 4 | 7.41 | 44.099 |
| 5 | 3.197 | 16.106 |
| 8 | 1.982 | 16.461 |
| 8 | 6.201 | 39.957 |
| 7 | 4.067 | 23.149 |
| 3 | 1.033 | 6.053 |
| 5 | 1.803 | 11.253 |
| 7 | 6.376 | 40.024 |
| 7 | 4.182 | 24.394 |
| 8 | 2.73 | 19.564 |
| 4 | 5.027 | 23.916 |
| 8 | 6.471 | 42.426 |
| 8 | 3.919 | 24.451 |
| 6 | 3.561 | 19.128 |
| 3 | 0.301 | 5.609 |
| 4 | 7.163 | 41.444 |
| 7 | 0.309 | 12.027 |
| 3 | 6.335 | 32.357 |
4 SOURCE CODE
4.1 Library yang Dibutuhkan
> library(rmarkdown)
> library(knitr)
> library(tinytex)
> library(prettydoc)
> library(readxl)
> library(lmtest)
> library(car)4.2 Memanggil Data dan Menampilkan Struktur Data
Pemanggilan data dapat memanfaatkan fungsi impor yang
tersedia di dalam RStudio. Salah satu caranya adalah memanfaatkan
file bertipe .xlsx.
> data = read_excel("C:/Users/FAISAL/Downloads/Statistika Semester 4/Komputasi Statistika/Marks.xlsx")
> str(data)
tibble [100 × 3] (S3: tbl_df/tbl/data.frame)
$ NumberofCourses: num [1:100] 3 4 4 6 8 6 3 5 4 3 ...
$ AvgTimeStudy : num [1:100] 4.508 0.096 3.133 7.909 7.811 ...
$ MarksObtained : num [1:100] 19.2 7.73 13.81 53.02 55.3 ...Struktur dari data dapat diidentifikasi berupa tibble dengan 100 observasi dan terdapat variabel. Variabel Number of Courses, Average Time Study, dan Marks Obtained merupakan variabel bertipe numerik.
Function read_excel() berfungsi agar R dapat
mengakses file bertipe .xlsx dengan
argument berupa file path dari data Microsoft Excel.
Function str() berfungsi untuk menampilkan
deskripsi singkat jenis data yang tersedia.
4.3 Scatterplot
> smoothScatter(x = data$NumberofCourses, y = data$MarksObtained, xlab = "Number of Courses", ylab = "Marks Obtained", main = "Gambar 1. Marks Obtained~Vertical Length")
> smoothScatter(x = data$AvgTimeStudy, y = data$MarksObtained, xlab = "Average Time Study", ylab = "Marks Obtained", main = "Gambar 2. Marks Obtained~Average Time Study")Function smoothScatter() berfungsi untuk
membentuk grafik sebar yang dimuluskan yang menunjukkan hubungan antara
dua variabel. Argument berupa variabel x, variabel y, label
untuk variabel x dan y, serta judul dari grafik yang dibentuk. Adanya
scatterplot ini berguna untuk mendeteksi pola hubungan yang
mungkin dari variabel prediktor dan variabel respons.
4.4 Analisis Model Regresi Linier Berganda
> regresi = lm(MarksObtained~NumberofCourses+AvgTimeStudy, data = data)
> regresi
Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy,
data = data)
Coefficients:
(Intercept) NumberofCourses AvgTimeStudy
-7.456 1.864 5.399 Function lm() berfungsi untuk membuat model
regresi yang sesuai. Argument berupa model atau formula yaitu
Respons~Prediktor dengan data = [namadata].
Pada analisis ini, variabel respons adalah Marks Obtained, sedangkan
variabel prediktor adalah Number of Courses dan Average Time Study.
4.5 Statistika Deskriptif
> summary(regresi)
Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy,
data = data)
Residuals:
Min 1Q Median 3Q Max
-4.5617 -3.1023 -0.8361 3.6051 7.2158
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -7.4563 1.1745 -6.349 6.98e-09 ***
NumberofCourses 1.8641 0.2017 9.243 5.78e-15 ***
AvgTimeStudy 5.3992 0.1529 35.303 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared: 0.9404, Adjusted R-squared: 0.9391
F-statistic: 764.8 on 2 and 97 DF, p-value: < 2.2e-16Function summary() berfungsi untuk menampilkan
penjelasan ringkas suatu model dengan argument berupa model
yang telah didefinisikan sebelumnya.
4.6 Asumsi Klasik
4.6.1 Asumsi Normalitas
> ks.test(regresi$residuals, "pnorm")
Asymptotic one-sample Kolmogorov-Smirnov test
data: regresi$residuals
D = 0.40505, p-value = 1.121e-14
alternative hypothesis: two-sidedFunction ks.test() berfungsi untuk melakukan
uji Kolmogorov-Smirnov sebagai pengujian asumsi normalitas model regresi
pada sampel besar (50-100 sampel). Argument berupa
residuals dari model yang telah didefinisikan sebelumnya
dengan pnorm sebagai pembanding distribusi data.
4.6.2 Asumsi Homoskedastisitas
> bptest(regresi)
studentized Breusch-Pagan test
data: regresi
BP = 2.9348, df = 2, p-value = 0.2305Function bptest() berfungsi untuk melakukan uji
Breusch-Pagan sebagai pengujian asumsi homoskedastisitas.
Argument berupa model yang telah didefinisikan sebelumnya.
4.6.3 Asumsi Non-Multikolinieritas
> vif(regresi)
NumberofCourses AvgTimeStudy
1.043799 1.043799 Function vif() berfungsi untuk melakukan
pengujian asumsi non-multikolinieritas. Argument berupa model
yang telah didefinisikan sebelumnya.
4.6.4 Asumsi Non-Autokorelasi
> dwtest(regresi)
Durbin-Watson test
data: regresi
DW = 1.9779, p-value = 0.4517
alternative hypothesis: true autocorrelation is greater than 0Function dwtest() berfungsi untuk melakukan uji
Durbin-Watson sebagai pengujian asumsi non-autokorelasi.
Argument berupa model yang telah didefinisikan sebelumnya.
5 HASIL DAN PEMBAHASAN
5.1 Scatterplot
Berikut scatterplot yang terbentuk berdasarkan output R, hanya pada Gambar 2 yang terindikasi adanya hubungan linier antara variabel prediktor Average Time Study \((X_2)\) dan variabel respons Marks \((Y)\)
5.2 Model Regresi Linier Berganda
Estimate Std. Error t value Pr(>|t|)
(Intercept) -7.456346 1.1744582 -6.348754 6.982054e-09
NumberofCourses 1.864051 0.2016715 9.243007 5.783861e-15
AvgTimeStudy 5.399179 0.1529395 35.302700 3.678846e-57
Model regresi linier berganda berdasarkan output R sebagai berikut:
\[ \bar{Y}\ =\ -7,456346 + 1,864051X_1 + 5,399179X_2 \]
Interpretasi:
- \(\beta_0\ =\ -7,456346\)
Jika variabel \(X_1\) (Number of Courses) dan \(X_2\) (Average Time Study) bernilai nol, maka variabel \(\bar{Y}\) (Marks Obtained) bernilai sebesar \(-7,456346\).
- \(\beta_1\ =\ 1,864051\)
Jika variabel \(X_1\) (Number of Courses) naik satu satuan dengan asumsi variabel \(X_2\) (Average Time Study) bernilai konstan, maka variabel \(\bar{Y}\) (Marks Obtained) akan mengalami kenaikan sebesar \(1,864051\).
- \(\beta_2\ =\ 5,399179\)
Jika variabel \(X_2\) (Average Time Study) naik satu satuan dengan asumsi variabel \(X_1\) (Number of Courses) bernilai konstan, maka variabel \(\bar{Y}\) (Marks Obtained) akan mengalami kenaikan sebesar \(5,399179\).
5.3 Statistika Deskriptif
Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy,
data = data)
Residuals:
Min 1Q Median 3Q Max
-4.5617 -3.1023 -0.8361 3.6051 7.2158
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -7.4563 1.1745 -6.349 6.98e-09 ***
NumberofCourses 1.8641 0.2017 9.243 5.78e-15 ***
AvgTimeStudy 5.3992 0.1529 35.303 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared: 0.9404, Adjusted R-squared: 0.9391
F-statistic: 764.8 on 2 and 97 DF, p-value: < 2.2e-16
Ringkasan lima angka residual berdasarkan output R sebagai berikut:
- \(Min\ =\ -4,5617\)
Interpretasi: Data penelitian memiliki residual terkecil sebesar \(-4,5617\).
- \(Q_1\ =\ -3,1023\)
Interpretasi: Data penelitian memiliki residual kuartil pertama sebesar \(-3,1023\).
- \(Median\ =\ -0,8361\)
Interpretasi: Data penelitian memiliki residual median sebesar \(-0,8361\).
- \(Q_3\ =\ 3,6051\)
Interpretasi: Data penelitian memiliki residual kuartil ketiga sebesar \(3,6051\).
- \(Max\ =\ 7,2158\)
Interpretasi: Data penelitian memiliki residual terbesar sebesar \(7,2158\).
5.4 Asumsi Klasik
5.4.1 Asumsi Normalitas
Hipotesis:
\(H_0:\) Galat berdistribusi normal (Asumsi normalitas terpenuhi).
\(H_1:\) Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi).
Asymptotic one-sample Kolmogorov-Smirnov test
data: regresi$residuals
D = 0.40505, p-value = 1.121e-14
alternative hypothesis: two-sided
Uji Kolmogorov-Smirnov berdasarkan output R diperoleh \(p-value\ =\ 1,121 \cdot 10^{-14}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (1,121 \cdot 10^{-14})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data belum cukup bukti untuk memenuhi asumsi normalitas. Pada data ini, galat tidak berdistribusi normal.
5.4.2 Asumsi Homoskedastisitas
\(H_0:\sigma_i^2=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas terpenuhi).
\(H_1:\sigma_i^2\not=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas tidak terpenuhi).
studentized Breusch-Pagan test
data: regresi
BP = 2.9348, df = 2, p-value = 0.2305
Uji Breusch-Pagan berdasarkan output R diperoleh \(p-value\ =\ 0,2305\). Hal tersebut menghasilkan keputusan gagal tolak \(H_0\), karena \(p-value\ (0,2305)\ >\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data sudah cukup bukti untuk memenuhi asumsi homoskedastisitas. Pada penelitian ini, ragam memiliki nilai yang sama untuk setiap amatan pada nilai \(X_i\) yang sama.
5.4.3 Asumsi Non-Multikolinieritas
NumberofCourses AvgTimeStudy
1.043799 1.043799
Nilai VIF masing-masing variabel berdasarkan output R secara independen antara lain, Number of Courses \(=\ 1,043799\) dan Average Time Study \(=\ 1,043799\). Nilai VIF memberikan informasi adanya peubah yang menyebabkan ragam galat menjadi besar. Pada output R setiap variabel memiliki nilai \(VIF < 10\). Dengan demikian, data sudah cukup bukti untuk memenuhi asumsi non-multikolinieritas. Pada data ini, tidak terjadi multikolinieritas.
5.4.4 Asumsi Non-Autokorelasi
\(H_0:\) Tidak terjadi autokorelasi.
\(H_1:\) Terjadi autokorelasi.
Durbin-Watson test
data: regresi
DW = 1.9779, p-value = 0.4517
alternative hypothesis: true autocorrelation is greater than 0
Uji Durbin-Watson berdasarkan output R diperoleh \(p-value\ =\ 0,4517\). Hal tersebut menghasilkan keputusan gagal tolak \(H_0\), karena \(p-value\ (0,01522)\ >\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data sudah cukup bukti untuk memenuhi asumsi non-autokorelasi. Pada data ini, antar residual tidak terindikasi terjadi korelasi.
5.5 Pengujian Hipotesis
Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy,
data = data)
Residuals:
Min 1Q Median 3Q Max
-4.5617 -3.1023 -0.8361 3.6051 7.2158
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -7.4563 1.1745 -6.349 6.98e-09 ***
NumberofCourses 1.8641 0.2017 9.243 5.78e-15 ***
AvgTimeStudy 5.3992 0.1529 35.303 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared: 0.9404, Adjusted R-squared: 0.9391
F-statistic: 764.8 on 2 and 97 DF, p-value: < 2.2e-16
5.5.1 Uji Simultan
\(H_0:\beta_1=\beta_2=...=\beta_k=0\)
\(H_1:\) Terdapat minimal satu \(\beta_i\not=0\) dimana \(i=1,2,...,k\)
Uji simultan berdasarkan output R diperoleh \(p-value\ <\ 2,2 \cdot 10^{-16}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (2,2 \cdot 10^{-16})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa seluruh variabel prediktor secara simultan berpengaruh terhadap variabel respons.
5.5.2 Uji Parsial
\(H_0:\beta_j=0\)
\(H_1:\beta_j\not=0\)
Uji parsial berdasarkan output R diperoleh sebagai berikut:
- Variabel Number of Courses \((X_1)\)
Berdasarkan output R diperoleh \(p-value\ =\ 5,78 \cdot 10^{-15}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (5,78 \cdot 10^{-15})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa variabel prediktor Number of Courses \((X_1)\) secara parsial berpengaruh terhadap variabel respons Marks Obtained \((Y)\).
- Variabel Average Time Study \((X_2)\)
Berdasarkan output R diperoleh \(p-value\ <\ 2 \cdot 10^{-16}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (2 \cdot 10^{-16})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa variabel prediktor Average Time Study \((X_2)\) secara parsial berpengaruh terhadap variabel respons Marks Obtained \((Y)\).
5.6 Koefisien Determinasi
Koefisien determinasi \((R^{2})\) berdasarkan output R diperoleh \(Adjusted\ R-squared\ =\ 0,9391\). Hal tersebut memiliki arti bahwa variabilitas dalam variabel respons dapat dijelaskan oleh variabel-variabel prediktor sebesar \(93,91\%\). Sementara \(6,09\%\) sisanya dijelaskan oleh variabel lain yang tidak dibahas pada penelitian.
6 KESIMPULAN DAN SARAN
6.1 Kesimpulan
Berdasarkan hasil dan pembahasan, dapat ditarik kesimpulan bahwa model regresi yang terbentuk sebagai berikut:
\[ \bar{Y}\ =\ -7,456346 + 1,864051X_1 + 5,399179X_2 \]
Dimana pada uji simultan dan uji parsial, variabel-variabel prediktor baik secara simultan maupun parsial berpengaruh siginifikan terhadap variabel respons. Selain itu pada koefisien determinasi \((R^{2})\), tingkat variabilitas dalam variabel respons dapat dijelaskan oleh variabel-variabel prediktor sebesar \(93,91\%\). Namun, terdapat asumsi yang tidak terpenuhi yakni asumsi normalitas.
6.2 Saran
Data penelitian yang telah dilakukan belum sepenuhnya sempurna. Hal ini dikarenakan, saat pengujian asumsi klasik masih terdapat asumsi yang belum terpenuhi yakni asumsi normalitas. Hal ini dapat menjadikan kesimpulan tidak valid atau komprehensif terhadap model regresi yang ada. Oleh karena itu, saran untuk penelitian selanjutnya dapat melakukan pengambilan data ulang dan memberikan informasi mengenai dasa tersebut secara lengkap.
7 DAFTAR PUSTAKA
Ghozali, Imam. (2018). Aplikasi Analisis Multivariate dengan Program IBM SPSS 25. Edisi 9. Semarang: Universitas Diponegoro.
Nofianti, A. I. (2019). Pengaruh Kegiatan Ekstrakurikuler dan Motivasi Belajar Terhadap Prestasi Belajar Siswa. JDMP (Jurnal Dinamika Manajemen Pendidikan). https://doi.org/10.26740/jdmp.v2n2.p120-129
Situmorang, Z. R. D., & Latifah, M. (2014). Pengaruh Dukungan Sosial, Konsep Diri, dan Strategi Pengaturan Diri dalam Belajar terhadap Prestasi Akademik. Jurnal Ilmu Keluarga Dan Konsumen. https://doi.org/10.24156/jikk.2014.7.3.154
Student Marks Dataset. (2022, January 4). Kaggle. https://www.kaggle.com/datasets/yasserh/student-marks-dataset
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. E. (2010). Probability and statistics for engineers and scientists (9th ed.). Pearson.