1 PENDAHULUAN
2 TINJAUAN PUSTAKA
3 DATA
4 SOURCE CODE
5 HASIL DAN PEMBAHASAN
6 KESIMPULAN DAN SARAN
- 6.1 Kesimpulan
- 6.2 Saran
7 DAFTAR PUSTAKA

library(knitr)
opts_chunk$set(echo = TRUE)
opts_chunk$set(message = FALSE)
opts_chunk$set(warning = FALSE)
opts_chunk$set(comment = "")
opts_chunk$set(collapse = TRUE)
opts_chunk$set(error = TRUE)
opts_chunk$set(prompt = TRUE)
opts_chunk$set(fig.align = "center")

1 PENDAHULUAN

1.1 Latar Belakang

Pada bidang disiplin pendidikan formal, prestasi akan nilai akhir menjadi salah satu poin penting dalam subcapaian pembelajaran. Prestasi siswa menjadi pilar utama dalam evaluasi keberhasilan suatu instansi pendidikan maupun siswa itu sendiri. Siswa mempunyai andil besar dalam penentuan prestasinya. Siswa memiliki tanggung jawab penuh akan tugasnya menjadi seorang pelajar, yakni bertanggung jawab untuk menuntut ilmu sebaik mungkin. Namun, adakalanya siswa juga ikut berpartisipasi secara aktif dalam kegiatan-kegiatan lain di luar kewajibannya tersebut, seperti mengikuti kursus.

Penggunaan sumber daya dan waktu yang efektif tentu menjadi tantangan terbesar seorang siswa. Apapun yang terjadi siswa dituntut untuk dapat membagi waktu dengan bijak antara kursus yang diikuti dan waktu belajar. Hal ini dilakukan agar subcapaian pembelajaran dapat tercapai secara maksimal. Berdasarkan permasalahan ini maka dilakukanlah analisis untuk mengidentifikasi hubungan antara jumlah kursus yang diikuti dan waktu belajar terhadap prestasi siswa.

1.2 Rumusan Masalah

Apakah terdapat hubungan antara jumlah kursus yang diikuti (Number of Courses) dan lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained)?
Apakah terdapat hubungan antara jumlah kursus yang diikuti (Number of Courses) terhadap nilai akhir siswa (Marks Obtained)?
Apakah terdapat hubungan antara lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained)?

1.3 Tujuan

Untuk mengetahui hubungan antara jumlah kursus yang diikuti (Number of Courses) dan lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained).
Untuk mengetahui hubungan antara jumlah kursus yang diikuti (Number of Courses) terhadap nilai akhir siswa (Marks Obtained).
Untuk mengetahui hubungan antara lama waktu belajar (Average Time Study) terhadap nilai akhir siswa (Marks Obtained).

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan atau penyajian data hingga memberi informasi yang berguna. Data yang dilihat adalah jumlah data, nilai minimum, nilai maksimum, nilai rata-rata (mean), dan standar deviasi. (Ghozali, 2018:19)

2.2 Analisis Regresi

Konsep analisis regresi adalah menemukan hubungan terbaik antara variabel prediktor dan variabel respons, mengukur kekuatan hubungan, dan menggunakan metode yang memungkinkan prediksi nilai variabel respons yang diberikan oleh nilai variabel prediktor. Namun, dalam sebagian besar penelitian yang menerapkan analisis regresi terdapat lebih dari satu variabel prediktor dalam pemodelan regresi. Oleh karena itu, model analisis regresi berganda diperlukan untuk dapat memprediksi nilai variabel respons. Secara umum, model regresi linier berganda sebagai berikut.

\[ \bar{Y}\ =\ \beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_kX_k + \varepsilon \]

Di mana:

\(\bar{Y}:\) variabel respons duga.

\(\beta_0:\) intercept.

\(X_1,X_2,…,X_k:\) variabel-variabel prediktor.

\(\beta_1,\beta_2,...,\beta_k:\) koefisien-koefisien regresi yang menunjukkan hubungan antara variabel prediktor dengan variabel respons.

\(\varepsilon:\) galat.

2.3 Asumsi Klasik

2.3.1 Asumsi Normalitas

\(H_0:\) Galat berdistribusi normal (Asumsi normalitas terpenuhi).

\(H_1:\) Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi).

Asumsi normalitas adalah analisis regresi yang mengacu pada asumsi bahwa galat (error) model regresi harus berdistribusi normal. Asumsi ini harus terpenuhi agar hasil estimasi model menjadi valid. Uji statistik dapat menggunakan uji Jarque-Berra atau uji Shapiro-Wilk bagi sampel kecil dan uji Kolmogorov-Smirnov bagi sampel besar. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi normalitas terpenuhi.

2.3.2 Asumsi Homoskedastisitas

\(H_0:\sigma_i^2=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas terpenuhi).

\(H_1:\sigma_i^2\not=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas tidak terpenuhi).

Asumsi homoskedastisitas adalah asumsi bahwa varians dari galat (error) model regresi sama atau konstan di semua tingkat nilai variabel prediktor. Asumsi ini menyatakan bahwa sebaran galat model regresi tidak berubah secara sistematis seiring perubahan nilai variabel prediktor. Uji statistik dapat menggunakan uji White atau uji Breuch-Pagan. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi homoskedastisitas terpenuhi.

2.3.3 Asumsi Non-Multikolinieritas

Asumsi non-multikolinieritas mangacu pada ada atau tidaknya korelasi yang tinggi antara dua atau lebih variabel prediktor dalam model regresi. Asumsi ini harus terpenuhi agar hasil estimasi model menjadi valid. Untuk menguji asumsi ini, dapat menggunakan Variance Inflation Factor (VIF) dengan rumus sebagai berikut.

\[ VIF(\hat\beta_j) =\ \frac{1}{1-R_j^2}\ ,\ j\ =\ 1,2,...,k \]

Perhitungan VIF dilakukan untuk setiap variabel prediktor dalam model regresi. Apabila nilai VIF lebih besar dari 10 dapat menunjukkan adanya multikolinieritas.

2.3.4 Asumsi Non-Autokorelasi

\(H_0:\) Tidak terjadi autokorelasi.

\(H_1:\) Terjadi autokorelasi.

Asumsi non-autokorelasi mengacu pada ada atau tidaknya korelasi antara galat (error) model regresi pada waktu yang berbeda. Uji statistik dapat menggunakan uji Durbin-Watson. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi non-autokorelasi terpenuhi.

2.4 Pengujian Hipotesis

2.4.1 Tabel ANOVA pada Regresi

Sumber	Jumlah Kuadrat	db	Kuadrat Tengah	\(F_{hitung}\)
Regresi	JKR	\(db_R\)	KTR	\(F_{db_R,db_G;\alpha}\)
Galat	JKG	\(db_G\)	KTG
Total	JKT	\(db_T\)

Di mana:

\(db_T\ =\ n\ -\ 1\\db_R\ =\ k\ -\ 1\\db_G\ =\ db_T\ -\ db_R\\JKT\ =\ n\Sigma_{i=1}^n(y_i-\bar{y})^2\\JKR\ =\ \Sigma_{i=1}^n(\hat{y_i}-\bar{y})^2\\JKG\ =\ JKT\ -\ JKR\\KTR\ =\ \frac{JKR}{db_R}\\KTG\ =\ \frac{JKG}{db_G}\\F_{db_R,db_G;\alpha}\ =\ \frac{KTR}{KTG}\)

2.4.2 Uji Simultan

\(H_0:\beta_1=\beta_2=...=\beta_k=0\)

\(H_1:\) Terdapat minimal satu \(\beta_i\not=0\) dimana \(i=1,2,...,k\)

Uji simultan dalam regresi mengacu pada uji hipotesis secara serentak terhadap satu atau lebih koefisien regresi dalam model. Hal ini digunakan untuk mengetahui hubungan signifikan keseluruhan variabel prediktor terhadap variabel respons. Untuk pengujian simultan dapat menggunakan rumus sebagai berikut.

\[ F\ =\ \frac{KTR}{KTG} \]

Apabila nilai F (p-value) uji lebih kecil dari tingkat signifikasi yang ditentukan, maka dapat disimpulkan bahwa terdapat hubungan linier yang signifikan antara variabel prediktor dan variabel respons.

2.4.3 Uji Parsial

\(H_0:\) \(\beta_j=0\)

\(H_1:\) \(\beta_j\not=0\)

Uji parsial dalam regresi mengacu pada uji hipotesis terhadap satu koefisien regresi tertentu dalam model dengan mengabaikan pengaruh variabel prediktor lain. Hal ini digunakan untuk mengetahui hubungan signifikan variabel prediktor secara individual terhadap variabel respons. Untuk pengujian simultan dapat menggunakan rumus sebagai berikut.

\[ t\ =\ \frac{\hat\beta_j-\beta_{j0}}{s_d} \]

Apabila nilai t (p-value) uji lebih kecil dari tingkat signifikasi yang ditentukan, maka dapat disimpulkan bahwa terdapat hubungan linier yang signifikan antara variabel prediktor tersebut dan variabel respons.

3 DATA

Data yang digunakan merupakan data yang diarsip oleh UCI Machine Learning Repository dan tersedia di Kaggle. Data hubungan antara Number of Courses Opted dan Average Time Studied terhadap Marks Obtained.

Number of Courses	Avg Time Study	Marks Obtained
3	4.058	19.202
4	0.096	7.734
4	3.133	13.811
6	7.909	53.018
8	7.811	55.299
6	3.211	17.822
3	6.063	29.889
5	3.413	17.264
4	4.41	20.348
3	6.173	30.862
3	7.353	42.036
7	0.423	12.132
7	4.218	24.318
3	4.274	17.672
3	2.908	11.397
4	4.26	19.466
5	5.719	30.548
8	6.08	38.49
6	7.711	50.986
8	3.977	25.133
4	4.733	22.073
6	6.126	35.939
5	2.051	12.209
7	4.875	28.043
4	3.635	16.517
3	1.407	6.623
7	0.508	12.647
8	4.378	26.532
5	0.156	9.333
4	1.299	8.837
8	3.864	24.172
3	1.923	8.1
8	0.932	15.038
6	6.594	39.965
3	4.083	17.171
3	7.543	43.978
4	2.966	13.119
6	7.283	46.453
7	6.533	41.358
6	7.775	51.142
4	0.14	7.336
6	2.754	15.725
6	3.591	19.771
5	1.557	10.429
4	1.954	9.742
3	2.061	8.924
4	3.797	16.703
4	4.779	22.701
3	5.635	26.882
5	3.913	19.106
6	6.703	40.602
6	4.13	22.184
4	0.771	7.892
7	6.049	36.653
8	7.591	53.158
7	2.913	18.238
8	7.641	53.359
7	7.649	51.583
3	6.198	31.236
8	7.468	51.343
6	0.376	10.522
4	2.438	10.844
6	3.606	19.59
3	4.869	21.379
7	0.13	12.591
6	2.142	13.562
4	5.473	27.569
3	0.55	6.185
4	1.395	8.92
6	3.948	21.4
4	3.736	16.606
5	2.518	13.416
3	4.633	20.398
3	1.629	7.014
4	6.954	39.952
3	0.803	6.217
5	6.379	36.746
8	5.985	38.278
7	7.451	49.544
3	0.805	6.349
7	7.957	54.321
8	2.262	17.705
4	7.41	44.099
5	3.197	16.106
8	1.982	16.461
8	6.201	39.957
7	4.067	23.149
3	1.033	6.053
5	1.803	11.253
7	6.376	40.024
7	4.182	24.394
8	2.73	19.564
4	5.027	23.916
8	6.471	42.426
8	3.919	24.451
6	3.561	19.128
3	0.301	5.609
4	7.163	41.444
7	0.309	12.027
3	6.335	32.357

4 SOURCE CODE

4.1 Library yang Dibutuhkan

> library(rmarkdown)
> library(knitr)
> library(tinytex)
> library(prettydoc)
> library(readxl)
> library(lmtest)
> library(car)

4.2 Memanggil Data dan Menampilkan Struktur Data

Pemanggilan data dapat memanfaatkan fungsi impor yang tersedia di dalam RStudio. Salah satu caranya adalah memanfaatkan file bertipe .xlsx.

> data = read_excel("C:/Users/FAISAL/Downloads/Statistika Semester 4/Komputasi Statistika/Marks.xlsx")
> str(data)
tibble [100 × 3] (S3: tbl_df/tbl/data.frame)
 $ NumberofCourses: num [1:100] 3 4 4 6 8 6 3 5 4 3 ...
 $ AvgTimeStudy   : num [1:100] 4.508 0.096 3.133 7.909 7.811 ...
 $ MarksObtained  : num [1:100] 19.2 7.73 13.81 53.02 55.3 ...

Struktur dari data dapat diidentifikasi berupa tibble dengan 100 observasi dan terdapat variabel. Variabel Number of Courses, Average Time Study, dan Marks Obtained merupakan variabel bertipe numerik.

Function read_excel() berfungsi agar R dapat mengakses file bertipe .xlsx dengan argument berupa file path dari data Microsoft Excel. Function str() berfungsi untuk menampilkan deskripsi singkat jenis data yang tersedia.

4.3 Scatterplot

> smoothScatter(x = data$NumberofCourses, y = data$MarksObtained, xlab = "Number of Courses", ylab = "Marks Obtained", main = "Gambar 1. Marks Obtained~Vertical Length")
> smoothScatter(x = data$AvgTimeStudy, y = data$MarksObtained, xlab = "Average Time Study", ylab = "Marks Obtained", main = "Gambar 2. Marks Obtained~Average Time Study")

Function smoothScatter() berfungsi untuk membentuk grafik sebar yang dimuluskan yang menunjukkan hubungan antara dua variabel. Argument berupa variabel x, variabel y, label untuk variabel x dan y, serta judul dari grafik yang dibentuk. Adanya scatterplot ini berguna untuk mendeteksi pola hubungan yang mungkin dari variabel prediktor dan variabel respons.

4.4 Analisis Model Regresi Linier Berganda

> regresi = lm(MarksObtained~NumberofCourses+AvgTimeStudy, data = data)
> regresi

Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy, 
    data = data)

Coefficients:
    (Intercept)  NumberofCourses     AvgTimeStudy  
         -7.456            1.864            5.399

Function lm() berfungsi untuk membuat model regresi yang sesuai. Argument berupa model atau formula yaitu Respons~Prediktor dengan data = [namadata]. Pada analisis ini, variabel respons adalah Marks Obtained, sedangkan variabel prediktor adalah Number of Courses dan Average Time Study.

4.5 Statistika Deskriptif

> summary(regresi)

Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy, 
    data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5617 -3.1023 -0.8361  3.6051  7.2158 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)      -7.4563     1.1745  -6.349 6.98e-09 ***
NumberofCourses   1.8641     0.2017   9.243 5.78e-15 ***
AvgTimeStudy      5.3992     0.1529  35.303  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared:  0.9404,    Adjusted R-squared:  0.9391 
F-statistic: 764.8 on 2 and 97 DF,  p-value: < 2.2e-16

Function summary() berfungsi untuk menampilkan penjelasan ringkas suatu model dengan argument berupa model yang telah didefinisikan sebelumnya.

4.6 Asumsi Klasik

4.6.1 Asumsi Normalitas

> ks.test(regresi$residuals, "pnorm")

    Asymptotic one-sample Kolmogorov-Smirnov test

data:  regresi$residuals
D = 0.40505, p-value = 1.121e-14
alternative hypothesis: two-sided

Function ks.test() berfungsi untuk melakukan uji Kolmogorov-Smirnov sebagai pengujian asumsi normalitas model regresi pada sampel besar (50-100 sampel). Argument berupa residuals dari model yang telah didefinisikan sebelumnya dengan pnorm sebagai pembanding distribusi data.

4.6.2 Asumsi Homoskedastisitas

> bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 2.9348, df = 2, p-value = 0.2305

Function bptest() berfungsi untuk melakukan uji Breusch-Pagan sebagai pengujian asumsi homoskedastisitas. Argument berupa model yang telah didefinisikan sebelumnya.

4.6.3 Asumsi Non-Multikolinieritas

> vif(regresi)
NumberofCourses    AvgTimeStudy 
       1.043799        1.043799

Function vif() berfungsi untuk melakukan pengujian asumsi non-multikolinieritas. Argument berupa model yang telah didefinisikan sebelumnya.

4.6.4 Asumsi Non-Autokorelasi

> dwtest(regresi)

    Durbin-Watson test

data:  regresi
DW = 1.9779, p-value = 0.4517
alternative hypothesis: true autocorrelation is greater than 0

Function dwtest() berfungsi untuk melakukan uji Durbin-Watson sebagai pengujian asumsi non-autokorelasi. Argument berupa model yang telah didefinisikan sebelumnya.

5 HASIL DAN PEMBAHASAN

5.1 Scatterplot

Berikut scatterplot yang terbentuk berdasarkan output R, hanya pada Gambar 2 yang terindikasi adanya hubungan linier antara variabel prediktor Average Time Study \((X_2)\) dan variabel respons Marks \((Y)\)

5.2 Model Regresi Linier Berganda

                 Estimate Std. Error   t value     Pr(>|t|)
(Intercept)     -7.456346  1.1744582 -6.348754 6.982054e-09
NumberofCourses  1.864051  0.2016715  9.243007 5.783861e-15
AvgTimeStudy     5.399179  0.1529395 35.302700 3.678846e-57

Model regresi linier berganda berdasarkan output R sebagai berikut:

\[ \bar{Y}\ =\ -7,456346 + 1,864051X_1 + 5,399179X_2 \]

Interpretasi:

\(\beta_0\ =\ -7,456346\)

Jika variabel \(X_1\) (Number of Courses) dan \(X_2\) (Average Time Study) bernilai nol, maka variabel \(\bar{Y}\) (Marks Obtained) bernilai sebesar \(-7,456346\).

\(\beta_1\ =\ 1,864051\)

Jika variabel \(X_1\) (Number of Courses) naik satu satuan dengan asumsi variabel \(X_2\) (Average Time Study) bernilai konstan, maka variabel \(\bar{Y}\) (Marks Obtained) akan mengalami kenaikan sebesar \(1,864051\).

\(\beta_2\ =\ 5,399179\)

Jika variabel \(X_2\) (Average Time Study) naik satu satuan dengan asumsi variabel \(X_1\) (Number of Courses) bernilai konstan, maka variabel \(\bar{Y}\) (Marks Obtained) akan mengalami kenaikan sebesar \(5,399179\).

5.3 Statistika Deskriptif


Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy, 
    data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5617 -3.1023 -0.8361  3.6051  7.2158 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)      -7.4563     1.1745  -6.349 6.98e-09 ***
NumberofCourses   1.8641     0.2017   9.243 5.78e-15 ***
AvgTimeStudy      5.3992     0.1529  35.303  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared:  0.9404,    Adjusted R-squared:  0.9391 
F-statistic: 764.8 on 2 and 97 DF,  p-value: < 2.2e-16

Ringkasan lima angka residual berdasarkan output R sebagai berikut:

\(Min\ =\ -4,5617\)

Interpretasi: Data penelitian memiliki residual terkecil sebesar \(-4,5617\).

\(Q_1\ =\ -3,1023\)

Interpretasi: Data penelitian memiliki residual kuartil pertama sebesar \(-3,1023\).

\(Median\ =\ -0,8361\)

Interpretasi: Data penelitian memiliki residual median sebesar \(-0,8361\).

\(Q_3\ =\ 3,6051\)

Interpretasi: Data penelitian memiliki residual kuartil ketiga sebesar \(3,6051\).

\(Max\ =\ 7,2158\)

Interpretasi: Data penelitian memiliki residual terbesar sebesar \(7,2158\).

5.4 Asumsi Klasik

5.4.1 Asumsi Normalitas

Hipotesis:

\(H_0:\) Galat berdistribusi normal (Asumsi normalitas terpenuhi).

\(H_1:\) Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi).


    Asymptotic one-sample Kolmogorov-Smirnov test

data:  regresi$residuals
D = 0.40505, p-value = 1.121e-14
alternative hypothesis: two-sided

Uji Kolmogorov-Smirnov berdasarkan output R diperoleh \(p-value\ =\ 1,121 \cdot 10^{-14}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (1,121 \cdot 10^{-14})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data belum cukup bukti untuk memenuhi asumsi normalitas. Pada data ini, galat tidak berdistribusi normal.

5.4.2 Asumsi Homoskedastisitas

\(H_0:\sigma_i^2=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas terpenuhi).

\(H_1:\sigma_i^2\not=\sigma_j^2,\ i\not=j\) (Asumsi homoskedastisitas tidak terpenuhi).


    studentized Breusch-Pagan test

data:  regresi
BP = 2.9348, df = 2, p-value = 0.2305

Uji Breusch-Pagan berdasarkan output R diperoleh \(p-value\ =\ 0,2305\). Hal tersebut menghasilkan keputusan gagal tolak \(H_0\), karena \(p-value\ (0,2305)\ >\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data sudah cukup bukti untuk memenuhi asumsi homoskedastisitas. Pada penelitian ini, ragam memiliki nilai yang sama untuk setiap amatan pada nilai \(X_i\) yang sama.

5.4.3 Asumsi Non-Multikolinieritas

NumberofCourses    AvgTimeStudy 
       1.043799        1.043799

Nilai VIF masing-masing variabel berdasarkan output R secara independen antara lain, Number of Courses \(=\ 1,043799\) dan Average Time Study \(=\ 1,043799\). Nilai VIF memberikan informasi adanya peubah yang menyebabkan ragam galat menjadi besar. Pada output R setiap variabel memiliki nilai \(VIF < 10\). Dengan demikian, data sudah cukup bukti untuk memenuhi asumsi non-multikolinieritas. Pada data ini, tidak terjadi multikolinieritas.

5.4.4 Asumsi Non-Autokorelasi

\(H_0:\) Tidak terjadi autokorelasi.

\(H_1:\) Terjadi autokorelasi.


    Durbin-Watson test

data:  regresi
DW = 1.9779, p-value = 0.4517
alternative hypothesis: true autocorrelation is greater than 0

Uji Durbin-Watson berdasarkan output R diperoleh \(p-value\ =\ 0,4517\). Hal tersebut menghasilkan keputusan gagal tolak \(H_0\), karena \(p-value\ (0,01522)\ >\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), data sudah cukup bukti untuk memenuhi asumsi non-autokorelasi. Pada data ini, antar residual tidak terindikasi terjadi korelasi.

5.5 Pengujian Hipotesis


Call:
lm(formula = MarksObtained ~ NumberofCourses + AvgTimeStudy, 
    data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5617 -3.1023 -0.8361  3.6051  7.2158 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)      -7.4563     1.1745  -6.349 6.98e-09 ***
NumberofCourses   1.8641     0.2017   9.243 5.78e-15 ***
AvgTimeStudy      5.3992     0.1529  35.303  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.534 on 97 degrees of freedom
Multiple R-squared:  0.9404,    Adjusted R-squared:  0.9391 
F-statistic: 764.8 on 2 and 97 DF,  p-value: < 2.2e-16

5.5.1 Uji Simultan

\(H_0:\beta_1=\beta_2=...=\beta_k=0\)

\(H_1:\) Terdapat minimal satu \(\beta_i\not=0\) dimana \(i=1,2,...,k\)

Uji simultan berdasarkan output R diperoleh \(p-value\ <\ 2,2 \cdot 10^{-16}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (2,2 \cdot 10^{-16})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa seluruh variabel prediktor secara simultan berpengaruh terhadap variabel respons.

5.5.2 Uji Parsial

\(H_0:\beta_j=0\)

\(H_1:\beta_j\not=0\)

Uji parsial berdasarkan output R diperoleh sebagai berikut:

Variabel Number of Courses \((X_1)\)

Berdasarkan output R diperoleh \(p-value\ =\ 5,78 \cdot 10^{-15}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (5,78 \cdot 10^{-15})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa variabel prediktor Number of Courses \((X_1)\) secara parsial berpengaruh terhadap variabel respons Marks Obtained \((Y)\).

Variabel Average Time Study \((X_2)\)

Berdasarkan output R diperoleh \(p-value\ <\ 2 \cdot 10^{-16}\). Hal tersebut menghasilkan keputusan tolak \(H_0\), karena \(p-value\ (2 \cdot 10^{-16})\ <\ \alpha\ (0,05)\). Dengan tingkat signifikasi \(5\%\), dapat disimpulkan bahwa variabel prediktor Average Time Study \((X_2)\) secara parsial berpengaruh terhadap variabel respons Marks Obtained \((Y)\).

5.6 Koefisien Determinasi

Koefisien determinasi \((R^{2})\) berdasarkan output R diperoleh \(Adjusted\ R-squared\ =\ 0,9391\). Hal tersebut memiliki arti bahwa variabilitas dalam variabel respons dapat dijelaskan oleh variabel-variabel prediktor sebesar \(93,91\%\). Sementara \(6,09\%\) sisanya dijelaskan oleh variabel lain yang tidak dibahas pada penelitian.

6 KESIMPULAN DAN SARAN

6.1 Kesimpulan

Berdasarkan hasil dan pembahasan, dapat ditarik kesimpulan bahwa model regresi yang terbentuk sebagai berikut:

\[ \bar{Y}\ =\ -7,456346 + 1,864051X_1 + 5,399179X_2 \]

Dimana pada uji simultan dan uji parsial, variabel-variabel prediktor baik secara simultan maupun parsial berpengaruh siginifikan terhadap variabel respons. Selain itu pada koefisien determinasi \((R^{2})\), tingkat variabilitas dalam variabel respons dapat dijelaskan oleh variabel-variabel prediktor sebesar \(93,91\%\). Namun, terdapat asumsi yang tidak terpenuhi yakni asumsi normalitas.

6.2 Saran

Data penelitian yang telah dilakukan belum sepenuhnya sempurna. Hal ini dikarenakan, saat pengujian asumsi klasik masih terdapat asumsi yang belum terpenuhi yakni asumsi normalitas. Hal ini dapat menjadikan kesimpulan tidak valid atau komprehensif terhadap model regresi yang ada. Oleh karena itu, saran untuk penelitian selanjutnya dapat melakukan pengambilan data ulang dan memberikan informasi mengenai dasa tersebut secara lengkap.

7 DAFTAR PUSTAKA

Ghozali, Imam. (2018). Aplikasi Analisis Multivariate dengan Program IBM SPSS 25. Edisi 9. Semarang: Universitas Diponegoro.

Nofianti, A. I. (2019). Pengaruh Kegiatan Ekstrakurikuler dan Motivasi Belajar Terhadap Prestasi Belajar Siswa. JDMP (Jurnal Dinamika Manajemen Pendidikan). https://doi.org/10.26740/jdmp.v2n2.p120-129

Situmorang, Z. R. D., & Latifah, M. (2014). Pengaruh Dukungan Sosial, Konsep Diri, dan Strategi Pengaturan Diri dalam Belajar terhadap Prestasi Akademik. Jurnal Ilmu Keluarga Dan Konsumen. https://doi.org/10.24156/jikk.2014.7.3.154

Student Marks Dataset. (2022, January 4). Kaggle. https://www.kaggle.com/datasets/yasserh/student-marks-dataset

Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. E. (2010). Probability and statistics for engineers and scientists (9th ed.). Pearson.