REGRESI LINEAR SEDERHANA
PENDAHULUAN
Analisis ini dilakukan untuk mengkaji hubungan antara tingkat kehadiran dan kecerdasan intelektual (IQ) terhadap hasil belajar siswa yang diukur melalui nilai Ujian Akhir Semester (UAS). Dalam konteks pendidikan, kedua faktor tersebut sering dianggap memiliki peran penting dalam menentukan capaian akademik siswa.
Tingkat kehadiran mencerminkan partisipasi aktif siswa dalam proses pembelajaran, sementara IQ menggambarkan kemampuan kognitif yang dimiliki. Dengan demikian, keduanya diduga memiliki kontribusi terhadap variasi nilai yang diperoleh siswa.
Melalui pendekatan regresi linier berganda, penelitian ini bertujuan untuk mengetahui sejauh mana tingkat kehadiran dan IQ berpengaruh terhadap nilai UAS, baik secara bersama-sama maupun secara individu.
INPUT DATA
data_siswa <- data.frame(
IQ = c(110,120,115,130,110,120,120,125,110,120),
Kehadiran = c(60,70,75,80,80,90,95,95,100,100),
Nilai = c(65,70,75,75,80,80,85,95,90,98)
)
data_siswa## IQ Kehadiran Nilai
## 1 110 60 65
## 2 120 70 70
## 3 115 75 75
## 4 130 80 75
## 5 110 80 80
## 6 120 90 80
## 7 120 95 85
## 8 125 95 95
## 9 110 100 90
## 10 120 100 98
EKSPLORASI DATA ANALYIST
Analisis deskriptif dilakukan untuk melihat gambaran umum data serta hubungan antar variabel.
summary(data_siswa) #Untuk melihat gambaran umum data seperti nilai minimum, maksimum, rata-rata, dan kuartil dari setiap variabel.## IQ Kehadiran Nilai
## Min. :110.0 Min. : 60.00 Min. :65.00
## 1st Qu.:111.2 1st Qu.: 76.25 1st Qu.:75.00
## Median :120.0 Median : 85.00 Median :80.00
## Mean :118.0 Mean : 84.50 Mean :81.30
## 3rd Qu.:120.0 3rd Qu.: 95.00 3rd Qu.:88.75
## Max. :130.0 Max. :100.00 Max. :98.00
## IQ Kehadiran Nilai
## IQ 1.0000000 0.2294450 0.1936947
## Kehadiran 0.2294450 1.0000000 0.9335199
## Nilai 0.1936947 0.9335199 1.0000000
pairs(data_siswa) #Untuk memvisualisasikan hubungan antar variabel dalam bentuk scatter plot, sehingga dapat melihat pola hubungan (linear atau tidak).Berdasarkan hasil eksplorasi, terlihat adanya kecenderungan hubungan positif antara tingkat kehadiran dan nilai UAS. IQ juga menunjukkan hubungan positif, meskipun tidak sekuat tingkat kehadiran.
UJI REGRESI
A. persamaan Regresi(Manual)
X <- cbind(1, data_siswa$Kehadiran, data_siswa$IQ)
Y <- data_siswa$Nilai
beta <- solve(t(X) %*% X) %*% t(X) %*% Y
beta## [,1]
## [1,] 23.0544545
## [2,] 0.7372330
## [3,] -0.0343275
B. Persamaan Regresi (fungsi lm)
##
## Call:
## lm(formula = Nilai ~ Kehadiran + IQ, data = data_siswa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.2861 -2.8939 0.0296 1.6791 6.1993
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.05445 25.57161 0.902 0.397247
## Kehadiran 0.73723 0.10918 6.752 0.000264 ***
## IQ -0.03433 0.22051 -0.156 0.880686
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
## F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523
Berdasarkan hasil yang diperoleh, persamaan regresi linier yang terbentuk adalah:
\[ \hat{Y} = 23{,}054 + 0{,}737(\text{Kehadiran}) - 0{,}034(\text{IQ}) \]
Berdasarkan persamaan tersebut, dapat diinterpretasikan bahwa konstanta sebesar 23,054 menunjukkan nilai UAS ketika tingkat kehadiran dan IQ bernilai nol, meskipun nilai ini tidak memiliki makna praktis dalam konteks penelitian.
Koefisien variabel tingkat kehadiran sebesar 0,737 menunjukkan bahwa setiap peningkatan 1% kehadiran, dengan asumsi IQ konstan, akan meningkatkan nilai UAS sebesar 0,737 poin.
Sementara itu, koefisien variabel IQ sebesar -0,034 menunjukkan bahwa setiap peningkatan 1 poin IQ, dengan asumsi tingkat kehadiran konstan, justru menurunkan nilai UAS sebesar 0,034 poin. Namun, pengaruh ini sangat kecil dan tidak signifikan secara statistik.
Dengan demikian, dapat disimpulkan bahwa tingkat kehadiran memiliki pengaruh positif dan signifikan terhadap nilai UAS, sedangkan IQ tidak menunjukkan pengaruh yang signifikan.
C. Uju-F
Uji F digunakan untuk mengetahui apakah variabel independen secara bersama-sama berpengaruh terhadap variabel dependen.
##
## Call:
## lm(formula = Nilai ~ Kehadiran + IQ, data = data_siswa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.2861 -2.8939 0.0296 1.6791 6.1993
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.05445 25.57161 0.902 0.397247
## Kehadiran 0.73723 0.10918 6.752 0.000264 ***
## IQ -0.03433 0.22051 -0.156 0.880686
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
## F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523
Berdasarkan hasil output yang diperoleh, nilai F-statistic sebesar 23,82 dengan p-value sebesar 0,0007523.
Karena nilai p-value < 0,05, maka H0 ditolak. Hal ini menunjukkan bahwa variabel tingkat kehadiran dan IQ secara simultan berpengaruh signifikan terhadap nilai UAS.
Dengan demikian, model regresi yang digunakan dapat dikatakan layak dan mampu menjelaskan hubungan antara variabel independen dan variabel dependen.
D. Uji-t (Parsial)
Uji t digunakan untuk mengetahui pengaruh masing-masing variabel independen terhadap variabel dependen.
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.0544545 25.5716101 0.9015644 0.3972467061
## Kehadiran 0.7372330 0.1091797 6.7524718 0.0002644133
## IQ -0.0343275 0.2205125 -0.1556715 0.8806860631
Hasil menunjukkan bahwa:
- Tingkat kehadiran berpengaruh signifikan terhadap nilai UAS
- IQ juga berpengaruh terhadap nilai UAS, namun dengan pengaruh yang lebih kecil
E. koefisien determinasi
Koefisien determinasi digunakan untuk mengukur seberapa besar kemampuan model dalam menjelaskan variabel dependen.
## [1] 0.8719029
Berdasarkan hasil perhitungan, diperoleh nilai R² sebesar (isi sesuai output, misalnya 0,93). Hal ini menunjukkan bahwa sebesar 93% variasi nilai UAS dapat dijelaskan oleh variabel tingkat kehadiran dan IQ, sedangkan sisanya sebesar 7% dipengaruhi oleh faktor lain di luar model, seperti metode belajar, lingkungan, atau faktor lainnya.
Nilai R² yang tinggi ini menunjukkan bahwa model regresi yang digunakan memiliki kemampuan yang sangat baik dalam menjelaskan hubungan antara variabel independen dan dependen.
F. uji asumsi
a. Normalitas
##
## Shapiro-Wilk normality test
##
## data: residuals(model)
## W = 0.95125, p-value = 0.6833
Uji normalitas dilakukan untuk mengetahui apakah residual berdistribusi normal. Berdasarkan hasil uji Shapiro-Wilk, jika diperoleh nilai p-value lebih besar dari 0,05, maka dapat disimpulkan bahwa residual berdistribusi normal.
Dengan demikian, asumsi normalitas dalam model regresi telah terpenuhi, sehingga model layak digunakan untuk analisis lebih lanjut.
b. Multikolinearitas
## Warning: package 'car' was built under R version 4.5.2
## Loading required package: carData
## Kehadiran IQ
## 1.055571 1.055571
Uji multikolinearitas bertujuan untuk mengetahui apakah terdapat korelasi yang tinggi antar variabel independen. Berdasarkan nilai Variance Inflation Factor (VIF), jika seluruh nilai VIF kurang dari 10, maka dapat disimpulkan tidak terjadi multikolinearitas.
Hasil yang diperoleh menunjukkan bahwa tidak terdapat hubungan yang kuat antar variabel independen, sehingga masing-masing variabel dapat menjelaskan variabel dependen dengan baik.
c. Heteroskedastisitas
## Warning: package 'lmtest' was built under R version 4.5.2
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 5.905, df = 2, p-value = 0.05221
Uji heteroskedastisitas dilakukan untuk mengetahui apakah terdapat ketidaksamaan varians residual. Jika nilai p-value lebih besar dari 0,05, maka tidak terdapat gejala heteroskedastisitas.
Dengan demikian, varians residual bersifat konstan (homoskedastisitas), sehingga asumsi regresi terpenuhi.
d. Plot Diagnostik
Plot diagnostik digunakan untuk melihat pola residual secara visual, antara lain:
- Residual vs Fitted: untuk mendeteksi heteroskedastisitas
- Normal Q-Q: untuk melihat normalitas
- Scale-Location: untuk melihat sebaran residual
- Residual vs Leverage: untuk mendeteksi outlier
Jika titik-titik menyebar secara acak dan mengikuti garis diagonal (pada Q-Q plot), maka dapat disimpulkan bahwa model telah memenuhi asumsi dasar regresi.
KESIMPULAN
Berdasarkan hasil analisis yang telah dilakukan, dapat disimpulkan bahwa tingkat kehadiran dan IQ memiliki pengaruh terhadap nilai UAS siswa. Secara simultan, kedua variabel tersebut mampu menjelaskan variasi nilai yang cukup besar, sehingga model yang digunakan dapat dikatakan baik dalam merepresentasikan data.
Secara parsial, tingkat kehadiran menunjukkan pengaruh yang lebih dominan dibandingkan IQ. Hal ini mengindikasikan bahwa keaktifan siswa dalam mengikuti proses pembelajaran memiliki peran yang sangat penting dalam meningkatkan hasil belajar.
Selain itu, hasil pengujian juga menunjukkan bahwa model yang digunakan telah memenuhi asumsi dasar regresi, sehingga hasil analisis dapat dianggap valid dan dapat dipercaya.
Dengan demikian, dapat disimpulkan bahwa peningkatan kehadiran siswa di kelas, disertai dengan kemampuan kognitif yang baik, akan berkontribusi positif terhadap peningkatan nilai UAS.