I. Latar Belakang

Kemampuan akademik siswa merupakan salah satu indikator penting dalam menilai keberhasilan proses pembelajaran di sekolah. Berbagai kemampuan dasar seperti kemampuan matematika dan kemampuan membaca memiliki peran penting dalam mendukung proses belajar siswa. Kemampuan membaca membantu siswa memahami informasi yang disajikan dalam bentuk teks, sedangkan kemampuan matematika berkaitan dengan kemampuan berpikir logis, analitis, dan pemecahan masalah. Kedua kemampuan tersebut sering kali saling berkaitan karena dalam proses pembelajaran siswa perlu memahami soal atau informasi yang diberikan sebelum menyelesaikan suatu permasalahan.

Oleh karena itu, penting untuk mengetahui apakah terdapat hubungan antara kemampuan matematika dan kemampuan membaca siswa. Salah satu metode yang dapat digunakan untuk menganalisis hubungan tersebut adalah regresi linier sederhana. Melalui analisis ini dapat diketahui apakah nilai matematika memiliki pengaruh terhadap nilai membaca siswa serta seberapa besar kemampuan variabel matematika dalam menjelaskan variasi nilai membaca. Dalam penelitian ini, math score digunakan sebagai variabel independen (X) dan reading score digunakan sebagai variabel dependen (Y) untuk dianalisis menggunakan metode regresi linier sederhana.

II. Tinjauan Pustaka

Regresi linier sederhana merupakan metode analisis statistik yang digunakan untuk mengetahui hubungan antara satu variabel independen dan satu variabel dependen. Analisis ini bertujuan untuk mengetahui apakah variabel independen memiliki pengaruh terhadap variabel dependen serta untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen.

Secara umum, model regresi linier sederhana dinyatakan dalam bentuk persamaan: \[ y=\beta_0 + \beta_1 X_1 + \epsilon \] di mana Y merupakan variabel dependen, X merupakan variabel independen,β0 adalah konstanta, β1 adalah koefisien regresi, dan ε merupakan error. Analisis regresi juga memerlukan beberapa asumsi yang harus dipenuhi, seperti normalitas residual, linearitas hubungan antar variabel, homoskedastisitas, dan tidak adanya autokorelasi.

Selain itu, untuk mengetahui signifikansi model regresi digunakan uji hipotesis seperti uji t untuk menguji pengaruh variabel independen secara parsial terhadap variabel dependen, serta uji F untuk menguji signifikansi model regresi secara keseluruhan. Kekuatan hubungan antara variabel dapat dilihat melalui koefisien korelasi, sedangkan kemampuan model dalam menjelaskan variasi data dapat dilihat melalui koefisien determinasi.

III. Metodologi

Penelitian ini menggunakan pendekatan kuantitatif dengan metode analisis regresi linier sederhana. Data yang digunakan terdiri dari nilai math score sebagai variabel independen (X) dan reading score sebagai variabel dependen (Y) dengan jumlah observasi sebanyak 1000 data. Data ini merupakan data sekunder yang berasal dari Students Performance Dataset yang tersedia secara publik di Kaggle. Dataset tersebut memuat informasi performa akademik siswa, termasuk nilai matematika (math score) dan nilai membaca (reading score), yang kemudian digunakan sebagai variabel dalam analisis penelitian ini.

Tahapan analisis yang dilakukan meliputi statistik deskriptif untuk melihat gambaran umum data, pembuatan scatter plot untuk mengetahui pola hubungan antara variabel, serta pengujian asumsi regresi yang meliputi uji normalitas, uji linearitas, uji homoskedastisitas, dan uji autokorelasi. Selanjutnya dilakukan analisis regresi linier sederhana untuk mengetahui hubungan antara kedua variabel. Pengujian hipotesis dilakukan menggunakan uji t untuk mengetahui pengaruh variabel independen terhadap variabel dependen serta uji F untuk menguji signifikansi model regresi. Selain itu, dihitung koefisien korelasi dan koefisien determinasi untuk mengetahui kekuatan hubungan dan kemampuan model dalam menjelaskan variasi data.

IV. Analisis dan Pembahasan

IV.1. Statistik Deskriptif

library(readxl)
data <- read_excel("C:/Users/LENOVO/OneDrive/เอกสาร/Math_and_Reading_score.xlsx")
summary(data)

##    math score    reading score
##  Min.   : 13.0   Min.   : 27  
##  1st Qu.: 56.0   1st Qu.: 60  
##  Median : 66.5   Median : 70  
##  Mean   : 66.4   Mean   : 69  
##  3rd Qu.: 77.0   3rd Qu.: 79  
##  Max.   :100.0   Max.   :100

IV.2. Scatterplot

plot(data$`math score`, data$`reading score`,
     main="Scatter Plot Math Score vs Reading Score",
     xlab="Math Score",
     ylab="Reading Score",
     pch=16)

IV.3. Model Awal

model=lm(`reading score`~`math score`, data = data)
summary(model)

## 
## Call:
## lm(formula = `reading score` ~ `math score`, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -23.1795  -5.8094   0.0562   6.1544  22.9565 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  16.94825    1.18328   14.32   <2e-16 ***
## `math score`  0.78399    0.01736   45.16   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.452 on 998 degrees of freedom
## Multiple R-squared:  0.6714, Adjusted R-squared:  0.6711 
## F-statistic:  2039 on 1 and 998 DF,  p-value: < 2.2e-16

Berdasarkan output di atas, diperoleh :

β0 = 16.94825
β1 = 0.78399

Sehingga, persamaan regresinya : \[ y=16.948+0.784 X_1 + \epsilon \]

IV.4. Uji Asumsi Model Regresi

IV.4.1. Uji Normalitas Residual

error=model$residuals
ks.test(error,"pnorm",mean(error),sqrt(var(error)))

## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  error
## D = 0.021307, p-value = 0.7543
## alternative hypothesis: two-sided

Berdasarkan hasil uji normalitas residual menggunakan uji Kolmogorov–Smirnov diperoleh nilai p-value sebesar 0.7543 lebih besar dari 0.05. Hal ini menunjukkan bahwa residual pada model regresi berdistribusi normal, sehingga asumsi normalitas pada model regresi telah terpenuhi.

IV.4.2. Uji Homoskedastisitas

library(lmtest)

## Loading required package: zoo

## 
## Attaching package: 'zoo'

## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

library(zoo)
bptest(model)

## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 1.757, df = 1, p-value = 0.185

Berdasarkan hasil uji Breusch–Pagan diperoleh nilai p-value 0.185 lebih besar dari 0.05. Hal ini menunjukkan bahwa tidak terjadi heteroskedastisitas pada model regresi, sehingga asumsi homoskedastisitas terpenuhi.

IV.4.3. Uji Linieritas

plot(data$`math score`, data$`reading score`,
     main = "Scatter Plot Math Score vs Reading Score",
     xlab = "Math Score",
     ylab = "Reading Score",
     pch = 16)

abline(model, col = "red")

Berdasarkan scatter plot antara variabel math score dan reading score, terlihat bahwa titik data mengikuti pola garis lurus dan menyebar di sekitar garis regresi. Hal ini menunjukkan bahwa hubungan antara kedua variabel bersifat linear sehingga asumsi linearitas pada model regresi linier sederhana dapat terpenuhi.

IV.4.4. Uji Autokorelasi

library(lmtest)
dwtest(model)

## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.0828, p-value = 0.9051
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan hasil uji Durbin–Watson diperoleh nilai p-value 0.9051 lebih besar dari 0.05 sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual model regresi.

IV.5. Uji Signifikasi dan Koefisien Determinasi

summary(model)

## 
## Call:
## lm(formula = `reading score` ~ `math score`, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -23.1795  -5.8094   0.0562   6.1544  22.9565 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  16.94825    1.18328   14.32   <2e-16 ***
## `math score`  0.78399    0.01736   45.16   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.452 on 998 degrees of freedom
## Multiple R-squared:  0.6714, Adjusted R-squared:  0.6711 
## F-statistic:  2039 on 1 and 998 DF,  p-value: < 2.2e-16

IV.5.1. Uji t

Berdasarkan hasil uji t diperoleh nilai p-value sebesar < 2e-16, yang lebih kecil dari taraf signifikansi 0.05. Hal ini menunjukkan bahwa variabel math score berpengaruh signifikan terhadap variabel reading score.

IV.5.2. Uji F

Berdasarkan hasil uji F diperoleh nilai p-value (2.2e-16) < 0,05, sehingga dapat disimpulkan bahwa model regresi linier sederhana yang digunakan signifikan. Dengan demikian, variabel math score secara statistik mampu menjelaskan variasi pada variabel reading score.

IV.5.3. Koefisien Determinasi

Nilai koefisien determinasi sebesar 0.6714 menunjukkan bahwa 67.14% variasi pada variabel reading score dapat dijelaskan oleh variabel math score, sedangkan 32.86% sisanya dijelaskan oleh faktor lain di luar model yang tidak diteliti dalam laporan ini.

IV.6. Model Akhir

Berdasarkan uji F, model regresi yang dibuat cocok digunakan untuk analisis lebih lanjut dan berdasarkan uji t, koefisien parameter regresi X yaitu β1 berpengaruh signfikan terhadap Y. sehingga model akhir sama dengan model awal, yaitu : \[ \hat{y}=16.948+0.784 X_1 \]

V. Kesimpulan

Berdasarkan pengujian asumsi regresi yang telah dilakukan, diperoleh bahwa asumsi-asumsi regresi telah terpenuhi. Hasil uji normalitas menunjukkan bahwa residual berdistribusi normal, scatter plot menunjukkan hubungan yang bersifat linear, uji homoskedastisitas menunjukkan tidak adanya gejala heteroskedastisitas, serta uji autokorelasi menunjukkan tidak terdapat autokorelasi pada residual model.

Berdasarkan hasil analisis regresi linier, diperoleh bahwa variabel math score memiliki pengaruh yang signifikan terhadap variabel reading score. Hasil uji t menunjukkan nilai p-value lebih kecil dari 0.05 sehingga dapat disimpulkan bahwa variabel math score secara parsial berpengaruh signifikan terhadap reading score. Selain itu, hasil uji F juga menunjukkan nilai p-value lebih kecil dari 0.05 sehingga model regresi yang digunakan signifikan dan layak digunakan untuk menjelaskan hubungan antara kedua variabel.

Nilai koefisien determinasi (R²) sebesar 0.6714 menunjukkan bahwa 67.14% variasi pada variabel reading score dapat dijelaskan oleh variabel math score, sedangkan sisanya sebesar 32.86% dipengaruhi oleh faktor lain di luar model.

Model regresi linier sederhana yang diperoleh dalam penelitian ini adalah: \[ \hat{y}=16.948+0.784 X_1 \] yang menunjukkan bahwa setiap kenaikan 1 poin math score akan meningkatkan reading score sebesar sekitar 0.784 poin.

Dengan demikian dapat disimpulkan bahwa terdapat hubungan positif dan signifikan antara nilai matematika dan nilai membaca siswa. Semakin tinggi nilai matematika siswa, maka nilai membaca siswa juga cenderung meningkat.

Analisis Hubungan Nilai Matematika dan Nilai Membaca Menggunakan Metode Regresi Linier Sederhana

Qifda Nadhifa

2026-03-07