Input Data

y <- c(65, 70, 75, 75, 80, 80, 85, 95, 90, 98)
x1 <- c(60, 70, 75, 80, 80, 90, 95, 95, 100, 100) # Kehadiran
x2 <- c(110, 120, 115, 130, 110, 120, 120, 125, 110, 120) # IQ

Uji Asumsi Klasik

# Normalitas (Shapiro-Wilk)
shapiro.test(residuals(model))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.95125, p-value = 0.6833

# Homoskedastisitas (Breusch-Pagan)
library(lmtest)

## Loading required package: zoo

## 
## Attaching package: 'zoo'

## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

bptest(model)

## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.905, df = 2, p-value = 0.05221

# Non-Multikolinieritas (VIF)
library(car)

## Loading required package: carData

vif(model)

##       x1       x2 
## 1.055571 1.055571

Normalitas (Shapiro-Wilk)

Uji ini memastikan apakah residuals (selisih antara data asli dan prediksi) berdistribusi normal. Jika p-value dari uji Shapiro-Wilk lebih besar dari 0.05, maka kita gagal menolak hipotesis nol, yang berarti residuals berdistribusi normal. Jika p-value lebih kecil dari 0.05, maka kita menolak hipotesis nol, yang berarti residuals tidak berdistribusi normal. p-value dari uji Saphiro-Wilk adalah 0.6833, yang lebih besar dari 0.05, sehingga kita gagal menolak hipotesis nol. Ini berarti bahwa residuals berdistribusi normal.

Homoskedastisitas (Breusch-Pagan)

Uji ini digunakan untuk menguji apakah varians residuals konstan (homoskedastisitas). Jika p-value dari uji Breusch-Pagan lebih besar dari 0.05, maka kita gagal menolak hipotesis nol, yang berarti varians residuals konstan. Jika p-value lebih kecil dari 0.05, maka kita menolak hipotesis nol, yang berarti varians residuals tidak konstan (heteroskedastisitas). p-value dari uji breusch-pagan ialah 0.05221, yang sedikit lebih besar dari 0.05, sehingga kita gagal menolak hipotesis nol. Ini berarti bahwa varians residuals konstan (homoskedastisitas). Namun, karena p-value sangat dekat dengan 0.05, kita harus berhati-hati dalam menginterpretasikan hasil ini, dan mungkin perlu melakukan analisis lebih lanjut untuk memastikan bahwa asumsi homoskedastisitas benar-benar terpenuhi.

Non-Multikolinieritas (VIF)

Uji ini digunakan untuk mengukur tingkat multikolinieritas antara variabel independen. Jika nilai VIF lebih besar dari 10, maka ada indikasi multikolinieritas yang tinggi. Jika nilai VIF kurang dari 10, maka tidak ada indikasi multikolinieritas yang tinggi. Nilai VIF untuk x1 (Kehadiran) adalah 1.055571, dan untuk x2 (IQ) adalah 1.055571, yang keduanya kurang dari 10. Ini menunjukkan bahwa tidak ada indikasi multikolinieritas yang tinggi antara variabel independen dalam model ini.

Persamaan Regresi Linear Berganda

Perhitungan Manual

# Membuat matriks X (tambahkan kolom 1 untuk intercept)
X <- cbind(1, x1, x2)
Y <- as.matrix(y)

# Menghitung beta duga: (X'X)^-1 X'Y
beta_manual <- solve(t(X) %*% X) %*% t(X) %*% Y
print("Beta Duga Manual:")

## [1] "Beta Duga Manual:"

print(beta_manual)

##          [,1]
##    23.0544545
## x1  0.7372330
## x2 -0.0343275

Perhitungan dengan Fungsi lm()

model <- lm(y ~ x1 + x2)
print("Beta Duga dengan lm():")

## [1] "Beta Duga dengan lm():"

print(coef(model))

## (Intercept)          x1          x2 
##  23.0544545   0.7372330  -0.0343275

Hasil perhitungan manual memberikan nilai beta duga untuk intercept, x1, dan x2. Berdasarkan hasil tersebut, persamaanya adalah: Y = 23.054 + 0.737 * x1 - 0.034 * x2 dengan interpretasi: - Intercept (23.054): Ketika x1 dan x2 bernilai 0, nilai Y diperkirakan sebesar 23.054. - Koefisien x1 (0.737): Setiap peningkatan 1 unit pada x1 (kehadiran) diharapkan meningkatkan Y sebesar 0.737, dengan asumsi x2 tetap. - Koefisien x2 (-0.034): Setiap peningkatan 1 unit pada x2 (IQ) diharapkan menurunkan Y sebesar 0.034, dengan asumsi x1 tetap. Namun, koefisien x2 yang negatif menunjukkan bahwa ada hubungan negatif antara IQ dan nilai Y, meskipun pengaruhnya sangat kecil.

Evaluasi Model

summary(model)

## 
## Call:
## lm(formula = y ~ x1 + x2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## x1           0.73723    0.10918   6.752 0.000264 ***
## x2          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Uji F (Uji Simultan)

Uji ini digunakan untuk melihat apakah \(X_1\) (Kehadiran) dan \(X_2\) (IQ) secara bersama-sama berpengaruh signifikan terhadap \(Y\). P-value dari uji F adalah 0.0007523, yang lebih kecil dari 0.05, sehingga kita menolak hipotesis nol. Ini berarti bahwa setidaknya salah satu dari variabel independen (x1 atau x2) memiliki pengaruh signifikan terhadap variabel dependen (y).

Uji T (Uji Parsial)

Didalam output summary(model), kita dapat melihat nilai p-value untuk masing-masing koefisien ialah: - untuk x1 (Kehadiran) memiliki p-value sebesar 0.000264, yang lebih kecil dari 0.05, sehingga kita menolak hipotesis nol untuk x1. Ini berarti bahwa kehadiran memiliki pengaruh signifikan terhadap nilai Y. - untuk x2 (IQ) memiliki p-value sebesar 0.880686, yang lebih besar dari 0.05, sehingga kita gagal menolak hipotesis nol untuk x2. Ini berarti bahwa IQ tidak memiliki pengaruh signifikan terhadap nilai Y. - ## Koefisien Determinasi (R^2) nilai R^2 adalah 0.8719, yang berarti bahwa sekitar 87.19% variasi dalam nilai Y dapat dijelaskan oleh model regresi yang melibatkan x1 (Kehadiran) dan x2 (IQ). Ini menunjukkan bahwa model memiliki kemampuan yang baik dalam menjelaskan variasi data.

Kesimpulan

Berdasarkan hasil analisis regresi linear berganda, kita dapat menyimpulkan bahwa kehadiran (x1) memiliki pengaruh signifikan terhadap nilai Y, sedangkan IQ (x2) tidak memiliki pengaruh signifikan. Model regresi ini menjelaskan sekitar 87.19% variasi dalam nilai Y, menunjukkan bahwa model ini cukup baik dalam menjelaskan data yang ada. Namun, perlu diingat bahwa hasil ini hanya berlaku untuk data yang digunakan dalam analisis ini, dan mungkin tidak dapat digeneralisasi untuk populasi yang lebih luas tanpa melakukan analisis lebih lanjut. Selain itu, meskipun IQ tidak memiliki pengaruh signifikan dalam model ini, hal ini tidak berarti bahwa IQ tidak penting dalam konteks lain atau dalam kombinasi dengan variabel lain. Oleh karena itu, disarankan untuk melakukan analisis lebih lanjut dengan memasukkan variabel lain yang mungkin relevan untuk mendapatkan pemahaman yang lebih komprehensif tentang faktor-faktor yang mempengaruhi nilai Y.

Pengantar Metode Statistika

Sala Jalaludin

2026-03-23