Tugas Pengantar Model Linier

# Input Data
data_siswa <- data.frame(
  siswa <- 1:10,
  IQ <- c(110, 120, 115, 130, 110, 120, 120, 125, 110, 120),
  kehadiran <- c(60, 70, 75, 80, 80, 90, 95, 95, 100, 100),
  UAS <- c(65, 70, 75, 75, 80, 80, 85, 95, 90, 98)
)
data_siswa
##    siswa....1.10 IQ....c.110..120..115..130..110..120..120..125..110..120.
## 1              1                                                       110
## 2              2                                                       120
## 3              3                                                       115
## 4              4                                                       130
## 5              5                                                       110
## 6              6                                                       120
## 7              7                                                       120
## 8              8                                                       125
## 9              9                                                       110
## 10            10                                                       120
##    kehadiran....c.60..70..75..80..80..90..95..95..100..100.
## 1                                                        60
## 2                                                        70
## 3                                                        75
## 4                                                        80
## 5                                                        80
## 6                                                        90
## 7                                                        95
## 8                                                        95
## 9                                                       100
## 10                                                      100
##    UAS....c.65..70..75..75..80..80..85..95..90..98.
## 1                                                65
## 2                                                70
## 3                                                75
## 4                                                75
## 5                                                80
## 6                                                80
## 7                                                85
## 8                                                95
## 9                                                90
## 10                                               98

1. Buat Persamaan Regresi Linier Berganda

# Model Regresi

# Manual
# Variabel dependen 
Y <- as.matrix(data_siswa$UAS) 
# Variabel independen (tambahkan intercept) 
X <- cbind(1, data_siswa$kehadiran, data_siswa$IQ) 
X 
##       [,1] [,2] [,3]
##  [1,]    1   60  110
##  [2,]    1   70  120
##  [3,]    1   75  115
##  [4,]    1   80  130
##  [5,]    1   80  110
##  [6,]    1   90  120
##  [7,]    1   95  120
##  [8,]    1   95  125
##  [9,]    1  100  110
## [10,]    1  100  120
Y
##       [,1]
##  [1,]   65
##  [2,]   70
##  [3,]   75
##  [4,]   75
##  [5,]   80
##  [6,]   80
##  [7,]   85
##  [8,]   95
##  [9,]   90
## [10,]   98
# Menghitung Beta
beta <- solve(t(X) %*% X) %*% t(X) %*% Y 
beta
##            [,1]
## [1,] 23.0544545
## [2,]  0.7372330
## [3,] -0.0343275
# Fugsi lm
model <- lm(UAS ~ kehadiran + IQ, data = data_siswa)
summary(model)
## 
## Call:
## lm(formula = UAS ~ kehadiran + IQ, data = data_siswa)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## kehadiran    0.73723    0.10918   6.752 0.000264 ***
## IQ          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523
# Persamaan Regresi
lm <- coef(model)

# Bandingkan Hasil
cbind(beta, lm)
##                                lm
## (Intercept) 23.0544545 23.0544545
## kehadiran    0.7372330  0.7372330
## IQ          -0.0343275 -0.0343275

Dari hasil perhitungan manual maupun menggunakan fungsi lm, didapat model sebagai berikut: \(\hat{Y} = 23.054 + 0.737X_1 - 0.034X_2\)

Interpretasi:

2. Uji-F

summary(model)
## 
## Call:
## lm(formula = UAS ~ kehadiran + IQ, data = data_siswa)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## kehadiran    0.73723    0.10918   6.752 0.000264 ***
## IQ          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Uji F digunakan untuk mengetahui apakah variabel kehadiran dan IQ secara bersama-sama berpengaruh terhadap nilai UAS.

Berdasarkan output regresi diperoleh p-value sebesar 0.0007523.

Hipotesis:

Pengujian:

Jika p-value \(< 0.05\), maka tolak \(H_0\)

Keputusan:

Karena p-value (0.0007523) \(< 0.05\), maka \(H_0\) ditolak.

Kesimpulan:

Variabel kehadiran dan IQ secara bersama-sama berpengaruh signifikan terhadap nilai UAS.

2. Uji-t

summary(model)$coefficients
##               Estimate Std. Error    t value     Pr(>|t|)
## (Intercept) 23.0544545 25.5716101  0.9015644 0.3972467061
## kehadiran    0.7372330  0.1091797  6.7524718 0.0002644133
## IQ          -0.0343275  0.2205125 -0.1556715 0.8806860631

Uji t digunakan untuk mengetahui pengaruh masing-masing variabel independen terhadap variabel dependen (nilai UAS).

Hipotesis:

Pengujian:

Jika p-value \(< 0.05\), maka tolak \(H_0\)

1. Variabel Kehadiran

Karena p-value(0.000264) \(< 0.05\), maka \(H_0\) ditolak.

Kesimpulan:

Variabel kehadiran berpengaruh signifikan terhadap nilai UAS. Artinya, semakin tinggi tingkat kehadiran, maka nilai UAS cenderung meningkat.

2. Variabel IQ

Karena p-value(0.880686) \(> 0.05\), maka \(H_0\) gagal ditolak.

Kesimpulan:

Variabel IQ tidak berpengaruh signifikan terhadap nilai UAS.

Berdasarkan uji-t didapat bahwa variabel kehadiran berpengaruh signifaikan terhadap variabel dependen (nilai UAS), sedangkan variabel IQ tidak berpengaruh signifikan terhadap variabel dependen (nilai UAS).

3. Koefisien Determinasi(\(R^2\))

summary(model)$r.squared
## [1] 0.8719029

Berdasarkan koefisien determinasai(\(R^2\)), diketahui bahwa sebesar 87.19% variasi pada nilai UAS dapat dijelaskan oleh variabel kehadiran dan IQ dalam model regresi. Sedangkan sisanya sebesar 12.81% dijelaskan oleh faktor lain di luar model. Model regresi yang digunakan memiliki kemampuan yang sangat baik dalam menjelaskan variasi nilai UAS, karena nilai (\(R^2\)),(87.19%) mendekati 1.

5. Uji Asumsi

Normalitas

shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.95125, p-value = 0.6833

Hipotesis:

Pengujian:

Jika p-value \(< 0.05\), maka tolak \(H_0\)

Keputusan:

Karena p-value (0.6833) \(> 0.05\), maka \(H_0\) gagal ditolak.

Kesimpulan:

Residual model berdistribusi normal, sehingga asumsi normalitas dalam model regresi telah terpenuhi.

Heteroskedastisitas

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.4.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.4.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.905, df = 2, p-value = 0.05221

Hipotesis:

Pengujian:

Jika p-value \(< 0.05\), maka tolak \(H_0\)

Keputusan:

Karena p-value (0.05221) \(> 0.05\), maka \(H_0\) gagal ditolak.

Kesimpulan:

Keragaman dari error menyebar tidak homogen, dapat disimpulkan bahwa tidak terdapat gejala heteroskedastisitas pada model regresi.

Autokorelasi

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0

Hipotesis:

Pengujian:

Jika p-value \(< 0.05\), maka tolak \(H_0\)

Keputusan:

Karena p-value (0.8013) \(> 0.05\), maka \(H_0\) gagal ditolak.

Kesimpulan:

Asumsi independensi residual terpenuhi, tidak terdapat autokorelasi pada model regresi.

Multikolinearitas

library(car)
## Warning: package 'car' was built under R version 4.4.2
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.4.2
vif(model)
## kehadiran        IQ 
##  1.055571  1.055571

Uji Statistik:

variance inflation factor (VIF) \(>\) 10: Terdapat multikoliniertas

Keputusan:

VIF kehadiran (1.055571) \(< 0.05\), maka tidak terdapat multikolinieritas.

VIF IQ (1.055571) \(< 0.05\), maka tidak terdapat multikolinieritas.

Kesimpulan: Berdasarkan hasil perhitungan Variance Inflation Factor (VIF), diperoleh nilai VIF untuk variabel kehadiran dan IQ masing-masing sebesar 1.055571. Nilai tersebut lebih kecil dari 10, sehingga dapat disimpulkan bahwa tidak terjadi multikolinieritas antar variabel independen dalam model regresi.