Data Kehadiran dan Score IQ 10 Siswa

knitr::include_graphics("C:/Users/ACER/Pictures/Screenshots/data 10 siswa.png")

Data_siswa <- data.frame(
  Absensi <- c(60,70,75,80,80,90,95,95,100,100),
  IQ <- c(110,120,115,130,110,120,120,125,110,120),
  N_UAS <- c(65,70,75,75,80,80,85,95,90,98))

Pertanyaan dan Jawaban

1. Buatlah persamaan regresi linier berganda!(hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)

Jawab:

#Metode Manual

X <- cbind(1, Absensi, IQ)
Y <- N_UAS

beta <- solve(t(X) %*% X) %*% t(X) %*% Y
beta
##               [,1]
##         23.0544545
## Absensi  0.7372330
## IQ      -0.0343275
#Menggunakan Fungsi lm
library(lmtest)

Persamaan <- lm(N_UAS ~ Absensi + IQ)
print(Persamaan)
## 
## Call:
## lm(formula = N_UAS ~ Absensi + IQ)
## 
## Coefficients:
## (Intercept)      Absensi           IQ  
##    23.05445      0.73723     -0.03433

Ketika menghitung nilai beta duga dengan manual dan dengan menggunakan fungsi lm menghasilkan output yang sama, hanya saja apabila menggunakan fungsi lm nilai output yang diperoleh hanya menampilkan 5 angka di belakang koma bahkan untuk nilai IQ terjadi aproksimasi atau pembulatan pada angka terakhir dibelakang koma, sedangkan dengan metode manual menghasilkan output 7 angka dibelakang koma.

2. Lakukan Uji-F! (interpretasikan hasilnya)

Jawab: Sebelum melakukan Uji-F, terdapat kriteria \(H_0\) dan \(H_1\) (alternatf)

  1. (tidak terdapat pengaruh) \[H_0∶\ \beta_1\ =\beta_2= 0\]

  2. (Terdapat pengaruh)

\[H_1∶minimal\ ada\ satu\ \beta_i\ \ne0\]

Berdasarkan hasil dari nomor satu, salah satu dari metode yang digunakan akan dicari nilai Uji-F statistik sebagai berikut:

Persamaan <- lm(N_UAS ~ Absensi + IQ)
summary(Persamaan)
## 
## Call:
## lm(formula = N_UAS ~ Absensi + IQ)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## Absensi      0.73723    0.10918   6.752 0.000264 ***
## IQ          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Berdasarkan hasil tersebut diperoleh nilai F-statistic sebesar 23,82 dan nilai P-value sebesar 0,0007523 < 0,05 sehingga \(H_0\) ditolak. Artinya dengan uji simultan atau uji-F, Absensi dan nilai IQ secara bersama-sama memiliki pengaruh terhadap nilai UAS.

3. Lakukan Uji-t! (interpretasikan hasilnya)

Jawab: Untuk Uji-t Student (uji parsial) terdapat kriteria \(H_0\) dan \(H_1\) (alternatf) pada masing-maasing variabel.

  1. Absensi
  • (tidak berpengaruh)

\[H_0∶\ \beta_1\ =0\]

  • (berpengaruh)

\[H_1∶\ \beta_1\ \neq0\]

  1. Score IQ
  • (tidak berpengaruh)

\[H_0∶\ \beta_2\ =0\]

  • (berpengaruh)

\[H_1∶\ \beta_2\ \neq0\]

Menggunakan hasil dari pertanyaan pertama dengan memilih salah satu metode untuk dilakukan Uji-t Student sebagai berikut:

#Fungsi Coef
#Absensi

coef(summary(Persamaan))["Absensi", ]
##     Estimate   Std. Error      t value     Pr(>|t|) 
## 0.7372330190 0.1091797257 6.7524718001 0.0002644133
#Fungsi Coef
#Score IQ

coef(summary(Persamaan))["IQ", ]
##   Estimate Std. Error    t value   Pr(>|t|) 
## -0.0343275  0.2205125 -0.1556715  0.8806861
#dengan fungsi summary
Persamaan <- lm(N_UAS ~ Absensi + IQ)
summary(Persamaan)
## 
## Call:
## lm(formula = N_UAS ~ Absensi + IQ)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## Absensi      0.73723    0.10918   6.752 0.000264 ***
## IQ          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Berdasarkan hasil yang telah diperoleh terlihat apabila nilai \(\alpha\) 0,05, maka variabel yang secara signifikan berpengaruh terhadap nilai UAS adalah variabel Absensi dengan nilai 0,000264 < 0,05. Sedangkan, variabel Score IQ tidak berpengaruh terhadap nilai UAS karena nilai 0,880686 > 0,05.

4. Berapa koefisien determinasinya?, interpretasikan hasilnya!

Jawab:

y <- Data_siswa$N_UAS
y_pred <- predict(Persamaan)

SSE <- sum((y - y_pred)^2)
SST <- sum((y - mean(y))^2)

R2 <- 1 - (SSE/SST)
R2
## [1] 0.8719029

Beradarkan nilai yang diperoleh dari \(R^2\) atau koefisien determinasi adalah 0,8719029 atau jika dibulatkan menjadi 0,872, artinya 87% variasi nilai UAS dapat dijelaskan oleh variabel Absensi dan Score IQ, sedangkan sisanya dijelaskan oleh faktor lain di luar model.

5. Lakukan uji asumsi dan jelaskan hasilnya!

Jawab:

Uji Normalitas residual

Untuk mengetahui apakah residual pada data berdistribusi normal atau tidak, yaitu dengan melihat nilai P-value yang diperoleh dan dibandingkan dengan nilai \(\alpha\). Apabila nilai P-value < \(\alpha\) maka kemungkinan besar residual tidak berdistribusi normal dan jikan nilai P-value > \(\alpha\) maka residual berdistribusi dengan normal.

Apabila melakukan uji normalitas residual dengan plot terlihat data menyebar mengikuti garis distribusi, maka residual berdistribusi normal, namun jika data menyebar tidak mengikuti garis distribusi maka residual tidak berdistribusi normal.

#Uji Asumsi Normalitas (Shapiro Wilk)

shapiro.test(residuals(Persamaan))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(Persamaan)
## W = 0.95125, p-value = 0.6833
#Dengan QQ-Plot

qqnorm(residuals(Persamaan), main = "Normal QQ-Plot")
qqline(residuals(Persamaan), col = "grey")

Berdasarkan hasil nilai P-Value yang diperoleh adalah sebesar 0,6833 > 0,05 dan pada plot terlihat data berdistribusi mengikuti garis, sehingga dapat disimpulkan bahwa residual berdistribusi normal

Uji Asumsi Heteroskedastisitas

Untuk mengetahui apakah hasil dari uji asumsi heteroskedastisitas terpenuhi atau tidak, yaitu dengan melihat nilai P-value dan plot.

  • P-value < \(\alpha\) = heteroskedastisitas

  • P-value > \(\alpha\) = homoskedastisitas.

  • Data pada plot terlihat menyebar acak dan tidak membentuk pola = homoskedastisitas

  • Data pada plot terlihat menyebar membentuk pola = heteroskedastisitas

#Uji Asumsi Heteroskedastisitas (Breusch-Pagan)

library(lmtest)

bptest(Persamaan)
## 
##  studentized Breusch-Pagan test
## 
## data:  Persamaan
## BP = 5.905, df = 2, p-value = 0.05221
#Residual vs Fitted Plot

plot(fitted(Persamaan), residuals(Persamaan))
abline(h = 0, col = "pink")

Berdasarkan hasil dari metode Breusch-Pagan diperoleh nilai P-value sebsar 0,05221 dan hasil pada grafik terlihat bahwa data menyebar acak dan tidak membentuk pola, sehingga asumsi heteroskedastisitas residual terpenuhi.

Uji Asumsi Autokorelasi

Untuk mengetahui apakah terdapat korelasi pada residual data perlu dilakukan uji asumsi autokorelasi, korelasi pada residual dapat diketahui melalui beberapa tes dan memplotkan data pada grafik, salah satu tes dan plot yang digunakan adalah Durbin-Watson tes dan ACf plot dengan kriteria berikut :

  • Nilai P-value yang diperoleh dari uji Durbin-Watson < \(\alpha\) = terdapat korelasi antar residual

  • Nilai P-value yang diperoleh dari uji Durbin-Watson > \(\alpha\) = tidak terdapat korelasi antar residual

  • Terdapat lag data observasi yang melewati garis pembatas selain lag 0 = terdapat korelasi korelasi

  • Semua lag data berada dalam garis batas dan tidak melewati garis pembatas = tidak terdapat korelasi

#Uji Asumsi Autokorelasi (Durbin Watson)

library(lmtest)

dwtest(Persamaan)
## 
##  Durbin-Watson test
## 
## data:  Persamaan
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0
#Menggunakan cf Plot
acf(residuals(Persamaan))

Hasil yang diperoleh berdasarkan uji asumsi yang telah dilakukan terlihat nilai P-value sebesar 0,8013 > 0,05 dan pada grafik tidak terdapat lag data yang melewati garis pembatas artinya antar residual data tidak memiliki korelasi.

Uji Asumsi Multikolinearitas

Untuk mengetahui apakah antar variabel independen saling berkaitan dapat dilakukan beberapa uji asumsi, salah satu dari uji asumsi yang digunakan adalah Varince Inflantion Factors (VIF) dengan kieria sebagai berikut :

  • Nilai korelasi yang diperoleh < 10 = tidak ada hubungan antar variabel independen

  • Nilai korelasi yang diperoleh > 10 = terdapat hubungan antar variabel independen

#Uji Asumsi Multikolinearitas

library(car)

vif(Persamaan)
##  Absensi       IQ 
## 1.055571 1.055571

Berdasarkan hasil yang diperoleh dari uji tersebut berupa nilai dari variabel absensi sebesar 1,056 dan variabel Score IQ sebesar 1,056 menunjukan bahwa ke dua variabel tersebut tidak memiliki korelasi, sehingga asumsi multikolinearitas terpenuhi.