knitr::include_graphics("C:/Users/ACER/Pictures/Screenshots/data 10 siswa.png")
Data_siswa <- data.frame(
Absensi <- c(60,70,75,80,80,90,95,95,100,100),
IQ <- c(110,120,115,130,110,120,120,125,110,120),
N_UAS <- c(65,70,75,75,80,80,85,95,90,98))
Jawab:
#Metode Manual
X <- cbind(1, Absensi, IQ)
Y <- N_UAS
beta <- solve(t(X) %*% X) %*% t(X) %*% Y
beta
## [,1]
## 23.0544545
## Absensi 0.7372330
## IQ -0.0343275
#Menggunakan Fungsi lm
library(lmtest)
Persamaan <- lm(N_UAS ~ Absensi + IQ)
print(Persamaan)
##
## Call:
## lm(formula = N_UAS ~ Absensi + IQ)
##
## Coefficients:
## (Intercept) Absensi IQ
## 23.05445 0.73723 -0.03433
Ketika menghitung nilai beta duga dengan manual dan dengan menggunakan fungsi lm menghasilkan output yang sama, hanya saja apabila menggunakan fungsi lm nilai output yang diperoleh hanya menampilkan 5 angka di belakang koma bahkan untuk nilai IQ terjadi aproksimasi atau pembulatan pada angka terakhir dibelakang koma, sedangkan dengan metode manual menghasilkan output 7 angka dibelakang koma.
Jawab: Sebelum melakukan Uji-F, terdapat kriteria \(H_0\) dan \(H_1\) (alternatf)
(tidak terdapat pengaruh) \[H_0∶\ \beta_1\ =\beta_2= 0\]
(Terdapat pengaruh)
\[H_1∶minimal\ ada\ satu\ \beta_i\ \ne0\]
Berdasarkan hasil dari nomor satu, salah satu dari metode yang digunakan akan dicari nilai Uji-F statistik sebagai berikut:
Persamaan <- lm(N_UAS ~ Absensi + IQ)
summary(Persamaan)
##
## Call:
## lm(formula = N_UAS ~ Absensi + IQ)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.2861 -2.8939 0.0296 1.6791 6.1993
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.05445 25.57161 0.902 0.397247
## Absensi 0.73723 0.10918 6.752 0.000264 ***
## IQ -0.03433 0.22051 -0.156 0.880686
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
## F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523
Berdasarkan hasil tersebut diperoleh nilai F-statistic sebesar 23,82 dan nilai P-value sebesar 0,0007523 < 0,05 sehingga \(H_0\) ditolak. Artinya dengan uji simultan atau uji-F, Absensi dan nilai IQ secara bersama-sama memiliki pengaruh terhadap nilai UAS.
Jawab: Untuk Uji-t Student (uji parsial) terdapat kriteria \(H_0\) dan \(H_1\) (alternatf) pada masing-maasing variabel.
\[H_0∶\ \beta_1\ =0\]
\[H_1∶\ \beta_1\ \neq0\]
\[H_0∶\ \beta_2\ =0\]
\[H_1∶\ \beta_2\ \neq0\]
Menggunakan hasil dari pertanyaan pertama dengan memilih salah satu metode untuk dilakukan Uji-t Student sebagai berikut:
#Fungsi Coef
#Absensi
coef(summary(Persamaan))["Absensi", ]
## Estimate Std. Error t value Pr(>|t|)
## 0.7372330190 0.1091797257 6.7524718001 0.0002644133
#Fungsi Coef
#Score IQ
coef(summary(Persamaan))["IQ", ]
## Estimate Std. Error t value Pr(>|t|)
## -0.0343275 0.2205125 -0.1556715 0.8806861
#dengan fungsi summary
Persamaan <- lm(N_UAS ~ Absensi + IQ)
summary(Persamaan)
##
## Call:
## lm(formula = N_UAS ~ Absensi + IQ)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.2861 -2.8939 0.0296 1.6791 6.1993
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.05445 25.57161 0.902 0.397247
## Absensi 0.73723 0.10918 6.752 0.000264 ***
## IQ -0.03433 0.22051 -0.156 0.880686
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
## F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523
Berdasarkan hasil yang telah diperoleh terlihat apabila nilai \(\alpha\) 0,05, maka variabel yang secara signifikan berpengaruh terhadap nilai UAS adalah variabel Absensi dengan nilai 0,000264 < 0,05. Sedangkan, variabel Score IQ tidak berpengaruh terhadap nilai UAS karena nilai 0,880686 > 0,05.
Jawab:
y <- Data_siswa$N_UAS
y_pred <- predict(Persamaan)
SSE <- sum((y - y_pred)^2)
SST <- sum((y - mean(y))^2)
R2 <- 1 - (SSE/SST)
R2
## [1] 0.8719029
Beradarkan nilai yang diperoleh dari \(R^2\) atau koefisien determinasi adalah 0,8719029 atau jika dibulatkan menjadi 0,872, artinya 87% variasi nilai UAS dapat dijelaskan oleh variabel Absensi dan Score IQ, sedangkan sisanya dijelaskan oleh faktor lain di luar model.
Jawab:
Untuk mengetahui apakah residual pada data berdistribusi normal atau tidak, yaitu dengan melihat nilai P-value yang diperoleh dan dibandingkan dengan nilai \(\alpha\). Apabila nilai P-value < \(\alpha\) maka kemungkinan besar residual tidak berdistribusi normal dan jikan nilai P-value > \(\alpha\) maka residual berdistribusi dengan normal.
Apabila melakukan uji normalitas residual dengan plot terlihat data menyebar mengikuti garis distribusi, maka residual berdistribusi normal, namun jika data menyebar tidak mengikuti garis distribusi maka residual tidak berdistribusi normal.
#Uji Asumsi Normalitas (Shapiro Wilk)
shapiro.test(residuals(Persamaan))
##
## Shapiro-Wilk normality test
##
## data: residuals(Persamaan)
## W = 0.95125, p-value = 0.6833
#Dengan QQ-Plot
qqnorm(residuals(Persamaan), main = "Normal QQ-Plot")
qqline(residuals(Persamaan), col = "grey")
Berdasarkan hasil nilai P-Value yang diperoleh adalah sebesar 0,6833 > 0,05 dan pada plot terlihat data berdistribusi mengikuti garis, sehingga dapat disimpulkan bahwa residual berdistribusi normal
Untuk mengetahui apakah hasil dari uji asumsi heteroskedastisitas terpenuhi atau tidak, yaitu dengan melihat nilai P-value dan plot.
P-value < \(\alpha\) = heteroskedastisitas
P-value > \(\alpha\) = homoskedastisitas.
Data pada plot terlihat menyebar acak dan tidak membentuk pola = homoskedastisitas
Data pada plot terlihat menyebar membentuk pola = heteroskedastisitas
#Uji Asumsi Heteroskedastisitas (Breusch-Pagan)
library(lmtest)
bptest(Persamaan)
##
## studentized Breusch-Pagan test
##
## data: Persamaan
## BP = 5.905, df = 2, p-value = 0.05221
#Residual vs Fitted Plot
plot(fitted(Persamaan), residuals(Persamaan))
abline(h = 0, col = "pink")
Berdasarkan hasil dari metode Breusch-Pagan diperoleh nilai P-value sebsar 0,05221 dan hasil pada grafik terlihat bahwa data menyebar acak dan tidak membentuk pola, sehingga asumsi heteroskedastisitas residual terpenuhi.
Untuk mengetahui apakah terdapat korelasi pada residual data perlu dilakukan uji asumsi autokorelasi, korelasi pada residual dapat diketahui melalui beberapa tes dan memplotkan data pada grafik, salah satu tes dan plot yang digunakan adalah Durbin-Watson tes dan ACf plot dengan kriteria berikut :
Nilai P-value yang diperoleh dari uji Durbin-Watson < \(\alpha\) = terdapat korelasi antar residual
Nilai P-value yang diperoleh dari uji Durbin-Watson > \(\alpha\) = tidak terdapat korelasi antar residual
Terdapat lag data observasi yang melewati garis pembatas selain lag 0 = terdapat korelasi korelasi
Semua lag data berada dalam garis batas dan tidak melewati garis pembatas = tidak terdapat korelasi
#Uji Asumsi Autokorelasi (Durbin Watson)
library(lmtest)
dwtest(Persamaan)
##
## Durbin-Watson test
##
## data: Persamaan
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0
#Menggunakan cf Plot
acf(residuals(Persamaan))
Hasil yang diperoleh berdasarkan uji asumsi yang telah dilakukan terlihat nilai P-value sebesar 0,8013 > 0,05 dan pada grafik tidak terdapat lag data yang melewati garis pembatas artinya antar residual data tidak memiliki korelasi.
Untuk mengetahui apakah antar variabel independen saling berkaitan dapat dilakukan beberapa uji asumsi, salah satu dari uji asumsi yang digunakan adalah Varince Inflantion Factors (VIF) dengan kieria sebagai berikut :
Nilai korelasi yang diperoleh < 10 = tidak ada hubungan antar variabel independen
Nilai korelasi yang diperoleh > 10 = terdapat hubungan antar variabel independen
#Uji Asumsi Multikolinearitas
library(car)
vif(Persamaan)
## Absensi IQ
## 1.055571 1.055571
Berdasarkan hasil yang diperoleh dari uji tersebut berupa nilai dari variabel absensi sebesar 1,056 dan variabel Score IQ sebesar 1,056 menunjukan bahwa ke dua variabel tersebut tidak memiliki korelasi, sehingga asumsi multikolinearitas terpenuhi.