Tugas Pengantar Model Linier
Data
Diberikan data tentang IQ dan tingkat kehadiran sepuluh siswa di kelas yang diperkirakan mempengaruhi nilai UAS
| Siswa | IQ (X2) |
Tingkat Kehadiran (%) (X1) |
Nilai UAS (Y) |
|---|---|---|---|
| 1 | 110 | 60 | 65 |
| 2 | 120 | 70 | 70 |
| 3 | 115 | 75 | 75 |
| 4 | 130 | 80 | 75 |
| 5 | 110 | 80 | 80 |
| 6 | 120 | 90 | 80 |
| 7 | 120 | 95 | 85 |
| 8 | 125 | 95 | 95 |
| 9 | 110 | 100 | 90 |
| 10 | 120 | 100 | 98 |
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
Pertanyaan
Berikut adalah pertanyaan untuk data yang telah diberikan :
- Buatlah persamaan regresi linear berganda ! (hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)
- Lakukan Uji-F ! (interpretasikan hasilnya)
- Lakukan Uji-t ! (interpretasikan hasilnya)
- Berapa koefisien determinasinya? Interpretasikan hasil ini!
- Lakukan uji asumsi dan jelaskan hasilnya
Pengerjaan studi kasus
Berikut adalah Model Regresi Linear Berganda
\[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \epsilon\]
1. Buatlah persamaan regresi linear berganda ! (hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)
a). Metode Manual
#1. Input Data
data<-data.frame(
Siswa = 1:10,
X1_Hadir = c(60,70,75,80,80,90,95,95,100,100),
X2_Iq = c(110, 120, 115, 130, 110, 120, 120, 125, 110, 120),
Y_Uas = c(65,70,75,75,80,80,85,95,90,98))
#2. Inisialisasi variabel
Y<-as.matrix(data$Y_Uas,ncol=1)
X1<-(data$X1_Hadir)
X2<-(data$X2_Iq)
#3. Matriks X
X<-cbind(1,X1,X2)
Y_duga<-matrix(Y,ncol=1)
X ; Y## X1 X2
## [1,] 1 60 110
## [2,] 1 70 120
## [3,] 1 75 115
## [4,] 1 80 130
## [5,] 1 80 110
## [6,] 1 90 120
## [7,] 1 95 120
## [8,] 1 95 125
## [9,] 1 100 110
## [10,] 1 100 120
## [,1]
## [1,] 65
## [2,] 70
## [3,] 75
## [4,] 75
## [5,] 80
## [6,] 80
## [7,] 85
## [8,] 95
## [9,] 90
## [10,] 98
## [,1]
## 23.0544545
## X1 0.7372330
## X2 -0.0343275
Hasil :
\[\beta_0=23.0544, \beta_1=0.7372, \beta_2=-0.0343\]
b). Metode lm()
##
## Call:
## lm(formula = Y ~ X2 + X1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.2861 -2.8939 0.0296 1.6791 6.1993
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.05445 25.57161 0.902 0.397247
## X2 -0.03433 0.22051 -0.156 0.880686
## X1 0.73723 0.10918 6.752 0.000264 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
## F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523
Hasil :
Hasil dari metode lm() memiliki kesamaan pada :
\[\beta_0=23.0544, \beta_1=0.7372, \beta_2=-0.0343\]
Interpretasi :
\(\beta_0\)=23.0544, jika \(X_1\) = 0 dan \(X_2\) = 0, maka prediksi nilai dari UAS adalah 23.05
\(\beta_1\) = 0.74, dengan setiap kenaikan sebesar 1% tingkat kehadiran, maka nilai UAS diprediksi akan meningkat sebesar 0.7372 poin
\(\beta_2\) = -0.0343, dengan setiap kenaikan 1 poin IQ, nilai UAS akan diprediksi menurun sebesar 0.03, dengan asumsi tingkat kehadiran (\(X_1\)) dianggap konstan
Kemudian, berdasarkan hasil model
\[ Ŷ=23.0544 + 0.7372X_1 - 0.0343X_2 \]
2. Lakukan Uji-F ! (interpretasikan hasilnya)
#1. Menemukan nilai Y Prediksi dan Y_bar
Y_pred<-X%*%beta
Y_bar<-mean(data$Y_Uas)
#SST, SSR, SSE
SST<-sum((data$Y_Uas-Y_bar)^2)
SSR<-sum((Y_pred-Y_bar)^2)
SSE<-sum((data$Y_Uas-Y_pred)^2)
#Derajat bebas
n<-length(data$Y_Uas)
k<-2
df_reg<-k
df_err<-n-k-1
#MSR & MSE
MSR<-SSR/df_reg
MSE<-SSE/df_err
#F Hitung
F_hit<-MSR/MSE
F_tabel<-qf(0.95,df_reg,df_err)
p_value<-pf(F_hit,df_reg,df_err,lower.tail=FALSE)
F_hit ; F_tabel ; p_value## [1] 23.82303
## [1] 4.737414
## [1] 0.0007522929
Interpretasi
\(H_0:\beta_1=\beta_2=0\) (X1 dan X2 tidak memiliki pengaruh terhadap Y
\(H_1\) : minimal satu \(\beta≠0\)
Keputusan : F-Hitung 23.82 > F-Tabel (4.737) dengan p value (0.00075) < \(\alpha\) (0.05) -> Tolak \(H_0\)
Variabel tingkat kehadiran (X1) dan IQ (X2) secara bersama-sama memiliki pengaruh signifikan terhadap nilai UAS. Model regresi yang terbentuk layak digunakan untuk prediksi
3. Lakukan Uji-t ! (interpretasikan hasilnya)
#1. Mencari varians residual, Varians beta, standar error
sigma2<-MSE # Varians Residual
var_beta<-sigma2*solve(t(X)%*%X) # Varians Beta
std_beta<-sqrt(diag(var_beta)) #Standar error
#2. T hitung dan p-value
t_hit<-beta/std_beta #t hitung
p_t<-2*pt(-abs(t_hit),df_err) #p_value
#3. T tabel
t_tabel<-qt(0.975,df=n-k-1)
t_hit ## [,1]
## 0.9015644
## X1 6.7524718
## X2 -0.1556715
## [,1]
## 0.3972467061
## X1 0.0002644133
## X2 0.8806860631
## [1] 2.364624
interpretasi :
\(\beta_1\) (Kehadiran) : |t-hitung| = 6.75 > t-tabel = 2.36 dengan p-value = 0.0003 < 0.05 -> Tolak \(H_0\). Tingkat kehadiran bergengaruh secara signifikan terhadap nilai UAS Siswa dan merupakan prediktor utama dalam model
\(\beta_2\) (IQ) : |t-hitung| = 0.16 < t-tabel = 2.36 dengan p-value 0.88 > 0.05 -> Gagal tolak \(H_0\). Oleh karena itu IQ tidak berpengaruh signifikan secara parsial terhadap nilai UAS pada model ini.
4. Berapa koefisien determinasinya? Interpretasikan hasil ini!
5. Lakukan uji asumsi dan jelaskan hasilnya
Autokorelasi (Durbin-Watson)
##
## Durbin-Watson test
##
## data: model
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0
Interpretasi
\(H_0\) : tidak ada autokorelasi antar residual
Nilai DW = 2.594 dan p-value 0.8013>0.05, maka gagal tolak \(H_0\). Maka pada residual model regresi tidak terdapat autokorelasi
Heteroskedastisitas (Breusch-Pagan)
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 5.905, df = 2, p-value = 0.05221
Interpretasi
\(H_0\) : ragam error homogen (terdapat homoskedastisitas)
p-value = 0.05522 > 0.05 -> Gagal Tolak \(H_0\)
Asumsi homoskedastisitas Terpenuhi namun berada diambang yang sangat tipis
Multikolinearitas (VIF)
## X2 X1
## 1.055571 1.055571
Interpretasi
VIF kedua variabel = 1.056, sangat jauh dibawah VIF = 10.
Artinya tidak terdapat multikolinearitas . X1 dan X2 bersifat independen satu sama lain.
Normalitas
##
## Shapiro-Wilk normality test
##
## data: residuals(model)
## W = 0.95125, p-value = 0.6833
Interpretasi
\(H_0\) : residual berdistribusi normal
p-value = 0.6833 > 0.05 -> Gagal tolak \(H_0\)
Dengan demikian asumsi normalitas Terpenuhi. Residua model ini menyebar mengikuti distribusi normal, sehingga uji hipotesis (Uji-F dan Uji-t) dapat dipercaya.
Kesimpulan Akhir
Model regresi yang terbentuk adalah \(Ŷ=23.0544 + 0.7372X_1 - 0.0343X_2\) Dimana tingkat kehadiran (X1) memiliki pengaruh dominan pada nilai UAS, sementara IQ (X2) memiliki pengaruh yang sangat kecil.
Uji-F menunjukkan bahwa X1 dan X2 secara bersamaan memiliki pengaruh signifikan terhadap nilai UAS (F=23.82 dan p = 0.00075)
Uji-t menunjukkan bahwa hanya X1 (kehadiran) yang signifikan secara parsial (p = 0.0003), sedangkan X2 (IQ) tidak (p = 0.88).
\(R^2\) = 87.19% menunjukkan seberapa besar keragaman nilai dapat dijelaskan oleh kedua variabel tersebut
Semua asumsi klasik terpenuhi. Menunjukkan bahwa model regresi ini valid dan dapat dipercaya untuk dipakai sebagai alat prediksi nilai UAS