Tugas Pengantar Model Linier

Data

Diberikan data tentang IQ dan tingkat kehadiran sepuluh siswa di kelas yang diperkirakan mempengaruhi nilai UAS

Siswa IQ
(X2)
Tingkat Kehadiran (%)
(X1)
Nilai UAS
(Y)
1 110 60 65
2 120 70 70
3 115 75 75
4 130 80 75
5 110 80 80
6 120 90 80
7 120 95 85
8 125 95 95
9 110 100 90
10 120 100 98
summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Pertanyaan

Berikut adalah pertanyaan untuk data yang telah diberikan :

  1. Buatlah persamaan regresi linear berganda ! (hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)
  2. Lakukan Uji-F ! (interpretasikan hasilnya)
  3. Lakukan Uji-t ! (interpretasikan hasilnya)
  4. Berapa koefisien determinasinya? Interpretasikan hasil ini!
  5. Lakukan uji asumsi dan jelaskan hasilnya

Pengerjaan studi kasus

Berikut adalah Model Regresi Linear Berganda

\[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \epsilon\]

1. Buatlah persamaan regresi linear berganda ! (hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)

a). Metode Manual

#1. Input Data
data<-data.frame(
  Siswa = 1:10,
  X1_Hadir = c(60,70,75,80,80,90,95,95,100,100),
  X2_Iq = c(110, 120, 115, 130, 110, 120, 120, 125, 110, 120),
  Y_Uas = c(65,70,75,75,80,80,85,95,90,98))
  
  
#2. Inisialisasi variabel
Y<-as.matrix(data$Y_Uas,ncol=1)
X1<-(data$X1_Hadir)
X2<-(data$X2_Iq)
  
#3. Matriks X
X<-cbind(1,X1,X2)
Y_duga<-matrix(Y,ncol=1)
X ; Y
##          X1  X2
##  [1,] 1  60 110
##  [2,] 1  70 120
##  [3,] 1  75 115
##  [4,] 1  80 130
##  [5,] 1  80 110
##  [6,] 1  90 120
##  [7,] 1  95 120
##  [8,] 1  95 125
##  [9,] 1 100 110
## [10,] 1 100 120
##       [,1]
##  [1,]   65
##  [2,]   70
##  [3,]   75
##  [4,]   75
##  [5,]   80
##  [6,]   80
##  [7,]   85
##  [8,]   95
##  [9,]   90
## [10,]   98
#4. Hitung Beta (OLS)
beta <- solve(t(X) %*% X) %*% t(X) %*% Y_duga
beta
##          [,1]
##    23.0544545
## X1  0.7372330
## X2 -0.0343275

Hasil :

\[\beta_0=23.0544, \beta_1=0.7372, \beta_2=-0.0343\]

b). Metode lm()

model<-lm(Y~X2+X1)
summary(model)
## 
## Call:
## lm(formula = Y ~ X2 + X1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## X2          -0.03433    0.22051  -0.156 0.880686    
## X1           0.73723    0.10918   6.752 0.000264 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Hasil :

Hasil dari metode lm() memiliki kesamaan pada :

\[\beta_0=23.0544, \beta_1=0.7372, \beta_2=-0.0343\]

Interpretasi :

  • \(\beta_0\)=23.0544, jika \(X_1\) = 0 dan \(X_2\) = 0, maka prediksi nilai dari UAS adalah 23.05

  • \(\beta_1\) = 0.74, dengan setiap kenaikan sebesar 1% tingkat kehadiran, maka nilai UAS diprediksi akan meningkat sebesar 0.7372 poin

  • \(\beta_2\) = -0.0343, dengan setiap kenaikan 1 poin IQ, nilai UAS akan diprediksi menurun sebesar 0.03, dengan asumsi tingkat kehadiran (\(X_1\)) dianggap konstan

Kemudian, berdasarkan hasil model

\[ Ŷ=23.0544 + 0.7372X_1 - 0.0343X_2 \]

2. Lakukan Uji-F ! (interpretasikan hasilnya)

#1. Menemukan nilai Y Prediksi dan Y_bar
Y_pred<-X%*%beta
Y_bar<-mean(data$Y_Uas)
#SST, SSR, SSE
SST<-sum((data$Y_Uas-Y_bar)^2)
SSR<-sum((Y_pred-Y_bar)^2)
SSE<-sum((data$Y_Uas-Y_pred)^2)
#Derajat bebas
n<-length(data$Y_Uas)
k<-2
df_reg<-k
df_err<-n-k-1
#MSR & MSE 
MSR<-SSR/df_reg
MSE<-SSE/df_err
#F Hitung
F_hit<-MSR/MSE
F_tabel<-qf(0.95,df_reg,df_err)
p_value<-pf(F_hit,df_reg,df_err,lower.tail=FALSE)


F_hit ; F_tabel ; p_value
## [1] 23.82303
## [1] 4.737414
## [1] 0.0007522929

Interpretasi

  • \(H_0:\beta_1=\beta_2=0\) (X1 dan X2 tidak memiliki pengaruh terhadap Y

  • \(H_1\) : minimal satu \(\beta≠0\)

Keputusan : F-Hitung 23.82 > F-Tabel (4.737) dengan p value (0.00075) < \(\alpha\) (0.05) -> Tolak \(H_0\)

Variabel tingkat kehadiran (X1) dan IQ (X2) secara bersama-sama memiliki pengaruh signifikan terhadap nilai UAS. Model regresi yang terbentuk layak digunakan untuk prediksi

3. Lakukan Uji-t ! (interpretasikan hasilnya)

#1. Mencari varians residual, Varians beta, standar error
sigma2<-MSE # Varians Residual
var_beta<-sigma2*solve(t(X)%*%X) # Varians Beta
std_beta<-sqrt(diag(var_beta)) #Standar error

#2. T hitung dan p-value
t_hit<-beta/std_beta #t hitung
p_t<-2*pt(-abs(t_hit),df_err) #p_value

#3. T tabel
t_tabel<-qt(0.975,df=n-k-1)

t_hit 
##          [,1]
##     0.9015644
## X1  6.7524718
## X2 -0.1556715
p_t
##            [,1]
##    0.3972467061
## X1 0.0002644133
## X2 0.8806860631
t_tabel
## [1] 2.364624

interpretasi :

  • \(\beta_1\) (Kehadiran) : |t-hitung| = 6.75 > t-tabel = 2.36 dengan p-value = 0.0003 < 0.05 -> Tolak \(H_0\). Tingkat kehadiran bergengaruh secara signifikan terhadap nilai UAS Siswa dan merupakan prediktor utama dalam model

  • \(\beta_2\) (IQ) : |t-hitung| = 0.16 < t-tabel = 2.36 dengan p-value 0.88 > 0.05 -> Gagal tolak \(H_0\). Oleh karena itu IQ tidak berpengaruh signifikan secara parsial terhadap nilai UAS pada model ini.

4. Berapa koefisien determinasinya? Interpretasikan hasil ini!

Manual

SST<-sum((data$Y_Uas-Y_bar)^2)
SSR<-sum((Y_pred-Y_bar)^2)
SSE<-sum((data$Y_Uas-Y_pred)^2)

R2<-SSR/SST
R2
## [1] 0.8719029

Function R

summary(model)$r.squared
## [1] 0.8719029

Interpretasi :

Didapatkan hasil \(R^2\) sebesar 0.8719 atau 87.19% keragaman nilai UAS dapat dijelaskan oleh variabel tingkat kehadiran (X1) dan IQ (X2) secara bersama-sama. Sisanya 12.81% dijelaskan oleh faktor lain

5. Lakukan uji asumsi dan jelaskan hasilnya

Autokorelasi (Durbin-Watson)

library(lmtest)
dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0

Interpretasi

  • \(H_0\) : tidak ada autokorelasi antar residual

  • Nilai DW = 2.594 dan p-value 0.8013>0.05, maka gagal tolak \(H_0\). Maka pada residual model regresi tidak terdapat autokorelasi

Heteroskedastisitas (Breusch-Pagan)

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.905, df = 2, p-value = 0.05221

Interpretasi

  • \(H_0\) : ragam error homogen (terdapat homoskedastisitas)

  • p-value = 0.05522 > 0.05 -> Gagal Tolak \(H_0\)

  • Asumsi homoskedastisitas Terpenuhi namun berada diambang yang sangat tipis

Multikolinearitas (VIF)

library(car)
vif(model)
##       X2       X1 
## 1.055571 1.055571

Interpretasi

  • VIF kedua variabel = 1.056, sangat jauh dibawah VIF = 10.

  • Artinya tidak terdapat multikolinearitas . X1 dan X2 bersifat independen satu sama lain.

Normalitas

shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.95125, p-value = 0.6833

Interpretasi

  • \(H_0\) : residual berdistribusi normal

  • p-value = 0.6833 > 0.05 -> Gagal tolak \(H_0\)

  • Dengan demikian asumsi normalitas Terpenuhi. Residua model ini menyebar mengikuti distribusi normal, sehingga uji hipotesis (Uji-F dan Uji-t) dapat dipercaya.

Kesimpulan Akhir

  • Model regresi yang terbentuk adalah \(Ŷ=23.0544 + 0.7372X_1 - 0.0343X_2\) Dimana tingkat kehadiran (X1) memiliki pengaruh dominan pada nilai UAS, sementara IQ (X2) memiliki pengaruh yang sangat kecil.

  • Uji-F menunjukkan bahwa X1 dan X2 secara bersamaan memiliki pengaruh signifikan terhadap nilai UAS (F=23.82 dan p = 0.00075)

  • Uji-t menunjukkan bahwa hanya X1 (kehadiran) yang signifikan secara parsial (p = 0.0003), sedangkan X2 (IQ) tidak (p = 0.88).

  • \(R^2\) = 87.19% menunjukkan seberapa besar keragaman nilai dapat dijelaskan oleh kedua variabel tersebut

  • Semua asumsi klasik terpenuhi. Menunjukkan bahwa model regresi ini valid dan dapat dipercaya untuk dipakai sebagai alat prediksi nilai UAS