Tugas Pengantar Model Linier

Data

Diberikan data tentang IQ dan tingkat kehadiran sepuluh siswa di kelas yang diperkirakan mempengaruhi nilai UAS

Siswa	IQ (X2)	Tingkat Kehadiran (%) (X1)	Nilai UAS (Y)
1	110	60	65
2	120	70	70
3	115	75	75
4	130	80	75
5	110	80	80
6	120	90	80
7	120	95	85
8	125	95	95
9	110	100	90
10	120	100	98

summary(cars)

##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Pertanyaan

Berikut adalah pertanyaan untuk data yang telah diberikan :

Buatlah persamaan regresi linear berganda ! (hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)
Lakukan Uji-F ! (interpretasikan hasilnya)
Lakukan Uji-t ! (interpretasikan hasilnya)
Berapa koefisien determinasinya? Interpretasikan hasil ini!
Lakukan uji asumsi dan jelaskan hasilnya

Pengerjaan studi kasus

Berikut adalah Model Regresi Linear Berganda

\[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \epsilon\]

1. Buatlah persamaan regresi linear berganda ! (hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)

a). Metode Manual

#1. Input Data
data<-data.frame(
  Siswa = 1:10,
  X1_Hadir = c(60,70,75,80,80,90,95,95,100,100),
  X2_Iq = c(110, 120, 115, 130, 110, 120, 120, 125, 110, 120),
  Y_Uas = c(65,70,75,75,80,80,85,95,90,98))
  
  
#2. Inisialisasi variabel
Y<-as.matrix(data$Y_Uas,ncol=1)
X1<-(data$X1_Hadir)
X2<-(data$X2_Iq)
  
#3. Matriks X
X<-cbind(1,X1,X2)
Y_duga<-matrix(Y,ncol=1)
X ; Y

##          X1  X2
##  [1,] 1  60 110
##  [2,] 1  70 120
##  [3,] 1  75 115
##  [4,] 1  80 130
##  [5,] 1  80 110
##  [6,] 1  90 120
##  [7,] 1  95 120
##  [8,] 1  95 125
##  [9,] 1 100 110
## [10,] 1 100 120

##       [,1]
##  [1,]   65
##  [2,]   70
##  [3,]   75
##  [4,]   75
##  [5,]   80
##  [6,]   80
##  [7,]   85
##  [8,]   95
##  [9,]   90
## [10,]   98

#4. Hitung Beta (OLS)
beta <- solve(t(X) %*% X) %*% t(X) %*% Y_duga
beta

##          [,1]
##    23.0544545
## X1  0.7372330
## X2 -0.0343275

Hasil :

\[\beta_0=23.0544, \beta_1=0.7372, \beta_2=-0.0343\]

b). Metode lm()

model<-lm(Y~X2+X1)
summary(model)

## 
## Call:
## lm(formula = Y ~ X2 + X1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## X2          -0.03433    0.22051  -0.156 0.880686    
## X1           0.73723    0.10918   6.752 0.000264 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Hasil :

Hasil dari metode lm() memiliki kesamaan pada :

\[\beta_0=23.0544, \beta_1=0.7372, \beta_2=-0.0343\]

Interpretasi :

\(\beta_0\)=23.0544, jika \(X_1\) = 0 dan \(X_2\) = 0, maka prediksi nilai dari UAS adalah 23.05
\(\beta_1\) = 0.74, dengan setiap kenaikan sebesar 1% tingkat kehadiran, maka nilai UAS diprediksi akan meningkat sebesar 0.7372 poin
\(\beta_2\) = -0.0343, dengan setiap kenaikan 1 poin IQ, nilai UAS akan diprediksi menurun sebesar 0.03, dengan asumsi tingkat kehadiran (\(X_1\)) dianggap konstan

Kemudian, berdasarkan hasil model

\[ Ŷ=23.0544 + 0.7372X_1 - 0.0343X_2 \]

2. Lakukan Uji-F ! (interpretasikan hasilnya)

#1. Menemukan nilai Y Prediksi dan Y_bar
Y_pred<-X%*%beta
Y_bar<-mean(data$Y_Uas)
#SST, SSR, SSE
SST<-sum((data$Y_Uas-Y_bar)^2)
SSR<-sum((Y_pred-Y_bar)^2)
SSE<-sum((data$Y_Uas-Y_pred)^2)
#Derajat bebas
n<-length(data$Y_Uas)
k<-2
df_reg<-k
df_err<-n-k-1
#MSR & MSE 
MSR<-SSR/df_reg
MSE<-SSE/df_err
#F Hitung
F_hit<-MSR/MSE
F_tabel<-qf(0.95,df_reg,df_err)
p_value<-pf(F_hit,df_reg,df_err,lower.tail=FALSE)


F_hit ; F_tabel ; p_value

## [1] 23.82303

## [1] 4.737414

## [1] 0.0007522929

Interpretasi

\(H_0:\beta_1=\beta_2=0\) (X1 dan X2 tidak memiliki pengaruh terhadap Y
\(H_1\) : minimal satu \(\beta≠0\)

Keputusan : F-Hitung 23.82 > F-Tabel (4.737) dengan p value (0.00075) < \(\alpha\) (0.05) -> Tolak \(H_0\)

Variabel tingkat kehadiran (X1) dan IQ (X2) secara bersama-sama memiliki pengaruh signifikan terhadap nilai UAS. Model regresi yang terbentuk layak digunakan untuk prediksi

3. Lakukan Uji-t ! (interpretasikan hasilnya)

#1. Mencari varians residual, Varians beta, standar error
sigma2<-MSE # Varians Residual
var_beta<-sigma2*solve(t(X)%*%X) # Varians Beta
std_beta<-sqrt(diag(var_beta)) #Standar error

#2. T hitung dan p-value
t_hit<-beta/std_beta #t hitung
p_t<-2*pt(-abs(t_hit),df_err) #p_value

#3. T tabel
t_tabel<-qt(0.975,df=n-k-1)

t_hit

##          [,1]
##     0.9015644
## X1  6.7524718
## X2 -0.1556715

p_t

##            [,1]
##    0.3972467061
## X1 0.0002644133
## X2 0.8806860631

t_tabel

## [1] 2.364624

interpretasi :

\(\beta_1\) (Kehadiran) : |t-hitung| = 6.75 > t-tabel = 2.36 dengan p-value = 0.0003 < 0.05 -> Tolak \(H_0\). Tingkat kehadiran bergengaruh secara signifikan terhadap nilai UAS Siswa dan merupakan prediktor utama dalam model
\(\beta_2\) (IQ) : |t-hitung| = 0.16 < t-tabel = 2.36 dengan p-value 0.88 > 0.05 -> Gagal tolak \(H_0\). Oleh karena itu IQ tidak berpengaruh signifikan secara parsial terhadap nilai UAS pada model ini.

4. Berapa koefisien determinasinya? Interpretasikan hasil ini!

Manual

SST<-sum((data$Y_Uas-Y_bar)^2)
SSR<-sum((Y_pred-Y_bar)^2)
SSE<-sum((data$Y_Uas-Y_pred)^2)

R2<-SSR/SST
R2

## [1] 0.8719029

Function R

summary(model)$r.squared

## [1] 0.8719029

Interpretasi :

Didapatkan hasil \(R^2\) sebesar 0.8719 atau 87.19% keragaman nilai UAS dapat dijelaskan oleh variabel tingkat kehadiran (X1) dan IQ (X2) secara bersama-sama. Sisanya 12.81% dijelaskan oleh faktor lain

5. Lakukan uji asumsi dan jelaskan hasilnya

Autokorelasi (Durbin-Watson)

library(lmtest)
dwtest(model)

## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0

Interpretasi

\(H_0\) : tidak ada autokorelasi antar residual
Nilai DW = 2.594 dan p-value 0.8013>0.05, maka gagal tolak \(H_0\). Maka pada residual model regresi tidak terdapat autokorelasi

Heteroskedastisitas (Breusch-Pagan)

bptest(model)

## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.905, df = 2, p-value = 0.05221

Interpretasi

\(H_0\) : ragam error homogen (terdapat homoskedastisitas)
p-value = 0.05522 > 0.05 -> Gagal Tolak \(H_0\)
Asumsi homoskedastisitas Terpenuhi namun berada diambang yang sangat tipis

Multikolinearitas (VIF)

library(car)
vif(model)

##       X2       X1 
## 1.055571 1.055571

Interpretasi

VIF kedua variabel = 1.056, sangat jauh dibawah VIF = 10.
Artinya tidak terdapat multikolinearitas . X1 dan X2 bersifat independen satu sama lain.

Normalitas

shapiro.test(residuals(model))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.95125, p-value = 0.6833

Interpretasi

\(H_0\) : residual berdistribusi normal
p-value = 0.6833 > 0.05 -> Gagal tolak \(H_0\)
Dengan demikian asumsi normalitas Terpenuhi. Residua model ini menyebar mengikuti distribusi normal, sehingga uji hipotesis (Uji-F dan Uji-t) dapat dipercaya.

Kesimpulan Akhir

Model regresi yang terbentuk adalah \(Ŷ=23.0544 + 0.7372X_1 - 0.0343X_2\) Dimana tingkat kehadiran (X1) memiliki pengaruh dominan pada nilai UAS, sementara IQ (X2) memiliki pengaruh yang sangat kecil.
Uji-F menunjukkan bahwa X1 dan X2 secara bersamaan memiliki pengaruh signifikan terhadap nilai UAS (F=23.82 dan p = 0.00075)
Uji-t menunjukkan bahwa hanya X1 (kehadiran) yang signifikan secara parsial (p = 0.0003), sedangkan X2 (IQ) tidak (p = 0.88).
\(R^2\) = 87.19% menunjukkan seberapa besar keragaman nilai dapat dijelaskan oleh kedua variabel tersebut
Semua asumsi klasik terpenuhi. Menunjukkan bahwa model regresi ini valid dan dapat dipercaya untuk dipakai sebagai alat prediksi nilai UAS

Siswa	IQ (X2)	Tingkat Kehadiran (%) (X1)	Nilai UAS (Y)
1	110	60	65
2	120	70	70
3	115	75	75
4	130	80	75
5	110	80	80
6	120	90	80
7	120	95	85
8	125	95	95
9	110	100	90
10	120	100	98

Siswa	IQ (X2)	Tingkat Kehadiran (%) (X1)	Nilai UAS (Y)
1	110	60	65
2	120	70	70
3	115	75	75
4	130	80	75
5	110	80	80
6	120	90	80
7	120	95	85
8	125	95	95
9	110	100	90
10	120	100	98

Siswa	IQ (X2)	Tingkat Kehadiran (%) (X1)	Nilai UAS (Y)
1	110	60	65
2	120	70	70
3	115	75	75
4	130	80	75
5	110	80	80
6	120	90	80
7	120	95	85
8	125	95	95
9	110	100	90
10	120	100	98