Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

2 TINJAUAN PUSTAKA

2.1 Analisis Regresi

Analisis regresi adalah hubungan yang dinyatakan dalam bentuk persamaan matematik yang menyatakan hubungan fungsional antar variabel-variabel. Regresi dibagi menjadi 2 yaitu :

  1. Analisis regresi linier sederhana

Analisis ini digunakan untuk memperoleh hubungan matematis dalam bentuk persamaan antara variabel dependen variabel independen tunggal. Adapun persamaan regresi linier sederhana adalah sebagai berikut

\(Y = \beta_{0} + \beta_{1}X\)

dimana:

Y = variabel dependen

X = variabel independen

\(\beta_{0}\)= parameter intersep

\(\beta_{1}\) = parameter koefisien regresi

Persamaan model regresi sederhana hanya memungkinkan ketika pengaruh yang ada hanya dari variabel X terhadap variabel Y. Jadi harga b merupakan fungsi dari koefisien korelasi. Jika koefisien korelasi tinggi, maka harga b juga besar, begitupun sebaliknya. Jika koefisien korelasi bernilai positif, maka b juga bernilai positif, begitupun sebaliknya.

  1. Analisis regresi linier berganda

Analisis ini digunakan untuk memprediksi perubahan nilai variabel tertentu bila variabel lain berubah. Dikatakan regresi berganda karena banyaknya variabel independen sebagai prediktor lebih dari satu, maka persamaan regresi linier berganda sebagai berikut

\(Y = \beta_{0} + \beta_{1}X_{1} + … + \beta_{k}X_{k}\)

dengan:

Y = variabel dependen

\(X_{1}, …, X_{k}\) = variabel independen

\(\beta_{0}, \beta_{1}, …, \beta_{k}\) = koefisien regresi

Tujuan analisis regresi linier adalah untuk mengukur intensitas hubungan antara variabel dan memuat pendugaan nilai Y dan nilai X. Bentuk umum persamaan regresi linier berganda mencakup dua atau lebih variabel.

2.2 Asumsi

2.2.1 Normalitas Galat

Asumsi normalitas galat menyatakan bahwa galat (residual) dari model regresi atau data pengamatan di dalam sampel terdistribusi secara normal. Galat merujuk pada perbedaan antara nilai pengamatan aktual dan nilai yang diprediksi oleh model regresi. Dalam konteks ini, normalitas galat berarti bahwa galat-galat tersebut harus terdistribusi secara simetris di sekitar nilai nol, dengan sebagian besar galat berada di sekitar nol dan semakin jarang terdapat galat yang jauh dari nol. Asumsi normalitas galat pada analisis regresi berarti bahwa galat (residual) yang dihasilkan dari model regresi atau data pengamatan harus terdistribusi secara normal di dalam sampel. Jika asumsi ini tidak terpenuhi, artinya galat-galat tersebut tidak terdistribusi secara normal, maka hasil analisis regresi bisa menjadi tidak valid. Konsekuensinya, kesimpulan yang diambil dari analisis tersebut dapat menjadi tidak akurat atau mengarah pada kesalahan interpretasi.

Untuk memeriksa normalitas galat, dapat digunakan beberapa metode statistik, seperti uji Kolmogorov-Smirnov, uji Shapiro-Wilk, atau uji Lilliefors. Hasil dari uji normalitas ini dapat memberikan informasi apakah galat terdistribusi secara normal atau tidak.

2.2.2 Non Multikolinieritas

Asumsi non-multikolinieritas menyatakan bahwa tidak ada hubungan linier sempurna antara variabel prediktor dalam model regresi. Multikolinieritas terjadi ketika terdapat korelasi tinggi antara dua atau lebih variabel prediktor dalam model regresi. Hal ini berarti bahwa ada hubungan linier yang kuat antara variabel prediktor yang dapat dijelaskan oleh variabel prediktor lainnya.

Multikolinieritas dapat menyebabkan beberapa masalah dalam analisis regresi. Salah satunya adalah kesulitan dalam menentukan kontribusi masing-masing variabel prediktor terhadap variabel respons. Ketika variabel prediktor saling berkorelasi tinggi, sulit untuk membedakan efek individu dari setiap variabel prediktor terhadap variabel respons. Selain itu, multikolinieritas juga dapat mengakibatkan koefisien regresi menjadi tidak stabil, dan interpretasi hasil regresi dapat menjadi tidak reliabel.

Pendeteksian multikolinieritas biasanya dilakukan dengan menggunakan metode-metode statistik seperti korelasi antar variabel prediktor, variance inflation factor (VIF), atau matriks korelasi. Korelasi yang tinggi antara variabel prediktor menunjukkan adanya potensi multikolinieritas. VIF mengukur seberapa besar varians dari estimasi koefisien regresi yang meningkat akibat multikolinieritas. Nilai VIF yang tinggi menunjukkan adanya multikolinieritas.

2.2.3 Homoskedastisitas

Asumsi homoskedastisitas menyiratkan bahwa variansi galat (residual) dalam model regresi adalah konstan di semua tingkat nilai variabel prediktor. Dengan kata lain, variasi galat tidak bergantung pada nilai-nilai variabel prediktor. Variabilitas galat harus seragam di seluruh rentang nilai variabel prediktor.

Asumsi homoskedastisitas penting karena metode regresi yang umum digunakan, seperti metode kuadrat terkecil biasa (OLS), didasarkan pada asumsi ini. Jika asumsi homoskedastisitas tidak terpenuhi, maka hasil analisis regresi dapat menjadi tidak konsisten, koefisien standar yang dihasilkan tidak dapat diandalkan, dan uji statistik menjadi tidak valid.

2.2.4 2.2.4 Non Autokorelasi

Asumsi non autokorelasi, juga dikenal sebagai asumsi ketiadaan korelasi residual, merupakan asumsi yang menyatakan bahwa tidak ada korelasi sistematis antara galat dalam model regresi. Dalam kata lain, galat pada suatu observasi tidak berkorelasi dengan galat pada observasi lainnya.

Jika terdapat autokorelasi dalam model regresi, hal ini dapat menyebabkan beberapa masalah, seperti estimasi koefisien regresi yang tidak efisien, interval kepercayaan yang terlalu sempit, dan uji hipotesis yang tidak valid. Dalam konteks analisis regresi, autokorelasi sering terjadi ketika ada pola ketergantungan waktu antara residual, seperti keberadaan pola tertentu dalam deret waktu residual.

Salah satu metode yang dapat digunakan untuk memeriksa asumsi non autokorelasi adalah menggunakan uji Durbin-Watson. Uji ini menguji apakah terdapat korelasi positif atau negatif dalam residual pada lag-lag tertentu. Jika nilai uji Durbin-Watson mendekati 2, maka asumsi non-autokorelasi terpenuhi.

3 SOURCE CODE

3.1 Library

> library(lmtest)
> library(car)

3.2 Data

> tingkat_kehadiran<-c(60,70,75,80,80,90,95,95,100,100)
> IQ<-c(110,120,115,130,110,120,120,125,110,120)
> UAS<-c(65,70,75,75,80,80,85,95,90,98)
> X<-matrix(c(rep(1,10),tingkat_kehadiran,IQ),nrow = 10)
> X
      [,1] [,2] [,3]
 [1,]    1   60  110
 [2,]    1   70  120
 [3,]    1   75  115
 [4,]    1   80  130
 [5,]    1   80  110
 [6,]    1   90  120
 [7,]    1   95  120
 [8,]    1   95  125
 [9,]    1  100  110
[10,]    1  100  120
> df<-data.frame(X1=tingkat_kehadiran,X2=IQ,Y=UAS)
> df
    X1  X2  Y
1   60 110 65
2   70 120 70
3   75 115 75
4   80 130 75
5   80 110 80
6   90 120 80
7   95 120 85
8   95 125 95
9  100 110 90
10 100 120 98

3.3 Analisis Regresi

> reg<-lm(Y~X1+X2, data=df)
> reg

Call:
lm(formula = Y ~ X1 + X2, data = df)

Coefficients:
(Intercept)           X1           X2  
   23.05445      0.73723     -0.03433  

3.4 Asumsi

> #Normalitas Galat
> Y_hat<-X%*%reg$coefficients
> Y_hat
          [,1]
 [1,] 63.51241
 [2,] 70.54147
 [3,] 74.39927
 [4,] 77.57052
 [5,] 78.25707
 [6,] 85.28613
 [7,] 88.97229
 [8,] 88.80065
 [9,] 93.00173
[10,] 92.65846
> sisa<-Y-Y_hat
Error in eval(expr, envir, enclos): object 'Y' not found
> sisa
Error in eval(expr, envir, enclos): object 'sisa' not found
> shapiro.test(sisa)
Error in stopifnot(is.numeric(x)): object 'sisa' not found
> #Homogenitas Ragam Galat
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 5.905, df = 2, p-value = 0.05221
> #Non Autokorelasi
> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 2.594, p-value = 0.8013
alternative hypothesis: true autocorrelation is greater than 0
> #Non Multikolinieritas
> vif(reg)
      X1       X2 
1.055571 1.055571 

4 HASIL DAN PEMBAHASAN

4.1 Analisis Regresi

Dari hasil analisis regresi, diperoleh \(\beta_{0} = 23.05445\), \(\beta_{1} = 0.73723\), dan \(\beta_{2} = -0.03433\) sehingga persamaan regresinya adalah \[Y = 23.05445 + 0.73723X_{1} - 0.03433X_{2}\]

4.2 Asumsi

4.2.1 Normalitas Galat

Dari hasil uji normalitas shapiro_wilk, diperoleh \(Pvalue = 0.4571\). Nilai p tersebut cukup besar, sehingga \(H_{0}\) tentang normalitas galat tidak dapat ditolak. Asumsi normalitas galat masih terpenuhi.

4.2.2 Homogenitas Ragam Galat

Dari hasil uji Breusch_Pagan, diperoleh \(Pvalue = 0.05221\). Nilai p tersebut lebih besar dari \(\alpha=0.05\), maka \(H_{0}\) diterima. Artinya, tidak terdapat pelanggaran asumsi homogenitas ragam galat.

4.2.3 Non Autokorelasi

Dari hasil uji Durbin-Watson, diperoleh \(Pvalue = 0.8013\). Nilai p tersebut cukup besar, sehingga \(H_{0}\) diterima. Artinya, tidak ada masalah autokorelasi.

4.2.4 Non Multikolinieritas

Dari hasil uji multikolinieritas, diperoleh \(VIF_{X_{1}} = 1.055571\) dan \(VIF_{X_{2}} = 1.055571\) . Nilai keduanya di bawah 10, artinya tidak terdapat multikolinieritas.

5 KESIMPULAN

Dari hasil analisis regresi, dapat ditarik kesimpulan yang dapat diinterpretasikan sebagai berikut:

Dari hasil uji asumsi, dapat disimpulkan bahwa galat pada regresi tersebut berdistribusi normal, tidak terdapat pelanggaran homogenitas ragam galat, tidak ada masalah autokorelasi, serta tidak terdapat multikolinieritas.

6 DAFTAR PUSAKA