Library:
> install.packages("knitr")
> install.packages("rmarkdown")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror> install.packages("prettydoc")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror> install.packages("equatiomatic")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror1 PENDAHULUAN
1.1 Latar Belakang
Analisis regresi linier merupakan suatu model statistik yang biasa digunakan untuk mendefinisikan atau memodelkan suatu hubungan antara satu variabel dependen dengan satu atau lebih variabel independen. Metode ini populer karena sederhana dan mampu untuk memberikan pemahaman yang tentang hubungan antara variabel.
Regresi linier didasarkan pada beberapa asumsi yang penting untuk dapat memastikan validitas dan keandalan pada hasil analisis.
asumsi linearitas mengharuskan bahwa terdapat hubungan linier antara variabel dependen dan independen.
asumsi independensi menyatakan bahwa observasi dalam dataset adalah independen satu sama lain.
asumsi homoskedastisitas mengharuskan bahwa variabilitas error adalah konstan di seluruh rentang variabel independen.
distribusi error harus normal, yang dikenal dengan asumsi normalitas.
tidak boleh ada multikolinearitas sempurna antara variabel independen, yang berarti bahwa variabel-variabel independen tidak boleh sangat berkorelasi satu sama lain.
Memenuhi asumsi-asumsi ini sangat penting karena pelanggaran terhadap salah satu asumsi dapat menyebabkan hasil analisis menjadi tidak valid dan menyesatkan. Oleh karena itu, sebelum melakukan interpretasi hasil regresi linier, penting untuk melakukan analisis diagnostik untuk memastikan bahwa semua asumsi telah dipenuhi.
1.2 Tinjauan Pustaka
1.2.1 Analisis Regresi Linier
Analisis regresi digunakan untuk menjelaskan atau memodelkan hubungan antar variabel. Variabel y sebagai variabel respon atau variabel penjelas dan juga variabel x sebagai variabel prediktor atau variabel penjelas. Apabila terdapat lebih dari satu variabel prediktor disebut analisis regresi berganda. Analisis regresi ini disebut berganda karena beberapa variabel prediktor diterapkan pada variabel respon.
Terdapat 2 macam analisis regresi linier yaitu sederhana dan berganda
Analisis regresi linier sederhana
Analisis regresi linier sederhana adalah hubungan secara linier antara satu variabel dependen (Y) dan satu variabel independen (x). Analisis ini memperlihatkan pengaruh satu variabel independen terhadap satu variabel dependen, apabila terdapat perubahan nilai pada variabel independen.
Rumus yang digunakan \[ Y=\beta_{0}+\beta_{1}X+e \] Keterangan:
\(Y\) = Variabel Respons
\(X\) = Variabel Prediktor
\(\beta_{0}\) = Parameter Intersep
\(\beta_{1}\) = Koefisien Regresi
\(e\) = Standard Error
- Analisis regresi linier Berganda Analisis regresi linier berganda adalah hubungan secara linier antara satu variabel dependen (Y) dan dua atau lebih variabel independen (x). Analisis ini memperlihatkan pengaruh satu variabel independen terhadap satu variabel dependen, apabila terdapat perubahan nilai pada variabel independen.
\[ Y=\beta_{0}+\beta_{1}X_{1}+...+\beta_{k}X_{k}+e \] Keterangan:
\(Y\) = Variabel Respons
\(X_{1},...,X_{k}\) = Variabel Prediktor
\(\beta_{0},...,\beta_{k}\) = Koefisien regresi
\(e\) = Standard Error
1.2.2 Asumsi Normalitas
Uji asumsi normalitas digunakan untuk menunjukkan apakah error (sisa) mengikuti distribusi normal. Asumsi ini menyatakan bahwa kesalahan atau cacat pada model berdistribusi normal atau hampir normal. Artinya rata-rata kesalahan harus mendekati nol dan variansnya konstan di semua level variabel independen. Jika asumsi kesalahan terpenuhi, maka estimasi parameter regresi dapat diyakini efisien dan benar. Beberapa metode dapat digunakan untuk menguji asumsi normalitas ini, seperti uji Shapiro – Wilk, uji Jarque Bera, dan uji Kolmogorov – Smirnov.
1.2.3 Asumsi Homoskedastisitas
Uji asumsi homoskedastisitas digunakan untuk mengetahui apakah terdapat kesamaan varians dari residu pengamatan. Asumsi homoskedastisitas merupakan asumsi yang menyatakan bahwa varians kesalahan pemodelan regresi harus konstan pada seluruh level variabel independen. Jika asumsi homoskedastisitas terpenuhi maka hasil estimasi parameter regresi konsisten dan efisien. Pelanggaran terhadap asumsi ini disebut masalah heteroskedastisitas.
1.2.4 Asumsi Non Multikolinieritas
Uji multikolinearitas digunakan untuk memeriksa apakah terdapat korelasi antar variabel independen dalam suatu model regresi. Asumsi ini cukup penting dalam analisis regresi berganda. Multikolinearitas terjadi ketika terdapat korelasi yang tinggi antara dua atau lebih variabel independen dalam suatu model regresi. Korelasi ini dapat menutupi pengaruh masing-masing variabel independen terhadap variabel dependen sehingga sulit untuk menentukan kontribusi masing-masing variabel independen. Model regresi yang baik berarti tidak terdapat korelasi yang tinggi antar variabel independen.
1.2.5 Asumsi Non-Autokorelasi
Asumsi non autokorelasi merupakan asumsi yang digunakan untuk menyatakan tidak adanya korelasi antar error atau kesalahan pada waktu yang berbeda dalam suatu model regresi. Autokorelasi menunjukkan adanya pola pada data yang tidak dijelaskan oleh variabel independen dalam model regresi. Pelanggaran terhadap asumsi ini disebut masalah autokorelasi, yang disebabkan oleh kesalahan spesifik model atau penghilangan variabel prediktor penting..
1.2.6 Uji R-square
Uji R-square merupakan suatu metode yang menyatakan seberapa baik garis regresi mencocokan data. Nilai R square berkisar 0-1. Dengan nilai yang kecil atau mendekati nol maka kemampuan dalam menjelaskan variabel dependen amat terbatas. Sebaliknya, nilai yang mendekati satu berarti variabel independen mampu memberikan penjelasan variase variabel dependen yang ada.
1.2.7 Uji F
Uji F dalam pengujian regresi merupakan metode statistik yang digunakan untuk mengetahui apakah model regresi yang digunakan memberikan informasi yang signifikan secara statistik. Hal ini terutama digunakan dalam regresi linier untuk menguji hipotesis bahwa semua koefisien regresi dalam model adalah nol, artinya tidak ada hubungan linier antara variabel independen dan variabel dependen. Ketika mempertimbangkan signifikansi model regresi secara keseluruhan, penting untuk dicatat bahwa nilai F yang tinggi menunjukkan bahwa setidaknya satu variabel independen mempunyai pengaruh signifikan terhadap variabel dependen.Nilai F yang rendah berarti model regresi tidak signifikan, yaitu tidak ada variabel independen yang mempengaruhi variabel dependen secara signifikan.
1.3 Data
Contoh data yang digunakan
| Nilai UAS (Y) | IQ (X1) | Tingkat Kehadiran (%) (X2) |
|---|---|---|
| 65 | 110 | 60 |
| 70 | 120 | 70 |
| 75 | 115 | 75 |
| 75 | 130 | 80 |
| 80 | 110 | 80 |
| 80 | 120 | 90 |
| 85 | 120 | 95 |
| 95 | 125 | 95 |
| 90 | 110 | 100 |
| 98 | 120 | 100 |
Sumber : https://simdos.unud.ac.id/uploads/file_pendidikan_1_dir/5f0221d2b0bb7ced1d61798fab7f4ad3.pdf
1.4 Tujuan
Tujuan analisis regresi adalah untuk menjelaskan atau memodelkan hubungan antar variabel. Variabel y sebagai variabel respon atau variabel penjelas dan juga variabel x sebagai variabel prediktor atau variabel penjelas. Apabila terdapat lebih dari satu variabel prediktor disebut analisis regresi berganda. Analisis regresi ini disebut berganda karena beberapa variabel prediktor diterapkan pada variabel respon.
2 SOURCE CODE
2.2 Impor Data
> Nilai_UAS<-c(65,70,75,75,80,80,85,95,90,98)
> IQ <-c(110,120,115,130,110,120,120,125,110,120)
> Tingkat_Kehadiran <-c(60,70,75,80,80,90,95,95,100,100)
> data <- data.frame(X1=IQ, X2=Tingkat_Kehadiran,Y=Nilai_UAS)
> str(data)
'data.frame': 10 obs. of 3 variables:
$ X1: num 110 120 115 130 110 120 120 125 110 120
$ X2: num 60 70 75 80 80 90 95 95 100 100
$ Y : num 65 70 75 75 80 80 85 95 90 98Data berasal dari sumber link yang telah dicantumkan
2.3 Plot
> plot(Nilai_UAS ~ IQ, data = data, xlab = "IQ", ylab = "Nilai UAS", main = "Hubungan antara IQ dan Nilai UAS")> plot(Nilai_UAS ~ Tingkat_Kehadiran, data = data, xlab = "Tingkat Kehadiran", ylab = "Nilai UAS", main = "Hubungan antara Tingkat Kehadiran dan Nilai UAS")
Mencoba melihat plot hubungan X1 Y dan X2 Y
2.4 Analisis Regresi
> regresi <- lm(Y~X1+X2,data=data)
> summary(regresi)
Call:
lm(formula = Y ~ X1 + X2, data = data)
Residuals:
Min 1Q Median 3Q Max
-5.2861 -2.8939 0.0296 1.6791 6.1993
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 23.05445 25.57161 0.902 0.397247
X1 -0.03433 0.22051 -0.156 0.880686
X2 0.73723 0.10918 6.752 0.000264 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4.346 on 7 degrees of freedom
Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523Keterangan :
\(Y\) = Nilai UAS
\(X_{1}\) = IQ
\(X_{2}\) = Tingkat Kehadiran
3 HASIL DAN PEMBAHASAN
3.1 Analisis Regresi Berganda
> regresi <- lm(Y~X1+X2,data=data)
> summary(regresi)
Call:
lm(formula = Y ~ X1 + X2, data = data)
Residuals:
Min 1Q Median 3Q Max
-5.2861 -2.8939 0.0296 1.6791 6.1993
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 23.05445 25.57161 0.902 0.397247
X1 -0.03433 0.22051 -0.156 0.880686
X2 0.73723 0.10918 6.752 0.000264 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4.346 on 7 degrees of freedom
Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523analisis regresi,diperoleh \(\beta_0=23.05445,\beta_1=-0.03433, \beta_2=0.73723\), persamaan regresi yang diperoleh \(Y=23.05445-0.03433X_1+0.73723X_2\)
keterangan,
\(Y\) = Nilai UAS
\(X_{1}\) = IQ
\(X_{2}\) = Tingkat Kehadiran
Interpretasi:
Nilai intersep pada persamaan regresi yaitu 23.05445 , menunjukkan bahwa ketika IQ (X1) dan Tingkat Kehadiran (X2) konstan , diperkirakan Nilai UAS (Y) akan bernilai 23.05445.
Nilai koefisien X1 adalah -0.03433, menunjukkan bahwa setiap peningkatan IQ sebanyak 1 satuan akan menurunkan Nilai UAS sebesar -0.03433, dengan nilai Tingkat Kehadiran yang konstan.
Nilai koefisien X2 adalah 0.73723, menunjukkan bahwa setiap peningkatan Tingkat Kehadiran sebanyak 1 satuan akan meningkatkan Nilai UAS sebesar 0.73723, dengan nilai IQ yang konstan.
3.2 Plot
> plot(Nilai_UAS ~ IQ, data = data, xlab = "IQ", ylab = "Nilai UAS", main = "Hubungan antara IQ dan Nilai UAS")> plot(Nilai_UAS ~ Tingkat_Kehadiran, data = data, xlab = "Tingkat Kehadiran", ylab = "Nilai UAS", main = "Hubungan antara Tingkat Kehadiran dan Nilai UAS")Sebaran hubungan plot pada variabel IQ dan Tingkat Keharian terhadap Nilai UAS
3.3 Uji R-squared atau Koefisien Determinasi
> summary(regresi)
Call:
lm(formula = Y ~ X1 + X2, data = data)
Residuals:
Min 1Q Median 3Q Max
-5.2861 -2.8939 0.0296 1.6791 6.1993
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 23.05445 25.57161 0.902 0.397247
X1 -0.03433 0.22051 -0.156 0.880686
X2 0.73723 0.10918 6.752 0.000264 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4.346 on 7 degrees of freedom
Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523Interpretasi:
Nilai R-squared pada regresi tersebut yaitu sebesar 0.8719, dapat disimpulkan bahwa model regresi linier berganda ini mampu menjelaskan sekitar 87.19% variasi dalam nilai UAS siswa menggunakan variabel IQ dan tingkat kehadiran.
3.4 Uji F
3.4.1 Hipotesis
Hipotesis
\(H_0\): \(\beta_0=\beta_1=\beta_2=0\) (Tidak berpengaruh terhadap Nilai UAS)
\(H_1\): \(\beta_k≠0\) (Berpengaruh Design Produk dengan Nilai UAS)
3.4.2 Statistik Uji F
> summary(regresi)
Call:
lm(formula = Y ~ X1 + X2, data = data)
Residuals:
Min 1Q Median 3Q Max
-5.2861 -2.8939 0.0296 1.6791 6.1993
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 23.05445 25.57161 0.902 0.397247
X1 -0.03433 0.22051 -0.156 0.880686
X2 0.73723 0.10918 6.752 0.000264 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4.346 on 7 degrees of freedom
Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523Interpretasi:
P-value untuk IQ yaitu sebesar 0.880686, p-value lebih besar dari α(0.05), sehingga dapat disimpulkan bahwa IQ tidak berpengaruh secara nyata terhadap Nilai UAS.
P-value untuk Tingkat Kehadiran sebesar 0.000264, p-value kurang dari α(0.05), sehingga dapat disimpulkan bahwa Tingkat Kehadiran sangat sangat sangat berpengaruh secara nyata terhadap Nilai UAS.
P-Value pada variabel IQ dan Tingkat Kehadiran sebesar 0.0007523, p-value kurang dari α(0.05),sehingga dapat disimpulkan bahwa variabel prediktor secara bersama-sama memengaruhi variabel respon secara nyata atau signifikan.
3.5 Uji Asumsi
3.5.1 Asumsi Normalitas
> sisa<-residuals(regresi)
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 0.58528, df = 2, p-value = 0.7463Dengan uji jarque bera didapatkan p-value sebesar 0.7463. Nilai p tersebut cukup besar, maka tidak terbukti ada pelanggaran asumsi normalitas galat pada model Nilai UAS sebagai fungsi dari IQ dan Tingkat Kehadiran.
Dengan uji Shapiro-wilk didapatkan p-value sebesar 0.6833. Nilai p tersebut cukup besar, maka tidak terbukti ada pelanggaran asumsi normalitas galat pada model Nilai UAS sebagai fungsi dari IQ dan Tingkat Kehadiran.
3.5.2 Asumsi Homoskedastisitas
> bptest(regresi)
studentized Breusch-Pagan test
data: regresi
BP = 5.905, df = 2, p-value = 0.05221Dengan uji Breusch-Pagan didapatkan p-value sebesar 0.05221. Nilai p lebih besar dari \(\alpha(0.05)\), Maka tidak terbukti ada pelanggaran asumsi homogenitas ragam galat pada model Nilai UAS sebagai fungsi dari IQ dan Tingkat Kehadiran.
3.5.3 Asumsi Nonmultikolinieritas
Karena nilai VIF dari kedua variabel dibawah 10, maka tidak terdapat multikolinieritas
3.5.4 Asumsi NonAutokorelasi
> dwtest(regresi)
Durbin-Watson test
data: regresi
DW = 2.594, p-value = 0.8013
alternative hypothesis: true autocorrelation is greater than 0Dengan uji durbin-watson didaptakan p-value sebesar 0.8013. Nilai p tersebut cukup besar, maka tidak terbukti ada masalah autokorelasi pada model Nilai UAS sebagai fungsi dari IQ dan Tingkat Kehadiran.
4 KESIMPULAN
Kesimpulan yang dapat diambil dari pengujian regresi linier berganda pada contoh soal di atas yaitu, IQ tidak berpengaruh secara signifikan terhadap Nilai UAS, sedangkan Tingkat Kehadiran sangat sangat sangat berpengaruh secara signifikan terhadap Nilai UAS. Berdasarkan uji asumsi, didapatkan informasi bahwa tidak terdapat pelanggaran asumsi normalitas, tidak terdapat pelanggaran homogenitas, tidak ada masalah autokorelasi, dan tidak terdapat multikolinieritas. Sehingga dapat disimpulkan bahwa model tersebut merupakan model regresi yang cukup baik.
5 SARAN
Ketika membuat syntax regresi pada rstud usahakan cek tata letak pada variabelnya, karena kesalahan pada tata letak dapat menyebabkan perbedaan nilai dari hasil analisisnya.
6 DAFTAR PUSTAKA
Achmad Efendi, Ni Wayan Surya Wardhani, Rahma Fitriani, Eni Sumarminingsih. (2020). Analisis Regresi : Teori dan Aplikasi dalam R. Malang: Universitas Brawijaya Press.
Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to linear regression analysis. John Wiley & Sons.
Gunawan, A. (2016). Statistika untuk Penelitian. Penerbit Bumi Aksara.