1 PENDAHULUAN
1.1 Latar Belakang
Dalam banyak hal yang berkaitan dengan kegiatan perusahaan dan perekonomian mungkin perlu diketahui hubungan antara dua variabel atau lebih variabel dan hubungan ini dapat digunakan untuk memperkirakan nilai rata-rata dari suatu variabel yang dinamakan variabel tidak bebas dan variabel bebas. Misalnya diketahui data tentang pengeluaran untuk iklan berdasarkan volume penjualan, memperkirakan pengeluaran untuk keperluan pokok keluarga berdasarkan pendapatan keluarga itu, meramalkan hsil tanaman kacang tanah berdasarkan banyak pupuk yang digunakan tiap hektar, daya tahan papan kayu A terhadap bobot tertentu ditinjau dari tebalnya, dan masih banyak lagi. Untuk menjawab hal-hal yang seperti dicontohkan, perlu dibahas mengenai bentuk hubungan dan keeratan hubungan. Bila ingin mengetahui bentuk hubungan dua variabel atau lebih, maka digunakan analisi regresi. Kemudian bila ingin melihat hubungan, maka digunakan analisis korelasi.
Analisis regresi digunakan untuk mempelajari dan mengukur hubungan statistik yang terjadi antara dua atau lebih variabel. Dalam regresi sederhana dikaji dua variabel, sedangkan regresi berganda (multiple regression) dikaji lebih dari dua variabel. Analisis Korelasi bertujuan untuk mengukur seberapa kuat atau derajat kedekatan suatu relasi yang terjadi antara variabel. Dengan menggunakan analisis regresi ingin diketahui pola relasi dalam persamaan regresi dan dengan menggunakan analisis korelasi ingin diketahui kekuatan hubungan tersebut terhadap koefisien korelasinya. Sehingga analisis regresi dan korelasi sering dilakukan bersama-sama.
1.2 Data
Data yang digunakan adalah data sekunder. Data ini diambil dari penelitian sebelumnya yaitu dengan cara melakukan pengukuran tinggi badan, berat badan, dan umur pada 57 Mahasiswa Prodi Teknik Industri di Universitas Mercubuana. Kemudian data hasil pengukuran tersebut dicatat pada lembar pengamatan yang telah disediakan lalu diimpor ke Microsoft Excel.
1.3 Mengimpor Data
> read.table("D:/data_laprak.csv", header=TRUE, sep=";")
UMUR BB TB1 20 50 176
2 26 56 168
3 19 55 170
4 20 60 160
5 19 50 176
6 19 53 175
7 19 72 182
8 20 77 175
9 18 59 176
10 19 55 175
11 19 59 165
12 19 56 168
13 19 75 175
14 19 59 176
15 20 48 168
16 19 75 170
17 19 71 177
18 19 47 162
19 18 54 160
20 19 58 173
21 20 52 165
22 19 45 168
23 19 90 170
24 19 60 169
25 19 55 165
26 21 54 165
27 19 57 187
28 20 95 173
29 20 58 175
30 19 45 160
31 19 49 160
32 19 46 173
33 19 49 158
34 19 69 166
35 19 60 170
36 20 62 173
37 20 75 175
38 22 80 170
39 19 55 170
40 19 60 169
41 19 55 166
42 19 50 168
43 20 75 165
44 18 57 173
45 18 53 160
46 17 45 155
47 19 63 160
48 18 68 168
49 17 62 162
50 17 55 170
51 20 50 169
52 18 79 175
53 18 50 170
54 17 40 160
55 18 50 180
56 18 50 173
57 17 60 175
> dataku<-read.table("D:/data_laprak.csv", header=TRUE, sep=";")
1.4 Menyajiikan Data
Mendefinisikan Variabel: \[ X_1= Umur , X_2=TinggiBadan, Y=BeratBadan \]
> X1<-dataku$UMUR
> X2<-dataku$TB
> Y<-dataku$BB
> df<-data.frame(X1,X2,Y)
> df
X1 X2 Y1 20 176 50
2 26 168 56
3 19 170 55
4 20 160 60
5 19 176 50
6 19 175 53
7 19 182 72
8 20 175 77
9 18 176 59
10 19 175 55
11 19 165 59
12 19 168 56
13 19 175 75
14 19 176 59
15 20 168 48
16 19 170 75
17 19 177 71
18 19 162 47
19 18 160 54
20 19 173 58
21 20 165 52
22 19 168 45
23 19 170 90
24 19 169 60
25 19 165 55
26 21 165 54
27 19 187 57
28 20 173 95
29 20 175 58
30 19 160 45
31 19 160 49
32 19 173 46
33 19 158 49
34 19 166 69
35 19 170 60
36 20 173 62
37 20 175 75
38 22 170 80
39 19 170 55
40 19 169 60
41 19 166 55
42 19 168 50
43 20 165 75
44 18 173 57
45 18 160 53
46 17 155 45
47 19 160 63
48 18 168 68
49 17 162 62
50 17 170 55
51 20 169 50
52 18 175 79
53 18 170 50
54 17 160 40
55 18 180 50
56 18 173 50
57 17 175 60
Data didapatkan dari peneliti terdahulu.
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> # Library
> library(rmarkdown)
> library(prettydoc)
> library(tinytex)
> library(readxl)
> library(equatiomatic)
> library(tseries)
> library(car)
> library(lmtest)
2.2 Plot
> X1<-dataku$UMUR
> X2<-dataku$TB
> Y<-dataku$BB
> X <- rbind(X1, X2)
> library(rmarkdown)
> paged_table(as.data.frame(X))
> smoothScatter(X, xlab = "X1", ylab = "X2", main = "Gambar 1. Smooth Scatter Plot")
2.3 Pendugaan Model Regresi
Setelah itu kita dapat membentuk model dengan fungsi lm
pada package stats (secara defaults R sudah mengaktifkan package stats).
lm(formula,data,...)
Argumen yang diisikan dalam function lm()
adalah formula dan data yang digunakan. Argumen formula dituliskan sebagai Y~X1+X2
dan argumen data diisikan df yang sebelumnya sudah didefinisikan.
> regresi<-lm(Y~X1+X2,data=df)
> print(regresi)
:
Calllm(formula = Y ~ X1 + X2, data = df)
:
Coefficients
(Intercept) X1 X2 -57.7964 1.4161 0.5304
Didapatkan model regresi:
\[
\hat Y= -57,7964+1,4161X_1+0,5304X_2+\epsilon_i
\]
2.4 Uji Signifikansi
Untuk melihat variabel independen mana saja yang berpengaruh signifikan terhadap variabel dependen yaitu dengan menampilkan summary
dari model.
> summary(regresi)
:
Calllm(formula = Y ~ X1 + X2, data = df)
:
Residuals
Min 1Q Median 3Q Max -14.869 -8.035 -2.217 6.357 32.715
:
CoefficientsPr(>|t|)
Estimate Std. Error t value -57.7964 42.5492 -1.358 0.1800
(Intercept) 1.4161 1.0913 1.298 0.1999
X1 0.5304 0.2274 2.332 0.0235 *
X2 ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Signif. codes
: 10.98 on 54 degrees of freedom
Residual standard error-squared: 0.123, Adjusted R-squared: 0.09048
Multiple R-statistic: 3.786 on 2 and 54 DF, p-value: 0.02894 F
2.5 ANOVA
Untuk melakukan analisis ragam, agar diperoleh tabel analisis ragam dan statistik uji F digunakan perintah anova(...)
. Dengan argumen model yang sudah didefiniskan sebelumnya, yaitu regresi
> anova(regresi)
Analysis of Variance Table
: Y
ResponsePr(>F)
Df Sum Sq Mean Sq F value 1 257.1 257.11 2.1324 0.15001
X1 1 655.8 655.76 5.4387 0.02345 *
X2 54 6510.9 120.57
Residuals ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Signif. codes
2.6 Uji Asumsi Klasik
2.6.1 Normalitas
Uji normalitas dlakukan untuk mengetahui distribusi residual dari model regresi. Jika residual berdistribusi normal maka model dapat dianalisis dengan analisis regresi. Namun jika residual tidak berdistribusi normal maka model tersebut tidak dapat dianalisis dengan analisis regresi.
Untuk melakukan uji normalitas, kita dapat menggunakan Jarque-Bera Test yang terdapat pada package tseries dengan perintah:
jarque.bera.test(x)
Argumen x adalah suatu data bertipe vektor yang akan diuji kenormalannya. Dalam hal ini yaitu regresi$residuals
> library(tseries)
> jarque.bera.test(regresi$residuals)
Jarque Bera Test
: regresi$residuals
data-squared = 11.197, df = 2, p-value = 0.003703 X
2.6.2 Non Multikolinieritas
Untuk mengetahui apakah terjadi kasus multikolinieritas atau tidak, kita dapat melihat nilai VIF (Variance Inflation Factor). Beberapa packages di R yang menyediakan fungsi untuk menghitung VIF diantaranya : VIF di package HH, VIF di package car, VIF di package fmsb, VIF di package faraway, dan VIF di package VIF. Pada kasus ini akan digunakan fungsi VIF pada package car yaitu sebagai berikut:
vif(mod,...)
mod
adalah model yang ingin diuji multikolinieritas. Dalam hal ini, modelnya yaitu regresi.
> library(car)
> vif(regresi)
X1 X2 1.004681 1.004681
2.6.3 Non Auto Korelasi
Untuk mengetahui apakah asumsi non-autokorelasi sudah terpenuhi maka dapat dibuktikan dengan Breusch-Godfrey Test. Software R sudah menyediakan fungsi ini pada packages lmtest yaitu sebagai berikut:
bgtest(formula,order=1,...)
Argumen yang dibutuhkan yaitu formula dan order.
formula
: formula/model yang ingin diuji autokorelasi
order
: orde sisaan yang akan diuji autokorelasi
> library(lmtest)
> bgtest(regresi,1)
-Godfrey test for serial correlation of order up to 1
Breusch
: regresi
data= 0.16034, df = 1, p-value = 0.6888 LM test
2.6.4 Heterokedastisitas
Untuk membuktikan apakah terjadi kasus heterokedastisitas atau tidak, maka dapat digunakan Breusch-Pagan Test yang terdapat pada packages lmtest yaitu sebagai berikut:
bptest(formula,...)
formula
: model yang ingin diuji heterokedastisitas
> bptest(regresi)
-Pagan test
studentized Breusch
: regresi
data= 2.8005, df = 2, p-value = 0.2465 BP
2.7 Plot Model
Pemeriksaan sisaan adalah langkah untuk memeriksa secara visual, apakah terdapat pelanggaran asumsi dari model regresi yang sudah dibentuk. Digunakan perintah plot(x)
yag akan langsung menyajikan empat plot (1,2,3,5), namun agar keempatnya tampil dalam satu layer, perlu digunakan perintah
par(mfrow(2,2))
Yang mengatur tampilan gambar pada dua baris dengan masing-masing baris berisi dua gambar.
> par(mfrow=c(2,2))
> plot(regresi)
3 HASIL DAN PEMBAHASAN
3.1 Pendugaan Model Regresi
Dari perhitungan yang telah dilakukan, Didapatkan model regresi sebagai berikut:
\[
\hat Y= -57,7964+1,4161X_1+0,5304X_2+\epsilon_i
\] artinya:
1. Setiap kenaikan 1 satuan X1 dan X2 konstan, maka Y yang dihasilkan. mengalami peningkatan sebesar 1,4161
2. Setiap kenaikan 1 satuan X2 dan X1 konstan, maka Y yang dihasilkan mengalami peningkatan sebesar 0,5304.
3.2 ANOVA
Diperoleh pval sebesar 0.02894, maka keputusannya adalah tolak HO. Artinya secara simultan umur dan tinggi badan berpengaruh signifikan terhadap berat badan.
3.3 Uji Signifkansi
Diperoleh nilai R-square sebesar 0.123. Artinya, umur dan tinggi badan dapat menjelaskan hubungan terhadap berat badan sebesar 12,3%. Sisanya 87.7% dipengaruhi oleh variabel lain di luar model.
Pada uji parsial untuk X1 dan X2 diperoleh p-val secara berturut-turut yaitu 0.1999 dan 0.0235. Artinya, secara parsial umur mahasiswa tidak mempengaruhi berat badan mahasiswa. Selain itu, secara parsial tinggi badan mahasiswa secara signifikan mempengaruhi berat badan mahasiswa.
3.4 Uji Asumsi Klasik
3.4.1 Uji Normalitas
Didapatkan p-value sebesar 0.003703, artinya tolak H0
. Jadi dapat disimpulkan bahwa ada pelanggaran asumsi normalitas galat.
3.4.2 Non Multikolinieritas
Didapatkan nilai VIF X1 dan VIF X2 di bawah 10. Artinya tidak ada mutikolinnearitas.
3.4.3 Non Autokorelasi
Didapatkan p-value cukup besar, maka terima H0
. Jadi dapat disimpulkan bahwa tidak terdapat autokorelasi.
3.4.4 Heterokedastisitas
Didapatkan p-value sebesar 0.2465, maka terima H0
. Jadi dapat disimpulkan bahwa tidak ada gejala heterokedastisitas.
Setelah dipastikan tidak ada masalah pelanggaran asumsi, hasil analisis sah digunakan dan diinterpretasikan.
4 DAFTAR PUSTAKA
Walpole. Ronald.E. 1995. Ilmu Peluang dan Statistika. Bandung: ITB.
Sudijono, Anas. 1996. Pengantar Statistik Pendidikan. Jakarta: Rajawali.