1 PENDAHULUAN

1.1 Latar Belakang

Dalam banyak hal yang berkaitan dengan kegiatan perusahaan dan perekonomian mungkin perlu diketahui hubungan antara dua variabel atau lebih variabel dan hubungan ini dapat digunakan untuk memperkirakan nilai rata-rata dari suatu variabel yang dinamakan variabel tidak bebas dan variabel bebas. Misalnya diketahui data tentang pengeluaran untuk iklan berdasarkan volume penjualan, memperkirakan pengeluaran untuk keperluan pokok keluarga berdasarkan pendapatan keluarga itu, meramalkan hsil tanaman kacang tanah berdasarkan banyak pupuk yang digunakan tiap hektar, daya tahan papan kayu A terhadap bobot tertentu ditinjau dari tebalnya, dan masih banyak lagi. Untuk menjawab hal-hal yang seperti dicontohkan, perlu dibahas mengenai bentuk hubungan dan keeratan hubungan. Bila ingin mengetahui bentuk hubungan dua variabel atau lebih, maka digunakan analisi regresi. Kemudian bila ingin melihat hubungan, maka digunakan analisis korelasi.
Analisis regresi digunakan untuk mempelajari dan mengukur hubungan statistik yang terjadi antara dua atau lebih variabel. Dalam regresi sederhana dikaji dua variabel, sedangkan regresi berganda (multiple regression) dikaji lebih dari dua variabel. Analisis Korelasi bertujuan untuk mengukur seberapa kuat atau derajat kedekatan suatu relasi yang terjadi antara variabel. Dengan menggunakan analisis regresi ingin diketahui pola relasi dalam persamaan regresi dan dengan menggunakan analisis korelasi ingin diketahui kekuatan hubungan tersebut terhadap koefisien korelasinya. Sehingga analisis regresi dan korelasi sering dilakukan bersama-sama.

1.2 Data

Data yang digunakan adalah data sekunder. Data ini diambil dari penelitian sebelumnya yaitu dengan cara melakukan pengukuran tinggi badan, berat badan, dan umur pada 57 Mahasiswa Prodi Teknik Industri di Universitas Mercubuana. Kemudian data hasil pengukuran tersebut dicatat pada lembar pengamatan yang telah disediakan lalu diimpor ke Microsoft Excel.

1.3 Mengimpor Data

> read.table("D:/data_laprak.csv", header=TRUE, sep=";")
   UMUR BB  TB
1    20 50 176
2    26 56 168
3    19 55 170
4    20 60 160
5    19 50 176
6    19 53 175
7    19 72 182
8    20 77 175
9    18 59 176
10   19 55 175
11   19 59 165
12   19 56 168
13   19 75 175
14   19 59 176
15   20 48 168
16   19 75 170
17   19 71 177
18   19 47 162
19   18 54 160
20   19 58 173
21   20 52 165
22   19 45 168
23   19 90 170
24   19 60 169
25   19 55 165
26   21 54 165
27   19 57 187
28   20 95 173
29   20 58 175
30   19 45 160
31   19 49 160
32   19 46 173
33   19 49 158
34   19 69 166
35   19 60 170
36   20 62 173
37   20 75 175
38   22 80 170
39   19 55 170
40   19 60 169
41   19 55 166
42   19 50 168
43   20 75 165
44   18 57 173
45   18 53 160
46   17 45 155
47   19 63 160
48   18 68 168
49   17 62 162
50   17 55 170
51   20 50 169
52   18 79 175
53   18 50 170
54   17 40 160
55   18 50 180
56   18 50 173
57   17 60 175
> dataku<-read.table("D:/data_laprak.csv", header=TRUE, sep=";")

1.4 Menyajiikan Data

Mendefinisikan Variabel: \[ X_1= Umur , X_2=TinggiBadan, Y=BeratBadan \]

> X1<-dataku$UMUR
> X2<-dataku$TB
> Y<-dataku$BB
> df<-data.frame(X1,X2,Y)
> df
   X1  X2  Y
1  20 176 50
2  26 168 56
3  19 170 55
4  20 160 60
5  19 176 50
6  19 175 53
7  19 182 72
8  20 175 77
9  18 176 59
10 19 175 55
11 19 165 59
12 19 168 56
13 19 175 75
14 19 176 59
15 20 168 48
16 19 170 75
17 19 177 71
18 19 162 47
19 18 160 54
20 19 173 58
21 20 165 52
22 19 168 45
23 19 170 90
24 19 169 60
25 19 165 55
26 21 165 54
27 19 187 57
28 20 173 95
29 20 175 58
30 19 160 45
31 19 160 49
32 19 173 46
33 19 158 49
34 19 166 69
35 19 170 60
36 20 173 62
37 20 175 75
38 22 170 80
39 19 170 55
40 19 169 60
41 19 166 55
42 19 168 50
43 20 165 75
44 18 173 57
45 18 160 53
46 17 155 45
47 19 160 63
48 18 168 68
49 17 162 62
50 17 170 55
51 20 169 50
52 18 175 79
53 18 170 50
54 17 160 40
55 18 180 50
56 18 173 50
57 17 175 60

Data didapatkan dari peneliti terdahulu.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # Library
> library(rmarkdown)
> library(prettydoc)
> library(tinytex)
> library(readxl)
> library(equatiomatic)
> library(tseries)
> library(car)
> library(lmtest)

2.2 Plot

> X1<-dataku$UMUR
> X2<-dataku$TB
> Y<-dataku$BB
> X   <- rbind(X1, X2)

> library(rmarkdown)
> paged_table(as.data.frame(X))

> smoothScatter(X, xlab = "X1", ylab = "X2", main = "Gambar 1. Smooth Scatter Plot")

2.3 Pendugaan Model Regresi

Setelah itu kita dapat membentuk model dengan fungsi lm pada package stats (secara defaults R sudah mengaktifkan package stats).

lm(formula,data,...)

Argumen yang diisikan dalam function lm() adalah formula dan data yang digunakan. Argumen formula dituliskan sebagai Y~X1+X2 dan argumen data diisikan df yang sebelumnya sudah didefinisikan.

> regresi<-lm(Y~X1+X2,data=df)
> print(regresi)

Call:
lm(formula = Y ~ X1 + X2, data = df)

Coefficients:
(Intercept)           X1           X2  
   -57.7964       1.4161       0.5304

Didapatkan model regresi:
\[ \hat Y= -57,7964+1,4161X_1+0,5304X_2+\epsilon_i \]

2.4 Uji Signifikansi

Untuk melihat variabel independen mana saja yang berpengaruh signifikan terhadap variabel dependen yaitu dengan menampilkan summary dari model.

> summary(regresi)

Call:
lm(formula = Y ~ X1 + X2, data = df)

Residuals:
    Min      1Q  Median      3Q     Max 
-14.869  -8.035  -2.217   6.357  32.715 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) -57.7964    42.5492  -1.358   0.1800  
X1            1.4161     1.0913   1.298   0.1999  
X2            0.5304     0.2274   2.332   0.0235 *
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 10.98 on 54 degrees of freedom
Multiple R-squared:  0.123, Adjusted R-squared:  0.09048 
F-statistic: 3.786 on 2 and 54 DF,  p-value: 0.02894

2.5 ANOVA

Untuk melakukan analisis ragam, agar diperoleh tabel analisis ragam dan statistik uji F digunakan perintah anova(...). Dengan argumen model yang sudah didefiniskan sebelumnya, yaitu regresi

> anova(regresi)
Analysis of Variance Table

Response: Y
          Df Sum Sq Mean Sq F value  Pr(>F)  
X1         1  257.1  257.11  2.1324 0.15001  
X2         1  655.8  655.76  5.4387 0.02345 *
Residuals 54 6510.9  120.57                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

2.6 Uji Asumsi Klasik

2.6.1 Normalitas

Uji normalitas dlakukan untuk mengetahui distribusi residual dari model regresi. Jika residual berdistribusi normal maka model dapat dianalisis dengan analisis regresi. Namun jika residual tidak berdistribusi normal maka model tersebut tidak dapat dianalisis dengan analisis regresi.
Untuk melakukan uji normalitas, kita dapat menggunakan Jarque-Bera Test yang terdapat pada package tseries dengan perintah:

jarque.bera.test(x)

Argumen x adalah suatu data bertipe vektor yang akan diuji kenormalannya. Dalam hal ini yaitu regresi$residuals

> library(tseries)
> jarque.bera.test(regresi$residuals)

    Jarque Bera Test

data:  regresi$residuals
X-squared = 11.197, df = 2, p-value = 0.003703

2.6.2 Non Multikolinieritas

Untuk mengetahui apakah terjadi kasus multikolinieritas atau tidak, kita dapat melihat nilai VIF (Variance Inflation Factor). Beberapa packages di R yang menyediakan fungsi untuk menghitung VIF diantaranya : VIF di package HH, VIF di package car, VIF di package fmsb, VIF di package faraway, dan VIF di package VIF. Pada kasus ini akan digunakan fungsi VIF pada package car yaitu sebagai berikut:

vif(mod,...)

mod adalah model yang ingin diuji multikolinieritas. Dalam hal ini, modelnya yaitu regresi.

> library(car)
> vif(regresi)
      X1       X2 
1.004681 1.004681

2.6.3 Non Auto Korelasi

Untuk mengetahui apakah asumsi non-autokorelasi sudah terpenuhi maka dapat dibuktikan dengan Breusch-Godfrey Test. Software R sudah menyediakan fungsi ini pada packages lmtest yaitu sebagai berikut:

bgtest(formula,order=1,...)

Argumen yang dibutuhkan yaitu formula dan order.
formula : formula/model yang ingin diuji autokorelasi
order : orde sisaan yang akan diuji autokorelasi

> library(lmtest)
> bgtest(regresi,1)

    Breusch-Godfrey test for serial correlation of order up to 1

data:  regresi
LM test = 0.16034, df = 1, p-value = 0.6888

2.6.4 Heterokedastisitas

Untuk membuktikan apakah terjadi kasus heterokedastisitas atau tidak, maka dapat digunakan Breusch-Pagan Test yang terdapat pada packages lmtest yaitu sebagai berikut:

bptest(formula,...)

formula : model yang ingin diuji heterokedastisitas

> bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 2.8005, df = 2, p-value = 0.2465

2.7 Plot Model

Pemeriksaan sisaan adalah langkah untuk memeriksa secara visual, apakah terdapat pelanggaran asumsi dari model regresi yang sudah dibentuk. Digunakan perintah plot(x) yag akan langsung menyajikan empat plot (1,2,3,5), namun agar keempatnya tampil dalam satu layer, perlu digunakan perintah

par(mfrow(2,2))

Yang mengatur tampilan gambar pada dua baris dengan masing-masing baris berisi dua gambar.

> par(mfrow=c(2,2))
> plot(regresi)

3 HASIL DAN PEMBAHASAN

3.1 Pendugaan Model Regresi

Dari perhitungan yang telah dilakukan, Didapatkan model regresi sebagai berikut:
\[ \hat Y= -57,7964+1,4161X_1+0,5304X_2+\epsilon_i \] artinya:
1. Setiap kenaikan 1 satuan X1 dan X2 konstan, maka Y yang dihasilkan. mengalami peningkatan sebesar 1,4161
2. Setiap kenaikan 1 satuan X2 dan X1 konstan, maka Y yang dihasilkan mengalami peningkatan sebesar 0,5304.

3.2 ANOVA

Diperoleh pval sebesar 0.02894, maka keputusannya adalah tolak HO. Artinya secara simultan umur dan tinggi badan berpengaruh signifikan terhadap berat badan.

3.3 Uji Signifkansi

Diperoleh nilai R-square sebesar 0.123. Artinya, umur dan tinggi badan dapat menjelaskan hubungan terhadap berat badan sebesar 12,3%. Sisanya 87.7% dipengaruhi oleh variabel lain di luar model.
Pada uji parsial untuk X1 dan X2 diperoleh p-val secara berturut-turut yaitu 0.1999 dan 0.0235. Artinya, secara parsial umur mahasiswa tidak mempengaruhi berat badan mahasiswa. Selain itu, secara parsial tinggi badan mahasiswa secara signifikan mempengaruhi berat badan mahasiswa.

3.4 Uji Asumsi Klasik

3.4.1 Uji Normalitas

Didapatkan p-value sebesar 0.003703, artinya tolak H0. Jadi dapat disimpulkan bahwa ada pelanggaran asumsi normalitas galat.

3.4.2 Non Multikolinieritas

Didapatkan nilai VIF X1 dan VIF X2 di bawah 10. Artinya tidak ada mutikolinnearitas.

3.4.3 Non Autokorelasi

Didapatkan p-value cukup besar, maka terima H0. Jadi dapat disimpulkan bahwa tidak terdapat autokorelasi.

3.4.4 Heterokedastisitas

Didapatkan p-value sebesar 0.2465, maka terima H0. Jadi dapat disimpulkan bahwa tidak ada gejala heterokedastisitas.

Setelah dipastikan tidak ada masalah pelanggaran asumsi, hasil analisis sah digunakan dan diinterpretasikan.

4 DAFTAR PUSTAKA

Walpole. Ronald.E. 1995. Ilmu Peluang dan Statistika. Bandung: ITB.
Sudijono, Anas. 1996. Pengantar Statistik Pendidikan. Jakarta: Rajawali.

Pengaruh Umur dan Tinggi Badan terhadap Berat Badan Mahasiswa Teknik Industri Sebanyak 100 Mahasiswa

Fitria Dwi Safira

16 Mei 2022