Penerapan Analisis Regresi Linear Sederhana Untuk Mengetahui Pengaruh Biaya Bahan Bakar Bensin Terhadap Uang Saku Mahasiswa

Anggreta Sela Indriaputri

2023-06-01

1 PENDAHULUAN

1.1 Latar Belakang

Bahan bakar minyak (BBM) merupakan salah satu sumber daya alam yang berperan dalam kehidupan manusia. Bahan bakar minyak (BBM) menjadi salah satu bagian dari kebutuhan pokok masyarakat hingga sangat mempengaruhi perekonomian secara nasional, karena memiliki peranan dalam menunjang setiap aktivitas kehidupan masyarakat, seperti halnya pada mahasiswa. Mahasiswa sendiri sangat membutuhkan bahan bakar minyak pada sarana transportasi yang digunakan untuk beraktivitas ke kampus, sehingga tanpa adanya bahan bakar minyak akan berakibat tersendatnya aktivitas tersebut. Namun tanpa disadari oleh mahasiswa bahwa bahan bakar minyak dapat menguras pendapatan perbulannya. Pendapatan yang awalnya cukup untuk memenuhi kebutuhan hidup menjadi tidak cukup karena harus mengeluarkan biaya untuk bahan bakar tersebut. Oleh karena itu, pada mini project mata kuliah Komputasi Statistika ini akan dibahas tentang seberapa besar pengaruh biaya yang dikeluaran oleh mahasiswa untuk membeli bahan bakar minyak terhadap pendapatan uang saku per bulannya dalam waktu satu minggu.

1.2 Data Penelitian

Data merupakan suatu kumpulan berisi fakta-fakta yang dibuat dengan kata-kata, simbol, angka dan lainnya untuk memberikan gambaran secara luas tentang suatu keadaan. Data terdiri dari dua jenis yaitu data primer dan data sekunder. Data primer adalah data yang diambil secara langsung oleh peneliti tanpa melalui perantara sedangkan data sekunder adalah data yang didapatkan melalui perantara atau data yang dimiliki berasal dari data yang sudah ada. Dalam penerapan analisis regresi linier sederhana ini, digunakan data sekunder yaitu data yang diambil dari suatu perantara dan pada kasus ini data terkait uang saku dan bahan bakar minyak (bbm) diambil dari sumber Laporan Ekonometrika.

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif merupakan metode-metode yang berhubungan dengan pengumpulan, penyusunan, dan penyajian data sehingga memberikan informasi yang berguna. Metode ini bermanfaat untuk menganalisa tentang sifat-sifat atau karakteristik dari suatu kasus dan membuat deskripsi atau gambaran yang sistematis serta akurat mengenai fakta-fakta dan sifat-sifat dari kasus yang dianalisa. Data dapat disajikan dalam tabel, diagram, dan grafik.

2.2 Analisis Regresi Linear Sederhana

Analisis regresi linear sederhana merupakan metode pendekatan statistik untuk pemodelan hubungan antara satu variabel respon (Y) dan satu variabel prediktor (X). Metode ini bertujuan untuk memprediksi nilai Y untuk nilai X yang tersedia. Dalam regresi, variabel prediktor menerangkan variabel respon. Dalam analisis regresi sederhana, hubungan antar variabel bersifat linear, dimana perubahan pada variabel X akan diikuti oleh perubahan Variabel Y secara tetap.

Persamaan untuk Model Regresi Linier Sederhana:

\[ \ Yˆ=β0+β1X \\ Keterangan: \\Yˆ = Garis Regresi/Variabel Respon \\β0 = Konstanta \\β1 = Koefisien Regresi \\X = Variabel Prediktor \]

Rumus Mencari Besar β0 dan β1:

\[ β1 = \frac {ΣXY−[(ΣX)(ΣY)] /n}{ΣX2−(ΣX)2/n} \\β0=Y¯−β1X \]

2.3 Pengujian Hipotesis

2.3.1 Uji Simultan

Uji simultan atau uji F digunakan untuk menguji pengaruh secara bersama-sama seluruh variabel prediktor yang diuji terhadap variabel respons. Hipotesis yang digunakan adalah sebagai berikut: \[ H0:β1=β2=...=βk−1=0 \\ H1:βk≠0 \]

2.3.2 Uji Parsial

Uji t digunakan untuk pengujian koefisien regresi secara parsial. Masing-masing variabel prediktor diuji untuk diketahui pengaruhnya terhadap variabel respons. Hipotesis yang digunakan sebagai berikut: \[ H0:βi=0 \\ H1:βi≠0 \]

2.4 Pengujian Asumsi

2.4.1 Uji Normalitas

Uji normalitas adalah pengujian untuk melihat apakah residual dari model regresi yang terbentuk berdistribusi normal. Model regresi yang baik adalah model yang distribusinya normal. Uji yang digunakan bisa berupa uji shapiro-wilk, uji anderson-darling, dan uji kolmogorov-smirnov.

2.4.2 Uji Homoskedastisitas

Homoskedastisitas adalah kondisi di mana terdapat varians yang sama dari setiap residualnya. Untuk melakukan anaisis regresi, asumai homoskedastisitas harus terpenuhi. Kebalikan dari homoskedastisitas adalah heteroskedastisitas. Heteroskedastisitas berarti kondisi di mana varians dari setiap residualnya tidak sama. Asumsi homoskedastisitas dapat diperiksa dengan memperhatikan plot Scale-location, yang disebut juga plot spread-location. \[ H0 : σ^2i = σ^2j, i ̸= j \\H1 : σ2i ̸= σ2j, i ̸= j \]

2.4.3 Uji Non-Autokorelasi

asumsi ini mengasumsikan bahwa antar galat tidak saling berkorelasi. Biasanya galat yang berurutan dapat terindikasi autokorelasi, bisa jadi berkorelasi positif maupun negatif. Jika tidak terpenuhi, standard error yang diestimasi bisa jauh dari yang sebenarnya, sehingga memberikan informasi palsu. Maka, perhitungan menjadi tidak valid. Uji yang bisa dilakukan adalah uji Durbin Watson.

2.5 Uji Kelayakan Model (Uji Goodness of Fit)

Uji koefisien determinasi (R^2) merupakan uji yang digunakan untuk mengetahui layak atau tidaknya model regresi yang terbentuk. Dengan melihat seberapa baik kemampuan model dalam menjelaskan keragaman pada variabel prediktor. Nilai koefisien Determinasi berada diantara 0 sampai 1, dimana ketika nilai koefisien determinasi semakin mendekati nilai 1 maka semakin baik kemampuan variabel predictor dalam menjelaskan variabel respon atau model yang terbentuk layak untuk digunakan dalam melakukan pengambilan keputusan selanjutnya.

2.6 Selang Kepercayaan

Selang kepercayaan adalah sebuah interval dari antara dua nilai yang memuat nilai dari sebuah parameter.

2.7 Diagnostic Sisaan

Model regresi linear dapat dikatakan model yang baik jika memenuhi kriteria BLUE (Best Linear Unbiased Estimator). Pengujian asumsi untuk memperoleh model yang terbaik dapat dilakukan dengan diagnostik sisaan. Asumsi-asumsi yang mendasari model regresi yang diperoleh melalui sisaan antara lain:

  1. Nilai harapan sisaan sama dengan nol

  2. kenormalan (normality)

  3. kehomogenan ragam (homoscedaticity)

  4. keacakan (randomness)

3 SOURCE CODE

3.1 Library

> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(lmtest)

3.2 Data

> library(knitr)
> Mahasiswa<- c(1:20)
> Uang_Saku <- c(145,130,130,310,160,240,190,250,380,420,110,130,165,220,80,70,140,140,80,180)
> Bensin <- c(45,30,25,60,40,30,40,50,80,70,30,30,50,70,20,20,80,30,30,40)
> data <- data.frame(Mahasiswa, Uang_Saku, Bensin)
> kable (data, caption= "Tabel 1. Data")
Tabel 1. Data
Mahasiswa Uang_Saku Bensin
1 145 45
2 130 30
3 130 25
4 310 60
5 160 40
6 240 30
7 190 40
8 250 50
9 380 80
10 420 70
11 110 30
12 130 30
13 165 50
14 220 70
15 80 20
16 70 20
17 140 80
18 140 30
19 80 30
20 180 40

3.3 Smooth Scatter Plot

> n <- 20
> Mahasiswa<- c(1:20)
> Uang_Saku <- c(145,130,130,310,160,240,190,250,380,420,110,130,165,220,80,70,140,140,80,180)
> Bensin <- c(45,30,25,60,40,30,40,50,80,70,30,30,50,70,20,20,80,30,30,40)
> data <- data.frame(Mahasiswa, Uang_Saku, Bensin)
> library(rmarkdown)
> paged_table(as.data.frame(data))
> scatter.smooth(x=Bensin,y=Uang_Saku,xlab="Bensin",ylab="Uang_Saku", main = "Gambar 1. Smooth Scatter Plot", col = "burlywood")

3.4 Boxplot

> boxplot(Uang_Saku~Bensin, main="Boxplot respon setiap perlakuan", xlab="bensin",ylab="Uang_Saku")

3.5 Model Analisis Regresi

> regresi<-lm(Uang_Saku~Bensin,data=data)
> regresi

Call:
lm(formula = Uang_Saku ~ Bensin, data = data)

Coefficients:
(Intercept)       Bensin  
     28.378        3.566  
> model<-summary(regresi)
> model

Call:
lm(formula = Uang_Saku ~ Bensin, data = data)

Residuals:
     Min       1Q   Median       3Q      Max 
-173.660  -32.694   -5.359   25.066  142.000 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  28.3779    38.8638   0.730  0.47467    
Bensin        3.5660     0.8207   4.345  0.00039 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 68.69 on 18 degrees of freedom
Multiple R-squared:  0.5119,    Adjusted R-squared:  0.4848 
F-statistic: 18.88 on 1 and 18 DF,  p-value: 0.0003901

4 HASIL DAN PEMBAHASAN

4.1 Menentukan Variabel Prediktor dan Variabel Respon

Variabel Prediktor (X) = Biaya Bahan Bakar Minyak (BBM) atau bensin

Variabel Respon (Y) = Uang Saku Perbulannya Dikarenakan BBM atau bensin yang mempengaruhi uang saku perbulannya.

4.2 Statistika Deskriptif

Berdasarkan output model regresi diperoleh lima angka residual : \[ Min = -173.660 \] Maka disimpulkan bahwa data memiliki residual terkecil sebesar -173.660. \[ Q1 = -32.694 \] Maka, disimpulkan bahwa data memiliki residual kuartil pertama sebesar -32.694. \[ Median = -5.359 \] Maka, dapat disimpulkan bahwa data memiliki residual median sebesar -5.359. \[ Q3 = 25.066 \] Maka, disimpulkan bahwa data memiliki residual quartil ketiga sebesar -5.359. \[ Max = 142 \] Maka. disimpulkan bahwa data memiliki residual terbesar sebesar 142.

4.3 Analisis Regresi Linear Sederhana

> n <- dim(data)[1]
> n
[1] 20
> X <- matrix(c(rep(1, 20), data$Bensin), nrow = 20)
> X
      [,1] [,2]
 [1,]    1   45
 [2,]    1   30
 [3,]    1   25
 [4,]    1   60
 [5,]    1   40
 [6,]    1   30
 [7,]    1   40
 [8,]    1   50
 [9,]    1   80
[10,]    1   70
[11,]    1   30
[12,]    1   30
[13,]    1   50
[14,]    1   70
[15,]    1   20
[16,]    1   20
[17,]    1   80
[18,]    1   30
[19,]    1   30
[20,]    1   40
> Y <- data$Uang_Saku
> Y
 [1] 145 130 130 310 160 240 190 250 380 420 110 130 165 220  80  70 140 140  80
[20] 180
> k <- dim(X)[2]
> k
[1] 2
> b_hat <- solve(t(X)%*%X)%*%(t(X)%*%Y)
> b_hat
          [,1]
[1,] 28.377944
[2,]  3.566024

Persamaan Regresi:

\[ (ˆY)=β0+β1Xi=28.377944+3.566024Xi \] Persamaan regresi linier sederhana yang didapatkan yaitu Y = 28.377944 + 3.566024Xi. Persamaan tersebut menunjukkan bahwa setiap penambahan 1% uang saku mahasiswa perbulannya, akan menambah pengeluaran uang bensin sebanyak 3.566024%.

4.4 Pengujian Hipotesis

4.4.1 Uji Simultan

> Y_hat <- X %*% b_hat
> Y_hat
           [,1]
 [1,] 188.84904
 [2,] 135.35867
 [3,] 117.52855
 [4,] 242.33940
 [5,] 171.01892
 [6,] 135.35867
 [7,] 171.01892
 [8,] 206.67916
 [9,] 313.65989
[10,] 277.99964
[11,] 135.35867
[12,] 135.35867
[13,] 206.67916
[14,] 277.99964
[15,]  99.69843
[16,]  99.69843
[17,] 313.65989
[18,] 135.35867
[19,] 135.35867
[20,] 171.01892
> sisa <- Y - Y_hat
> sisa
             [,1]
 [1,]  -43.849036
 [2,]   -5.358672
 [3,]   12.471449
 [4,]   67.660600
 [5,]  -11.018915
 [6,]  104.641328
 [7,]   18.981085
 [8,]   43.320842
 [9,]   66.340114
[10,]  142.000357
[11,]  -25.358672
[12,]   -5.358672
[13,]  -41.679158
[14,]  -57.999643
[15,]  -19.698430
[16,]  -29.698430
[17,] -173.659886
[18,]    4.641328
[19,]  -55.358672
[20,]    8.981085
> Ybar <- rep(mean(Y), n)
> JKT <- t(Y - Ybar) %*% (Y - Ybar)
> JKT
       [,1]
[1,] 174005
> JKR <- t(Y_hat - Ybar) %*% (Y_hat - Ybar)
> JKR
         [,1]
[1,] 89079.29
> JKG <- t(Y - Y_hat) %*% (Y - Y_hat)
> JKG
         [,1]
[1,] 84925.71
> JK <- c(JKR, JKG, JKT)
> JK
[1]  89079.29  84925.71 174005.00
> DBReg <- 2 - 1
> DBTotal <- 20 - 1
> DBGalat <- DBTotal - DBReg
> DB <- c(DBReg, DBGalat, DBTotal)
> DB
[1]  1 18 19
> KT <- JK / DB
> KT
[1] 89079.286  4718.095  9158.158
> su <- c("Regresi", "Galat", "Total")
> su
[1] "Regresi" "Galat"   "Total"  
> anreg <- data.frame(su, JK, DB, KT)
> names(anreg) <- c("SK", "JK", "DB", "KT")
> anreg
       SK        JK DB        KT
1 Regresi  89079.29  1 89079.286
2   Galat  84925.71 18  4718.095
3   Total 174005.00 19  9158.158
> F_hit <- anreg$KT[1] / anreg$KT[2]
> F_hit
[1] 18.88035
> pF <- pf(F_hit, anreg$DB[1], anreg$DB[2], lower.tail = FALSE)
> pF
[1] 0.0003900519

Hipotesis

H0 : seluruh variabel biaya BBM atau bensin tidak berpengaruh signifikan terhadap variabel uang saku perbulannya

H1 : minimal ada 1 variabel biaya BBM atau bensin yang berpengaruh signifikan terhadap variabel uang saku perbulannya

Statistik uji:

p−value=0.00039

Titik kritis:

α=0.05

Keputusan:

Statistik uji (0.00039) < Titik kritis (0.05), maka Tolak H0.

Kesimpulan:

Dengan taraf nyata 5% dapat disimpulkan bahwa minimal ada 1 variabel biaya BBM atau bensin yang berpengaruh signifikan terhadap variabel uang saku perbulannya.

4.4.2 Uji Parsial

> var_cov <- anreg$KT[2] * solve(t(X) %*% X)
> var_cov
           [,1]        [,2]
[1,] 1510.39665 -29.2986640
[2,]  -29.29866   0.6735325
> sd <- rep(0, 2)
> for (i in 1:2) {
+   sd[i] <- sqrt(var_cov[i, i])
+ }
> sd
[1] 38.8638218  0.8206903
> t <- b_hat / sd
> t
          [,1]
[1,] 0.7301892
[2,] 4.3451524
> p <- 2 * pt(abs(t), anreg$DB[2], lower.tail = FALSE)
> p
             [,1]
[1,] 0.4746714805
[2,] 0.0003900519

Pengujian X terhadap Y

Hipotesis

H0: β1 = 0 (tidak terdapat hubungan linier antara peubah uang bensin dengan uang saku perbulannya) H1 : β1 ≠ 0 (terdapat hubungan linier antara peubah uang bensin dengan uang saku perbulannya)

Statistik Uji

Nilai P-value = 0.000390

Taraf Signifikansi:

α = 0,05

Keputusan

P-value < α(0,05) maka tolak H0

Kesimpulan

Dengan taraf nyata 5% sudah cukup bukti bahwa terdapat hubungan linier antara peubah uang bensin dengan uang saku perbulannya.

4.5 Pengujian Asumsi

4.5.1 Asumsi Non-Autokorelasi

> dwtest(regresi)

    Durbin-Watson test

data:  regresi
DW = 1.5356, p-value = 0.1497
alternative hypothesis: true autocorrelation is greater than 0

Hipotesis

H0 : Tidak terjadi autokorelasi

H1 : Terjadi autokorelasi

Statistik uji:

p−value=0.1497

Titik kritis:

α=0.05

Keputusan: Statistik uji (0.1497) > alpha (0.05), maka Terima H0.

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terjadi masalah autokorelasi.

4.5.2 Asumsi Homoskedastisitas

> library(lmtest)
> lmtest :: bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 7.6431, df = 1, p-value = 0.005699

Hipotesis

H0 : Tidak terjadi heteroskedastisitas

H1 : Terjadi heteroskedastisitas

Statistik uji:

p = 0.005699

Taraf Signifikansi:

α = 0.05

Keputusan:

Statistik uji (0.005699) > alpha (0.05), maka Terima H0.

Kesimpulan:

Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terjadi masalah heteroskedastisitas atau asumsi homoskedastisitas terpenuhi.

4.5.3 Asumsi Normalitas

> sisa<-residuals(regresi)
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.94665, p-value = 0.319

Hipotesis

H0 : Populasi berdistribusi normal

H1 : Populasi tidak berdistribusi normal

Statistik uji:

p−value=0.319

Taraf Signifikansi:

α=0.05

Keputusan:

Statistik uji (0.319) > alpha (0.05), maka Terima H0.

Kesimpulan:

Berdasarkan hasil uji Shapiro Wilk, dapat diketahui bahwa P-value = 0.319 > α = 0.05, maka terima Ho. Sehingga dapat disimpulkan bahwa galat menyebar normal atau asumsi normalitas galat terpenuhi.

4.6 Uji Kelayakan Model (Uji Goodness of Fit)

> R2 <- anreg$JK[1] / anreg$JK[3]
> R2
[1] 0.5119352

Dengan koefisien determinasi 0.5119352, maka disimpulkan bahwa variabel biaya BBM atau bensin menjelaskan hubungan terhadap uang saku perbulannya sebesar 51.19%, sisanya dipengaruhi oleh variabel lain.

4.7 Selang Kepercayaan

> alfa <- 0.05
> ttab <- qt(alfa/2, anreg$DB[2], lower.tail = FALSE)
> ttab
[1] 2.100922
> lb_sk <- b_hat - ttab * sd
> ub_sk <- b_hat + ttab * sd
> sk <- cbind(lb_sk, ub_sk)
> sk
           [,1]       [,2]
[1,] -53.271916 110.027804
[2,]   1.841818   5.290231

Dengan selang kepercayaan yang didapatkan, disimpulkan bahwa selang kepercayaan bagi βˆi adalah 1.841818 <βˆi< 5.290231 atau nilai beta duga ke-i berada di antara 1.841818 dan 5.29031.

4.8 Diagnostic Sisaan

> par(mfrow=c(2,2))
> plot(regresi)

Dari plot Residuals vs Fitted Pada plot ini dapat dilihat garis merah yang menghubungkan pusat dari kelompok sisaan masih terlihat datar (horizontal) sehingga dapat disimpulkan model sudah tepat.

Dari plot Normal Q-Q Plot, Titik-titik berada tidak jauh dari garis normal dengan sudut 45 derajat antara sumbu X dan sumbu Y di kuadran 1. Secara grafis tidak ada indikasi pelanggaran normalitas.

Dari plot Scale-Location garis merah tidak terlalu mendatar, mungkin ada masalah heteroskedastisitas.

Dari plot Residuals vs Leverage, ada beberapa titik yang diberi “warning” sebagai amatan berpengaruh karena di atas jarak Cook. Dapat dipastikan dapat membentuk regresi baru tanpa titik tersebut.

5 KESIMPULAN

Berdasarkan hasil dan pembahasan, dapat ditarik kesimpulan bahwa model regresi yang terbentuk sebagai berikut:

\[ (ˆY)=β0+β1Xi=28.377944+3.566024Xi \] Dimana pada uji simultan dan uji parsial, variabel prediktor baik secara simultan maupun parsial berpengaruh siginifikan terhadap variabel respons. Selain itu pada koefisien determinasi (R2), tingkat variabilitas dalam variabel respons dapat dijelaskan oleh variabel prediktor sebesar 51.19%. Adapun untuk seluruh asumsi seperti normalitas, non autokorelasi, dan homoskedastisitas telah teruji dan terpenuhi.

6 DAFTAR PUSTAKA

Rahma Fitriani. 2023. Materi pembelajaran komputasi statistika : M10 Analisis Regresi dalam R.

Aulia, H. 2022. Pengaruh Biaya Bahan Bakar Minyak Terhadap Uang Saku . Laporan Ekonometrika : JURUSAN EKONOMI SYARIAH, FAKULTAS EKONOMI DAN BISNIS ISLAM, INSTITUT AGAMA ISLAM NEGERI METRO.

Miftachul, H. 2018. Buku Statistik . Malang : Stikeswch.

Sunyoto, Suyanto. 2011. Analisis Regresi dan Uji Hipotesis . Yogyakarta: Caps.