- 1 PENDAHULUAN
- 2 TINJAUAN PUSTAKA
- 3 SOURCE CODE
- 4 HASIL DAN PEMBAHASAN
- 5 KESIMPULAN
- 6 DAFTAR PUSTAKA
1 PENDAHULUAN
1.1 Latar Belakang
Bahan bakar minyak (BBM) merupakan salah satu sumber daya alam yang berperan dalam kehidupan manusia. Bahan bakar minyak (BBM) menjadi salah satu bagian dari kebutuhan pokok masyarakat hingga sangat mempengaruhi perekonomian secara nasional, karena memiliki peranan dalam menunjang setiap aktivitas kehidupan masyarakat, seperti halnya pada mahasiswa. Mahasiswa sendiri sangat membutuhkan bahan bakar minyak pada sarana transportasi yang digunakan untuk beraktivitas ke kampus, sehingga tanpa adanya bahan bakar minyak akan berakibat tersendatnya aktivitas tersebut. Namun tanpa disadari oleh mahasiswa bahwa bahan bakar minyak dapat menguras pendapatan perbulannya. Pendapatan yang awalnya cukup untuk memenuhi kebutuhan hidup menjadi tidak cukup karena harus mengeluarkan biaya untuk bahan bakar tersebut. Oleh karena itu, pada mini project mata kuliah Komputasi Statistika ini akan dibahas tentang seberapa besar pengaruh biaya yang dikeluaran oleh mahasiswa untuk membeli bahan bakar minyak terhadap pendapatan uang saku per bulannya dalam waktu satu minggu.
1.2 Data Penelitian
Data merupakan suatu kumpulan berisi fakta-fakta yang dibuat dengan kata-kata, simbol, angka dan lainnya untuk memberikan gambaran secara luas tentang suatu keadaan. Data terdiri dari dua jenis yaitu data primer dan data sekunder. Data primer adalah data yang diambil secara langsung oleh peneliti tanpa melalui perantara sedangkan data sekunder adalah data yang didapatkan melalui perantara atau data yang dimiliki berasal dari data yang sudah ada. Dalam penerapan analisis regresi linier sederhana ini, digunakan data sekunder yaitu data yang diambil dari suatu perantara dan pada kasus ini data terkait uang saku dan bahan bakar minyak (bbm) diambil dari sumber Laporan Ekonometrika.
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif merupakan metode-metode yang berhubungan dengan pengumpulan, penyusunan, dan penyajian data sehingga memberikan informasi yang berguna. Metode ini bermanfaat untuk menganalisa tentang sifat-sifat atau karakteristik dari suatu kasus dan membuat deskripsi atau gambaran yang sistematis serta akurat mengenai fakta-fakta dan sifat-sifat dari kasus yang dianalisa. Data dapat disajikan dalam tabel, diagram, dan grafik.
2.2 Analisis Regresi Linear Sederhana
Analisis regresi linear sederhana merupakan metode pendekatan statistik untuk pemodelan hubungan antara satu variabel respon (Y) dan satu variabel prediktor (X). Metode ini bertujuan untuk memprediksi nilai Y untuk nilai X yang tersedia. Dalam regresi, variabel prediktor menerangkan variabel respon. Dalam analisis regresi sederhana, hubungan antar variabel bersifat linear, dimana perubahan pada variabel X akan diikuti oleh perubahan Variabel Y secara tetap.
Persamaan untuk Model Regresi Linier Sederhana:
\[ \ Yˆ=β0+β1X \\ Keterangan: \\Yˆ = Garis Regresi/Variabel Respon \\β0 = Konstanta \\β1 = Koefisien Regresi \\X = Variabel Prediktor \]
Rumus Mencari Besar β0 dan β1:
\[ β1 = \frac {ΣXY−[(ΣX)(ΣY)] /n}{ΣX2−(ΣX)2/n} \\β0=Y¯−β1X \]
2.3 Pengujian Hipotesis
2.3.1 Uji Simultan
Uji simultan atau uji F digunakan untuk menguji pengaruh secara bersama-sama seluruh variabel prediktor yang diuji terhadap variabel respons. Hipotesis yang digunakan adalah sebagai berikut: \[ H0:β1=β2=...=βk−1=0 \\ H1:βk≠0 \]
2.3.2 Uji Parsial
Uji t digunakan untuk pengujian koefisien regresi secara parsial. Masing-masing variabel prediktor diuji untuk diketahui pengaruhnya terhadap variabel respons. Hipotesis yang digunakan sebagai berikut: \[ H0:βi=0 \\ H1:βi≠0 \]
2.4 Pengujian Asumsi
2.4.1 Uji Normalitas
Uji normalitas adalah pengujian untuk melihat apakah residual dari model regresi yang terbentuk berdistribusi normal. Model regresi yang baik adalah model yang distribusinya normal. Uji yang digunakan bisa berupa uji shapiro-wilk, uji anderson-darling, dan uji kolmogorov-smirnov.
2.4.2 Uji Homoskedastisitas
Homoskedastisitas adalah kondisi di mana terdapat varians yang sama dari setiap residualnya. Untuk melakukan anaisis regresi, asumai homoskedastisitas harus terpenuhi. Kebalikan dari homoskedastisitas adalah heteroskedastisitas. Heteroskedastisitas berarti kondisi di mana varians dari setiap residualnya tidak sama. Asumsi homoskedastisitas dapat diperiksa dengan memperhatikan plot Scale-location, yang disebut juga plot spread-location. \[ H0 : σ^2i = σ^2j, i ̸= j \\H1 : σ2i ̸= σ2j, i ̸= j \]
2.4.3 Uji Non-Autokorelasi
asumsi ini mengasumsikan bahwa antar galat tidak saling berkorelasi. Biasanya galat yang berurutan dapat terindikasi autokorelasi, bisa jadi berkorelasi positif maupun negatif. Jika tidak terpenuhi, standard error yang diestimasi bisa jauh dari yang sebenarnya, sehingga memberikan informasi palsu. Maka, perhitungan menjadi tidak valid. Uji yang bisa dilakukan adalah uji Durbin Watson.
2.5 Uji Kelayakan Model (Uji Goodness of Fit)
Uji koefisien determinasi (R^2) merupakan uji yang digunakan untuk mengetahui layak atau tidaknya model regresi yang terbentuk. Dengan melihat seberapa baik kemampuan model dalam menjelaskan keragaman pada variabel prediktor. Nilai koefisien Determinasi berada diantara 0 sampai 1, dimana ketika nilai koefisien determinasi semakin mendekati nilai 1 maka semakin baik kemampuan variabel predictor dalam menjelaskan variabel respon atau model yang terbentuk layak untuk digunakan dalam melakukan pengambilan keputusan selanjutnya.
2.6 Selang Kepercayaan
Selang kepercayaan adalah sebuah interval dari antara dua nilai yang memuat nilai dari sebuah parameter.
2.7 Diagnostic Sisaan
Model regresi linear dapat dikatakan model yang baik jika memenuhi kriteria BLUE (Best Linear Unbiased Estimator). Pengujian asumsi untuk memperoleh model yang terbaik dapat dilakukan dengan diagnostik sisaan. Asumsi-asumsi yang mendasari model regresi yang diperoleh melalui sisaan antara lain:
Nilai harapan sisaan sama dengan nol
kenormalan (normality)
kehomogenan ragam (homoscedaticity)
keacakan (randomness)
3 SOURCE CODE
3.1 Library
> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(lmtest)
3.2 Data
> library(knitr)
> Mahasiswa<- c(1:20)
> Uang_Saku <- c(145,130,130,310,160,240,190,250,380,420,110,130,165,220,80,70,140,140,80,180)
> Bensin <- c(45,30,25,60,40,30,40,50,80,70,30,30,50,70,20,20,80,30,30,40)
> data <- data.frame(Mahasiswa, Uang_Saku, Bensin)
> kable (data, caption= "Tabel 1. Data")
Mahasiswa | Uang_Saku | Bensin |
---|---|---|
1 | 145 | 45 |
2 | 130 | 30 |
3 | 130 | 25 |
4 | 310 | 60 |
5 | 160 | 40 |
6 | 240 | 30 |
7 | 190 | 40 |
8 | 250 | 50 |
9 | 380 | 80 |
10 | 420 | 70 |
11 | 110 | 30 |
12 | 130 | 30 |
13 | 165 | 50 |
14 | 220 | 70 |
15 | 80 | 20 |
16 | 70 | 20 |
17 | 140 | 80 |
18 | 140 | 30 |
19 | 80 | 30 |
20 | 180 | 40 |
3.3 Smooth Scatter Plot
> n <- 20
> Mahasiswa<- c(1:20)
> Uang_Saku <- c(145,130,130,310,160,240,190,250,380,420,110,130,165,220,80,70,140,140,80,180)
> Bensin <- c(45,30,25,60,40,30,40,50,80,70,30,30,50,70,20,20,80,30,30,40)
> data <- data.frame(Mahasiswa, Uang_Saku, Bensin)
> library(rmarkdown)
> paged_table(as.data.frame(data))
> scatter.smooth(x=Bensin,y=Uang_Saku,xlab="Bensin",ylab="Uang_Saku", main = "Gambar 1. Smooth Scatter Plot", col = "burlywood")
3.4 Boxplot
> boxplot(Uang_Saku~Bensin, main="Boxplot respon setiap perlakuan", xlab="bensin",ylab="Uang_Saku")
3.5 Model Analisis Regresi
> regresi<-lm(Uang_Saku~Bensin,data=data)
> regresi
:
Calllm(formula = Uang_Saku ~ Bensin, data = data)
:
Coefficients
(Intercept) Bensin 28.378 3.566
> model<-summary(regresi)
> model
:
Calllm(formula = Uang_Saku ~ Bensin, data = data)
:
Residuals
Min 1Q Median 3Q Max -173.660 -32.694 -5.359 25.066 142.000
:
CoefficientsPr(>|t|)
Estimate Std. Error t value 28.3779 38.8638 0.730 0.47467
(Intercept) 3.5660 0.8207 4.345 0.00039 ***
Bensin ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Signif. codes
: 68.69 on 18 degrees of freedom
Residual standard error-squared: 0.5119, Adjusted R-squared: 0.4848
Multiple R-statistic: 18.88 on 1 and 18 DF, p-value: 0.0003901 F
4 HASIL DAN PEMBAHASAN
4.1 Menentukan Variabel Prediktor dan Variabel Respon
Variabel Prediktor (X) = Biaya Bahan Bakar Minyak (BBM) atau bensin
Variabel Respon (Y) = Uang Saku Perbulannya Dikarenakan BBM atau bensin yang mempengaruhi uang saku perbulannya.
4.2 Statistika Deskriptif
Berdasarkan output model regresi diperoleh lima angka residual : \[ Min = -173.660 \] Maka disimpulkan bahwa data memiliki residual terkecil sebesar -173.660. \[ Q1 = -32.694 \] Maka, disimpulkan bahwa data memiliki residual kuartil pertama sebesar -32.694. \[ Median = -5.359 \] Maka, dapat disimpulkan bahwa data memiliki residual median sebesar -5.359. \[ Q3 = 25.066 \] Maka, disimpulkan bahwa data memiliki residual quartil ketiga sebesar -5.359. \[ Max = 142 \] Maka. disimpulkan bahwa data memiliki residual terbesar sebesar 142.
4.3 Analisis Regresi Linear Sederhana
> n <- dim(data)[1]
> n
1] 20
[> X <- matrix(c(rep(1, 20), data$Bensin), nrow = 20)
> X
1] [,2]
[,1,] 1 45
[2,] 1 30
[3,] 1 25
[4,] 1 60
[5,] 1 40
[6,] 1 30
[7,] 1 40
[8,] 1 50
[9,] 1 80
[10,] 1 70
[11,] 1 30
[12,] 1 30
[13,] 1 50
[14,] 1 70
[15,] 1 20
[16,] 1 20
[17,] 1 80
[18,] 1 30
[19,] 1 30
[20,] 1 40
[> Y <- data$Uang_Saku
> Y
1] 145 130 130 310 160 240 190 250 380 420 110 130 165 220 80 70 140 140 80
[20] 180
[> k <- dim(X)[2]
> k
1] 2
[> b_hat <- solve(t(X)%*%X)%*%(t(X)%*%Y)
> b_hat
1]
[,1,] 28.377944
[2,] 3.566024 [
Persamaan Regresi:
\[ (ˆY)=β0+β1Xi=28.377944+3.566024Xi \] Persamaan regresi linier sederhana yang didapatkan yaitu Y = 28.377944 + 3.566024Xi. Persamaan tersebut menunjukkan bahwa setiap penambahan 1% uang saku mahasiswa perbulannya, akan menambah pengeluaran uang bensin sebanyak 3.566024%.
4.4 Pengujian Hipotesis
4.4.1 Uji Simultan
> Y_hat <- X %*% b_hat
> Y_hat
1]
[,1,] 188.84904
[2,] 135.35867
[3,] 117.52855
[4,] 242.33940
[5,] 171.01892
[6,] 135.35867
[7,] 171.01892
[8,] 206.67916
[9,] 313.65989
[10,] 277.99964
[11,] 135.35867
[12,] 135.35867
[13,] 206.67916
[14,] 277.99964
[15,] 99.69843
[16,] 99.69843
[17,] 313.65989
[18,] 135.35867
[19,] 135.35867
[20,] 171.01892
[> sisa <- Y - Y_hat
> sisa
1]
[,1,] -43.849036
[2,] -5.358672
[3,] 12.471449
[4,] 67.660600
[5,] -11.018915
[6,] 104.641328
[7,] 18.981085
[8,] 43.320842
[9,] 66.340114
[10,] 142.000357
[11,] -25.358672
[12,] -5.358672
[13,] -41.679158
[14,] -57.999643
[15,] -19.698430
[16,] -29.698430
[17,] -173.659886
[18,] 4.641328
[19,] -55.358672
[20,] 8.981085
[> Ybar <- rep(mean(Y), n)
> JKT <- t(Y - Ybar) %*% (Y - Ybar)
> JKT
1]
[,1,] 174005
[> JKR <- t(Y_hat - Ybar) %*% (Y_hat - Ybar)
> JKR
1]
[,1,] 89079.29
[> JKG <- t(Y - Y_hat) %*% (Y - Y_hat)
> JKG
1]
[,1,] 84925.71
[> JK <- c(JKR, JKG, JKT)
> JK
1] 89079.29 84925.71 174005.00
[> DBReg <- 2 - 1
> DBTotal <- 20 - 1
> DBGalat <- DBTotal - DBReg
> DB <- c(DBReg, DBGalat, DBTotal)
> DB
1] 1 18 19
[> KT <- JK / DB
> KT
1] 89079.286 4718.095 9158.158
[> su <- c("Regresi", "Galat", "Total")
> su
1] "Regresi" "Galat" "Total"
[> anreg <- data.frame(su, JK, DB, KT)
> names(anreg) <- c("SK", "JK", "DB", "KT")
> anreg
SK JK DB KT1 Regresi 89079.29 1 89079.286
2 Galat 84925.71 18 4718.095
3 Total 174005.00 19 9158.158
> F_hit <- anreg$KT[1] / anreg$KT[2]
> F_hit
1] 18.88035
[> pF <- pf(F_hit, anreg$DB[1], anreg$DB[2], lower.tail = FALSE)
> pF
1] 0.0003900519 [
Hipotesis
H0 : seluruh variabel biaya BBM atau bensin tidak berpengaruh signifikan terhadap variabel uang saku perbulannya
H1 : minimal ada 1 variabel biaya BBM atau bensin yang berpengaruh signifikan terhadap variabel uang saku perbulannya
Statistik uji:
p−value=0.00039
Titik kritis:
α=0.05
Keputusan:
Statistik uji (0.00039) < Titik kritis (0.05), maka Tolak H0.
Kesimpulan:
Dengan taraf nyata 5% dapat disimpulkan bahwa minimal ada 1 variabel biaya BBM atau bensin yang berpengaruh signifikan terhadap variabel uang saku perbulannya.
4.4.2 Uji Parsial
> var_cov <- anreg$KT[2] * solve(t(X) %*% X)
> var_cov
1] [,2]
[,1,] 1510.39665 -29.2986640
[2,] -29.29866 0.6735325
[> sd <- rep(0, 2)
> for (i in 1:2) {
+ sd[i] <- sqrt(var_cov[i, i])
+ }
> sd
1] 38.8638218 0.8206903
[> t <- b_hat / sd
> t
1]
[,1,] 0.7301892
[2,] 4.3451524
[> p <- 2 * pt(abs(t), anreg$DB[2], lower.tail = FALSE)
> p
1]
[,1,] 0.4746714805
[2,] 0.0003900519 [
Pengujian X terhadap Y
Hipotesis
H0: β1 = 0 (tidak terdapat hubungan linier antara peubah uang bensin dengan uang saku perbulannya) H1 : β1 ≠ 0 (terdapat hubungan linier antara peubah uang bensin dengan uang saku perbulannya)
Statistik Uji
Nilai P-value = 0.000390
Taraf Signifikansi:
α = 0,05
Keputusan
P-value < α(0,05) maka tolak H0
Kesimpulan
Dengan taraf nyata 5% sudah cukup bukti bahwa terdapat hubungan linier antara peubah uang bensin dengan uang saku perbulannya.
4.5 Pengujian Asumsi
4.5.1 Asumsi Non-Autokorelasi
> dwtest(regresi)
-Watson test
Durbin
: regresi
data= 1.5356, p-value = 0.1497
DW : true autocorrelation is greater than 0 alternative hypothesis
Hipotesis
H0 : Tidak terjadi autokorelasi
H1 : Terjadi autokorelasi
Statistik uji:
p−value=0.1497
Titik kritis:
α=0.05
Keputusan: Statistik uji (0.1497) > alpha (0.05), maka Terima H0.
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terjadi masalah autokorelasi.
4.5.2 Asumsi Homoskedastisitas
> library(lmtest)
> lmtest :: bptest(regresi)
-Pagan test
studentized Breusch
: regresi
data= 7.6431, df = 1, p-value = 0.005699 BP
Hipotesis
H0 : Tidak terjadi heteroskedastisitas
H1 : Terjadi heteroskedastisitas
Statistik uji:
p = 0.005699
Taraf Signifikansi:
α = 0.05
Keputusan:
Statistik uji (0.005699) > alpha (0.05), maka Terima H0.
Kesimpulan:
Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terjadi masalah heteroskedastisitas atau asumsi homoskedastisitas terpenuhi.
4.5.3 Asumsi Normalitas
> sisa<-residuals(regresi)
> shapiro.test(sisa)
-Wilk normality test
Shapiro
: sisa
data= 0.94665, p-value = 0.319 W
Hipotesis
H0 : Populasi berdistribusi normal
H1 : Populasi tidak berdistribusi normal
Statistik uji:
p−value=0.319
Taraf Signifikansi:
α=0.05
Keputusan:
Statistik uji (0.319) > alpha (0.05), maka Terima H0.
Kesimpulan:
Berdasarkan hasil uji Shapiro Wilk, dapat diketahui bahwa P-value = 0.319 > α = 0.05, maka terima Ho. Sehingga dapat disimpulkan bahwa galat menyebar normal atau asumsi normalitas galat terpenuhi.
4.6 Uji Kelayakan Model (Uji Goodness of Fit)
> R2 <- anreg$JK[1] / anreg$JK[3]
> R2
1] 0.5119352 [
Dengan koefisien determinasi 0.5119352, maka disimpulkan bahwa variabel biaya BBM atau bensin menjelaskan hubungan terhadap uang saku perbulannya sebesar 51.19%, sisanya dipengaruhi oleh variabel lain.
4.7 Selang Kepercayaan
> alfa <- 0.05
> ttab <- qt(alfa/2, anreg$DB[2], lower.tail = FALSE)
> ttab
1] 2.100922
[> lb_sk <- b_hat - ttab * sd
> ub_sk <- b_hat + ttab * sd
> sk <- cbind(lb_sk, ub_sk)
> sk
1] [,2]
[,1,] -53.271916 110.027804
[2,] 1.841818 5.290231 [
Dengan selang kepercayaan yang didapatkan, disimpulkan bahwa selang kepercayaan bagi βˆi adalah 1.841818 <βˆi< 5.290231 atau nilai beta duga ke-i berada di antara 1.841818 dan 5.29031.
4.8 Diagnostic Sisaan
> par(mfrow=c(2,2))
> plot(regresi)
Dari plot Residuals vs Fitted Pada plot ini dapat dilihat garis merah yang menghubungkan pusat dari kelompok sisaan masih terlihat datar (horizontal) sehingga dapat disimpulkan model sudah tepat.
Dari plot Normal Q-Q Plot, Titik-titik berada tidak jauh dari garis normal dengan sudut 45 derajat antara sumbu X dan sumbu Y di kuadran 1. Secara grafis tidak ada indikasi pelanggaran normalitas.
Dari plot Scale-Location garis merah tidak terlalu mendatar, mungkin ada masalah heteroskedastisitas.
Dari plot Residuals vs Leverage, ada beberapa titik yang diberi “warning” sebagai amatan berpengaruh karena di atas jarak Cook. Dapat dipastikan dapat membentuk regresi baru tanpa titik tersebut.
5 KESIMPULAN
Berdasarkan hasil dan pembahasan, dapat ditarik kesimpulan bahwa model regresi yang terbentuk sebagai berikut:
\[ (ˆY)=β0+β1Xi=28.377944+3.566024Xi \] Dimana pada uji simultan dan uji parsial, variabel prediktor baik secara simultan maupun parsial berpengaruh siginifikan terhadap variabel respons. Selain itu pada koefisien determinasi (R2), tingkat variabilitas dalam variabel respons dapat dijelaskan oleh variabel prediktor sebesar 51.19%. Adapun untuk seluruh asumsi seperti normalitas, non autokorelasi, dan homoskedastisitas telah teruji dan terpenuhi.
6 DAFTAR PUSTAKA
Rahma Fitriani. 2023. Materi pembelajaran komputasi statistika : M10 Analisis Regresi dalam R.
Aulia, H. 2022. Pengaruh Biaya Bahan Bakar Minyak Terhadap Uang Saku . Laporan Ekonometrika : JURUSAN EKONOMI SYARIAH, FAKULTAS EKONOMI DAN BISNIS ISLAM, INSTITUT AGAMA ISLAM NEGERI METRO.
Miftachul, H. 2018. Buku Statistik . Malang : Stikeswch.
Sunyoto, Suyanto. 2011. Analisis Regresi dan Uji Hipotesis . Yogyakarta: Caps.