Analisis Regresi Linier Sederhana untuk Prediksi Jumlah Bahan Baku untuk Produksi Tahu di Kota Pekanbaru

Dina Apriska

2023-05

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Dalam membangun atau menjalankan suatu usaha, tentunya terdapat penyusunan rencana mengenai produksi barang atau jasa yang akan dijual. Rencana produksi tersebut disusun berdasarkan informasi yang ada. Suatu perusahaan akan dikatakan boros jika produksi yang dihasilkan berlebihan. Di sisi lain, jika produksi barangnya sedikit yang mana kurang dari batas permintaan, maka perusahaan lain dapat mengambil peluang/kesempatan untuk menjual produk mereka sehingga perusahaan akan merugi. Hal tersebut perlu diatasi dengan membuat rencana produksi yang matang dan sesuai dengan target pasar. Pemanfaatan ilmu statistika dan penerapan IPTEK yang sudah maju ini dapat digunakan untuk membantu perusahaan dalam membuat rencana produksi. Kasus yang akan dibahas saat ini adalah mengenai rencana produksi pada usaha Tahu di Kota Pekanbaru.

Salah satu permasalahan usaha produksi Tahu rumahan di Pekan baru ialah minimnya pencatatan mengenai jumlah produksi dan jumlah penjualan Tahu. Hal tersebut dapat menjadi penyebab terjadinya ketidakseimbangan produksi (kelebihan atau kekurangan stock). Ketidakseimbangan produksi membuat banyak produsen mengeluh karena profitnya berkurang atau stock tidak memenuhi permintaan pasar. Oleh karena itu, diperlukan analisis untuk mengoptimalkan produksi Tahu di Pekanbaru. Analisis yang digunakan berasal dari pemanfaatan ilmu statistika, yaitu analisis Regresi Linier Sederhana.

Analisis regresi merupakan metode statistika yang digunakan untuk memahami hubungan linier antara variabel terikat dan variabel bebas. Regresi linier sederhana merupakan analisis statistika yang hanya memiliki satu variabel bebas. Pemanfaatan regresi linier dapat untuk memproses data timeseries. Namun pada kasus ini, regresi linier sederhana digunakan untuk menganalisis dan mengestimasi proses produksi agar mendapatkan solusi terbaik dari permasalahan yang telah dijelaskan sebelumnya. Model regresi linier sederhana akan memuat nilai estimasi atau prediksi yang berguna untuk membantu menentukan jumlah produksi dan persediaan bahan baku agar proses produksi menjadi optimal.

2 TINJAUAN PUSTAKA

2.1 Analisis Regresi

Analisis regresi merupakan metode statistika yang digunakan untuk memahami hubungan linier antara variabel terikat dan variabel bebas. Terdapat dua jenis variabel dalam analisis regresi, yaitu variabel bebas/independen (X) dan variabel terikat/dependen (Y). Adapun Tujuan dari analisis regresi adalah untuk memberi perkiraan atau prediksi nilai variabel terikat (Y) pada nilai variabel bebas (X) yang tertentu. Ada beberapa macam analisis regresi yang sering digunakan, antara lain: analisis regresi linier sederhana, regresi linier berganda, regresi non-linier sederhana, dan regresi non-linier berganda.

2.2 Regresi Linier Sederhana

Regresi linier sederhana merupakan jenis analisis regresi yang hanya memiliki satu variabel independen (X) dan variabel dependen (Y). Model regresi linier sederhana adalah sebagai berikut.

\[ Y=\alpha+\beta x \] diduga menjadi persamaan berikut.

Rumus y Duga

Keterangan: \[ \hat{Y} = variabel~terikat\ \] \[ \alpha = intercept\ \] \[ \beta = slope/kemiringan~(koefisien~variabel~X)\ \] \[ \ X = variabel~independen\ \] Dalam model regresi linier sederhana terdapat dua parameter, yaitu ∝ dan β (Walpole dan Myers, 1986). Nilai a setara dengan nilai β0 dan nilai b setara dengan nilai β1. Untuk mendapatkan nilai β0 dan β1 digunakan rumus sebagai berikut.

Rumus Beta Duga

2.3 Regresi Linier Berganda

Regresi linier berganda merupakan salah satu jenis analisis regresi linier yang mana dalam pengujiannya terdapat dua atau lebih variabel independen (X) terhadap satu variabel dependen (Y). Model regresi berganda mengasumsikan adanya hubungan linier antara variabel dependen (Y) dengan masing-masing variabel bebasnya. Model regresi berganda adalah sebagai berikut. Model Linier Berganda

2.4 Uji Asumsi Klasik

Uji asumsi klasik adalah suatu pengujian yang dilakukan sebelum melakukan analisis regresi linier. Berikut terdapat beberapa asumsi yang harus dipenuhi untuk mendapatkan model regresi yang baik. - Galat harus berdistribusi normal. - Ragam galat bersifat homogen. - Tidak ada autokorelasi atau galat saling bebas. - Tidak terjadi multikolinearitas (untuk analisis regresi linier berganda).

2.4.1 Uji Asumsi Normalitas

Uji asumsi normalitas digunakan untuk mengetahui sebaran atau distribusi dari galat model regresi. Model regresi yang baik adalah model regresi yang memenuhi asumsi bahwa galat berdistribusi normal. Jika terjadi pelanggaran asumsi ini, maka uji statistik menjadi tidak valid untuk jumlah sampel kecil (Dyah,2012). Pengujian normalitas galat ini dapat dilakukan dengan uji Shapiro-Wilk, uji Kolmogorov Smirnov, Uji Liliefors, dan Q-Q plot.

Hipotesis Pengujian H0 : Galat berdistribusi normal. H1 : Galat tidak berdistribusi.

Kriteria Pengujian Tolak H0, jika p-value < ∝ Terima H0, jika p-value > ∝

2.4.2 Uji Asumsi Homoskedastisitas

Uji asumsi homoskedastisitas adalah uji yang digunakan untuk melihat apakah galat memiliki variansi yang konstan atau tidak. Model regresi yang baik adalah model regresi yang dimana galat memiliki variansi yang konstan atau dengan kata lain variansi galat pengamatan satu dengan pengamatan lainnya adalah sama. Asumsi ini dapat diperiksa dengan uji Breusch-Pagan, uji White, uji Spearman’s Rank Correlation, dan lain sebagainya.

Hipotesis Pengujian H0 : Ragam galat homogen. H1 : Ragam galat tidak homogen.

Kriteria Pengujian Tolak H0, jika p-value < ∝ Terima H0, jika p-value > ∝

2.4.3 Uji Asumsi autokorelasi

Uji asumsi autokorelasi digunakan untuk mengetahui ada/tidaknya korelasi antar residual pada periode t dengan residual pada periode t-1 dalam model regresi linier (Dyah,2012). Asumsi ini biasa digunakan pada data timeseries. Salah satu cara mendeteksi ada/tidaknya autokorelasi adalah dengan uji Durbin-Watson.

Hipotesis Pengujian H0 : Tidak terjadi kasus autokorelasi H1 : Terjadi autokorelasi

Kriteria Pengujian Tolak H0, jika p-value < ∝ Terima H0, jika p-value > ∝

2.4.4 Uji Asumsi Multikolinieritas

Uji multikolinieritas bertujuan untuk menguji ada/tidaknya korelasi yang tinggi (r=1) antar variabel independen pada model regresi. Menurut Suyono (2015), multikolinieritas tidak memengaruhi kesesuaian model, tetapi sangat berpengaruh pada koefisien regresi. Model regresi yang baik adalah model yang tidak terdapat multikolinieritas. Adapun cara mendeteksi multikolinearitas, antara lain nilai R^2 cukup tinggi, dan hasil uji F sangat signifikan tetapi pada hasil uji t parsial tidak ada yang signifikan. Pengujian Multikolinearitas dapat dilakukan dengan menggunakan uji Tolerance (TOL) dan Variance Inflation Factor (VIF). Uji multikolinearitas tidak dapat digunakan pada regresi linier sederhana karena variabel independen yang digunakan hanya satu. Oleh karena itu, uji ini hanya dapat digunakan untuk analisis regresi linier berganda saja.

3 SOURCE CODE

3.1 Data

Data Jumlah Penjualan (X) dan Jumlah Produksi (Y)

> #Input data
> JumlahPenjualan <- c(2120,2150,2531,2480,2500,2200,2440,2266,2500,
+                      2285,2651,2721,2527,2690,2685,2754,2666,2802)
> JumlahProduksi <- c(2200,2259,2521,2601,2793,2540,2480,2543,2350,
+                     2540,2747,2744,2741,2753,2751,2853,2849,2851)
> #Membuat matriks Y(Jumlah Produksi) dan X(Jumlah Penjualan)
> Y <- matrix(cbind(JumlahProduksi),ncol=1)
> n <- dim(Y)[1]
> X0 <- rep(1,n)
> X1 <- JumlahPenjualan
> X <- matrix(cbind(X0,X1),nrow=18,ncol=2)

3.2 Mencari Nilai Beta Duga dengan Rumus Matriks.

> #Mencari Nilai Penduga dari Setiap Koefisien Regresi
> p <- (t(X)%*%X)     #perkalian matriks XtX
> q <- (t(X)%*%Y)     #perkalian matriks XtY
> 
> beta_topi <- solve(p)%*%(q)
> beta_topi
            [,1]
[1,] 662.9838184
[2,]   0.7823851

3.3 Analisis Regresi Linier Sederhana

> #Analisis Regresi Linier Sederhana (Lengkap)
> modelReg <- lm(JumlahProduksi~JumlahPenjualan)
> summary(modelReg)

Call:
lm(formula = JumlahProduksi ~ JumlahPenjualan)

Residuals:
     Min       1Q   Median       3Q      Max 
-268.946  -76.547   -3.263   97.450  174.054 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)     662.9838   328.1316   2.020   0.0604 .  
JumlahPenjualan   0.7824     0.1309   5.978 1.93e-05 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 116.2 on 16 degrees of freedom
Multiple R-squared:  0.6907,    Adjusted R-squared:  0.6714 
F-statistic: 35.73 on 1 and 16 DF,  p-value: 1.933e-05

3.4 Uji Asumsi Klasik

> #Uji Asumsi Klasik
> 
> # (1) Asumsi Normalitas
> library(tseries)
> library(nortest)
> shapiro.test(modelReg$residuals)

    Shapiro-Wilk normality test

data:  modelReg$residuals
W = 0.96035, p-value = 0.6084
> lillie.test(modelReg$residuals)

    Lilliefors (Kolmogorov-Smirnov) normality test

data:  modelReg$residuals
D = 0.11902, p-value = 0.7173
> 
> # (2) Asumsi Homoskedastisitas
> library(lmtest)
> bptest(modelReg)

    studentized Breusch-Pagan test

data:  modelReg
BP = 1.2442, df = 1, p-value = 0.2647
> 
> # (3) Asumsi Autokorelasi
> library(lmtest)
> dwtest(modelReg)

    Durbin-Watson test

data:  modelReg
DW = 2.228, p-value = 0.6325
alternative hypothesis: true autocorrelation is greater than 0

4 HASIL DAN PEMBAHASAN

4.1 Model Regresi Linier Sederhana

Didapatkan, nilai β0 = 662.9838 dan β1 = 0.7824 sehingga model regresi linier sederhana untuk kasus tersebut adalah sebagai berikut. \[ \hat{Y}=662.9838+0.7824x \] Interpretasi:

  • β0 = 662.9838 merupakan intersep, artinya jika variabel jumlah penjualan adalah konstan (nilai=0) maka jumlah produksi Tahu adalah sebesar 662,9838 satuan.
  • β1 = 0.7824 meruapakan slope, artinya jika variabel jumlah penjualan meningkat sebesar 1 unit maka variabel jumlah produksi akan meningkat pula sebesar 0,7824 satuan.

4.2 Uji F (Uji Simultan)

Hipotesis H0 : \(\beta_1 = 0\) (Secara simultan jumlah penjualan tidak berpengaruh terhadap jumlah produksi) H1 : \(\beta_1 \neq 0\) (Secara simultan jumlah penjualan berpengaruh terhadap jumlah produksi)

Taraf Nyata \[ \alpha=0.05 \] Output

> summary(modelReg)

Call:
lm(formula = JumlahProduksi ~ JumlahPenjualan)

Residuals:
     Min       1Q   Median       3Q      Max 
-268.946  -76.547   -3.263   97.450  174.054 

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)     662.9838   328.1316   2.020   0.0604 .  
JumlahPenjualan   0.7824     0.1309   5.978 1.93e-05 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 116.2 on 16 degrees of freedom
Multiple R-squared:  0.6907,    Adjusted R-squared:  0.6714 
F-statistic: 35.73 on 1 and 16 DF,  p-value: 1.933e-05

Statistik Uji

\[ F hit = 35.73\] dengan db1=1 dan db2=16 \[p-value = 1.933e-05\] Keputusan karena p-value (1.933e-05) < ∝ (0.05), maka Tolak H0.

Kesimpulan Dengan taraf nyata 5% didapatkan disimpulkan bahwa secara simultan jumlah penjualan berpengaruh terhadap jumlah produksi.

4.3 Uji t (Uji Parsial)

Hipotesis H0 : \(\beta_1 = 0\) (Secara parsial jumlah penjualan tidak berpengaruh terhadap jumlah produksi) H1 : \(\beta_1 \neq 0\) (Secara parsial jumlah penjualan berpengaruh terhadap jumlah produksi)

Taraf Nyata \[ \alpha=0.05 \] Statistik Uji

\[ t hit = 5.978\] \[p-value = 1.93e-05\] Keputusan karena p-value (1.93e-05) < ∝ (0.05), maka Tolak H0.

Kesimpulan Dengan taraf nyata 5% didapatkan disimpulkan bahwa secara parsial jumlah penjualan berpengaruh terhadap jumlah produksi.

4.4 Koefisien Determinasi

\[ R^2 = 0.6714 \] Interpretasi Nilai koefisien determinasi adalah sebesar 0.6714, yang berarti bahwa variabel independen (jumlah penjualan) mempengaruhi variabel dependen (jumlah produksi) sebesar 67,14% sedangkan sisanya dipengaruhi oleh variabel lain di luar model.

4.5 Uji Asumsi Normalitas

Hipotesis H0 : Galat berdistribusi normal H1 : Galat tidak berdistribusi normal

Taraf Nyata \[ \alpha=0.05 \] Output

> 
> # (1) Asumsi Normalitas
> library(tseries)
> library(nortest)
> shapiro.test(modelReg$residuals)

    Shapiro-Wilk normality test

data:  modelReg$residuals
W = 0.96035, p-value = 0.6084
> lillie.test(modelReg$residuals)

    Lilliefors (Kolmogorov-Smirnov) normality test

data:  modelReg$residuals
D = 0.11902, p-value = 0.7173

Statistik Uji \[p-value = 0.6084\] untuk uji Shapiro-Wilk \[p-value = 0.7173\] untuk uji Lilliefors

Keputusan karena p-value (0.6084) > ∝ (0.05), maka Terima H0. (Untuk Uji Shapiro-Wilk) karena p-value (0.7173) > ∝ (0.05), maka Terima H0. (Untuk Uji Liliefors)

Kesimpulan Berdasarkan dari kedua uji tersebut, dapat dikatakan bahwa dengan taraf nyata 5% didapat kesimpulan bahwa galat galat berdistribusi normal.

4.6 Uji Asumsi Homoskedastisitas

Hipotesis H0 : Ragam galat homogen H1 : Ragam galat tidak homogen

Taraf Nyata \[ \alpha=0.05 \]

Output

> 
> # (2) Asumsi Homoskedastisitas
> library(lmtest)
> bptest(modelReg)

    studentized Breusch-Pagan test

data:  modelReg
BP = 1.2442, df = 1, p-value = 0.2647

Statistik Uji \[p-value = 0.2647\]

Keputusan karena p-value (0.2647) > ∝ (0.05), maka Terima H0.

Kesimpulan Dengan taraf nyata 5% dapat disimpulkan bahwa asumsi ragam galat homogen terpenuhi.

4.7 Uji Asumsi Autokorelasi

Hipotesis H0 : Tidak terjadi kasus autokorelasi H1 : Terjadi kasus autokorelasi

Taraf Nyata \[ \alpha=0.05 \]

Output

> 
> # (3) Asumsi Autokorelasi
> library(lmtest)
> dwtest(modelReg)

    Durbin-Watson test

data:  modelReg
DW = 2.228, p-value = 0.6325
alternative hypothesis: true autocorrelation is greater than 0

Statistik Uji \[p-value = 0.6325\]

Keputusan karena p-value (0.6325) > ∝ (0.05), maka Terima H0.

Kesimpulan Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terjadi kasus autokorelasi pada model regresi linier sederhana.

5 KESIMPULAN

Berdasarkan hasil output dan pembahasan, dapat disimpulkan bahwa :

  1. Model regresi linier sederhana dari kasus produksi Tahu adalah sebagai berikut. \[ \hat{Y}=662.9838+0.7824x \] dimana variabel Y adalah Jumlah Produksi dan variabel X adalah Jumlah Penjualan.

  2. Dari hasil uji F (simultan) dan uji t (parsial), dapat disimpulkan bahwa variabel jumlah penjualan (X) berpengaruh signifikan terhadap variabel jumlah produksi.

  3. Model regresi linier sederhana yang diperoleh sudah sesuai dan sudah memenuhi ketiga uji asumsi klasik. Didapatkan bahwa galat dari model regresi berdistribusi normal, ragam galat pada model bersifat homogen, dan tidak terjadi autokorelasi atau galat saling bebas. Sehingga, dapat dikatakan bahwa model yang terbentuk merupakan model yang baik untuk digunakan dalam memprediksi proses produksi Tahu di Kota Pekanbaru.

6 DAFTAR PUSTAKA