Penerapan Analasis Regresi Linier Sederhana Untuk Mengetahui Pengaruh Jumlah Unit Yang Diproduksi Terhadap Jumlah Jam Kerja Karyawan

Fernandy Herlambang

Mei 2022

1 PENDAHULUAN

1.1 Latar Belakang

Regresi adalah metode statistik yang dipakai untuk memperkirakan hubungan antara sebuah variabel terikat dan satu variabel independen atau lebih. Metode ini juga bisa digunakan untuk menilai kekuatan hubungan antara variabel dengan perkiraan masa depan.

Analisis regresi merupakan suatu metode atau teknik analisis hipotesis penelitian untuk menguji ada tidaknya perngaruh antara variabel satu dengan variabel lain, yang dinyatakan dalam bentuk persamaan matematik (regresi).

Pada penelitian ini, ingin diketahui pengaruh jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan. Sehingga, analisis yang tepat untuk melakukan penelitian ini yaitu menggunakan analisis regresi linear sederhana. Penerapan analisis regresi linear sederhana ini diharapkan dapat memberikan hasil penelitian yang tepat agar dapat memenuhi keputusan yang diinginkan.

1.2 Statistika Deskriptif

Statistik deskriptif adalah bagian dari statistika yang mempelajari tentang cara pengumpulan data dan penyajian data sehingga mudah dipahami. Statistika deskriptif hanya berkaitan dengan uraian atau keterangan-keterangan tentang suatu data atau keadaan. Dengan kata lain, statistika deskriptif memiliki fungsi untuk menjelaskan suatu keadaan, gejala, atau persoalan. Penarikan kesimpulan dalam statistik deskriptif hanya ditujukan pada kumpulan data yang ada. Berikut merupakan contoh histogram pada statistika deskriptif.

Contoh Statistika Deskriptif berupa Histogram yang dipakai untuk memberikan informasi mengenai variasi dalam proses dan membantu manajemen dalam membuat keputusan dalam upaya peningkatan proses yang berkesimbungan.

1.3 Analisis Regresi Linier Sederhana

Menurut Sugiyono (2017:260) analisis regresi adalah untuk membuat keputusan apakah naik dan menurunnya variabel dependent dapat dilakukan melalui peningkatan variabel independent atau tidak. Regresi sederhana didasarkan pada hubungan fungsional ataupun kausal satu variabel independent dengan variabel dependent. Analisis regresi ini digunakan untuk memprediksi seberapa jauh perubahan nilai variabel dependent, bila variabel independent dimanipulasi atau dirubah-rubah atau dinaik-turunkan. Berikut merupakan contoh analisis regresi sederhana.

Gambar diatas merupakan regresi linear sederhana untuk membandingkan harga kamera dengan harga handphone.

1.4 Asumsi Heteroskedastisitas

Uji heteroskedastisitas digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik heteroskedastisitas yaitu adanya ketidaksamaan varian dari residual untuk semua pengamatan pada model regresi. Uji heteroskedastisitas bertujuan untuk menguji apakah dalam model regresi linear terjadi ketidaksamaan varians dari residual satu pengamatan ke pengamatan yang lain. Model regresi yang baik adalah yang homoskedastisitas atau tidak terjadi heteroskedastisitas. Untuk mendeteksi ada tidaknya heteroskedastisitas, dapat dilakukan dengan berbagai cara seperti uji grafik, uji Park, Uji Glejser, uji Spearman’s Rank Correlation, dan uji Whyte menggunakan Lagrange Multiplier.

Berikut merupakan contoh Uji Heteroskedastisitas.

1.5 Data

Data merupakan sekumpulan informasi atau faktar yang didapatkan dari suatu pengamatan atau penelitian. Data juga bisa terbentuk dari kata-kata, kalimat, simbol, angka, dan lainnya. Data pada analisis regresi linier sederhana ini dapat diperoleh dari sebuah pencarian ataupun dari penelitian dari sumber yang dapat dipercaya. Data ini digunakan untuk tujuan analisis.

Dalam penerapan analisis regresi linier sederhana ini digunakan data sekunder yang berasal dari perhitungan hasil jumlah unit yang sudah diproduksi terhadap lamanya jam kerja. Data menunjukkan jumlah unit yang diproduksi (X) dan jumlah jam kerja karyawan (Y). Lalu data tersebut akan diuji untuk mengetahui pengaruh antar variabel.

2 SOURCE CODE

2.1 Library yang akan digunakan

> library(rmarkdown)
> library(readxl)

2.2 Data Hasil Pengamatan

> library(readxl)
> DataANREG <-read_excel("C:/DATA_KOMSTAT.xlsx", range="A1:C11") 
> library(rmarkdown) 
> paged_table(as.data.frame(DataANREG))

Syntax diatas berguna untuk menggunakan library readxl dan memanggil datasekunder dengan data pengamatan yang akan diimport dari excel dengan cara read_excel dengan range A1 sampai C11. Lalu menggunakan library rmarkdown agar bisa menggunakan fungsi paged_table dimana untuk menampilkan data yang telah diimport tadi kedalam sebuah tabel.

2.3 Membangkitkan data

Membangkitkan data yang ada sesuai dengan tabel. Syntaxnya yaitu :

> X <- c(30,20,60,80,40,50,60,30,70,60)
> Y <- c(73,50,128,170,87,108,135,69,148,132)
> XX <- X^2
> YY <- Y^2
> XY <- X*Y
> n <- 10
> DataXY <- data.frame(X, Y, XX, YY, XY)
> 
> SigmaX <- sum(X)
> SigmaY <- sum(Y)
> SigmaXX <- sum(XX)
> SigmaYY <- sum(YY)
> SigmaXY <- sum(XY)
> Xbar <- mean(X)
> Ybar <- mean(Y)

Syntax diatas digunakan untuk membuat variabel X,Y,XX,YY,XY,n sesuai dengan tabel. Lalu membuat dataframe dengan nama variabel DataXY dan judul kolom X,Y,XX,YY,XY. Dan untuk mendefinisikan variabel SigmaX, SigmaY, SigmaXX, SigmaYY, SigmaXY, Xbar, Ybar.

Hasil

> DataXY
    X   Y   XX    YY    XY
1  30  73  900  5329  2190
2  20  50  400  2500  1000
3  60 128 3600 16384  7680
4  80 170 6400 28900 13600
5  40  87 1600  7569  3480
6  50 108 2500 11664  5400
7  60 135 3600 18225  8100
8  30  69  900  4761  2070
9  70 148 4900 21904 10360
10 60 132 3600 17424  7920
> SigmaX
[1] 500
> SigmaY
[1] 1100
> SigmaXX
[1] 28400
> SigmaYY
[1] 134660
> SigmaXY
[1] 61800
> Xbar
[1] 50
> Ybar
[1] 110

2.4 Mencari Persamaan Regresi

Mencari \(\beta_1\) dan \(\beta_0\)

> B1 <- (SigmaXY-((SigmaX*SigmaY)/n)) / (SigmaXX-((SigmaX*SigmaX)/n))
> B1
[1] 2
> B0 <- Ybar-(B1*Xbar)
> B0
[1] 10

Diperoleh Hasil Sebagai berikut \(\hat{Y}=\beta_0+\beta_1X_i=10+2X_i\)

2.5 ANOVA

Menghitung Derajat Bebas dan Jumlah Kuadrat

> Dbr <- 1
> Dbr
[1] 1
> Dbg <- n-2
> Dbg
[1] 8
> Dbt <- n-1
> Dbt
[1] 9
> 
> JKR <- (B1^2)*(SigmaXX-((SigmaX*SigmaX)/n))
> JKR
[1] 13600
> JKT <- SigmaYY-((SigmaY*SigmaY)/n)
> JKT
[1] 13660
> JKG <- JKT-JKR
> JKG
[1] 60

Menghitung Kuadrat Tengah, F Hitung dan F Tabel

> KTR <- JKR/Dbr
> KTR
[1] 13600
> KTG <- JKG/Dbg
> KTG
[1] 7.5
> 
> FHit <- KTR/KTG
> FHit
[1] 1813.333
> 
> FTab <- qf(0.05, 1, 8, lower.tail = F, log.p = F)
> FTab
[1] 5.317655

Setelah data untuk ANOVA sudah dihitung semua lalu buat tabelnya dengan syntax berikut :

> SK <- c("Perlakuan", "Galat", "Total")
> DB <- c(Dbr, Dbg, Dbt)
> JK <- c(JKR, JKT, JKG)
> KT <- c(KTR, KTG, NA)
> FHitung <- c(FHit, NA, NA)
> FTabel <- c(FTab, NA, NA)
> paged_table(data.frame(SK, KT, FHitung, FTabel))

Dari tabel ANOVA diatas diketahui bahwa F Hitung > F Tabel, maka \(H_0\) ditolak.

Dapat disimpulkan bahwa jumlah unit yang diproduksi berpengaruh terhadap jumlah jam kerja karyawan.

Menghitung T Hitung dan T Tabel

> THit <- B1/(sqrt(KTG/(SigmaXX-((SigmaX*SigmaX)/n))))
> THit
[1] 42.58325
> 
> TTab <- qt(0.025, 8, lower.tail = F, log.p = F)

Karena |t Hitung| > t Tabel, maka \(H_0\) ditolak.

Dapat disimpulkan bahwa jumlah unit yang diproduksi berpengaruh terhadap jumlah jam kerja karyawan.

Koefisien Determinasi

> Rkuadrat <- JKR/JKT
> Rkuadrat
[1] 0.9956076

Jadi variabel jumlah unit yang diproduksi dapat menjelaskan hubungan terhadap jumlah jam kerja karyawan sebesar 0.995 atau sebesar 99.5% dan sisanya dipengaruhi variabel lain diluar itu.

2.6 Diagram Pencar

Dengan menggunakan syntax

> plot(DataXY$X, DataXY$Y, main = "Jumlah unit yang diproduksi (X) dengan Jumlah jam kerja karyawan (Y)", xlab="Jumlah unit yang diproduksi (X)", ylab="dengan Jumlah jam kerja karyawan (Y)", col="Orange")
> abline(lm(DataXY$Y~DataXY$X), col="green")

3 HASIL DAN PEMBAHASAN

3.1 Variabel Prediktor dan Variabel Respon

Variabel Prediktor (X) = Jumlah unit yang diproduksi

Variabel Respon (Y) = Jumlah jam kerja karyawan

3.2 Persamaan regresi sederhana

Konstanta Regresi (Slope) dan Konstanta (Intersept)

\(β_1=\frac {\sum X_iY_i -\frac{(\sum X_i \sum Y_i)}{n}} {\sum X_i^2-(\frac{(\sum X_i)^2}{n})} = \frac {61800-\frac {(500)(1100)}{10}}{28400-\frac{250000}{10}}=2\) \(\beta_0=\bar{Y}-\beta_1\bar{X}=110-\left(2\right)\left(50\right)=10\)

Variabel Respon \(\hat{Y}=\beta_0+\beta_1X_i=10+2X_i\)

3.3 Uji Simultan

Hipotesis:

\(H_0\)= Tidak terdapat pengaruh antara jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan

\(H_1\)= Terdapat pengaruh antara jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan

Mencari JKR, JKT, dan JKG

\(JKR=(\beta_1^2)(\sum X_i^2 - \frac {(\sum X_i)^2}{n})=(4)^2 (28400- \frac {250000}{10})=13600\)

\(JKT=\sum Y_i^2 - \frac {(\sum Y_i)^2}{n}=134660-\frac {1210000}{10}\)

\(JKG=JKT - JKR= 13660-13600=60\)

Sehingga didapatkan data seperti ini
Tabel ANOVA :

Dari tabel ANOVA diatas diketahui bahwa F Hitung > F Tabel, maka \(H_0\) ditolak.

Dapat disimpulkan bahwa jumlah unit yang diproduksi berpengaruh terhadap jumlah jam kerja karyawan.

3.4 Uji Parsial

Hipotesis:

\(H_0\)= Tidak terdapat pengaruh antara jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan

\(H_1\)= Terdapat pengaruh antara jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan

t_hitung \(=\frac {\beta_1} {\sqrt{\frac{KTG}{\sum X_i^2 - \frac {(\sum X_i)^2}{n}}}}=\frac {4} {\sqrt{\frac{7,5}{28400- \frac {250000}{10}}}}=42.58325\)

t_tabel = t_(a;db) = t_(0,025;8) = 2,30600

Karena |t Hitung| > t Tabel, maka \(H_0\) ditolak.

Dapat disimpulkan bahwa jumlah unit yang diproduksi berpengaruh terhadap jumlah jam kerja karyawan.

3.5 Mencari Koefisien Determinasi

\(R^2= \frac {JKR}{JKT}= \frac {13600}{13660}=0,995\)

Jadi variabel jumlah unit yang diproduksi dapat menjelaskan hubungan terhadap jumlah jam kerja karyawan sebesar 0.995 atau sebesar 99.5% dan sisanya dipengaruhi variabel lain diluar itu.

3.6 Interpretasi Diagram Pencar

Pada diagram pencar diatas dapat disimpulkan bahwa hubungan antara variabel x dan variabel y merupakan hubungan yang positif. Dikarenakan variabel x dan variabel y bergerak searah.

3.7 Kesimpulan

Kesimpulan yang dapat diambil dari hasil perhitungan diatas yaitu hasil perhitungan antara manual dengan menggunakan rstudio mendapatkan hasil yang sama.

4 DAFTAR PUSTAKA

Draper, N. & Smith, H. (1998). Applied Regression Analysis. New York: Wiley.

Montgomery, D.C. & Peck, E. A. (1992). Introduction to Linear Regression Analysis. New York: Wiley.

Neter, J., Wasserman, W. & Kutner, M. H. (1990). Applied Linear Statistical Models. Irwin.

Pangesti, Sri. (2018). REGRESI LINEAR SEDERHANA. Gramedia Pustaka Utama

Myers, R.H. 1990. Classical and Modern Regression with Applications,2nd Ed. Boston: PWS-KENT Publishing Company.

Sen, A. dan Srivastava, M. 1990. Regression Analysis: Theory, Methods, and Applications. New York: Springer-Verlag.