Regresi adalah metode statistik yang dipakai untuk memperkirakan hubungan antara sebuah variabel terikat dan satu variabel independen atau lebih. Metode ini juga bisa digunakan untuk menilai kekuatan hubungan antara variabel dengan perkiraan masa depan.
Analisis regresi merupakan suatu metode atau teknik analisis hipotesis penelitian untuk menguji ada tidaknya perngaruh antara variabel satu dengan variabel lain, yang dinyatakan dalam bentuk persamaan matematik (regresi).
Pada penelitian ini, ingin diketahui pengaruh jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan. Sehingga, analisis yang tepat untuk melakukan penelitian ini yaitu menggunakan analisis regresi linear sederhana. Penerapan analisis regresi linear sederhana ini diharapkan dapat memberikan hasil penelitian yang tepat agar dapat memenuhi keputusan yang diinginkan.
Statistik deskriptif adalah bagian dari statistika yang mempelajari tentang cara pengumpulan data dan penyajian data sehingga mudah dipahami. Statistika deskriptif hanya berkaitan dengan uraian atau keterangan-keterangan tentang suatu data atau keadaan. Dengan kata lain, statistika deskriptif memiliki fungsi untuk menjelaskan suatu keadaan, gejala, atau persoalan. Penarikan kesimpulan dalam statistik deskriptif hanya ditujukan pada kumpulan data yang ada. Berikut merupakan contoh histogram pada statistika deskriptif.
Contoh Statistika Deskriptif berupa Histogram yang dipakai untuk memberikan informasi mengenai variasi dalam proses dan membantu manajemen dalam membuat keputusan dalam upaya peningkatan proses yang berkesimbungan.
Menurut Sugiyono (2017:260) analisis regresi adalah untuk membuat keputusan apakah naik dan menurunnya variabel dependent dapat dilakukan melalui peningkatan variabel independent atau tidak. Regresi sederhana didasarkan pada hubungan fungsional ataupun kausal satu variabel independent dengan variabel dependent. Analisis regresi ini digunakan untuk memprediksi seberapa jauh perubahan nilai variabel dependent, bila variabel independent dimanipulasi atau dirubah-rubah atau dinaik-turunkan. Berikut merupakan contoh analisis regresi sederhana.
Gambar diatas merupakan regresi linear sederhana untuk membandingkan harga kamera dengan harga handphone.
Uji heteroskedastisitas digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik heteroskedastisitas yaitu adanya ketidaksamaan varian dari residual untuk semua pengamatan pada model regresi. Uji heteroskedastisitas bertujuan untuk menguji apakah dalam model regresi linear terjadi ketidaksamaan varians dari residual satu pengamatan ke pengamatan yang lain. Model regresi yang baik adalah yang homoskedastisitas atau tidak terjadi heteroskedastisitas. Untuk mendeteksi ada tidaknya heteroskedastisitas, dapat dilakukan dengan berbagai cara seperti uji grafik, uji Park, Uji Glejser, uji Spearman’s Rank Correlation, dan uji Whyte menggunakan Lagrange Multiplier.
Berikut merupakan contoh Uji Heteroskedastisitas.
Data merupakan sekumpulan informasi atau faktar yang didapatkan dari suatu pengamatan atau penelitian. Data juga bisa terbentuk dari kata-kata, kalimat, simbol, angka, dan lainnya. Data pada analisis regresi linier sederhana ini dapat diperoleh dari sebuah pencarian ataupun dari penelitian dari sumber yang dapat dipercaya. Data ini digunakan untuk tujuan analisis.
Dalam penerapan analisis regresi linier sederhana ini digunakan data sekunder yang berasal dari perhitungan hasil jumlah unit yang sudah diproduksi terhadap lamanya jam kerja. Data menunjukkan jumlah unit yang diproduksi (X) dan jumlah jam kerja karyawan (Y). Lalu data tersebut akan diuji untuk mengetahui pengaruh antar variabel.
> library(rmarkdown)
> library(readxl)
> library(readxl)
> DataANREG <-read_excel("C:/DATA_KOMSTAT.xlsx", range="A1:C11")
> library(rmarkdown)
> paged_table(as.data.frame(DataANREG))
Syntax diatas berguna untuk menggunakan library readxl
dan memanggil datasekunder dengan data pengamatan yang akan diimport dari excel dengan cara read_excel
dengan range A1 sampai C11. Lalu menggunakan library rmarkdown
agar bisa menggunakan fungsi paged_table
dimana untuk menampilkan data yang telah diimport tadi kedalam sebuah tabel.
Membangkitkan data yang ada sesuai dengan tabel. Syntaxnya yaitu :
> X <- c(30,20,60,80,40,50,60,30,70,60)
> Y <- c(73,50,128,170,87,108,135,69,148,132)
> XX <- X^2
> YY <- Y^2
> XY <- X*Y
> n <- 10
> DataXY <- data.frame(X, Y, XX, YY, XY)
>
> SigmaX <- sum(X)
> SigmaY <- sum(Y)
> SigmaXX <- sum(XX)
> SigmaYY <- sum(YY)
> SigmaXY <- sum(XY)
> Xbar <- mean(X)
> Ybar <- mean(Y)
Syntax diatas digunakan untuk membuat variabel X,Y,XX,YY,XY,n sesuai dengan tabel. Lalu membuat dataframe dengan nama variabel DataXY dan judul kolom X,Y,XX,YY,XY. Dan untuk mendefinisikan variabel SigmaX, SigmaY, SigmaXX, SigmaYY, SigmaXY, Xbar, Ybar.
Hasil
> DataXY
X Y XX YY XY1 30 73 900 5329 2190
2 20 50 400 2500 1000
3 60 128 3600 16384 7680
4 80 170 6400 28900 13600
5 40 87 1600 7569 3480
6 50 108 2500 11664 5400
7 60 135 3600 18225 8100
8 30 69 900 4761 2070
9 70 148 4900 21904 10360
10 60 132 3600 17424 7920
> SigmaX
1] 500
[> SigmaY
1] 1100
[> SigmaXX
1] 28400
[> SigmaYY
1] 134660
[> SigmaXY
1] 61800
[> Xbar
1] 50
[> Ybar
1] 110 [
Mencari \(\beta_1\) dan \(\beta_0\)
> B1 <- (SigmaXY-((SigmaX*SigmaY)/n)) / (SigmaXX-((SigmaX*SigmaX)/n))
> B1
1] 2
[> B0 <- Ybar-(B1*Xbar)
> B0
1] 10 [
Diperoleh Hasil Sebagai berikut \(\hat{Y}=\beta_0+\beta_1X_i=10+2X_i\)
Menghitung Derajat Bebas dan Jumlah Kuadrat
> Dbr <- 1
> Dbr
1] 1
[> Dbg <- n-2
> Dbg
1] 8
[> Dbt <- n-1
> Dbt
1] 9
[>
> JKR <- (B1^2)*(SigmaXX-((SigmaX*SigmaX)/n))
> JKR
1] 13600
[> JKT <- SigmaYY-((SigmaY*SigmaY)/n)
> JKT
1] 13660
[> JKG <- JKT-JKR
> JKG
1] 60 [
Menghitung Kuadrat Tengah, F Hitung dan F Tabel
> KTR <- JKR/Dbr
> KTR
1] 13600
[> KTG <- JKG/Dbg
> KTG
1] 7.5
[>
> FHit <- KTR/KTG
> FHit
1] 1813.333
[>
> FTab <- qf(0.05, 1, 8, lower.tail = F, log.p = F)
> FTab
1] 5.317655 [
Setelah data untuk ANOVA sudah dihitung semua lalu buat tabelnya dengan syntax berikut :
> SK <- c("Perlakuan", "Galat", "Total")
> DB <- c(Dbr, Dbg, Dbt)
> JK <- c(JKR, JKT, JKG)
> KT <- c(KTR, KTG, NA)
> FHitung <- c(FHit, NA, NA)
> FTabel <- c(FTab, NA, NA)
> paged_table(data.frame(SK, KT, FHitung, FTabel))
Dari tabel ANOVA diatas diketahui bahwa F Hitung > F Tabel, maka \(H_0\) ditolak.
Dapat disimpulkan bahwa jumlah unit yang diproduksi berpengaruh terhadap jumlah jam kerja karyawan.
Menghitung T Hitung dan T Tabel
> THit <- B1/(sqrt(KTG/(SigmaXX-((SigmaX*SigmaX)/n))))
> THit
1] 42.58325
[>
> TTab <- qt(0.025, 8, lower.tail = F, log.p = F)
Karena |t Hitung| > t Tabel, maka \(H_0\) ditolak.
Dapat disimpulkan bahwa jumlah unit yang diproduksi berpengaruh terhadap jumlah jam kerja karyawan.
Koefisien Determinasi
> Rkuadrat <- JKR/JKT
> Rkuadrat
1] 0.9956076 [
Jadi variabel jumlah unit yang diproduksi dapat menjelaskan hubungan terhadap jumlah jam kerja karyawan sebesar 0.995 atau sebesar 99.5% dan sisanya dipengaruhi variabel lain diluar itu.
Dengan menggunakan syntax
> plot(DataXY$X, DataXY$Y, main = "Jumlah unit yang diproduksi (X) dengan Jumlah jam kerja karyawan (Y)", xlab="Jumlah unit yang diproduksi (X)", ylab="dengan Jumlah jam kerja karyawan (Y)", col="Orange")
> abline(lm(DataXY$Y~DataXY$X), col="green")
Variabel Prediktor (X) = Jumlah unit yang diproduksi
Variabel Respon (Y) = Jumlah jam kerja karyawan
Konstanta Regresi (Slope) dan Konstanta (Intersept)
\(β_1=\frac {\sum X_iY_i -\frac{(\sum X_i \sum Y_i)}{n}} {\sum X_i^2-(\frac{(\sum X_i)^2}{n})} = \frac {61800-\frac {(500)(1100)}{10}}{28400-\frac{250000}{10}}=2\) \(\beta_0=\bar{Y}-\beta_1\bar{X}=110-\left(2\right)\left(50\right)=10\)
Variabel Respon \(\hat{Y}=\beta_0+\beta_1X_i=10+2X_i\)
Hipotesis:
\(H_0\)= Tidak terdapat pengaruh antara jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan
\(H_1\)= Terdapat pengaruh antara jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan
Mencari JKR, JKT, dan JKG
\(JKR=(\beta_1^2)(\sum X_i^2 - \frac {(\sum X_i)^2}{n})=(4)^2 (28400- \frac {250000}{10})=13600\)
\(JKT=\sum Y_i^2 - \frac {(\sum Y_i)^2}{n}=134660-\frac {1210000}{10}\)
\(JKG=JKT - JKR= 13660-13600=60\)
Sehingga didapatkan data seperti iniDari tabel ANOVA diatas diketahui bahwa F Hitung > F Tabel, maka \(H_0\) ditolak.
Dapat disimpulkan bahwa jumlah unit yang diproduksi berpengaruh terhadap jumlah jam kerja karyawan.
Hipotesis:
\(H_0\)= Tidak terdapat pengaruh antara jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan
\(H_1\)= Terdapat pengaruh antara jumlah unit yang diproduksi terhadap jumlah jam kerja karyawan
thitung \(=\frac {\beta_1} {\sqrt{\frac{KTG}{\sum X_i^2 - \frac {(\sum X_i)^2}{n}}}}=\frac {4} {\sqrt{\frac{7,5}{28400- \frac {250000}{10}}}}=42.58325\)
ttabel = t(a;db) = t(0,025;8) = 2,30600
Karena |t Hitung| > t Tabel, maka \(H_0\) ditolak.
Dapat disimpulkan bahwa jumlah unit yang diproduksi berpengaruh terhadap jumlah jam kerja karyawan.
\(R^2= \frac {JKR}{JKT}= \frac {13600}{13660}=0,995\)
Jadi variabel jumlah unit yang diproduksi dapat menjelaskan hubungan terhadap jumlah jam kerja karyawan sebesar 0.995 atau sebesar 99.5% dan sisanya dipengaruhi variabel lain diluar itu.
Pada diagram pencar diatas dapat disimpulkan bahwa hubungan antara variabel x dan variabel y merupakan hubungan yang positif. Dikarenakan variabel x dan variabel y bergerak searah.
Kesimpulan yang dapat diambil dari hasil perhitungan diatas yaitu hasil perhitungan antara manual dengan menggunakan rstudio mendapatkan hasil yang sama.
Draper, N. & Smith, H. (1998). Applied Regression Analysis. New York: Wiley.
Montgomery, D.C. & Peck, E. A. (1992). Introduction to Linear Regression Analysis. New York: Wiley.
Neter, J., Wasserman, W. & Kutner, M. H. (1990). Applied Linear Statistical Models. Irwin.
Pangesti, Sri. (2018). REGRESI LINEAR SEDERHANA. Gramedia Pustaka Utama
Myers, R.H. 1990. Classical and Modern Regression with Applications,2nd Ed. Boston: PWS-KENT Publishing Company.
Sen, A. dan Srivastava, M. 1990. Regression Analysis: Theory, Methods, and Applications. New York: Springer-Verlag.