Analisis Regresi Linier Sederhana Pengaruh Lama Bekerja Terhadap Pendapatan

risalim21

2023-05-29

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Dalam suatu perusahaan, tentu terdapat kewajiban untuk membayarkan gaji sebagai pendapatan pekerja sesuai dengan kesepakatan yang sudah diatur pada undang-undang atau yang lebih kita kenal dengan UMR. Nilai dari gaji ini harus selalu dibayarkan dan tidak boleh kurang dari yang sudah ditentukan. Dari sinilah setiap perusahaan juga harus melakukan peninjauan upah secara berkala dengan memerhatikan kemampuan perusahaan dan produktivitas yang sudah diatur dalam perjanjian kerja atau peraturan perusahaan. Dalam pelaksanaan peninjauan pastinya akan ada faktor penilaian yang membedakan antara setiap pekerja. Hal tersebut adalah jabatan, divisi, lama bekerja, dan pendidikan terakhir pekerja. Faktor penilaian ini jika dipenuhi dengan baik oleh pekerja tentu akan mendapat pendapatan (gaji) sesuai yang telah disepakati dan tidak jarang mendapat bonus. Dikarenakan belum ada acuan yang pasti, hal ini sempat memicu pro dan kontra, salah satunya adalah harapan untuk adanya kenaikan pendapatan (gaji) semakin lama masa kerja pada perusahaan. Untuk itu, perlu diketahui bagaimana pengaruh lama masa kerja terhadap pendapatan yang didapatkan menggunakan Analisis Regresi Linear Sederhana.

1.2 Statistika Deskriptif

Teknik analisis statistik deskriptif adalah statistik yang digunakan untukmenganalisa data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimanan adanya tanpa bermaksud membuat kesimpulan yang berlaku umum atau generalisasi (Sugiyono, 2010).

1.3 Analisis Regresi Linier Sederhana

Analisis regresi linier sederhana adalah hubungan secara linear antara satu variabel independen/ prediktor (X) dengan variabel dependen/ respon (Y). Analisis regresi sederhana dapat digunakan untuk mengetahui arah dari hubungan antara variabel bebas dengan variabel terikat, apakah memiliki hubungan positif atau negatif serta untuk memprediksi nilai dari variabel terikat apabila nilai variabel bebas mengalami kenaikan ataupun penurunan. Pada regresi sederhana biasanya data yang digunakan memiliki skala interval atau rasio.

Rumus regresi linier sederhana sebagai berikut: \[ Y=a+bX \] dimana: Y = Variabel tak bebas (nilai yang akan diprediksi) a = Konstanta/ intersep (nilai dari Y apabila X=0) b = koefisien regresi (pengaruh positif atau negatif) X = Variabel bebas/ prediktor (variabel independent)

Besarnya a dan b dapat ditentukan menggunakan persamaan:

1.4 Uji Simultan (Uji F)

Uji simultan atau uji F digunakan untuk menguji pengaruh secara bersama-sama seluruh variabel prediktor yang diuji terhadap variabel respons. Hipotesis yang digunakan adalah sebagai berikut: Langkah- langkah pengujiannya adalah: 1. Perumusan Hipotesis Operasional Nihil (H0) dan Hipotesis Alternatif (Ha) \[ H0:β1=β2=0 H1:Minimal terdapat salah satu βk≠0 \] 2. Menentukan taraf signifikansi dan kriteria pengujian (α) Taraf signifikansi yang sering digunakan adalah α=5% (α=0,05) 3. Kriteria penerimaan atau penolakan hipotesis sebagai berikut \[ p-value ≥ (α), maka terima Ho pvalue < (α), maka tolak Ho \] 4. Kesimpulan

1.5 Uji Parsial (Uji t)

Uji t digunakan untuk mengetahui dan menunjukkan seberapa jauh pengaruh variabel independen secara individual dalam menerangkan variasi variabel dependen. Langkah- langkah pengujiannya adalah: 1. Perumusan Hipotesis Operasional Nihil (H0) dan Hipotesis Alternatif (Ha) \[ H0 : β = 0; variabel X tidak berpengaruh signifikan/nyata terhadap Y H1 : β ≠ 0; variabel X berpengaruh signifikan/nyata terhadap Y \] 2. Menentukan taraf signifikansi dan kriteria pengujian (α) Taraf signifikansi yang sering digunakan adalah α=5% (α=0,05) 3. Kriteria penerimaan atau penolakan hipotesis sebagai berikut \[ p-value ≥ (α), maka terima Ho pvalue < (α), maka tolak Ho \] 4. Kesimpulan

1.6 Analisis Korelasi

Analisis koefisien korelasi pada penelitian ini menggunakan analisis koefisien korelasi pearson. Analisis koefisien korelasi pearson digunakan untuk mengukur hubungan antara disiplin kerja (X) dan variabel kinerja (Y).

Rumus yang digunakan untuk uji korelasi menurut Sugiyono (2012) yaitu : \[ r=\frac {n∑xy−∑x∑y} {(√n∑x^2−(∑x)^2)(n∑y^2−(∑y)^2)} \] dimana: r = Koefisien korelasi n = Jumlah data X = Variabel Bebas (Independen) Y = Variabel terikat (Dependen)

1.7 Uji Asumsi Klasik

1.7.1 Asumsi Normalitas

Uji Shapiro-Wilk Hipotesis Ho : Populasi nilai ujian statistik berdistribusi normal H1 : Populasi nilai ujian statistik tidak berdistribusi normal

Syarat Uji Shapiro Wilk Syarat dari uji shapiro w adalah sebagai berikut: a. Data berskala interval atau ratio (kuantitatif) b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi c. Data dari sampel random

Signifikansi Jika nilai p > 5%, maka Ho diterima ; Ha ditolak. Jika nilai p < 5%, maka Ho ditolak ; Ha diterima.

1.7.2 Asumsi Homoskedastisitas

Jika homoskedastisitas tidak terpenuhi menandakan bahwa telah terjadinya ketidaksamaan varian dari residual untuk semua pengamatan dari model regresi. Uji yang bisa digunakan adalah uji breusch-pagan.

1.7.3 Asumsi Nonautokorelasi

Uji autokorelasi dilakukan untuk mengetahui adakah korelasi variabel yang ada di dalam model prediksi dengan perubahan waktu. Uji yang digunakan adalah uji durbin watson untuk menilai adanya autokorelasi pada residual. Uji durbin watson akan menghasilkan nilai Durbin Watson (DW) yang nantinya akan dibandingkan dengan dua nilai durbin Watson tabel, yaitu durbin Upper (DU) dan durbin Lower (DL).

Terima H0 atau tidak terjadi autokorelasi apabila nilai d hitung lebih besar dari nilai Durbin-Watson Batas Atas (d>dU) atau nilai d hitung kurang dari nilai 4-dU (d < 4 – dU ).

1.8 Data

X (variabel prediktor) = lama bekerja Y (variabel respon) = pendapatan

> Data <- read_excel("D:/4 학기/STATISTICS COMPUTATION/PRAK KOMSTAT/salary.xlsx")
Error in read_excel("D:/4 학기/STATISTICS COMPUTATION/PRAK KOMSTAT/salary.xlsx"): 함수 "read_excel"를 찾을 수 없습니다
> knitr::kable(Data, caption="Data yang digunakan")
Error in knitr::kable(Data, caption = "Data yang digunakan"): 객체 'Data'를 찾을 수 없습니다

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> library(readxl)
> library(tseries)
> library(lmtest)
> library(car)

2.2 Membangkitkan Data

> Data <- read_excel("D:/4 학기/STATISTICS COMPUTATION/PRAK KOMSTAT/salary.xlsx")
> X<-Data$LamaKerja
> Y<-Data$Pendapatan
> data2<-data.frame(X,Y)
> n<-dim(Data)[1]   #dimensi data
> n
[1] 30
> X<-matrix(c(rep(1,n),Data$LamaKerja),nrow=n)
> X
      [,1] [,2]
 [1,]    1  1.1
 [2,]    1  1.3
 [3,]    1  1.5
 [4,]    1  2.0
 [5,]    1  2.2
 [6,]    1  2.9
 [7,]    1  3.0
 [8,]    1  3.2
 [9,]    1  3.2
[10,]    1  3.7
[11,]    1  3.9
[12,]    1  4.0
[13,]    1  4.0
[14,]    1  4.1
[15,]    1  4.5
[16,]    1  4.9
[17,]    1  5.1
[18,]    1  5.3
[19,]    1  5.9
[20,]    1  6.0
[21,]    1  6.8
[22,]    1  7.1
[23,]    1  7.9
[24,]    1  8.2
[25,]    1  8.7
[26,]    1  9.0
[27,]    1  9.5
[28,]    1  9.6
[29,]    1 10.3
[30,]    1 10.5
> Y
 [1]  39343  46205  37731  43525  39891  56642  60150  54445  64445  57189
[11]  63218  55794  56957  57081  61111  67938  66029  83088  81363  93940
[21]  91738  98273 101302 113812 109431 105582 116969 112635 122391 121872
> k<-dim(X)[2]   #dimensi data variabel X
> k
[1] 2

2.3 Penduga Koefisien

> beta_duga <- solve(t(X)%*%X)%*%(t(X)%*%Y)
> beta_duga
          [,1]
[1,] 25792.200
[2,]  9449.962

2.4 Penduga Respon (Y) dan Penduga Sisaan (U)

> y_duga <- X%*%beta_duga
> y_duga
           [,1]
 [1,]  36187.16
 [2,]  38077.15
 [3,]  39967.14
 [4,]  44692.12
 [5,]  46582.12
 [6,]  53197.09
 [7,]  54142.09
 [8,]  56032.08
 [9,]  56032.08
[10,]  60757.06
[11,]  62647.05
[12,]  63592.05
[13,]  63592.05
[14,]  64537.05
[15,]  68317.03
[16,]  72097.02
[17,]  73987.01
[18,]  75877.00
[19,]  81546.98
[20,]  82491.97
[21,]  90051.94
[22,]  92886.93
[23,] 100446.90
[24,] 103281.89
[25,] 108006.87
[26,] 110841.86
[27,] 115566.84
[28,] 116511.84
[29,] 123126.81
[30,] 125016.80
> u_duga <- Y - y_duga
> u_duga
            [,1]
 [1,]  3155.8412
 [2,]  8127.8488
 [3,] -2236.1437
 [4,] -1167.1248
 [5,] -6691.1173
 [6,]  3444.9091
 [7,]  6007.9128
 [8,] -1587.0796
 [9,]  8412.9204
[10,] -3568.0608
[11,]   570.9467
[12,] -7798.0495
[13,] -6635.0495
[14,] -7456.0457
[15,] -7206.0306
[16,] -4159.0156
[17,] -7958.0080
[18,]  7210.9995
[19,]  -183.9779
[20,] 11448.0259
[21,]  1686.0560
[22,]  5386.0673
[23,]   855.0975
[24,] 10530.1088
[25,]  1424.1276
[26,] -5259.8611
[27,]  1402.1577
[28,] -3876.8385
[29,]  -735.8121
[30,] -3144.8046

2.5 Menghitung Analisis Ragam

> y_bar <- rep(mean(Y),n)
> JKT <- t(Y-y_bar)%*%(Y-y_bar)
> JKR <- t(y_duga-y_bar)%*%(y_duga-y_bar)
> JKG <- JKT-JKR
> JK <- c(JKR, JKG, JKT)
> JK
[1] 20856849300   938128552 21794977852
> k = 2 #banyaknya peubah
> dbR <- k-1
> dbT <- n-1
> dbG <- dbT-dbR
> db <- c(dbR, dbG, dbT)
> KT <- JK/db

2.6 Membentuk Tabel ANOVA

> SK <- c("Regresi", "Galat", "Total")
> anova <- data.frame(SK, JK, db, KT)
> names(anova) <- c("SK", "JK", "db", "KT")
> anova
       SK          JK db          KT
1 Regresi 20856849300  1 20856849300
2   Galat   938128552 28    33504591
3   Total 21794977852 29   751550960

2.7 Menghitung Uji F

> SU_F <- anova$KT[1]/anova$KT[2]
> SU_F
[1] 622.5072
> 
> pvalue_f <- pf(SU_F, anova$db[1], anova$db[2], lower.tail=FALSE)
> pvalue_f
[1] 1.143068e-20

2.8 Uji t

> var_cov<-anova$KT[2]*solve(t(X) %*% X)   #mencari ragam peragam
> var_cov
          [,1]      [,2]
[1,] 5166771.9 -762224.4
[2,] -762224.4  143455.0
> 
> sd<-rep(0,k)
>  for(i in 1:k){
+    sd[i]<-sqrt(var_cov[i,i])
+  }
> sd
[1] 2273.0534  378.7546
> 
> t<-beta_duga/sd
> t
         [,1]
[1,] 11.34694
[2,] 24.95009
> 
> pval<-2*pt(abs(t), anova$db[2], lower.tail=FALSE)
> pval
             [,1]
[1,] 5.511950e-12
[2,] 1.143068e-20

2.9 Koefisien Determinasi

> Rsq <- anova$JK[1]/anova$JK[3]
> Rsq
[1] 0.9569567

2.10 Scatter Plot

> scatter.smooth(x=Data$LamaKerja, y=Data$Pendapatan, main="Smooth Scatter Plot Pendapatan~LamaKerja", xlab="Lama Bekerja", ylab="Pendapatan", pch=16, col="brown1")

2.11 FUNGSI LM

2.11.1 Membentuk Model Regresi

> data <- read_excel("D:/4 학기/STATISTICS COMPUTATION/PRAK KOMSTAT/salary.xlsx") 
> reg <- lm(Pendapatan~LamaKerja,data=data) 
> summary(reg)

Call:
lm(formula = Pendapatan ~ LamaKerja, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-7958.0 -4088.5  -459.9  3372.6 11448.0 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  25792.2     2273.1   11.35 5.51e-12 ***
LamaKerja     9450.0      378.8   24.95  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5788 on 28 degrees of freedom
Multiple R-squared:  0.957, Adjusted R-squared:  0.9554 
F-statistic: 622.5 on 1 and 28 DF,  p-value: < 2.2e-16

2.12 Uji Asumsi Klasik

2.12.1 Asumsi Normalitas

> resi <- residuals(reg)
> shapiro.test(resi)

    Shapiro-Wilk normality test

data:  resi
W = 0.95234, p-value = 0.1952

2.12.2 Asumsi Homoskedastisitas

> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 0.39905, df = 1, p-value = 0.5276

2.12.3 Asumsi Nonautokorelasi

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 1.648, p-value = 0.1178
alternative hypothesis: true autocorrelation is greater than 0

3 HASIL DAN PEMBAHASAN

3.1 Analisis Koefisien Model

Model Regresi Linier Sederhana Y duga = 25792.2 + 9450X

Penjelasan: 1.Nilai b0 memiliki nilai positif sebesar 25792.2. Tanda positif
artinya menunjukkan pengaruh yang searah antara variabel independen
dan variabel dependen. Hal ini menunjukkan bahwa jika semua variabel independen yaitu lama bekerja (X) bernilai 0 atau tidak mengalami perubahan, maka pendapatan adalah 25792.2 ribu dolar. 2.Nilai koefisien regresi untuk variabel lama bekerja (X) memiliki nilai positif yaitu sebesar 9450. Hal ini menunjukkan jika lama bekerja mengalami kenaikan 1 tahun, maka pendapatan akan naik sebesar 9450 dolar. Tanda positif artinya menunjukkan pengaruh yang searah antara variabel independen dan variabel dependen.

3.2 Uji Simultan (Uji F)

p-value (1.143068e-20) < α (0.05), maka tolak H0.

Dengan taraf nyata 5% dapat disimpulkan bahwa secara simultan faktor lama bekerja berpengaruh secara signifikan terhadap pendapatan.

3.3 Uji Parsial (Uji t)

p-value (5.511950e-12(untuk b0) dan 1.143068e-20(untuk b1)) < α (0.05), maka tolak H0.

Dengan taraf nyata 5% dapat disimpulkan bahwa secara parsial faktor lama bekerja berpengaruh secara signifikan terhadap pendapatan.

3.4 Koefisien Determinasi

Nilai r yang didapat sebesar 0.9569567 (95.69567%)

Dapat disimpulkan bahwa variabel lama bekerja dapat menjelaskan hubungan terhadap pendapatan sebesar 95.69567% sedangkan sisanya dipengaruhi variabel lain di luar model.

3.5 Asumsi Normalitas

Hipotesis H0: Data berdistribusi normal H1: Data berdistribusi tidak normal

p-value (0.1952) > α (0.05) maka terima H0. Jadi dapat disimpulkan bahwa dengan menggunakan uji Saphiro-Wilk residual berdistribusi normal.

3.6 Asumsi Homoskedastisitas

Hipotesis H0: Variansi galat bersifat homoskedastisitas H1: Variansi galat bersifat heteroskedastisitas

p-value (0.5276) > α (0.05) maka terima H0. Jadi dapat disimpulkan bahwa dengan menggunakan uji Breusch-Pagan variansi galat bersifat homoskedastisitas.

3.7 Asumsi Nonautokorelasi

Hipotesis H0: Tidak terjadi autokorelasi H1: Terjad autokorelasi

p-value (0.1178) > α (0.05) maka terima H0. Jadi dapat disimpulkan bahwa dengan menggunakan uji Durbin-Watson tidak terjadi autokorelasi.

4 DAFTAR PUSTAKA

Sarbani,dkk. 2022. Pengaruh Tingkat Kemiskinan Terhadap Pembangunan Rumah Layak Huni Di Provinsi Riau Menggunakan Metode Analisis Regresi Sederhana.Jurnal Teknologi dan Manajemen Industri Terapan(JTMIT),vol.1, No.3. Sugiyono. 2010. Metode Penelitian Bisnis , Bandung : ALFABETA. Yuliara, I.M. 2016. Modul Regresi Linier Sederhana. Bali: Universitas Udayana.