Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Dalam suatu perusahaan, tentu terdapat kewajiban untuk membayarkan gaji sebagai pendapatan pekerja sesuai dengan kesepakatan yang sudah diatur pada undang-undang atau yang lebih kita kenal dengan UMR. Nilai dari gaji ini harus selalu dibayarkan dan tidak boleh kurang dari yang sudah ditentukan. Dari sinilah setiap perusahaan juga harus melakukan peninjauan upah secara berkala dengan memerhatikan kemampuan perusahaan dan produktivitas yang sudah diatur dalam perjanjian kerja atau peraturan perusahaan. Dalam pelaksanaan peninjauan pastinya akan ada faktor penilaian yang membedakan antara setiap pekerja. Hal tersebut adalah jabatan, divisi, lama bekerja, dan pendidikan terakhir pekerja. Faktor penilaian ini jika dipenuhi dengan baik oleh pekerja tentu akan mendapat pendapatan (gaji) sesuai yang telah disepakati dan tidak jarang mendapat bonus. Dikarenakan belum ada acuan yang pasti, hal ini sempat memicu pro dan kontra, salah satunya adalah harapan untuk adanya kenaikan pendapatan (gaji) semakin lama masa kerja pada perusahaan. Untuk itu, perlu diketahui bagaimana pengaruh lama masa kerja terhadap pendapatan yang didapatkan menggunakan Analisis Regresi Linear Sederhana.
1.2 Statistika Deskriptif
Teknik analisis statistik deskriptif adalah statistik yang digunakan untukmenganalisa data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimanan adanya tanpa bermaksud membuat kesimpulan yang berlaku umum atau generalisasi (Sugiyono, 2010).
1.3 Analisis Regresi Linier Sederhana
Analisis regresi linier sederhana adalah hubungan secara linear antara satu variabel independen/ prediktor (X) dengan variabel dependen/ respon (Y). Analisis regresi sederhana dapat digunakan untuk mengetahui arah dari hubungan antara variabel bebas dengan variabel terikat, apakah memiliki hubungan positif atau negatif serta untuk memprediksi nilai dari variabel terikat apabila nilai variabel bebas mengalami kenaikan ataupun penurunan. Pada regresi sederhana biasanya data yang digunakan memiliki skala interval atau rasio.
Rumus regresi linier sederhana sebagai berikut: \[ Y=a+bX \] dimana: Y = Variabel tak bebas (nilai yang akan diprediksi) a = Konstanta/ intersep (nilai dari Y apabila X=0) b = koefisien regresi (pengaruh positif atau negatif) X = Variabel bebas/ prediktor (variabel independent)
Besarnya a dan b dapat ditentukan menggunakan persamaan:
1.4 Uji Simultan (Uji F)
Uji simultan atau uji F digunakan untuk menguji pengaruh secara bersama-sama seluruh variabel prediktor yang diuji terhadap variabel respons. Hipotesis yang digunakan adalah sebagai berikut: Langkah- langkah pengujiannya adalah: 1. Perumusan Hipotesis Operasional Nihil (H0) dan Hipotesis Alternatif (Ha) \[ H0:β1=β2=0 H1:Minimal terdapat salah satu βk≠0 \] 2. Menentukan taraf signifikansi dan kriteria pengujian (α) Taraf signifikansi yang sering digunakan adalah α=5% (α=0,05) 3. Kriteria penerimaan atau penolakan hipotesis sebagai berikut \[ p-value ≥ (α), maka terima Ho pvalue < (α), maka tolak Ho \] 4. Kesimpulan
1.5 Uji Parsial (Uji t)
Uji t digunakan untuk mengetahui dan menunjukkan seberapa jauh pengaruh variabel independen secara individual dalam menerangkan variasi variabel dependen. Langkah- langkah pengujiannya adalah: 1. Perumusan Hipotesis Operasional Nihil (H0) dan Hipotesis Alternatif (Ha) \[ H0 : β = 0; variabel X tidak berpengaruh signifikan/nyata terhadap Y H1 : β ≠ 0; variabel X berpengaruh signifikan/nyata terhadap Y \] 2. Menentukan taraf signifikansi dan kriteria pengujian (α) Taraf signifikansi yang sering digunakan adalah α=5% (α=0,05) 3. Kriteria penerimaan atau penolakan hipotesis sebagai berikut \[ p-value ≥ (α), maka terima Ho pvalue < (α), maka tolak Ho \] 4. Kesimpulan
1.6 Analisis Korelasi
Analisis koefisien korelasi pada penelitian ini menggunakan analisis koefisien korelasi pearson. Analisis koefisien korelasi pearson digunakan untuk mengukur hubungan antara disiplin kerja (X) dan variabel kinerja (Y).
Rumus yang digunakan untuk uji korelasi menurut Sugiyono (2012) yaitu : \[ r=\frac {n∑xy−∑x∑y} {(√n∑x^2−(∑x)^2)(n∑y^2−(∑y)^2)} \] dimana: r = Koefisien korelasi n = Jumlah data X = Variabel Bebas (Independen) Y = Variabel terikat (Dependen)
1.7 Uji Asumsi Klasik
1.7.1 Asumsi Normalitas
Uji Shapiro-Wilk Hipotesis Ho : Populasi nilai ujian statistik berdistribusi normal H1 : Populasi nilai ujian statistik tidak berdistribusi normal
Syarat Uji Shapiro Wilk Syarat dari uji shapiro w adalah sebagai berikut: a. Data berskala interval atau ratio (kuantitatif) b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi c. Data dari sampel random
Signifikansi Jika nilai p > 5%, maka Ho diterima ; Ha ditolak. Jika nilai p < 5%, maka Ho ditolak ; Ha diterima.
1.7.2 Asumsi Homoskedastisitas
Jika homoskedastisitas tidak terpenuhi menandakan bahwa telah terjadinya ketidaksamaan varian dari residual untuk semua pengamatan dari model regresi. Uji yang bisa digunakan adalah uji breusch-pagan.
1.7.3 Asumsi Nonautokorelasi
Uji autokorelasi dilakukan untuk mengetahui adakah korelasi variabel yang ada di dalam model prediksi dengan perubahan waktu. Uji yang digunakan adalah uji durbin watson untuk menilai adanya autokorelasi pada residual. Uji durbin watson akan menghasilkan nilai Durbin Watson (DW) yang nantinya akan dibandingkan dengan dua nilai durbin Watson tabel, yaitu durbin Upper (DU) dan durbin Lower (DL).
Terima H0 atau tidak terjadi autokorelasi apabila nilai d hitung lebih besar dari nilai Durbin-Watson Batas Atas (d>dU) atau nilai d hitung kurang dari nilai 4-dU (d < 4 – dU ).
1.8 Data
X (variabel prediktor) = lama bekerja Y (variabel respon) = pendapatan
> Data <- read_excel("D:/4 학기/STATISTICS COMPUTATION/PRAK KOMSTAT/salary.xlsx")
Error in read_excel("D:/4 학기/STATISTICS COMPUTATION/PRAK KOMSTAT/salary.xlsx"): 함수 "read_excel"를 찾을 수 없습니다
> knitr::kable(Data, caption="Data yang digunakan")
Error in knitr::kable(Data, caption = "Data yang digunakan"): 객체 'Data'를 찾을 수 없습니다2 SOURCE CODE
2.1 Library yang Dibutuhkan
> library(readxl)
> library(tseries)
> library(lmtest)
> library(car)2.2 Membangkitkan Data
> Data <- read_excel("D:/4 학기/STATISTICS COMPUTATION/PRAK KOMSTAT/salary.xlsx")
> X<-Data$LamaKerja
> Y<-Data$Pendapatan
> data2<-data.frame(X,Y)
> n<-dim(Data)[1] #dimensi data
> n
[1] 30
> X<-matrix(c(rep(1,n),Data$LamaKerja),nrow=n)
> X
[,1] [,2]
[1,] 1 1.1
[2,] 1 1.3
[3,] 1 1.5
[4,] 1 2.0
[5,] 1 2.2
[6,] 1 2.9
[7,] 1 3.0
[8,] 1 3.2
[9,] 1 3.2
[10,] 1 3.7
[11,] 1 3.9
[12,] 1 4.0
[13,] 1 4.0
[14,] 1 4.1
[15,] 1 4.5
[16,] 1 4.9
[17,] 1 5.1
[18,] 1 5.3
[19,] 1 5.9
[20,] 1 6.0
[21,] 1 6.8
[22,] 1 7.1
[23,] 1 7.9
[24,] 1 8.2
[25,] 1 8.7
[26,] 1 9.0
[27,] 1 9.5
[28,] 1 9.6
[29,] 1 10.3
[30,] 1 10.5
> Y
[1] 39343 46205 37731 43525 39891 56642 60150 54445 64445 57189
[11] 63218 55794 56957 57081 61111 67938 66029 83088 81363 93940
[21] 91738 98273 101302 113812 109431 105582 116969 112635 122391 121872
> k<-dim(X)[2] #dimensi data variabel X
> k
[1] 22.3 Penduga Koefisien
> beta_duga <- solve(t(X)%*%X)%*%(t(X)%*%Y)
> beta_duga
[,1]
[1,] 25792.200
[2,] 9449.9622.4 Penduga Respon (Y) dan Penduga Sisaan (U)
> y_duga <- X%*%beta_duga
> y_duga
[,1]
[1,] 36187.16
[2,] 38077.15
[3,] 39967.14
[4,] 44692.12
[5,] 46582.12
[6,] 53197.09
[7,] 54142.09
[8,] 56032.08
[9,] 56032.08
[10,] 60757.06
[11,] 62647.05
[12,] 63592.05
[13,] 63592.05
[14,] 64537.05
[15,] 68317.03
[16,] 72097.02
[17,] 73987.01
[18,] 75877.00
[19,] 81546.98
[20,] 82491.97
[21,] 90051.94
[22,] 92886.93
[23,] 100446.90
[24,] 103281.89
[25,] 108006.87
[26,] 110841.86
[27,] 115566.84
[28,] 116511.84
[29,] 123126.81
[30,] 125016.80
> u_duga <- Y - y_duga
> u_duga
[,1]
[1,] 3155.8412
[2,] 8127.8488
[3,] -2236.1437
[4,] -1167.1248
[5,] -6691.1173
[6,] 3444.9091
[7,] 6007.9128
[8,] -1587.0796
[9,] 8412.9204
[10,] -3568.0608
[11,] 570.9467
[12,] -7798.0495
[13,] -6635.0495
[14,] -7456.0457
[15,] -7206.0306
[16,] -4159.0156
[17,] -7958.0080
[18,] 7210.9995
[19,] -183.9779
[20,] 11448.0259
[21,] 1686.0560
[22,] 5386.0673
[23,] 855.0975
[24,] 10530.1088
[25,] 1424.1276
[26,] -5259.8611
[27,] 1402.1577
[28,] -3876.8385
[29,] -735.8121
[30,] -3144.80462.5 Menghitung Analisis Ragam
> y_bar <- rep(mean(Y),n)
> JKT <- t(Y-y_bar)%*%(Y-y_bar)
> JKR <- t(y_duga-y_bar)%*%(y_duga-y_bar)
> JKG <- JKT-JKR
> JK <- c(JKR, JKG, JKT)
> JK
[1] 20856849300 938128552 21794977852
> k = 2 #banyaknya peubah
> dbR <- k-1
> dbT <- n-1
> dbG <- dbT-dbR
> db <- c(dbR, dbG, dbT)
> KT <- JK/db2.6 Membentuk Tabel ANOVA
> SK <- c("Regresi", "Galat", "Total")
> anova <- data.frame(SK, JK, db, KT)
> names(anova) <- c("SK", "JK", "db", "KT")
> anova
SK JK db KT
1 Regresi 20856849300 1 20856849300
2 Galat 938128552 28 33504591
3 Total 21794977852 29 7515509602.7 Menghitung Uji F
> SU_F <- anova$KT[1]/anova$KT[2]
> SU_F
[1] 622.5072
>
> pvalue_f <- pf(SU_F, anova$db[1], anova$db[2], lower.tail=FALSE)
> pvalue_f
[1] 1.143068e-202.8 Uji t
> var_cov<-anova$KT[2]*solve(t(X) %*% X) #mencari ragam peragam
> var_cov
[,1] [,2]
[1,] 5166771.9 -762224.4
[2,] -762224.4 143455.0
>
> sd<-rep(0,k)
> for(i in 1:k){
+ sd[i]<-sqrt(var_cov[i,i])
+ }
> sd
[1] 2273.0534 378.7546
>
> t<-beta_duga/sd
> t
[,1]
[1,] 11.34694
[2,] 24.95009
>
> pval<-2*pt(abs(t), anova$db[2], lower.tail=FALSE)
> pval
[,1]
[1,] 5.511950e-12
[2,] 1.143068e-202.9 Koefisien Determinasi
> Rsq <- anova$JK[1]/anova$JK[3]
> Rsq
[1] 0.95695672.10 Scatter Plot
> scatter.smooth(x=Data$LamaKerja, y=Data$Pendapatan, main="Smooth Scatter Plot Pendapatan~LamaKerja", xlab="Lama Bekerja", ylab="Pendapatan", pch=16, col="brown1")2.11 FUNGSI LM
2.11.1 Membentuk Model Regresi
> data <- read_excel("D:/4 학기/STATISTICS COMPUTATION/PRAK KOMSTAT/salary.xlsx")
> reg <- lm(Pendapatan~LamaKerja,data=data)
> summary(reg)
Call:
lm(formula = Pendapatan ~ LamaKerja, data = data)
Residuals:
Min 1Q Median 3Q Max
-7958.0 -4088.5 -459.9 3372.6 11448.0
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 25792.2 2273.1 11.35 5.51e-12 ***
LamaKerja 9450.0 378.8 24.95 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5788 on 28 degrees of freedom
Multiple R-squared: 0.957, Adjusted R-squared: 0.9554
F-statistic: 622.5 on 1 and 28 DF, p-value: < 2.2e-162.12 Uji Asumsi Klasik
2.12.1 Asumsi Normalitas
> resi <- residuals(reg)
> shapiro.test(resi)
Shapiro-Wilk normality test
data: resi
W = 0.95234, p-value = 0.19522.12.2 Asumsi Homoskedastisitas
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 0.39905, df = 1, p-value = 0.52762.12.3 Asumsi Nonautokorelasi
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 1.648, p-value = 0.1178
alternative hypothesis: true autocorrelation is greater than 03 HASIL DAN PEMBAHASAN
3.1 Analisis Koefisien Model
Model Regresi Linier Sederhana Y duga = 25792.2 + 9450X
Penjelasan: 1.Nilai b0 memiliki nilai positif sebesar 25792.2. Tanda
positif
artinya menunjukkan pengaruh yang searah antara variabel
independen
dan variabel dependen. Hal ini menunjukkan bahwa jika semua variabel
independen yaitu lama bekerja (X) bernilai 0 atau tidak mengalami
perubahan, maka pendapatan adalah 25792.2 ribu dolar. 2.Nilai koefisien
regresi untuk variabel lama bekerja (X) memiliki nilai positif yaitu
sebesar 9450. Hal ini menunjukkan jika lama bekerja mengalami kenaikan 1
tahun, maka pendapatan akan naik sebesar 9450 dolar. Tanda positif
artinya menunjukkan pengaruh yang searah antara variabel independen dan
variabel dependen.
3.2 Uji Simultan (Uji F)
p-value (1.143068e-20) < α (0.05), maka tolak H0.
Dengan taraf nyata 5% dapat disimpulkan bahwa secara simultan faktor lama bekerja berpengaruh secara signifikan terhadap pendapatan.
3.3 Uji Parsial (Uji t)
p-value (5.511950e-12(untuk b0) dan 1.143068e-20(untuk b1)) < α (0.05), maka tolak H0.
Dengan taraf nyata 5% dapat disimpulkan bahwa secara parsial faktor lama bekerja berpengaruh secara signifikan terhadap pendapatan.
3.4 Koefisien Determinasi
Nilai r yang didapat sebesar 0.9569567 (95.69567%)
Dapat disimpulkan bahwa variabel lama bekerja dapat menjelaskan hubungan terhadap pendapatan sebesar 95.69567% sedangkan sisanya dipengaruhi variabel lain di luar model.
3.5 Asumsi Normalitas
Hipotesis H0: Data berdistribusi normal H1: Data berdistribusi tidak normal
p-value (0.1952) > α (0.05) maka terima H0. Jadi dapat disimpulkan bahwa dengan menggunakan uji Saphiro-Wilk residual berdistribusi normal.
3.6 Asumsi Homoskedastisitas
Hipotesis H0: Variansi galat bersifat homoskedastisitas H1: Variansi galat bersifat heteroskedastisitas
p-value (0.5276) > α (0.05) maka terima H0. Jadi dapat disimpulkan bahwa dengan menggunakan uji Breusch-Pagan variansi galat bersifat homoskedastisitas.
3.7 Asumsi Nonautokorelasi
Hipotesis H0: Tidak terjadi autokorelasi H1: Terjad autokorelasi
p-value (0.1178) > α (0.05) maka terima H0. Jadi dapat disimpulkan bahwa dengan menggunakan uji Durbin-Watson tidak terjadi autokorelasi.
4 DAFTAR PUSTAKA
Sarbani,dkk. 2022. Pengaruh Tingkat Kemiskinan Terhadap Pembangunan Rumah Layak Huni Di Provinsi Riau Menggunakan Metode Analisis Regresi Sederhana.Jurnal Teknologi dan Manajemen Industri Terapan(JTMIT),vol.1, No.3. Sugiyono. 2010. Metode Penelitian Bisnis , Bandung : ALFABETA. Yuliara, I.M. 2016. Modul Regresi Linier Sederhana. Bali: Universitas Udayana.