1 PENDAHULUAN
1.1 Latar Belakang
Pengalaman kerja yang diperoleh seseorang akan membantunya dalam memberikan ketrampilan dan pengetahuan khusus yang sesuai dengan jenis pekerjaan yang ditekuninya. Seseorang yang melakukan jenis pekerjaan secara berulang-ulang dalam jangka waktu yang cukup lama akan menjadikan dirinya cukup terampil dalam mengerjakan pekerjaan tersebut. Dengan memiliki pengalaman yang semakin tinggi maka perusahaan akan menetapkan gaji minimal yang semakin tinggi pula. Oleh karena itu, dilakukan analisis regresi sederhana untuk mengetahui seberapa besar pengaruh lama pengalaman kerja dengan gaji yang diterima.
1.2 Data Penelitian
Dataset yang digunakan adalah gaji karyawan berdasarkan lama pengalaman bekerja. Kumpulan data diambil, diurutkan dan dikonversikan ke angka untuk memudahkan dalam melakukan analisis.
Data penelitian ini bersumber dari: https://www.kaggle.com/datasets/karthickveerakumar/salary-data-simple-linear-regression?resource=download .
2 PEMBAHASAN
2.1 Library yang Dibutuhkan
> # library(knitr)
> # library(rmarkdown)
> # library(prettydoc)
> # library(equatiomatic)2.2 Dataset
> Data<-read.table("clipboard", header = TRUE, dec = ".")
> Data
Years_of_Experience Salary
1 1.1 39343
2 1.3 46205
3 1.5 37731
4 2.0 43525
5 2.2 39891
6 2.9 56642
7 3.0 60150
8 3.2 54445
9 3.2 64445
10 3.7 57189
11 3.9 63218
12 4.0 55794
13 4.0 56957
14 4.1 57081
15 4.5 61111
16 4.9 67938
17 5.1 66029
18 5.3 83088
19 5.9 81363
20 6.0 93940
21 6.8 91738
22 7.1 98273
23 7.9 101302
24 8.2 113812
25 8.7 109431
26 9.0 105582
27 9.5 116969
28 9.6 112635
29 10.3 122391
30 10.5 1218722.3 Korelasi
Memberikan gambaran ukuran keeratan dan arah hubungan antar dua variabel (\(X\) dan \(Y\)), tanpa memperhatikan hubungan sebab akibat.
Koefisien korelasi Pearson:
\[
r
= \frac {\sum^{n}_{i=1}{(X_i - \bar{X})(Y_i - \bar{Y})}}{S_X S_Y}
\] Menghitung koefisien korelasi dengan menggunakan function cor() dengan menggunakan metode Pearson.
> Korelasi<-cor(Data, method = "pearson")
> Korelasi
Years_of_Experience Salary
Years_of_Experience 1.0000000 0.9782416
Salary 0.9782416 1.0000000Dapat disimpulkan bahwa terdapat korelasi yang cukup tinggi antara Years of Experience dan Salary.
2.4 Analisis Regresi
Regresi linier adalah metode yang dipakai untuk memperoleh model hubungan antara variabel dependen dan variabel independen. Terdapat dua jenis regresi linier yaitu, regresi linier sederhana dan regresi linier berganda. ### Pendugaan Parameter Penduga parameter \((\beta)\) dihitung dengan persamaan \[ \widehat{\beta} = (X'X)^{-1} (X'Y) \]
> n<-dim(Data)[1]
> X<-matrix(c(rep(1,n),Data$Years_of_Experience),nrow = n)
> Y<-Data$Salary> beta<-solve(t(X)%*%X)%*%(t(X)%*%Y)
> beta
[,1]
[1,] 25792.200
[2,] 9449.962Persamaan : \[ \widehat{Y_i}=25792.200+9449.962{X_i} \]
2.4.1 Y duga dan Sisaan
\[ \widehat{Y}=X\beta \]
> y_duga<-X%*%beta\[ \widehat{\varepsilon} = Y-\widehat{Y} \]
> e<-Y-y_duga2.4.2 Standar Error
\[ se=\sigma_\varepsilon(X'X)^{-1} \] \(\sigma_\varepsilon\) diduga dengan Kuadrat Tengah Galat
\[ \widehat\sigma_\varepsilon= \frac {\sum\widehat\varepsilon^2}{n-1} \]
> MSE<-sum(e^2)/(n-1)
> VarCov<-MSE*solve(t(X)%*%X)
> Se<-sqrt(diag(VarCov))2.4.3 Koefisien Determinasi
Mengukur variabilitas dari variabel respons yang terjelaskan oleh variabel prediktor. Koefisien determinasi bernilai antara 0 dan 1. Dikatakan baik jika nilai mendekati 1.
Persamaan koefisien Determinasi: \[
R^2=\frac{JK_{Reg}}{JK_{Total}}=1-\frac {JK_{Error}}{JK_{Total}}
\]
> JK_Error<-sum(e^2)
> JK_Total<-sum((Y-mean(Y))^2)
> R2<- 1-(JK_Error/JK_Total)> R2
[1] 0.9569567\(R^2\) adjusted akan menghitung setiap penambahan variabel dan mengestimasi nilai \(R^2\) dari penambahan variabel tersebut.
\[
R^2_{adj}=1-\frac{JK_{Error}/(n-1)}{JK_{Total}/(n+2)}=1-\frac{MS_{Error}}{JK_{Total}/(n+2)}
\]
> R2a<-1-(MSE/(JK_Total/(n+2)))> R2a
[1] 0.95250392.4.4 Analisis Regresi Menggunakan Fungsi Built In
Melakukan analisis regresi dengan fungsi lm().
> reg<-lm(Salary~Years_of_Experience, data=Data)> summary(reg)
Call:
lm(formula = Salary ~ Years_of_Experience, data = Data)
Residuals:
Min 1Q Median 3Q Max
-7958.0 -4088.5 -459.9 3372.6 11448.0
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 25792.2 2273.1 11.35 5.51e-12 ***
Years_of_Experience 9450.0 378.8 24.95 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5788 on 28 degrees of freedom
Multiple R-squared: 0.957, Adjusted R-squared: 0.9554
F-statistic: 622.5 on 1 and 28 DF, p-value: < 2.2e-16\[ \widehat{Y_i}=25792.200+9450.0{X_i} \]
- Kesimpulan :
Berdasarkan pengujian menggunakan fungsi regresi linier untuk memprediksi besarnya gaji dari pengalaman bekerja diketahui pengalaman bekerja memberikan pengaruh positif terhadap besarnya gai karyawan. Sehingga dapat disimpulkan bahwa bertambahnya pengalaman kerja seorang karyawan maka gaji yang diterima juga akan bertambah setiap tahunnya.
Setiap nilai \(X\) nol atau karyawan belum memiliki pengalaman bekerja, ia akan menerima gaji sebesar 25792 setiap tahunnya dan tiap pertambahan satu tahun pengalaman kerja, gaji yang diterima akan bertambah sebesar 9450 setiap tahunnya.
2.5 Pemeriksaan Sisaan
2.5.1 Pemeriksaan normalitas sisaan dengan menggunakan plot().
> plot(reg,2) Dari plot tersebut dapat dilihat bahwa tidak terdapat adanya pelanggaran normalitas karena data cenderung berada pada garis diagonal.
2.5.2 Pemeriksaan normalitas sisaan menggunakan perintah shapiro.test().
> sisa<-residuals(reg)
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.95234, p-value = 0.1952- Keputusan : Nilai p yang cukup besar, maka gagal tolak \(H_0\).
- Kesimpulan : Tidak terbukti ada pelanggaran asumsi normalitas galat pada model gaji sebagai fungsi dari lama pengalaman kerja.
3 PENUTUP
Analisis regresi dapat diimplementasikan dalam kehidupan sehari-hari. Salah satunya untuk memprediksi gaji karyawan berdasarkan lama pengalaman bekerjanya. Berdasarkan analisis yang telah dilakukan dapat disimpulkan bahwa terdapat pengaruh positif lama pengalaman bekerja terhadap gaji karyawan. Hal ini ditunjukkan dengan harga koefisien korelasi sebesar 0.9782416 dan diperoleh persamaan regresi sederhana \(\widehat{Y_i}=25792.200+9450.0{X_i}\), yang artinya tiap bertambahnya satu tahun pengalaman bekerja maka gaji yang diperoleh akan naik sebesar 9450 setiap tahunnya dan gaji yang diperoleh dengan 0 pengalaman bekerja adalah sebesar 25792 setiap tahunnya.