Pendahuluan
Latar Belakang
Proses rekrutmen menjadi salah satu rangkaian penting yang menentukan masa depan sebuah perusahaan. Dalam proses ini, diperlukan banyak pertimbangan untuk menghasilkan sebuah keputusan yang terbaik. Salah satu faktor yang dipertimbangkan adalah seberapa lama karyawan tersebut dapat bekerja di sebuah perusahaan. Departemen Sumber daya Manusia atau departemen lain yang bertanggung jawab dalam proses rekrutmen karyawan perlu memiliki pengetahuan mengenai faktor yang mempengaruhi hal tersebut.
Salah satu faktor yang diasumsikan mempengaruhi adalah gender. Berdasarkan penelitian-penelitian sebelumnya, terdapat hasil yang menyatakan bahwa gender berpengaruh terhadap hasil kerja dari karyawan. Pada analisis ini akan dibahas mengenai pengaruh gender terhadap jumlah perusahaan yang pernah menjadi tempat karyawan bekerja, jumlah total jam kerja karyawan selama karir mereka, lama karyawan bekerja pada perusahaan saat ini, lama karyawan bekerja dengan posisi mereka saat ini, dan lama karyawan bekerja dengan manajer mereka saat ini. Data didapatkan dari website kaggle dengan jumlah data yang digunakan yaitu 31 data dengan gender sebagai variabel independen dan terdapat 5 variabel dependen yaitu NumCompaniesWorked, TotalWorkingYears, YearsAtCompany, YearsInCurrentRole, YearsWithCurrManager. Diharapkan hasil analisis ini dapat menjadi wawasan baru bagi Departemen Human Resource sehingga kedepannya dapat dihasilkan keputusan yang lebih baik dalam pemilihan karyawan.
Tujuan
Mengetahui pengaruh gender terhadap jumlah perusahaan yang pernah menjadi tempat karyawan bekerja, jumlah total jam kerja karyawan selama karir mereka, lama karyawan bekerja pada perusahaan saat ini, lama karyawan bekerja dengan posisi mereka saat ini, dan lama karyawan bekerja dengan manajer mereka saat ini.
Data
Data yang digunakan dalam penelitian ini diambil dari website kaggle dan digunakan sebanyak 31 data dengan variabel-variabel sebagai berikut:
- Gender: Jenis kelamin karyawan, terdiri dari dua kategori yaitu “Male” (laki-laki) dan “Female” (Perempuan)
- NumCompaniesWorked: Jumlah perusahaan yang pernah menjadi tempat karyawan bekerja
- TotalWorkingYears: Jumlah total jam kerja karyawan selama karir mereka
- YearsAtCompany: Lama karyawan bekerja pada perusahaan saat ini
- YearsInCurrentRole: Lama karyawan bekerja dengan posisi mereka saat ini
- YearsWithCurrManager: Lama karyawan bekerja dengan manajer mereka saat ini
library(readxl)
data<- read_excel("D:/employeedata2.xlsx")
knitr::kable(data)| Gender | NumCompaniesWorked | TotalWorkingYears | YearsAtCompany | YearsInCurrentRole | YearsWithCurrManager |
|---|---|---|---|---|---|
| Male | 9 | 32 | 5 | 4 | 3 |
| Male | 6 | 7 | 3 | 2 | 1 |
| Male | 1 | 1 | 1 | 0 | 0 |
| Male | 1 | 32 | 32 | 5 | 7 |
| Male | 7 | 18 | 8 | 6 | 0 |
| Male | 7 | 15 | 7 | 6 | 7 |
| Female | 8 | 28 | 22 | 11 | 10 |
| Male | 6 | 4 | 2 | 2 | 2 |
| Male | 6 | 5 | 2 | 2 | 1 |
| Female | 1 | 7 | 6 | 5 | 2 |
| Male | 7 | 15 | 12 | 11 | 11 |
| Male | 3 | 8 | 6 | 2 | 0 |
| Male | 8 | 8 | 1 | 0 | 0 |
| Male | 3 | 23 | 3 | 2 | 2 |
| Male | 4 | 5 | 2 | 2 | 2 |
| Male | 5 | 17 | 14 | 1 | 7 |
| Female | 5 | 6 | 2 | 2 | 2 |
| Female | 2 | 26 | 11 | 4 | 8 |
| Male | 1 | 15 | 15 | 12 | 11 |
| Female | 1 | 9 | 9 | 0 | 7 |
| Male | 4 | 10 | 8 | 7 | 0 |
| Female | 0 | 6 | 5 | 4 | 3 |
| Male | 1 | 25 | 25 | 10 | 9 |
| Female | 3 | 16 | 1 | 1 | 0 |
| Female | 1 | 10 | 10 | 8 | 8 |
| Female | 2 | 25 | 19 | 17 | 8 |
| Male | 1 | 6 | 5 | 3 | 3 |
| Female | 3 | 26 | 20 | 17 | 6 |
| Male | 1 | 10 | 10 | 8 | 7 |
| Female | 3 | 8 | 0 | 0 | 0 |
| Male | 1 | 33 | 33 | 9 | 10 |
Latar Belakang Metode
Metode yang digunakan dalam analisis ini adalah metode MANOVA atau Multivariate of Variance Analysis. MANOVA adalah sebuah metode statistik yang digunakan untuk mengevaluasi secara bersamaan signifikansi perbedaan antara variabel independen terhadap lebih dari dua variabel dependen.Menurut Tabachnick dan Fidell (2007), MANOVA dapat dianggap sebagai perluasan dari ANOVA yang digunakan ketika terdapat beberapa variabel terikat yang ingin diuji secara statistik. Sedangkan menurut Field (2009: 603), beberapa asumsi yang harus dipenuhi dalam MANOVA antara lain:
- Pengamatan harus independen
- Pengambilan sampel harus acak
- Variabel dependen berdistribusi normal multivariat dalam masing-masing kelompok
- Variansi dalam setiap kelompok homogen
Metode ini sesuai dengan data yang akan digunakan karena data terdiri dari lima variabel dependen. sehingga dalam analisis paling sesuai menggunakan metode MANOVA.
Tinjauan Pustaka
Model MANOVA
Terdapat dua jenis model yang dapat digunakan untuk analisis variansi yaitu: - Model overparameterized (non-full-rank)
\[x_{ijk} = \mu + \alpha_i + \beta_j + \gamma_{ij} + \epsilon_{ijk}\] Model ini mengharuskan data memiliki ukuran sel yang sama
- Model Rerata Sel
\[ x_{ijk} = \mu_{ij} + \epsilon{ijk}\]
Menurut Rencher (1998), model rerata sel adalah pendekatan statistik yang simpel dan jelas yang menghasilkan hasil yang mudah diinterpretasikan dan mendukung pengujian hipotesis yang tidak membingungkan.Model ini tidak mengharuskan data memiliki ukuran sel yang sama.
Statistik Uji MANOVA
Menurut Kattree dan Naik (2000: 66) terdapat beberapa statistik uji yang digunakan untuk MANOVA, antara lain: - Pillai’s Trace \[ P = \sum^p_{i=1} (\frac {\lambda_i} {1+ \lambda_i}) = tr\lambda_i (1+\lambda_i)^{-1}= tr \frac {|B|}{|B+W|} \] Statistik uji ini merupakan pilihan yang paling sesuai ketika asumsi homogenitas matriks varians-kovarians tidak terpenuhi, ketika ukuran sampel kecil, dan jika hasil pengujian menunjukkan adanya perbedaan signifikan antara beberapa vektor rata-rata sementara yang lain tidak. Semakin tinggi nilai statistik Pillai’s Trace, semakin besar pengaruhnya terhadap model.
- Wilk’s Lambda \[ U = \prod^p_{i=1}(1+\lambda_i)^{-1} = \frac {|W|} {|B+W|}\] Uji ini digunakan jika asumsi homogenitas matriks varians kovarians terpenuhi dan terdapat lebih dari dua variabel independen.
- Hotteling’s Trace \[ T = \sum^p_{i=1}\lambda_i = tr \lambda_i = tr (W)^{-1}(B)\] Statistik uji ini sesuai apabila hanya ada dua kelompok variabel independen. Semakin tinggi nilai statistik Hotelling’s Trace, semakin besar dampaknya terhadap model.
- Roy’s Largest Root \[R = \lambda_{maks} = maks(\lambda_1,\lambda_2,... \lambda_p)\] Uji ini hanya dapat digunakan jika asumsi homogenitas varians kovarians terpenuhi. Semakin tinggi nilai statistik Roy’s Largest Root, pengaruh terhadap model semakin besar.
Uji Asumsi Normalitas
Terdapat beberapa uji yang dapat digunakan untuk menguji normalitas data multivariat. Salah satu yang dapat digunakan yaitu Uji Mardia. Menurut Rencher (2002), uji Mardia merupakan salah satu prosedur yang melibatkan uji normalitas multivariat yang bergantung pada skewness (kemiringan) dan kurtosis (keruncingan). Berdasarkan penelitian oleh Romeu dan Ozturk (dalam Timm, 2002), sebanyak 10 uji goodness-of-fit digunakan untuk menilai normalitas multivariat. Hasil simulasi dari penelitian ini menunjukkan bahwa uji normalitas multivariat yang mempertimbangkan skewness dan kurtosis yang diusulkan oleh Mardia adalah yang paling andal dan stabil dalam menilai normalitas multivariat.
Uji Asumsi Homogenitas Varians Kovarians
Salah satu asumsi yang penting untuk diuji adalah asumsi homogenitas varians kovarians. Pengujian ini dilakukan dengan menggunakan uji Box’s M.
Source Code dan Pembahasan
Library
Beberapa library yang digunakan dalam analisis ini antara lain:
library(readxl)Library ini digunakan untuk membaca file excel. Data yang digunakan dalam penelitian ini disimpan dalam bentuk excel, maka dari itu library ini diperlukan.
library(MVN)Library ini digunakan untuk pengujian asumsi normal multivariat
library(MVTests)##
## Attaching package: 'MVTests'
## The following object is masked from 'package:datasets':
##
## iris
Library ini digunakan untuk menguji asumsi homogenitas matriks varian kovarian
##Source Code - Import Data
library(readxl)
data <- read_excel("D:/employeedata2.xlsx")
View(data)
x<- as.matrix(data$Gender, nrow=31, ncol=1)
y1<- as.matrix(data$NumCompaniesWorked, nrow=31, ncol=1)
y2<- as.matrix(data$TotalWorkingYears, nrow=31, ncol=1)
y3<-as.matrix(data$YearsAtCompany, nrow=31, ncol=1)
y4<-as.matrix(data$YearsInCurrentRole, nrow=31, ncol=1)
y5<-as.matrix(data$YearsWithCurrManager, nrow=31, ncol=1)Code ini digunakan untuk mengimport data yang sudah di simpan pada file D dengan nama employeedata2.Data kemudian diubah dalam bentuk matriks dan diberi nama sesuai dengan nama variabel yang dibutuhkan. Code “nrow” digunakan untuk mendefinisikan jumlah baris dan “ncol” digunakan untuk mendefinisikan jumlah kolom.
- Pengecekan Missing Value
is.na(data)## Gender NumCompaniesWorked TotalWorkingYears YearsAtCompany
## [1,] FALSE FALSE FALSE FALSE
## [2,] FALSE FALSE FALSE FALSE
## [3,] FALSE FALSE FALSE FALSE
## [4,] FALSE FALSE FALSE FALSE
## [5,] FALSE FALSE FALSE FALSE
## [6,] FALSE FALSE FALSE FALSE
## [7,] FALSE FALSE FALSE FALSE
## [8,] FALSE FALSE FALSE FALSE
## [9,] FALSE FALSE FALSE FALSE
## [10,] FALSE FALSE FALSE FALSE
## [11,] FALSE FALSE FALSE FALSE
## [12,] FALSE FALSE FALSE FALSE
## [13,] FALSE FALSE FALSE FALSE
## [14,] FALSE FALSE FALSE FALSE
## [15,] FALSE FALSE FALSE FALSE
## [16,] FALSE FALSE FALSE FALSE
## [17,] FALSE FALSE FALSE FALSE
## [18,] FALSE FALSE FALSE FALSE
## [19,] FALSE FALSE FALSE FALSE
## [20,] FALSE FALSE FALSE FALSE
## [21,] FALSE FALSE FALSE FALSE
## [22,] FALSE FALSE FALSE FALSE
## [23,] FALSE FALSE FALSE FALSE
## [24,] FALSE FALSE FALSE FALSE
## [25,] FALSE FALSE FALSE FALSE
## [26,] FALSE FALSE FALSE FALSE
## [27,] FALSE FALSE FALSE FALSE
## [28,] FALSE FALSE FALSE FALSE
## [29,] FALSE FALSE FALSE FALSE
## [30,] FALSE FALSE FALSE FALSE
## [31,] FALSE FALSE FALSE FALSE
## YearsInCurrentRole YearsWithCurrManager
## [1,] FALSE FALSE
## [2,] FALSE FALSE
## [3,] FALSE FALSE
## [4,] FALSE FALSE
## [5,] FALSE FALSE
## [6,] FALSE FALSE
## [7,] FALSE FALSE
## [8,] FALSE FALSE
## [9,] FALSE FALSE
## [10,] FALSE FALSE
## [11,] FALSE FALSE
## [12,] FALSE FALSE
## [13,] FALSE FALSE
## [14,] FALSE FALSE
## [15,] FALSE FALSE
## [16,] FALSE FALSE
## [17,] FALSE FALSE
## [18,] FALSE FALSE
## [19,] FALSE FALSE
## [20,] FALSE FALSE
## [21,] FALSE FALSE
## [22,] FALSE FALSE
## [23,] FALSE FALSE
## [24,] FALSE FALSE
## [25,] FALSE FALSE
## [26,] FALSE FALSE
## [27,] FALSE FALSE
## [28,] FALSE FALSE
## [29,] FALSE FALSE
## [30,] FALSE FALSE
## [31,] FALSE FALSE
sum(is.na(data))## [1] 0
Code ini digunakan untuk melakukan pengecekan apakah terdapat data yang hilang. Program akan memunculkan baris data yang bernilai “NA”. Apabila hasil sum bernilai 0, maka dapat dipastikan bahwa tidak ada data yang hilang.
- Pembentukan Data Frame
data_employee<-data.frame(x,y1,y2,y3,y4,y5)Data yang sudah didefinisikan kemudian disatukan dengan data frame dan diberi nama data_employee. Data ini yang nantinya akan digunakan untuk analisis.
- Uji Asumsi Normalitas
norm.test = mvn(data = data, subset = "Gender",mvnTest = "mardia")
norm.test$multivariateNormality## $Female
## Test Statistic p value Result
## 1 Mardia Skewness 34.870974637336 0.474336851438201 YES
## 2 Mardia Kurtosis -1.2624909643079 0.20677217560984 YES
## 3 MVN <NA> <NA> YES
##
## $Male
## Test Statistic p value Result
## 1 Mardia Skewness 46.7078907793212 0.089168308537351 YES
## 2 Mardia Kurtosis -0.42456171598974 0.671156206405575 YES
## 3 MVN <NA> <NA> YES
Pengujian asumsi normalitas dilakukan dengan menggunakan fungsi mvn pada library “MVN”. Subset yang didefinisikan merupakan variabel independen. “Kemudian test yang digunakan yaitu mardia.”Mvntest” digunakan untuk memilih jenis penujian yang digunakan, pada analisis kali ini digunakan Mardia Test.
- Uji Asumsi Homogenitas Matriks Varian Kovarian
ujiboxm<-BoxM(data = data[,2:6], data$`Gender`)
summary(ujiboxm)## Box's M Test
##
## Chi-Squared Value = 23.34838 , df = 15 and p-value: 0.077
Pengujian Asumsi Homogenitas Varian Kovarian menggunakan fungsi BoxM pada library MVTests. Variabel dependen dipilih pada data yang sudah diimport sebelumnya pada kolom ke dua hingga ke 6.
- Uji MANOVA
ujimanova <- manova(cbind(y1,y2,y3,y4,y5)~x,data=data_employee)
summary(ujimanova, test="Pillai")## Df Pillai approx F num Df den Df Pr(>F)
## x 1 0.18728 1.1522 5 25 0.3598
## Residuals 29
summary(ujimanova, test="Roy")## Df Roy approx F num Df den Df Pr(>F)
## x 1 0.23043 1.1522 5 25 0.3598
## Residuals 29
summary(ujimanova, test="Wilks")## Df Wilks approx F num Df den Df Pr(>F)
## x 1 0.81272 1.1522 5 25 0.3598
## Residuals 29
summary(ujimanova, test="Hotelling-Lawley")## Df Hotelling-Lawley approx F num Df den Df Pr(>F)
## x 1 0.23043 1.1522 5 25 0.3598
## Residuals 29
Hasil dan Pembahasan
Uji Asumsi Normalitas
\(H_0\) : Data berdistribusi normal vs \(H_1\) : Data tidak berdistribusi normal
norm.test$multivariateNormality## $Female
## Test Statistic p value Result
## 1 Mardia Skewness 34.870974637336 0.474336851438201 YES
## 2 Mardia Kurtosis -1.2624909643079 0.20677217560984 YES
## 3 MVN <NA> <NA> YES
##
## $Male
## Test Statistic p value Result
## 1 Mardia Skewness 46.7078907793212 0.089168308537351 YES
## 2 Mardia Kurtosis -0.42456171598974 0.671156206405575 YES
## 3 MVN <NA> <NA> YES
Berdasarkan hasil dari uji mardia, dapat dilihat bahwa nilai-p melebihi \(\alpha = 0,05\) untuk seluruh perlakuan, maka \(H_0\) gagal ditolak, dapat disimpulkan bahwa data memenuhi asumsi normalitas untuk setiap perlakuan
Uji Asumsi Homogenitas Matriks Varian Kovarian
\(H_0\) : Matriks varian kovarian homogen vs \(H_1\) : Matriks varian kovarian tidak homogen
summary(ujiboxm)## Box's M Test
##
## Chi-Squared Value = 23.34838 , df = 15 and p-value: 0.077
Berdasarkan hasil uji Box M, didapatkan nilai-p = 0,077 yang berarti lebih besar dari nilai \(\alpha = 0.05\), sehingga \(H_0\) gagal ditolak, dapat disimpulkan bahwa asumsi kehomogenan matriks varian kovarian terpenuhi
Statistik Uji MANOVA
\(H_0\) : \(\mu_1 = \mu_2 = ... =\mu_5\) vs \(H_1\) : Setidaknya terdapat satu \(\mu_i\) yang berbeda
summary(ujimanova, test="Pillai")## Df Pillai approx F num Df den Df Pr(>F)
## x 1 0.18728 1.1522 5 25 0.3598
## Residuals 29
summary(ujimanova, test="Roy")## Df Roy approx F num Df den Df Pr(>F)
## x 1 0.23043 1.1522 5 25 0.3598
## Residuals 29
summary(ujimanova, test="Wilks")## Df Wilks approx F num Df den Df Pr(>F)
## x 1 0.81272 1.1522 5 25 0.3598
## Residuals 29
summary(ujimanova, test="Hotelling-Lawley")## Df Hotelling-Lawley approx F num Df den Df Pr(>F)
## x 1 0.23043 1.1522 5 25 0.3598
## Residuals 29
Berdasarkan hasil uji, didapatkan nilai-p = 0,3598 yang berarti lebih besar dari \(\alpha = 0.05\), sehingga \(H_0\) gagal ditolak. Tidak terdapat perbedaan yang signifikan antar variabel. Maka, tidak perlu dilakukan uji lanjutan. Dapat disimpulkan bahwa gender tidak berpengaruh terhadap jumlah perusahaan yang pernah menjadi tempat karyawan bekerja, jumlah total jam kerja karyawan selama karir mereka, lama karyawan bekerja pada perusahaan saat ini, lama karyawan bekerja dengan posisi mereka saat ini, dan lama karyawan bekerja dengan manajer mereka saat ini.
Penutup
Kesimpulan
Berdasarkan hasil uji manova, dapat disimpulan bahwa gender tidak berpengaruh terhadap jumlah perusahaan yang pernah menjadi tempat karyawan bekerja, jumlah total jam kerja karyawan selama karir mereka, lama karyawan bekerja pada perusahaan saat ini, lama karyawan bekerja dengan posisi mereka saat ini, dan lama karyawan bekerja dengan manajer mereka saat ini.
Saran
Pembedaan rekrutmen berdasarkan gender tidak perlu dilakukan karena berdasarkan hasil penelitian tidak terdapat pengaruh yang signifikan. Perlu dilakukan penelitian lebih lanjut terkait faktor-faktor lain yang mungkin dapat menjadi pertimbangan dalam proses rekrutmen.
Daftar Pustaka
Employee Attrition Dataset. 2020. Kaggle. https://www.kaggle.com/datasets/colearninglounge/employee-attrition/
Field, A. 2009. Discovering Statistics Using SPSS. London: Sage Publications.
Rencher, A. C. 1998. Multivariate Statistical Inference and Applications. Kanada: John Wiley and Sons, Inc.
Tabachnick, B. G. dan Fidell, L. S. 2007. Using Multivariate Statistics. Boston: Pearson Education, Inc