## EmployeeNumber Surname GivenName Gender
## Min. : 1 Johnson : 106 James : 182 F:4120
## 1st Qu.:2085 Smith : 86 John : 161 M:4216
## Median :4168 Jones : 71 Robert : 136
## Mean :4168 Williams: 71 Mary : 124
## 3rd Qu.:6252 Brown : 62 William: 121
## Max. :8336 Moore : 47 Michael: 107
## (Other) :7893 (Other):7505
## City JobTitle DepartmentName
## Vancouver :1780 Cashier :1703 Customer Service:1737
## Victoria : 690 Dairy Person :1514 Dairy :1515
## New Westminster: 540 Meat Cutter :1480 Meats :1514
## Burnaby : 339 Baker :1404 Bakery :1449
## Surrey : 275 Produce Clerk:1129 Produce :1163
## Richmond : 228 Shelf Stocker: 712 Processed Foods : 746
## (Other) :4484 (Other) : 394 (Other) : 212
## StoreLocation Division Age
## Vancouver :1836 Executive : 11 Min. : 3.505
## Victoria : 853 FinanceAndAccounting: 73 1st Qu.:35.299
## Nanaimo : 610 HumanResources : 76 Median :42.115
## New Westminster: 525 InfoTech : 10 Mean :42.007
## Kelowna : 418 Legal : 3 3rd Qu.:48.667
## Kamloops : 360 Stores :8163 Max. :77.938
## (Other) :3734
## LengthService AbsentHours BusinessUnit AbsenceRate
## Min. : 0.0121 Min. : 0.00 HeadOffice: 173 Min. : 0.0000
## 1st Qu.: 3.5759 1st Qu.: 19.13 Stores :8163 1st Qu.: 0.9196
## Median : 4.6002 Median : 56.01 Median : 2.6926
## Mean : 4.7829 Mean : 61.28 Mean : 2.9463
## 3rd Qu.: 5.6239 3rd Qu.: 94.28 3rd Qu.: 4.5329
## Max. :43.7352 Max. :272.53 Max. :13.1024
##
Proses data cleaning dimana terdapat data dimana ada usia yang kita gunakan untuk memprediksi data ini disepakati lebih dari 18 tahun dan di bawah 65 tahun.
Grafik yang menggambarkan Jumlah Karyawan per Unit bisnis, Jenis Kelamin dan Divisi
Kita akan bertanya melalui analisa eksploratori
## Loading required package: car
## Loading required package: sandwich
## Anova Table (Type II tests)
##
## Response: AbsenceRate
## Sum Sq Df F value Pr(>F)
## Gender 496 1 97.773 < 2.2e-16 ***
## Residuals 41379 8163
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## F M
## 3.157624 2.664813
## Anova Table (Type II tests)
##
## Response: AbsenceRate
## Sum Sq Df F value Pr(>F)
## Division 91 5 3.5617 0.003218 **
## Residuals 41783 8159
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Executive FinanceAndAccounting HumanResources
## 2.323580 1.921890 2.651743
## InfoTech Legal Stores
## 1.925995 2.471724 2.920856
## Anova Table (Type II tests)
##
## Response: AbsenceRate
## Sum Sq Df F value Pr(>F)
## Division 92 5 3.6145 0.002877 **
## Gender 496 1 97.9418 < 2.2e-16 ***
## Division:Gender 5 5 0.1784 0.970783
## Residuals 41283 8153
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## F M
## Executive 2.976419 1.779546
## FinanceAndAccounting 2.172804 1.634077
## HumanResources 3.014491 2.214311
## InfoTech 3.298112 1.773538
## Legal 3.298112 2.058530
## Stores 3.169049 2.680788
Didapatkan dari analisa tersebut bahwa tingkat absensi lintas organisasi berbeda secara signifikan berdasarkan divisi, jenis kelamin dan interaksi antar keduanya.
Korelasi dan Diagram scatter bisa menjelaskan hal ini
## [1] 0.8246129
## [1] -0.04669242
## [1] 0.05623405
Dapat dilihat korelasi yang kuat antara usia dan tingkat absensi, tetapi tidak dengan masa kerja dengan tingkat absensi, atau antara masa kerja dengan usia.