setwd("~/R/Machinefabriek")
getwd()
## [1] "C:/Users/menno_000/Documents/R/Machinefabriek"
Machinefabriek <- read.csv("~/R/Machinefabriek/labordtl 6.csv", sep = ";")
dim(Machinefabriek)
## [1] 9999 13
Voor het toevoegen van verwerkingstijd heb ik eerst de begin en eindtijden omgezet in een leesbaar format (POSIXct). Daarna heb ik het verschil bepaald tussen deze twee en die weggeschreven in verwerkingstijd.
Machinefabriek$timestampIN <- strftime(Machinefabriek$timestamp.IN, format="%d-%m-%y %H:%M")
Machinefabriek$timestampOUT <- strftime(Machinefabriek$timestamp.OUT, format="%d-%m-%y %H:%M")
Machinefabriek$verwerkingstijd <- difftime(Machinefabriek$timestampOUT, Machinefabriek$timestampIN, units = "mins")
lapply(Machinefabriek, class)
## $EmployeeNum
## [1] "factor"
##
## $event
## [1] "integer"
##
## $timestamp.IN
## [1] "factor"
##
## $timestamp.OUT
## [1] "factor"
##
## $case.JobNum
## [1] "factor"
##
## $OprSeq
## [1] "integer"
##
## $OpComplete
## [1] "factor"
##
## $LaborQty
## [1] "factor"
##
## $Complete
## [1] "factor"
##
## $LaborDtlSeq
## [1] "integer"
##
## $LaborHrs
## [1] "factor"
##
## $BurdenHrs
## [1] "factor"
##
## $LaborHrs...BurdenHrs
## [1] "factor"
##
## $timestampIN
## [1] "character"
##
## $timestampOUT
## [1] "character"
##
## $verwerkingstijd
## [1] "difftime"
De gegevens zoals ingelezen inclusief de toegevoegde verwerkingstijd wegschrijven naar Machinefabriek_new.csv (in CSV format ; gescheiden).
Cols <- c("EmployeeNum", "case.JobNum", "OprSeq", "OpComplete", "LaborQty", "Complete", "LaborDtlSeq", "LaborHrs", "LaborHrs...BurdenHrs", "timestampIN", "timestampOUT", "verwerkingstijd" )
Machinefabriek_new <- Machinefabriek[ , Cols]
write.table(Machinefabriek_new, "~/R/Machinefabriek/Machinefabriek_new.csv", sep = ";", row.names = FALSE)
## Bepalen aantal casussen
aantal_casusssen <- length(unique(Machinefabriek_new$case.JobNum))
aantal_casusssen
## [1] 2403
## bepalen lengte van casussen
casussen <- as.data.frame(table(Machinefabriek_new$case.JobNum))
Frequenties <- as.data.frame(table(casussen$Freq))
hist(casussen$Freq)
Frequenties
## Var1 Freq
## 1 1 506
## 2 2 488
## 3 3 367
## 4 4 288
## 5 5 187
## 6 6 120
## 7 7 94
## 8 8 79
## 9 9 60
## 10 10 43
## 11 11 50
## 12 12 31
## 13 13 24
## 14 14 17
## 15 15 17
## 16 16 10
## 17 17 6
## 18 18 5
## 19 19 2
## 20 21 3
## 21 22 2
## 22 23 1
## 23 27 1
## 24 36 1
## 25 39 1