Inlezen bestand

setwd("~/R/Machinefabriek")
getwd()
## [1] "C:/Users/menno_000/Documents/R/Machinefabriek"
Machinefabriek <- read.csv("~/R/Machinefabriek/labordtl 6.csv", sep = ";")
dim(Machinefabriek)
## [1] 9999   13

Toevoegen verwerkingstijd

Voor het toevoegen van verwerkingstijd heb ik eerst de begin en eindtijden omgezet in een leesbaar format (POSIXct). Daarna heb ik het verschil bepaald tussen deze twee en die weggeschreven in verwerkingstijd.

Machinefabriek$timestampIN <- strftime(Machinefabriek$timestamp.IN, format="%d-%m-%y %H:%M")
Machinefabriek$timestampOUT <- strftime(Machinefabriek$timestamp.OUT, format="%d-%m-%y %H:%M")
Machinefabriek$verwerkingstijd <- difftime(Machinefabriek$timestampOUT, Machinefabriek$timestampIN, units = "mins")
lapply(Machinefabriek, class)
## $EmployeeNum
## [1] "factor"
## 
## $event
## [1] "integer"
## 
## $timestamp.IN
## [1] "factor"
## 
## $timestamp.OUT
## [1] "factor"
## 
## $case.JobNum
## [1] "factor"
## 
## $OprSeq
## [1] "integer"
## 
## $OpComplete
## [1] "factor"
## 
## $LaborQty
## [1] "factor"
## 
## $Complete
## [1] "factor"
## 
## $LaborDtlSeq
## [1] "integer"
## 
## $LaborHrs
## [1] "factor"
## 
## $BurdenHrs
## [1] "factor"
## 
## $LaborHrs...BurdenHrs
## [1] "factor"
## 
## $timestampIN
## [1] "character"
## 
## $timestampOUT
## [1] "character"
## 
## $verwerkingstijd
## [1] "difftime"

Schrijf Machinefabriek weg in CSV format

De gegevens zoals ingelezen inclusief de toegevoegde verwerkingstijd wegschrijven naar Machinefabriek_new.csv (in CSV format ; gescheiden).

Cols <- c("EmployeeNum", "case.JobNum", "OprSeq", "OpComplete", "LaborQty", "Complete", "LaborDtlSeq", "LaborHrs", "LaborHrs...BurdenHrs", "timestampIN", "timestampOUT", "verwerkingstijd" )
Machinefabriek_new <- Machinefabriek[ , Cols]
write.table(Machinefabriek_new, "~/R/Machinefabriek/Machinefabriek_new.csv", sep = ";", row.names = FALSE)

Bepalen van het aantal en de lengte van de casussen

## Bepalen aantal casussen
aantal_casusssen <- length(unique(Machinefabriek_new$case.JobNum))
aantal_casusssen
## [1] 2403
## bepalen lengte van casussen
casussen <- as.data.frame(table(Machinefabriek_new$case.JobNum))
Frequenties <- as.data.frame(table(casussen$Freq))
hist(casussen$Freq)

Frequenties
##    Var1 Freq
## 1     1  506
## 2     2  488
## 3     3  367
## 4     4  288
## 5     5  187
## 6     6  120
## 7     7   94
## 8     8   79
## 9     9   60
## 10   10   43
## 11   11   50
## 12   12   31
## 13   13   24
## 14   14   17
## 15   15   17
## 16   16   10
## 17   17    6
## 18   18    5
## 19   19    2
## 20   21    3
## 21   22    2
## 22   23    1
## 23   27    1
## 24   36    1
## 25   39    1