library(lubridate)
library(dplyr)
library(rstatix)
library(writexl)
library(stringr)
grafico = 1
dia = "2019-10-01"
load("/home/rstudio/data/TempoViagemConsolidado_2019_10_.Rds")
names(df) = unlist(df[1,])
df = df[2:length(df$Viagem), ]
df$Prefixo = gsub(" -.*$", "", df$Prefixo)
df$Linha = gsub(" -.*$", "", df$Linha)
colnames(df)[6] = "Tabela"
df$Tabela = as.character(df$Tabela)
df$Prefixo = as.numeric(df$Prefixo)
df$Data = as.Date(df$Data)
rcod$Tabela = as.character(rcod$Tabela)
rcod$Sentido = as.character(rcod$Sentido)
names(rcod) = paste(names(rcod),"RC", sep = "")
colnames(rcod)[c(2, 4:5, 8)] = c("Linha","Sentido", "Tabela", "Prefixo")
df = df[order(df$Sentido, df$Tabela),]
library(data.table)
df = as.data.table(df)
rcod$key = 1:nrow(rcod)
rcod = as.data.table(rcod)
falha = base[is.na(base$LargadaRC), ]
falhas = as.data.frame(table(falha$Linha.x))
A conjunto de dados da GoolSysten conta com 2896 registros de viagens e o conjunto rcod840 conta com 2896 viagens. A base considerada conta com 2896 viagens, sendo que 0.59% correspondendo a 17 viagens não puderam ser compatibilizadas com viagens do conjunto rcod 840.
Conceitos:
Data: Data da viagem
Linha: Prefixo da Linha Realizada
Sentido: Sentido do Trajeto Realizado
Partida Programada: Horário de Tabela para Inínio da Viagem
GSIni: Data de Início da Viagem registrado na plataforma GoolSystem
rcodIni: Data de Início da Viagem registrado no Boletim da Tripulação
ChegadaProgramada: Horário de Tabela para Conclusão da Viagem
GSFim: Data de Conclusão da Viagem registrado na plataforma GoolSystem
rcodFim: Data de Conclusão da Viagem registrado no Boletim da Tripulação
Empresa: Empresa operadora da Linha
Passageiros: Número de passageiros durante a viagem
##
## Shapiro-Wilk normality test
##
## data: diferencas
## W = 0.81973, p-value < 2.2e-16
Com base na estatistica de Shapiro Wilk com P-valor Inferior a 0.05 conclui-se que os dados não apresentam Distribuição Nornal, requerendo a aplicação do Teste de Wilcoxon.
##
## Wilcoxon signed rank test with continuity correction
##
## data: base$PartidaProgramada and base$GSIni
## V = 536010, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
## 0% 25% 50% 75% 100%
## -23 -1 0 2 37
##
## Shapiro-Wilk normality test
##
## data: diferencas
## W = 0.50217, p-value < 2.2e-16
Com base na estatistica de Shapiro Wilk com P-valor Inferior a 0.05 conclui-se que os dados não apresentam Distribuição Nornal, requerendo a aplicação do Teste de Wilcoxon.
##
## Wilcoxon signed rank test with continuity correction
##
## data: base$PartidaProgramada and base$rcodIni
## V = 6520.5, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
## 0% 25% 50% 75% 100%
## -10 0 0 0 10
##
## Shapiro-Wilk normality test
##
## data: diferencas
## W = 0.73785, p-value < 2.2e-16
Com base na estatistica de Shapiro Wilk com P-valor Inferior a 0.05 conclui-se que os dados não apresentam Distribuição Nornal, requerendo a aplicação do Teste de Wilcoxon.
##
## Wilcoxon signed rank test with continuity correction
##
## data: base$GSIni and base$rcodIni
## V = 980724, p-value = 6.062e-14
## alternative hypothesis: true location shift is not equal to 0
## 0% 25% 50% 75% 100%
## -32 -1 0 1 23
Abaixo são apresentados os gráficos de boxplot com a dispersão de valores para os registros de partida obtidos pelos dois instrumentos de mensuracão.
As densidades verificadas para o instante de partida são apresentadas abaixo:
As densidades verificadas para as diferenças de partida são apresentadas abaixo:
………………