O presente estudo foi desenvolvido com intuito de verificar a acurácia na medição do tempo de chegadas e partidas dos veículos de trasnporte coletivo na cidade de Porto Alegre, gerados a partir de equipamentos de GPS embarcado nos coletivos.
Para realização da análise foram utilizadas duas fontes de informacão. A primeira consiste em dados de registros de GPS onde constam a localização, linha, prefixo, hora de chegada e partida dos coletivos em pontos de embarque de interesse; já a segunda fonte de informação é oriunda de dados de cronometragem realizada in loco nos mesmos pontos de embarque para os instantes de chegada e partida.
Para verificação in loco foram utilizados cronometros marca VOLLO e modelo VL-1809 sincronizados com o horário de computadores que utilizam o horário de Brasília - DF (GMT-3).
Após obtidos os dois conjuntos de dados os mesmos foram consolidados em uma única base de dados, com cada linha de registro para viagens únicas constando dados de chegada e partida registrados pelas duas fontes e combinadas a partir dos dados de linha e prefixo.
Como os dados obtidos referem-se a horários de partida e chegada de coletivos nos mesmos locais, obtidos por meio de dois instrumentos de verificação, foram aplicados dois testes paramétricos pareados, sendo eles o Teste-T Pareado para Duas Amostras Dependentes e o Teste-F para Duas Amostras Pareadas Dependentes; ambos considerando análise bilateral. O primeiro teste consistiu em realizar o teste de comparação de médias e o segundo analise comparativa de variâncias.
Os dados obtidos são apresentados abaixo
Foram elaborados graficos de distribuição e dispersão para obtenção de uma compreensao mais intuitiva da distribuição dos dados.
As densidades verificadas para o instante de chegada são apresentadas abaixo:
Abaixo são apresentados os gráficos de boxplot com a dispersão de valores para os registros de chegada obtidos pelos dois instrumentos de mensuracão.
As densidades verificadas para o instante de partida são apresentadas abaixo:
Abaixo são apresentados os gráficos de boxplot com a dispersão de valores para os registros de partida obtidos pelos dois instrumentos de mensuracão.
Foram aplicados teste de Variância nas quatro amostras para identificar se apresentam variâncias iguais
Assumiu-se que as amostras possuem variâncias iguais e assim foram aplicados os testes para as amostras pareadas de chegada e de partida.
Os coeficientes e resultados estatísticos para as amostras pareadas de chegadas são demonstrados abaixo:
t.test(dados$ChegadaGPS, dados$ChegadaCron, paired = TRUE)
##
## Paired t-test
##
## data: dados$ChegadaGPS and dados$ChegadaCron
## t = 0.42829, df = 22, p-value = 0.6726
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -5.846785 8.890263
## sample estimates:
## mean of the differences
## 1.521739
Os coeficientes e resultados estatísticos para as amostras pareadas de partidas são demonstrados abaixo:
t.test(dados$SaidaGPS, dados$SaidaCron, paired = TRUE)
##
## Paired t-test
##
## data: dados$SaidaGPS and dados$SaidaCron
## t = -0.97299, df = 22, p-value = 0.3411
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -10.755808 3.886243
## sample estimates:
## mean of the differences
## -3.434783
Da mesma forma foram aplicados testes de Variância para os mesmos pares de amostras:
Os coeficientes e resultados estatísticos para as amostras pareadas de chegadas são demonstrados abaixo:
var.test(dados$ChegadaGPS, dados$ChegadaCron, ratio = 1, alternative = "two.sided")
##
## F test to compare two variances
##
## data: dados$ChegadaGPS and dados$ChegadaCron
## F = 0.95692, num df = 22, denom df = 22, p-value = 0.9187
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.4058408 2.2563142
## sample estimates:
## ratio of variances
## 0.9569244
Os coeficientes e resultados estatísticos para as amostras pareadas de partidas são demonstrados abaixo:
var.test(dados$SaidaGPS, dados$SaidaCron, ratio = 1, alternative = "two.sided" )
##
## F test to compare two variances
##
## data: dados$SaidaGPS and dados$SaidaCron
## F = 1.0082, num df = 22, denom df = 22, p-value = 0.985
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.4275722 2.3771322
## sample estimates:
## ratio of variances
## 1.008165
Como o valor crítico para duas amostras, ambas com 22 graus de liberdade e nível de significância de 5% é de 2.0477703 e portanto, maior que a estatística F obtida em ambos os casos, é possível afirmar que os testes para diferença não são significativos; fornecendo garantias suficentes para afirmar que as médias e variâncias dos dois instrumentos de aferição são equivalentes.
qf(p=.05, df1=22, df2=22, lower.tail=FALSE)
## [1] 2.04777
A partir dos testes pareados para médias e variâncias demonstra-se que não é possível afirmar a existência de diferenças entre os resultados dos dois instrumentos de de coleta. Como o intuito do trabalho consistiu em validar os dados gerados pela plataforma de dados de rastreio por GPS, demonstra-se que os resultados da plataforma são aderenrtes às necessidades requeridadas quanto à precisão e variabilidade. Assim os dados eletrônicos obtidos de dispositivos embarcados em ônibus de transporte coletivo demonstrar efetiva viabilidade de uso para avaliacão de tempos de viagem, tempo de permanência em pontos de embarque e monitoramento do frota.
BERNANRD ROSNER. Fundamentals of biostatistics. 8th. ed. Boston: Cengage, 2016.
BUSSAB, W. DE O.; MORETTIN, P. A. Estatística Básica. 9. ed. São Paulo: Saraiva, 2017.
DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. São Paulo: Cengage Learning, 2014.
SHARPE, N. R.; DE VEAUX, R. D.; VELLEMAN, P. F. Estatística Aplicada: Administração, Economia e Negócios, Porto Alegre: Artmed, 2011.