Visto que há informações de Latitude e Longitude, então é possível montar um mapa da região (com base no codigo da linha) e assim utilizá-lo para responder as seguintes perguntas? Quais regiões o tráfego é mais intenso e em quais horários?

Este problema foi pensando sem ter feito uma distribuição dos dados, uma vez que se feito seria possível detectar que o número de linhas é muito pequeno para ser utilizado como varíavel; sendo assim foi utilizado apenas as variáveis latitude, longitude e horario.

## Warning: package 'ggplot2' was built under R version 3.2.3
## Warning: package 'd3heatmap' was built under R version 3.2.3
## Warning: package 'plotly' was built under R version 3.2.3
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:graphics':
## 
##     layout

O gráfico abaixo mostra a distribuição de horário de acesso as linhas de ônibus pelos usuários em dados_2.txt.

dados_parsed <- read.csv("dados_parsed.txt", sep="")
plot(main="Distribuicao de Uso das linhas de ônibus",xlab='Horario (em segundos)'
     ,ylab="Frequencia",density(dados_parsed$time))
abline(v=70000,col='blue')
abline(v=190000,col='green')
abline(v=220000,col='red')

As linhas azul(7 A.M), verde (7 P.M) e vermelha(10 P.M) foram os horários escolhidos para a apresentação da análise por heatmap.

lat_long <- read.csv("lat_long.txt", sep=";")
plot(main="Transporte Publico Curitiba",xlab="Longitude",ylab="Latitude",lat_long$longitude,lat_long$latitude)

Heatmap para as 7 horas.

heattable <- read.csv("heattable_07.txt", header=FALSE, sep=";")
traffic = data.matrix(heattable)
vals <- unique(scales::rescale(c(traffic)))
o <- order(vals, decreasing = FALSE)
cols <- scales::col_numeric("Blues", domain = NULL)(vals)
colz <- setNames(data.frame("lat", "lon"), NULL)
plot_ly(z = traffic, colorscale = colz, type = "heatmap")

Heatmap para as 19 horas.

heattable <- read.csv("heattable_19.txt", header=FALSE, sep=";")
traffic = data.matrix(heattable)
vals <- unique(scales::rescale(c(traffic)))
o <- order(vals, decreasing = FALSE)
cols <- scales::col_numeric("Blues", domain = NULL)(vals)
colz <- setNames(data.frame("lat", "lon"), NULL)
plot_ly(z = traffic, colorscale = colz, type = "heatmap")

Heatmap para as 22 horas

heattable <- read.csv("heattable_22.txt", header=FALSE, sep=";")
traffic = data.matrix(heattable)
vals <- unique(scales::rescale(c(traffic)))
o <- order(vals, decreasing = FALSE)
cols <- scales::col_numeric("Blues", domain = NULL)(vals)
colz <- setNames(data.frame("lat", "lon"), NULL)
plot_ly(z = traffic, colorscale = colz, type = "heatmap")

Todos os horários

heattable <- read.csv("heattable.txt", header=FALSE, sep=";")
traffic = data.matrix(heattable)
vals <- unique(scales::rescale(c(traffic)))
o <- order(vals, decreasing = FALSE)
cols <- scales::col_numeric("Blues", domain = NULL)(vals)
colz <- setNames(data.frame("lat", "lon"), NULL)
plot_ly(z = traffic, colorscale = colz, type = "heatmap")

É que há fortes indícios de correlação entre rotas, tráfico e horário. Com a apresentação do mapa da cidade juntamente com o heatmap do tráfego seria possível identificar visualmente o motivo de alguns pontos serem mais intensos que outros.

Uma pesquisada rápida foi possível identificar que o motivo tais itensidades em determinados horários é devido as aulas na UFPR