Apresentação
O presente trabalho tem como principal objetivo analisar os dados referentes as infrações cometidas na Capital do Estado de Pernambuco, Recife. O ano de 2019 foi coletado do início ao fim, ao todo são mais de 800000 dados coletados.
Podemos identificar quais são os tipo de infrações cometidas pelos recifenses, como o tipo de identificação que foi observada a infração, como por exemplo: Lombada Eletrônica, Foto Sensor e etc.
A partir deste estudo podemos mudar nossa forma de dirigir e respeitar as leis de trânsito, como por exemplo o limite de velocidade das vias.
Explicação
Os dados foram coletados no portal de Dados abertos da Prefeitura do Recife, mais precisamente no ano de 2019. Analisando os dados e realizando alguns tratamentos com relação a datas, separando dados que estão juntos em uma unica coluna emergeando tabelas, como: tipo_equipamento.csv e relatorio-de-multas-implantadas-em-2019.csv para que os dados fiquem ao ponto de serem utilizados.
Abordagem
A metodologia utilizada será na identificação de pontos especificos inclusos nos dados de forma desordenada. Primeiramente uma análise visual será realizada com intuito de identificar no cenário macro pontos que necessitam de ajustes ou correções relevantes contidos nos dados. Posteriormente os dados serão separados em variáveis a fim de especificar ainda mais esses dados para realizar correlações.
Potencial
Dados valem ouro, empresas pagam milhões para ter acesso aos dados de uma forma que seja de fácil visualização e entendimento, dados existem aos “montes”, mas totalmente desorganizados e sem tratamento algum. Seguradoras de veículos são potenciais clientes de informações desse tipo.
dplyr: Para manipulação e estruturação de dados
data.table: Criação e manipulação tabelas
tidyr: Processamento e remoções de valores N/A
tm: Processamento de palavras, remoção de caracteres especiais e aplicação de expressões
wordcloud: Para geração de worldclouds
RColorBrewer: Colorir as worldclouds geradas
DT: Para visualizacao de dados em forma de tabela
runtime: shiny: Para interação no doc HTML
O presente trablho foi sobre o relatorio anual de infrações/multas implantadas na Capital Pernambucana, como parte do trabalho estão os Datasets escolhidos, sendo eles:
relatorio-de-multas-implantadas-em-2019.csv: Arquivo contendo dados sobre os bairros e seus codigos de indentificaçao
tipo_equipamento.csv: Arquivo que contém informações sobre os tipos de equipamento utilizados para anotação/reconhecimento do tipo de infração.
Os dados analisados foram do ano de 2019.
Os dados são compostos por algumas características específicas o Dataset maior (relatorio-de-multas-implantadas-em-2019) possui oito colunas com um total de 869.131 dados, iremos trabalhar com os dados em sua totalidade.
Algumas das colunas presentes são as seguintes: data infracao, infracao, descricao da infracao, amparo legal e local do cometimento
Algumas colunas tiveram que passar por tratamento antes da análise para ficarem preparadas para serem utilizadas, como é o caso das colunas data infracao, agente equipamento e data implantacao, separando-as e realizando merge.
Segue abaixo algumas informações a respeito dos dados, como seus tipos, valores inclusos e formatação.
## dataimplantacao datainfracao horainfracao
## 1 2019-01-08 2019-01-01 00:01:00
## 2 2019-01-08 2019-01-01 00:02:00
## 3 2019-01-08 2019-01-01 00:05:01
## 4 2019-01-08 2019-01-01 00:06:03
## 5 2019-01-08 2019-01-01 00:06:56
## 6 2019-01-08 2019-01-01 00:11:43
## agenteequipamento infracao
## 1 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 2 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 3 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 4 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 5 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 6 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## descricaoinfracao
## 1 Estacionar o veículo no passeio.
## 2 Estacionar o veículo no passeio.
## 3 Estacionar o veículo ao lado ou sobre canteiros centrais divisores de pista de rolamento.
## 4 Estacionar o veículo no passeio.
## 5 Estacionar o veículo no passeio.
## 6 Estacionar o veículo no passeio.
## amparolegal
## 1 Art. 181, Inc. VIII
## 2 Art. 181, Inc. VIII
## 3 Art. 181, Inc. VIII
## 4 Art. 181, Inc. VIII
## 5 Art. 181, Inc. VIII
## 6 Art. 181, Inc. VIII
## localcometimento
## 1 RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 2 RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 3 AVENIDA BOA VIAGEM, LADO OPOSTO AO N.4988
## 4 AVENIDA CONSELHEIRO AGUIAR, EM FRENTE AO N.3231
## 5 AV.ENG.DOMINGOS FERREIRA.SENTIDO UNICO., AO LADODO POSTE N.BO02225
## 6 AV.ENG.DOMINGOS FERREIRA .SENTIDO UNICO ., AO LADO AO POSTE N.BO02225
## dataimplantacao datainfracao horainfracao agenteequipamento
## Length:869131 Length:869131 Length:869131 Length:869131
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## infracao descricaoinfracao amparolegal localcometimento
## Length:869131 Length:869131 Length:869131 Length:869131
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## agenteequipamento valor
## 1 Código 3 - LOMBADA ELETRÔNICA 1
## 2 Código 4 – RADAR 2
## 3 Código 5 - FOTO SENSOR 3
## 4 Código 7 - ZONA AZUL TALÃO ELETRÔNICO 4
## 5 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5
## 6 Código 9 - FAIXA AZUL 6
## agenteequipamento valor
## Length:6 Min. :1.00
## Class :character 1st Qu.:2.25
## Mode :character Median :3.50
## Mean :3.50
## 3rd Qu.:4.75
## Max. :6.00
Segue abaixo os dados após limpeza e realização de merges e separates.
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## agenteequipamento ano_implantacao mes_implantacao dia_implantacao
## 1 Agente/Equipamento <NA> <NA> <NA>
## 2 Agente/Equipamento <NA> <NA> <NA>
## 3 Código 3 - LOMBADA ELETRÔNICA 2019 06 10
## 4 Código 3 - LOMBADA ELETRÔNICA 2019 01 21
## 5 Código 3 - LOMBADA ELETRÔNICA 2019 08 03
## 6 Código 3 - LOMBADA ELETRÔNICA 2019 04 22
## ano_infracao mes_infracao dia_infracao horainfracao infracao
## 1 <NA> <NA> <NA> Hora da infração Infração
## 2 <NA> <NA> <NA> Hora da Infração Código da Infração
## 3 2019 05 23 18:17:10 7455
## 4 2019 01 01 14:20:49 7455
## 5 2019 07 14 15:56:24 7455
## 6 2019 04 07 12:05:58 7455
## descricaoinfracao
## 1 Descrição da infração
## 2 Descrição da Infração
## 3 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 4 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 5 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 6 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## amparolegal
## 1 Amparo legal
## 2 Amparo Legal
## 3 Art. 218, Inc. I
## 4 Art. 218, Inc. I
## 5 Art. 218, Inc. I
## 6 Art. 218, Inc. I
## localcometimento
## 1 Local do cometimento
## 2 Local do cometimento
## 3 AV. MARECHAL MASCARENHAS DE MORAES - SEMAFORO, 531., Sentido:AEROPORTO Faixa: 4
## 4 CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO
## 5 CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO
## 6 AV. DOM JOAO VI, EM FRT. PT. DE ONIBUS N. 010243,SENT. SUB.
## valor
## 1 NA
## 2 NA
## 3 1
## 4 1
## 5 1
## 6 1
## agenteequipamento ano_implantacao mes_implantacao dia_implantacao
## Length:869132 Length:869132 Length:869132 Length:869132
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## ano_infracao mes_infracao dia_infracao horainfracao
## Length:869132 Length:869132 Length:869132 Length:869132
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## infracao descricaoinfracao amparolegal localcometimento
## Length:869132 Length:869132 Length:869132 Length:869132
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## valor
## Min. :1.000
## 1st Qu.:1.000
## Median :5.000
## Mean :3.523
## 3rd Qu.:5.000
## Max. :6.000
## NA's :6492
Nesse tópico será apresentado a análise temporal dos dados
length(mergeado$mes_infracao)
## [1] 869132
##
## Attaching package: 'data.table'
## The following objects are masked from 'package:dplyr':
##
## between, first, last
verificaMesCometimento(mergeado, "01")
## [1] "O total de infrações no mês selecionado foi de: 75324"
verificaMesCometimento(mergeado, "02")
## [1] "O total de infrações no mês selecionado foi de: 66031"
Tipos de infração referente ao mês de Janeiro.
Segue os dados referentes ao mês de Junho
Segue os dados referentes ao mês de Dezembro
## Loading required package: NLP
## Loading required package: RColorBrewer
Segue os dados referentes a alguns dos meses do ano.
## Warning in tm_map.SimpleCorpus(corpus_local, tolower): transformation drops
## documents
## Warning in tm_map.SimpleCorpus(corpus_local, removePunctuation): transformation
## drops documents
## Warning in tm_map.SimpleCorpus(corpus_local, stripWhitespace): transformation
## drops documents
## Warning in tm_map.SimpleCorpus(corpus_local, tolower): transformation drops
## documents
## Warning in tm_map.SimpleCorpus(corpus_local, removePunctuation): transformation
## drops documents
## Warning in tm_map.SimpleCorpus(corpus_local, stripWhitespace): transformation
## drops documents
## Warning in tm_map.SimpleCorpus(corpus_local, tolower): transformation drops
## documents
## Warning in tm_map.SimpleCorpus(corpus_local, removePunctuation): transformation
## drops documents
## Warning in tm_map.SimpleCorpus(corpus_local, stripWhitespace): transformation
## drops documents
verificaLocalCometimento <- function(df, texto){
rela <- data.table(Local_Infração=c(df$localcometimento))
local <- paste("^", texto, sep = "")
x <- rela[Local_Infração %like% local]
print(x)
print(paste("O total de infrações foi de:", length(x$Local_Infração)))
}
Segue o total de infrações por trecho de mensagem passada como parâmetro.
verificaLocalCometimento(mergeado, "CAIS")
## Local_Infração
## 1: CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO
## 2: CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO
## 3: CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO
## 4: CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO
## 5: CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO
## ---
## 22051: CAIS DA DETENCAO.SENTIDO UNICO., EM FRENTE AO POSTE N.BO19984
## 22052: CAIS DA DETENCAO.SENTIDO UNICO., EM FRENTE AO LADO DO POSTE N.BO19982
## 22053: CAIS DA DETENCAO.SENTIDO UNICO., EM FRENTE AO POSTE N.BO19984
## 22054: CAIS DO APOLO, AO LADO AO N.333
## 22055: CAIS DO APOLO, AO LADO AO N.333
## [1] "O total de infrações foi de: 22055"
verificaLocalCometimento(mergeado, "AVENIDA BOA VIAGEM")
## Local_Infração
## 1: AVENIDA BOA VIAGEM, EM FRENTE AO N. 3114
## 2: AVENIDA BOA VIAGEM, EM FRENTE AO N. 3296
## 3: AVENIDA BOA VIAGEM, EM FRENTE AO N.3296
## 4: AVENIDA BOA VIAGEM, EM FRENTE AO N. 30, SENTIDO UNICO
## 5: AVENIDA BOA VIAGEM, EM FRENTE AO N.4100
## ---
## 6102: AVENIDA BOA VIAGEM, EM FRENTE AO PARQUE DONA LINDU
## 6103: AVENIDA BOA VIAGEM, EM FRENTE AO N. 1716 SENTIDO UNICO
## 6104: AVENIDA BOA VIAGEM, LADO OPOSTO AO N. 650
## 6105: AVENIDA BOA VIAGEM, EM FRENTE AO N. 3650
## 6106: AVENIDA BOA VIAGEM, EM FRENTE AO N. 3232 SENTIDO SUBURBIO CIDADE
## [1] "O total de infrações foi de: 6106"
verificaLocalCometimento(mergeado, "AV. MAL. MASCARENHAS")
## Local_Infração
## 1: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. CENTRO
## 2: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. CENTRO
## 3: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. PRAZERES
## 4: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. PRAZERES
## 5: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. PRAZERES
## ---
## 18206: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. CENTRO
## 18207: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. CENTRO
## 18208: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. CENTRO
## 18209: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. CENTRO
## 18210: AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. PRAZERES
## [1] "O total de infrações foi de: 18210"
verificaLocalCometimento(mergeado, "AV. BEBERIBE")
## Local_Infração
## 1: AV. BEBERIBE, N. 3101 - SENTIDO CENTRO
## 2: AV. BEBERIBE, N. 3101 - SENTIDO CENTRO
## 3: AV. BEBERIBE, N. 3101 - SENTIDO CENTRO
## 4: AV. BEBERIBE, N. 2960 - SENTIDO SUBURBIO
## 5: AV. BEBERIBE, N. 3101 - SENTIDO CENTRO
## ---
## 20365: AV. BEBERIBE, SEMAFORO 131., Sentido:SUBURBIO Faixa: 2
## 20366: AV. BEBERIBE, SEMAFORO 131., Sentido:SUBURBIO Faixa: 2
## 20367: AV. BEBERIBE, SEMAFORO 131., Sentido:SUBURBIO Faixa: 2
## 20368: AV. BEBERIBE, SEMAFORO 131., Sentido:SUBURBIO Faixa: 1
## 20369: AV. BEBERIBE, SEMAFORO 131., Sentido:SUBURBIO
## [1] "O total de infrações foi de: 20369"
Através da análise de dados foi possível ter informações relevantes a cerca das infrações de trânsito implantadas na Cidade do Recife, conhecendo quais os meses com maior número de infrações, quais tipos de infrações são mais recorrentes e quais locais a incidência de multas é maior.
Após a análise dos mais de 850.000 dados, verificamos que os meses com maior número de infrações são os seguintes: Novembro e Dezembro. Já os Meses com o menor número de infrações são os seguintes: Junho, Abril e Maio. As Vias com o maior número de infrações são as seguintes: AV. Boa Viagem, Av. Beberibe, Av. Mal Mascarenhas de Moraes e Cais de Santa Rita. As infrações mais recorrentes são as seguintes: 7455 - Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento), 5550 - Estacionar o veículo em locais e horários proibidos especificamente pela sinalização.
Com o tratamento dos dados e a fácil visualização é possível que empresas de segurança a bordo, Seguradoras de veículos e auto escolas se aproveitem destas informações para investir em programas de orientação e educação no trânsito, como também planos de seguros que se encaixam mais com o perfil do condutor recifense.