Apresentação
O presente trabalho tem como principal objetivo analisar os dados referentes as infrações cometidas na Capital do Estado de Pernambuco, Recife. O ano de 2019 foi coletado do início ao fim, ao todo são mais de 800000 dados coletados.
Podemos identificar quais são os tipo de infrações cometidas pelos recifenses, como o tipo de identificação que foi observada a infração, como por exemplo: Lombada Eletrônica, Foto Sensor e etc.
A partir deste estudo podemos mudar nossa forma de dirigir e respeitar as leis de trânsito, como por exemplo o limite de velocidade das vias.
Explicação
Os dados foram coletados no portal de Dados abertos da Prefeitura do Recife, mais precisamente no ano de 2019. Analisando os dados e realizando alguns tratamentos com relação a datas, separando dados que estão juntos em uma unica coluna emergeando tabelas, como: tipo_equipamento.csv e relatorio-de-multas-implantadas-em-2019.csv para que os dados fiquem ao ponto de serem utilizados.
Abordagem
A metodologia utilizada será na identificação de pontos especificos inclusos nos dados de forma desordenada. Primeiramente uma análise visual será realizada com intuito de identificar no cenário macro pontos que necessitam de ajustes ou correções relevantes contidos nos dados. Posteriormente os dados serão separados em variáveis a fim de especificar ainda mais esses dados para realizar correlações.
Potencial
Dados valem ouro, empresas pagam milhões para ter acesso aos dados de uma forma que seja de fácil visualização e entendimento, dados existem aos “montes”, mas totalmente desorganizados e sem tratamento algum. Seguradoras de veículos são potenciais clientes de informações desse tipo.
dplyr: Para processamento e estruturação de valores N/A
data.table: Criação e manipulação tabelas
tidyr: Processamento e remoções de valores N/A
tm: Processamento de palavras, remoção de caracteres especiais e aplicação de expressões
wordcloud: Para geração de worldclouds
RColorBrewer: Colorir as worldclouds geradas
O presente trablho foi sobre o relatorio anual de infrações/multas implantadas na Capital Pernambucana, como parte do trabalho estão os Datasets escolhidos, sendo eles:
relatorio-de-multas-implantadas-em-2019.csv: Arquivo contendo dados sobre os bairros e seus codigos de indentificaçao
tipo_equipamento.csv: Arquivo que contém informações sobre os tipos de equipamento utilizados para anotação/reconhecimento do tipo de infração.
Os dados analisados foram do ano de 2019.
Os dados são compostos por algumas características específicas o Dataset maior (relatorio-de-multas-implantadas-em-2019) possui oito colunas com um total de 869.131 dados, mas irei trabalhar com 100.000 para evitar erros.
Algumas das colunas presentes são as seguintes: data infracao, infracao, descricao da infracao, amparo legal e local do cometimento
Algumas colunas tiveram que passar por tratamento antes da análise para ficarem preparadas para serem utilizadas, como é o caso das colunas data infracao, agente equipamento e data implantacao, separando-as e realizando merge.
Segue abaixo algumas informações a respeito dos dados, como seus tipos, valores inclusos e formatação.
## dataimplantacao datainfracao horainfracao
## 1 2019-01-08 2019-01-01 00:01:00
## 2 2019-01-08 2019-01-01 00:02:00
## 3 2019-01-08 2019-01-01 00:05:01
## 4 2019-01-08 2019-01-01 00:06:03
## 5 2019-01-08 2019-01-01 00:06:56
## 6 2019-01-08 2019-01-01 00:11:43
## agenteequipamento infracao
## 1 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 2 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 3 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 4 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 5 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 6 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## descricaoinfracao
## 1 Estacionar o veículo no passeio.
## 2 Estacionar o veículo no passeio.
## 3 Estacionar o veículo ao lado ou sobre canteiros centrais divisores de pista de rolamento.
## 4 Estacionar o veículo no passeio.
## 5 Estacionar o veículo no passeio.
## 6 Estacionar o veículo no passeio.
## amparolegal
## 1 Art. 181, Inc. VIII
## 2 Art. 181, Inc. VIII
## 3 Art. 181, Inc. VIII
## 4 Art. 181, Inc. VIII
## 5 Art. 181, Inc. VIII
## 6 Art. 181, Inc. VIII
## localcometimento
## 1 RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 2 RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 3 AVENIDA BOA VIAGEM, LADO OPOSTO AO N.4988
## 4 AVENIDA CONSELHEIRO AGUIAR, EM FRENTE AO N.3231
## 5 AV.ENG.DOMINGOS FERREIRA.SENTIDO UNICO., AO LADODO POSTE N.BO02225
## 6 AV.ENG.DOMINGOS FERREIRA .SENTIDO UNICO ., AO LADO AO POSTE N.BO02225
## dataimplantacao datainfracao horainfracao agenteequipamento
## Length:850000 Length:850000 Length:850000 Length:850000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## infracao descricaoinfracao amparolegal localcometimento
## Length:850000 Length:850000 Length:850000 Length:850000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## agenteequipamento valor
## 1 Código 3 - LOMBADA ELETRÔNICA 1
## 2 Código 4 – RADAR 2
## 3 Código 5 - FOTO SENSOR 3
## 4 Código 7 - ZONA AZUL TALÃO ELETRÔNICO 4
## 5 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5
## 6 Código 9 - FAIXA AZUL 6
## agenteequipamento valor
## Length:6 Min. :1.00
## Class :character 1st Qu.:2.25
## Mode :character Median :3.50
## Mean :3.50
## 3rd Qu.:4.75
## Max. :6.00
Segue abaixo os dados após limpeza e realização de merges e separates.
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## agenteequipamento ano_implantacao mes_implantacao dia_implantacao
## 1 Agente/Equipamento <NA> <NA> <NA>
## 2 Agente/Equipamento <NA> <NA> <NA>
## 3 Código 3 - LOMBADA ELETRÔNICA 2019 10 02
## 4 Código 3 - LOMBADA ELETRÔNICA 2019 01 25
## 5 Código 3 - LOMBADA ELETRÔNICA 2019 10 31
## 6 Código 3 - LOMBADA ELETRÔNICA 2019 10 04
## ano_infracao mes_infracao dia_infracao horainfracao infracao
## 1 <NA> <NA> <NA> Hora da infração Infração
## 2 <NA> <NA> <NA> Hora da Infração Código da Infração
## 3 2019 09 26 12:57:45 7455
## 4 2019 01 07 11:21:35 7455
## 5 2019 10 13 18:39:19 7455
## 6 2019 09 29 17:24:54 7455
## descricaoinfracao
## 1 Descrição da infração
## 2 Descrição da Infração
## 3 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 4 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 5 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 6 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## amparolegal
## 1 Amparo legal
## 2 Amparo Legal
## 3 Art. 218, Inc. I
## 4 Art. 218, Inc. I
## 5 Art. 218, Inc. I
## 6 Art. 218, Inc. I
## localcometimento valor
## 1 Local do cometimento NA
## 2 Local do cometimento NA
## 3 AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. CENTRO 1
## 4 AV. DOM JOAO VI, ENTRE OS N. 777 E 835 - SENTIDO CENTRO 1
## 5 AV. GOV. AGAMENON MAGALHAES - PROX. VIADUTO PRES.MEDICI - SENT. DERBY 1
## 6 AV. ENG. ABDIAS DE CARVALHO, ENTRE OS N. 1785 E 1745 - SENTIDO CENTRO 1
## agenteequipamento ano_implantacao mes_implantacao dia_implantacao
## Length:850001 Length:850001 Length:850001 Length:850001
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## ano_infracao mes_infracao dia_infracao horainfracao
## Length:850001 Length:850001 Length:850001 Length:850001
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## infracao descricaoinfracao amparolegal localcometimento
## Length:850001 Length:850001 Length:850001 Length:850001
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## valor
## Min. :1.000
## 1st Qu.:1.000
## Median :5.000
## Mean :3.527
## 3rd Qu.:5.000
## Max. :6.000
## NA's :6394
Nesse tópico será apresentado a análise temporal dos dados
length(mergeado$mes_infracao)
## [1] 850001
##
## Attaching package: 'data.table'
## The following objects are masked from 'package:dplyr':
##
## between, first, last
verificaMesCometimento(mergeado, "01")
## [1] "O total de infrações no mês selecionado foi de: 75324"
verificaMesCometimento(mergeado, "02")
## [1] "O total de infrações no mês selecionado foi de: 66031"
Tipos de infração referente ao mês de Janeiro.