Apresentação
O presente trabalho tem como principal objetivo analisar os dados referentes as infrações cometidas na Capital do Estado de Pernambuco, Recife. O ano de 2019 foi coletado do início ao fim, ao todo são mais de 800000 dados coletados.
Podemos identificar quais são os tipo de infrações cometidas pelos recifenses, como o tipo de identificação que foi observada a infração, como por exemplo: Lombada Eletrônica, Foto Sensor e etc.
A partir deste estudo podemos mudar nossa forma de dirigir e respeitar as leis de trânsito, como por exemplo o limite de velocidade das vias.
Explicação
Os dados foram coletados no portal de Dados abertos da Prefeitura do Recife, mais precisamente no ano de 2019. Analisando os dados e realizando alguns tratamentos com relação a datas, separando dados que estão juntos em uma unica coluna emergeando tabelas, como: tipo_equipamento.csv e relatorio-de-multas-implantadas-em-2019.csv para que os dados fiquem ao ponto de serem utilizados.
Abordagem
A metodologia utilizada será na identificação de pontos especificos inclusos nos dados de forma desordenada. Primeiramente uma análise visual será realizada com intuito de identificar no cenário macro pontos que necessitam de ajustes ou correções relevantes contidos nos dados. Posteriormente os dados serão separados em variáveis a fim de especificar ainda mais esses dados para realizar correlações.
Potencial
Dados valem ouro, empresas pagam milhões para ter acesso aos dados de uma forma que seja de fácil visualização e entendimento, dados existem aos “montes”, mas totalmente desorganizados e sem tratamento algum. Seguradoras de veículos são potenciais clientes de informações desse tipo.
dplyr: Para processamento e estruturação de valores N/A
data.table: Criação e manipulação tabelas
tidyr: Processamento e remoções de valores N/A
tm: Processamento de palavras, remoção de caracteres especiais e aplicação de expressões
wordcloud: Para geração de worldclouds
RColorBrewer: Colorir as worldclouds geradas
O presente trablho foi sobre o relatorio anual de infrações/multas implantadas na Capital Pernambucana, como parte do trabalho estão os Datasets escolhidos, sendo eles:
relatorio-de-multas-implantadas-em-2019.csv: Arquivo contendo dados sobre os bairros e seus codigos de indentificaçao
tipo_equipamento.csv: Arquivo que contém informações sobre os tipos de equipamento utilizados para anotação/reconhecimento do tipo de infração.
Os dados analisados foram do ano de 2019.
Os dados são compostos por algumas características específicas o Dataset maior (relatorio-de-multas-implantadas-em-2019) possui oito colunas com um total de 869.131 dados, mas irei trabalhar com 150.000 para evitar erros.
Algumas das colunas presentes são as seguintes: data infracao, infracao, descricao da infracao, amparo legal e local do cometimento
Algumas colunas tiveram que passar por tratamento antes da análise para ficarem preparadas para serem utilizadas, como é o caso das colunas data infracao, agente equipamento e data implantacao, separando-as e realizando merge.
Segue abaixo algumas informações a respeito dos dados, como seus tipos, valores inclusos e formatação.
## datainfracao horainfracao dataimplantacao
## 1 2019-01-01 00:01:00 2019-01-08
## 2 2019-01-01 00:02:00 2019-01-08
## 3 2019-01-01 00:05:01 2019-01-08
## 4 2019-01-01 00:06:03 2019-01-08
## 5 2019-01-01 00:06:56 2019-01-08
## 6 2019-01-01 00:11:43 2019-01-08
## agenteequipamento infracao
## 1 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 2 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 3 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 4 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 5 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## 6 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5452
## descricaoinfracao
## 1 Estacionar o veículo no passeio.
## 2 Estacionar o veículo no passeio.
## 3 Estacionar o veículo ao lado ou sobre canteiros centrais divisores de pista de rolamento.
## 4 Estacionar o veículo no passeio.
## 5 Estacionar o veículo no passeio.
## 6 Estacionar o veículo no passeio.
## amparolegal
## 1 Art. 181, Inc. VIII
## 2 Art. 181, Inc. VIII
## 3 Art. 181, Inc. VIII
## 4 Art. 181, Inc. VIII
## 5 Art. 181, Inc. VIII
## 6 Art. 181, Inc. VIII
## localcometimento
## 1 RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 2 RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 3 AVENIDA BOA VIAGEM, LADO OPOSTO AO N.4988
## 4 AVENIDA CONSELHEIRO AGUIAR, EM FRENTE AO N.3231
## 5 AV.ENG.DOMINGOS FERREIRA.SENTIDO UNICO., AO LADODO POSTE N.BO02225
## 6 AV.ENG.DOMINGOS FERREIRA .SENTIDO UNICO ., AO LADO AO POSTE N.BO02225
## datainfracao horainfracao dataimplantacao agenteequipamento
## Length:100000 Length:100000 Length:100000 Length:100000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## infracao descricaoinfracao amparolegal localcometimento
## Min. :5010 Length:100000 Length:100000 Length:100000
## 1st Qu.:5550 Class :character Class :character Class :character
## Median :7340 Mode :character Mode :character Mode :character
## Mean :6592
## 3rd Qu.:7455
## Max. :7633
## agenteequipamento valor
## 1 Código 3 - LOMBADA ELETRÔNICA 1
## 2 Código 4 – RADAR 2
## 3 Código 5 - FOTO SENSOR 3
## 4 Código 7 - ZONA AZUL TALÃO ELETRÔNICO 4
## 5 Código 8 - AUTOS NO TALÃO ELETRÔNICO 5
## 6 Código 9 - FAIXA AZUL 6
## agenteequipamento valor
## Length:6 Min. :1.00
## Class :character 1st Qu.:2.25
## Mode :character Median :3.50
## Mean :3.50
## 3rd Qu.:4.75
## Max. :6.00
Segue abaixo os dados após limpeza e realização de merges e separates.
## Installing package into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/4.0'
## (as 'lib' is unspecified)
## Installing package into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/4.0'
## (as 'lib' is unspecified)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## agenteequipamento ano_infracao mes_infracao dia_infracao
## 1 Código 3 - LOMBADA ELETRÔNICA 2019 01 01
## 2 Código 3 - LOMBADA ELETRÔNICA 2019 01 13
## 3 Código 3 - LOMBADA ELETRÔNICA 2019 01 06
## 4 Código 3 - LOMBADA ELETRÔNICA 2019 01 01
## 5 Código 3 - LOMBADA ELETRÔNICA 2019 01 04
## 6 Código 3 - LOMBADA ELETRÔNICA 2019 01 01
## horainfracao ano_implantacao mes_implantacao dia_implantacao infracao
## 1 07:52:14 2019 01 18 7455
## 2 07:42:23 2019 02 01 7455
## 3 11:42:47 2019 01 24 7455
## 4 07:50:40 2019 01 18 7455
## 5 13:14:45 2019 01 22 7455
## 6 15:43:14 2019 01 21 7455
## descricaoinfracao
## 1 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 2 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 3 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 4 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 5 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 6 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## amparolegal
## 1 Art. 218, Inc. I
## 2 Art. 218, Inc. I
## 3 Art. 218, Inc. I
## 4 Art. 218, Inc. I
## 5 Art. 218, Inc. I
## 6 Art. 218, Inc. I
## localcometimento valor
## 1 AV. ENG. ANTONIO DE GOES, N. 124 1
## 2 CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO 1
## 3 AV. RUI BARBOSA, N. 1397 1
## 4 AV. ENG. ANTONIO DE GOES, N. 124 1
## 5 AV. ENG. DOMINGOS FERREIRA, SEMAFORO 338, Faixa: 1 1
## 6 AV. ENG. ABDIAS DE CARVALHO, ENTRE OS N. 1785 E 1745 - SENTIDO CENTRO 1
## agenteequipamento ano_infracao mes_infracao dia_infracao
## Length:100001 Length:100001 Length:100001 Length:100001
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## horainfracao ano_implantacao mes_implantacao dia_implantacao
## Length:100001 Length:100001 Length:100001 Length:100001
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## infracao descricaoinfracao amparolegal localcometimento
## Min. :5010 Length:100001 Length:100001 Length:100001
## 1st Qu.:5550 Class :character Class :character Class :character
## Median :7340 Mode :character Mode :character Mode :character
## Mean :6592
## 3rd Qu.:7455
## Max. :7633
## NA's :1
## valor
## Min. :1.000
## 1st Qu.:1.000
## Median :5.000
## Mean :3.382
## 3rd Qu.:5.000
## Max. :6.000
## NA's :821
Nesse tópico será apresentado a análise temporal dos dados
length(mergeado$mes_infracao)
## [1] 100001
## Installing package into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/4.0'
## (as 'lib' is unspecified)
##
## Attaching package: 'data.table'
## The following objects are masked from 'package:dplyr':
##
## between, first, last
verificaMesCometimento(mergeado, "01")
## [1] "O total de infrações no mês selecionado foi de: 75324"
verificaMesCometimento(mergeado, "02")
## [1] "O total de infrações no mês selecionado foi de: 24676"
teste 2