Introdução

Sobre

Apresentação

O presente trabalho tem como principal objetivo analisar os dados referentes as infrações cometidas na Capital do Estado de Pernambuco, Recife. O ano de 2019 foi coletado do início ao fim, ao todo são mais de 800000 dados coletados.

Podemos identificar quais são os tipo de infrações cometidas pelos recifenses, como o tipo de identificação que foi observada a infração, como por exemplo: Lombada Eletrônica, Foto Sensor e etc.

A partir deste estudo podemos mudar nossa forma de dirigir e respeitar as leis de trânsito, como por exemplo o limite de velocidade das vias.

Explicação

Os dados foram coletados no portal de Dados abertos da Prefeitura do Recife, mais precisamente no ano de 2019. Analisando os dados e realizando alguns tratamentos com relação a datas, separando dados que estão juntos em uma unica coluna emergeando tabelas, como: tipo_equipamento.csv e relatorio-de-multas-implantadas-em-2019.csv para que os dados fiquem ao ponto de serem utilizados.

Dados Abertos Recife

Abordagem

A metodologia utilizada será na identificação de pontos especificos inclusos nos dados de forma desordenada. Primeiramente uma análise visual será realizada com intuito de identificar no cenário macro pontos que necessitam de ajustes ou correções relevantes contidos nos dados. Posteriormente os dados serão separados em variáveis a fim de especificar ainda mais esses dados para realizar correlações.

Potencial

Dados valem ouro, empresas pagam milhões para ter acesso aos dados de uma forma que seja de fácil visualização e entendimento, dados existem aos “montes”, mas totalmente desorganizados e sem tratamento algum. Seguradoras de veículos são potenciais clientes de informações desse tipo.

Pacotes Utilizados

dplyr: Para processamento e estruturação de valores N/A

data.table: Criação e manipulação tabelas

tidyr: Processamento e remoções de valores N/A

tm: Processamento de palavras, remoção de caracteres especiais e aplicação de expressões

wordcloud: Para geração de worldclouds

RColorBrewer: Colorir as worldclouds geradas

Preparação dos dados

Datasets utilizados

O presente trablho foi sobre o relatorio anual de infrações/multas implantadas na Capital Pernambucana, como parte do trabalho estão os Datasets escolhidos, sendo eles:

relatorio-de-multas-implantadas-em-2019.csv: Arquivo contendo dados sobre os bairros e seus codigos de indentificaçao

tipo_equipamento.csv: Arquivo que contém informações sobre os tipos de equipamento utilizados para anotação/reconhecimento do tipo de infração.

Os dados analisados foram do ano de 2019.

Dados Abertos Recife

Informações dos dados

Os dados são compostos por algumas características específicas o Dataset maior (relatorio-de-multas-implantadas-em-2019) possui oito colunas com um total de 869.131 dados, mas irei trabalhar com 100.000 para evitar erros.

Algumas das colunas presentes são as seguintes: data infracao, infracao, descricao da infracao, amparo legal e local do cometimento

Algumas colunas tiveram que passar por tratamento antes da análise para ficarem preparadas para serem utilizadas, como é o caso das colunas data infracao, agente equipamento e data implantacao, separando-as e realizando merge.

Informações dos Dados

Segue abaixo algumas informações a respeito dos dados, como seus tipos, valores inclusos e formatação.

##   dataimplantacao datainfracao horainfracao
## 1      2019-01-08   2019-01-01     00:01:00
## 2      2019-01-08   2019-01-01     00:02:00
## 3      2019-01-08   2019-01-01     00:05:01
## 4      2019-01-08   2019-01-01     00:06:03
## 5      2019-01-08   2019-01-01     00:06:56
## 6      2019-01-08   2019-01-01     00:11:43
##                      agenteequipamento infracao
## 1 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 2 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 3 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 4 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 5 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 6 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
##                                                                           descricaoinfracao
## 1                                                          Estacionar o veículo no passeio.
## 2                                                          Estacionar o veículo no passeio.
## 3 Estacionar o veículo ao lado ou sobre canteiros centrais divisores de pista de rolamento.
## 4                                                          Estacionar o veículo no passeio.
## 5                                                          Estacionar o veículo no passeio.
## 6                                                          Estacionar o veículo no passeio.
##           amparolegal
## 1 Art. 181, Inc. VIII
## 2 Art. 181, Inc. VIII
## 3 Art. 181, Inc. VIII
## 4 Art. 181, Inc. VIII
## 5 Art. 181, Inc. VIII
## 6 Art. 181, Inc. VIII
##                                                         localcometimento
## 1                         RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 2                         RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 3                             AVENIDA BOA VIAGEM, LADO OPOSTO  AO N.4988
## 4                       AVENIDA CONSELHEIRO AGUIAR, EM FRENTE  AO N.3231
## 5     AV.ENG.DOMINGOS FERREIRA.SENTIDO UNICO., AO LADODO POSTE N.BO02225
## 6 AV.ENG.DOMINGOS FERREIRA .SENTIDO UNICO ., AO LADO  AO POSTE N.BO02225
##  dataimplantacao    datainfracao       horainfracao       agenteequipamento 
##  Length:850000      Length:850000      Length:850000      Length:850000     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##    infracao         descricaoinfracao  amparolegal        localcometimento  
##  Length:850000      Length:850000      Length:850000      Length:850000     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character
##                       agenteequipamento valor
## 1         Código 3 - LOMBADA ELETRÔNICA     1
## 2                      Código 4 – RADAR     2
## 3                Código 5 - FOTO SENSOR     3
## 4 Código 7 - ZONA AZUL TALÃO ELETRÔNICO     4
## 5  Código 8 - AUTOS NO TALÃO ELETRÔNICO     5
## 6                 Código 9 - FAIXA AZUL     6
##  agenteequipamento      valor     
##  Length:6           Min.   :1.00  
##  Class :character   1st Qu.:2.25  
##  Mode  :character   Median :3.50  
##                     Mean   :3.50  
##                     3rd Qu.:4.75  
##                     Max.   :6.00

Dados limpos

Segue abaixo os dados após limpeza e realização de merges e separates.

## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
##               agenteequipamento ano_implantacao mes_implantacao dia_implantacao
## 1            Agente/Equipamento            <NA>            <NA>            <NA>
## 2            Agente/Equipamento            <NA>            <NA>            <NA>
## 3 Código 3 - LOMBADA ELETRÔNICA            2019              10              02
## 4 Código 3 - LOMBADA ELETRÔNICA            2019              01              25
## 5 Código 3 - LOMBADA ELETRÔNICA            2019              10              31
## 6 Código 3 - LOMBADA ELETRÔNICA            2019              10              04
##   ano_infracao mes_infracao dia_infracao     horainfracao           infracao
## 1         <NA>         <NA>         <NA> Hora da infração           Infração
## 2         <NA>         <NA>         <NA> Hora da Infração Código da Infração
## 3         2019           09           26         12:57:45               7455
## 4         2019           01           07         11:21:35               7455
## 5         2019           10           13         18:39:19               7455
## 6         2019           09           29         17:24:54               7455
##                                                                                descricaoinfracao
## 1                                                                          Descrição da infração
## 2                                                                          Descrição da Infração
## 3 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 4 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 5 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 6 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
##        amparolegal
## 1     Amparo legal
## 2     Amparo Legal
## 3 Art. 218, Inc. I
## 4 Art. 218, Inc. I
## 5 Art. 218, Inc. I
## 6 Art. 218, Inc. I
##                                                        localcometimento valor
## 1                                                  Local do cometimento    NA
## 2                                                  Local do cometimento    NA
## 3    AV. MAL. MASCARENHAS DE MORAES, EM FRENTE AEROPORTO - SENT. CENTRO     1
## 4               AV. DOM JOAO VI, ENTRE OS N. 777 E 835 - SENTIDO CENTRO     1
## 5 AV. GOV. AGAMENON MAGALHAES - PROX. VIADUTO PRES.MEDICI - SENT. DERBY     1
## 6 AV. ENG. ABDIAS DE CARVALHO, ENTRE OS N. 1785 E 1745 - SENTIDO CENTRO     1
##  agenteequipamento  ano_implantacao    mes_implantacao    dia_implantacao   
##  Length:850001      Length:850001      Length:850001      Length:850001     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  ano_infracao       mes_infracao       dia_infracao       horainfracao      
##  Length:850001      Length:850001      Length:850001      Length:850001     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##    infracao         descricaoinfracao  amparolegal        localcometimento  
##  Length:850001      Length:850001      Length:850001      Length:850001     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##      valor      
##  Min.   :1.000  
##  1st Qu.:1.000  
##  Median :5.000  
##  Mean   :3.527  
##  3rd Qu.:5.000  
##  Max.   :6.000  
##  NA's   :6394

Análise de dados

Infrações por Periodo do ano

Nesse tópico será apresentado a análise temporal dos dados

length(mergeado$mes_infracao)
## [1] 850001
## 
## Attaching package: 'data.table'
## The following objects are masked from 'package:dplyr':
## 
##     between, first, last
verificaMesCometimento(mergeado, "01")
## [1] "O total de infrações no mês selecionado foi de: 75324"
verificaMesCometimento(mergeado, "02")
## [1] "O total de infrações no mês selecionado foi de: 66031"

Tipos de infração referente ao mês de Janeiro.

Datasets