Introdução

Sobre

Apresentação

O presente trabalho tem como principal objetivo analisar os dados referentes as infrações cometidas na Capital do Estado de Pernambuco, Recife. O ano de 2019 foi coletado do início ao fim, ao todo são mais de 800000 dados coletados.

Podemos identificar quais são os tipo de infrações cometidas pelos recifenses, como o tipo de identificação que foi observada a infração, como por exemplo: Lombada Eletrônica, Foto Sensor e etc.

A partir deste estudo podemos mudar nossa forma de dirigir e respeitar as leis de trânsito, como por exemplo o limite de velocidade das vias.

Explicação

Os dados foram coletados no portal de Dados abertos da Prefeitura do Recife, mais precisamente no ano de 2019. Analisando os dados e realizando alguns tratamentos com relação a datas, separando dados que estão juntos em uma unica coluna emergeando tabelas, como: tipo_equipamento.csv e relatorio-de-multas-implantadas-em-2019.csv para que os dados fiquem ao ponto de serem utilizados.

Dados Abertos Recife

Abordagem

A metodologia utilizada será na identificação de pontos especificos inclusos nos dados de forma desordenada. Primeiramente uma análise visual será realizada com intuito de identificar no cenário macro pontos que necessitam de ajustes ou correções relevantes contidos nos dados. Posteriormente os dados serão separados em variáveis a fim de especificar ainda mais esses dados para realizar correlações.

Potencial

Dados valem ouro, empresas pagam milhões para ter acesso aos dados de uma forma que seja de fácil visualização e entendimento, dados existem aos “montes”, mas totalmente desorganizados e sem tratamento algum. Seguradoras de veículos são potenciais clientes de informações desse tipo.

Pacotes Utilizados

dplyr: Para processamento e estruturação de valores N/A

data.table: Criação e manipulação tabelas

tidyr: Processamento e remoções de valores N/A

tm: Processamento de palavras, remoção de caracteres especiais e aplicação de expressões

wordcloud: Para geração de worldclouds

RColorBrewer: Colorir as worldclouds geradas

Preparação dos dados

Datasets utilizados

O presente trablho foi sobre o relatorio anual de infrações/multas implantadas na Capital Pernambucana, como parte do trabalho estão os Datasets escolhidos, sendo eles:

relatorio-de-multas-implantadas-em-2019.csv: Arquivo contendo dados sobre os bairros e seus codigos de indentificaçao

tipo_equipamento.csv: Arquivo que contém informações sobre os tipos de equipamento utilizados para anotação/reconhecimento do tipo de infração.

Os dados analisados foram do ano de 2019.

Dados Abertos Recife

Informações dos dados

Os dados são compostos por algumas características específicas o Dataset maior (relatorio-de-multas-implantadas-em-2019) possui oito colunas com um total de 869.131 dados, mas irei trabalhar com 150.000 para evitar erros.

Algumas das colunas presentes são as seguintes: data infracao, infracao, descricao da infracao, amparo legal e local do cometimento

Algumas colunas tiveram que passar por tratamento antes da análise para ficarem preparadas para serem utilizadas, como é o caso das colunas data infracao, agente equipamento e data implantacao, separando-as e realizando merge.

Informações dos Dados

Segue abaixo algumas informações a respeito dos dados, como seus tipos, valores inclusos e formatação.

##   datainfracao horainfracao dataimplantacao
## 1   2019-01-01     00:01:00      2019-01-08
## 2   2019-01-01     00:02:00      2019-01-08
## 3   2019-01-01     00:05:01      2019-01-08
## 4   2019-01-01     00:06:03      2019-01-08
## 5   2019-01-01     00:06:56      2019-01-08
## 6   2019-01-01     00:11:43      2019-01-08
##                      agenteequipamento infracao
## 1 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 2 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 3 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 4 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 5 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
## 6 Código 8 - AUTOS NO TALÃO ELETRÔNICO     5452
##                                                                           descricaoinfracao
## 1                                                          Estacionar o veículo no passeio.
## 2                                                          Estacionar o veículo no passeio.
## 3 Estacionar o veículo ao lado ou sobre canteiros centrais divisores de pista de rolamento.
## 4                                                          Estacionar o veículo no passeio.
## 5                                                          Estacionar o veículo no passeio.
## 6                                                          Estacionar o veículo no passeio.
##           amparolegal
## 1 Art. 181, Inc. VIII
## 2 Art. 181, Inc. VIII
## 3 Art. 181, Inc. VIII
## 4 Art. 181, Inc. VIII
## 5 Art. 181, Inc. VIII
## 6 Art. 181, Inc. VIII
##                                                         localcometimento
## 1                         RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 2                         RUA TENENTE JOAO CICERO, LADO OPOSTO AO N. 170
## 3                             AVENIDA BOA VIAGEM, LADO OPOSTO  AO N.4988
## 4                       AVENIDA CONSELHEIRO AGUIAR, EM FRENTE  AO N.3231
## 5     AV.ENG.DOMINGOS FERREIRA.SENTIDO UNICO., AO LADODO POSTE N.BO02225
## 6 AV.ENG.DOMINGOS FERREIRA .SENTIDO UNICO ., AO LADO  AO POSTE N.BO02225
##  datainfracao       horainfracao       dataimplantacao    agenteequipamento 
##  Length:100000      Length:100000      Length:100000      Length:100000     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     infracao    descricaoinfracao  amparolegal        localcometimento  
##  Min.   :5010   Length:100000      Length:100000      Length:100000     
##  1st Qu.:5550   Class :character   Class :character   Class :character  
##  Median :7340   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :6592                                                           
##  3rd Qu.:7455                                                           
##  Max.   :7633
##                       agenteequipamento valor
## 1         Código 3 - LOMBADA ELETRÔNICA     1
## 2                      Código 4 – RADAR     2
## 3                Código 5 - FOTO SENSOR     3
## 4 Código 7 - ZONA AZUL TALÃO ELETRÔNICO     4
## 5  Código 8 - AUTOS NO TALÃO ELETRÔNICO     5
## 6                 Código 9 - FAIXA AZUL     6
##  agenteequipamento      valor     
##  Length:6           Min.   :1.00  
##  Class :character   1st Qu.:2.25  
##  Mode  :character   Median :3.50  
##                     Mean   :3.50  
##                     3rd Qu.:4.75  
##                     Max.   :6.00

Dados limpos

Segue abaixo os dados após limpeza e realização de merges e separates.

## Installing package into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/4.0'
## (as 'lib' is unspecified)
## Installing package into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/4.0'
## (as 'lib' is unspecified)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
##               agenteequipamento ano_infracao mes_infracao dia_infracao
## 1 Código 3 - LOMBADA ELETRÔNICA         2019           01           01
## 2 Código 3 - LOMBADA ELETRÔNICA         2019           01           13
## 3 Código 3 - LOMBADA ELETRÔNICA         2019           01           06
## 4 Código 3 - LOMBADA ELETRÔNICA         2019           01           01
## 5 Código 3 - LOMBADA ELETRÔNICA         2019           01           04
## 6 Código 3 - LOMBADA ELETRÔNICA         2019           01           01
##   horainfracao ano_implantacao mes_implantacao dia_implantacao infracao
## 1     07:52:14            2019              01              18     7455
## 2     07:42:23            2019              02              01     7455
## 3     11:42:47            2019              01              24     7455
## 4     07:50:40            2019              01              18     7455
## 5     13:14:45            2019              01              22     7455
## 6     15:43:14            2019              01              21     7455
##                                                                                descricaoinfracao
## 1 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 2 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 3 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 4 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 5 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
## 6 Transitar em velocidade superior à máxima permitida para o local em até 20% (vinte por cento).
##        amparolegal
## 1 Art. 218, Inc. I
## 2 Art. 218, Inc. I
## 3 Art. 218, Inc. I
## 4 Art. 218, Inc. I
## 5 Art. 218, Inc. I
## 6 Art. 218, Inc. I
##                                                        localcometimento valor
## 1                                      AV. ENG. ANTONIO DE GOES, N. 124     1
## 2                       CAIS SANTA RITA, PROX. AO N. 675 - SENT. CENTRO     1
## 3                                              AV. RUI BARBOSA, N. 1397     1
## 4                                      AV. ENG. ANTONIO DE GOES, N. 124     1
## 5                    AV. ENG. DOMINGOS FERREIRA, SEMAFORO 338, Faixa: 1     1
## 6 AV. ENG. ABDIAS DE CARVALHO, ENTRE OS N. 1785 E 1745 - SENTIDO CENTRO     1
##  agenteequipamento  ano_infracao       mes_infracao       dia_infracao      
##  Length:100001      Length:100001      Length:100001      Length:100001     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  horainfracao       ano_implantacao    mes_implantacao    dia_implantacao   
##  Length:100001      Length:100001      Length:100001      Length:100001     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##     infracao    descricaoinfracao  amparolegal        localcometimento  
##  Min.   :5010   Length:100001      Length:100001      Length:100001     
##  1st Qu.:5550   Class :character   Class :character   Class :character  
##  Median :7340   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :6592                                                           
##  3rd Qu.:7455                                                           
##  Max.   :7633                                                           
##  NA's   :1                                                              
##      valor      
##  Min.   :1.000  
##  1st Qu.:1.000  
##  Median :5.000  
##  Mean   :3.382  
##  3rd Qu.:5.000  
##  Max.   :6.000  
##  NA's   :821

Análise de dados

Infrações por Periodo do ano

Nesse tópico será apresentado a análise temporal dos dados

length(mergeado$mes_infracao)
## [1] 100001
## Installing package into '/home/rstudio-user/R/x86_64-pc-linux-gnu-library/4.0'
## (as 'lib' is unspecified)
## 
## Attaching package: 'data.table'
## The following objects are masked from 'package:dplyr':
## 
##     between, first, last
verificaMesCometimento(mergeado, "01")
## [1] "O total de infrações no mês selecionado foi de: 75324"
verificaMesCometimento(mergeado, "02")
## [1] "O total de infrações no mês selecionado foi de: 24676"

Datasets

teste 2