Analise exploratoria de ocorrencias

options(width = 120)

Tabela Ocorrencia

Descritores

(id [ocoid])

Local da Ocorrencia

  1. Sentido da Via (1. Crescente, 2. Decrescente) [ocosentido]

Datas

Tipos de Ocorrencia

???

  1. Comunicacao ?? [ococomid]
  2. ?? [ocoidorigem]
  3. CPF que identifica o executar da reficacao ?? [ococpfretif]

Sumario dos dados:

Alguns pontos de dados

setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia <- read.csv("ocorrencia_1_Semestre_2007.csv", head = TRUE, sep = ";", fileEncoding = "latin1")
head(ocorrencia)
##    ocoid ocolocal ocostatus ocomunicipio ocosentido   ocodataocorrencia     ocodataregistro ocotipo ococomid
## 1 173677    46057         S        81612          1 2006-12-27 10:40:00 2006-12-31 23:13:00       1   187007
## 2 173681   126898         S        72095          1 2006-12-30 20:30:00 2006-12-31 23:26:00       1   189137
## 3 173686    24468         S        31950          1 2006-12-31 19:50:00 2006-12-31 23:45:00       1   189522
## 4 173676   126893         S        19810          2 2006-12-31 20:10:00 2006-12-31 23:11:00       1   189548
## 5 173669   126885         S        17612          2 2006-12-31 19:00:00 2006-12-31 22:53:00       1   189507
## 6 173618    16474         S        62073          1 2006-12-31 10:42:00 2006-12-31 20:33:00       1   189504
##   ocoidorigem          ocodatafim
## 1      (null) 2007-01-01 00:03:00
## 2      (null) 2007-01-01 00:03:00
## 3      (null) 2007-01-01 00:03:00
## 4      (null) 2007-01-01 00:18:00
## 5      (null) 2007-01-01 00:34:00
## 6      (null) 2007-01-01 00:41:00

Correcao dos tipos de dados para visualizacao dos sumarios

ocorrencia$ocolocal = as.factor(ocorrencia$ocolocal)
ocorrencia$ocoid = as.factor(ocorrencia$ocoid)
ocorrencia$ocotipo = as.factor(ocorrencia$ocotipo)
ocorrencia$ocosentido = as.factor(ocorrencia$ocosentido)
ocorrencia$ococomid = as.factor(ocorrencia$ococomid)
summary(ocorrencia)
##      ocoid          ocolocal     ocostatus  ocomunicipio   ocosentido           ocodataocorrencia
##  3      :    1   36186  :  115   S:60934   64777  :  801   1:31394    2007-04-08 17:00:00:   28  
##  209    :    1   12983  :   90             56251  :  721   2:29539    2007-04-08 16:00:00:   19  
##  22124  :    1   43035  :   68             83275  :  683   3:    1    2007-04-08 18:00:00:   19  
##  46688  :    1   13103  :   66             56995  :  665              2007-04-08 15:30:00:   18  
##  82247  :    1   13278  :   64             75353  :  613              2007-04-08 17:30:00:   18  
##  88984  :    1   14059  :   58             58335  :  584              2007-04-15 19:00:00:   18  
##  (Other):60928   (Other):60473             (Other):56867              (Other)            :60814  
##             ocodataregistro  ocotipo      ococomid     ocoidorigem                  ocodatafim   
##  2007-01-11 15:11:00:    5   1:60934   165742 :    2   (null):60934   2007-01-02 23:34:00:    5  
##  2007-03-05 12:43:00:    5             190525 :    2                  2007-03-24 11:18:00:    5  
##  2007-03-20 21:20:00:    5             199779 :    2                  2007-04-09 11:05:00:    5  
##  2007-04-09 20:16:00:    5             211876 :    2                  2007-04-09 15:32:00:    5  
##  2007-05-08 13:52:00:    5             215287 :    2                  2007-05-07 18:29:00:    5  
##  2007-06-15 14:47:00:    5             215529 :    2                  2007-01-04 23:26:00:    4  
##  (Other)            :60904             (Other):60922                  (Other)            :60905

Perguntas de analise:

  1. Qual sera a duracao desde a abertura, registro e fechamento de cada ocorrencia?
  2. Qual a distribuicao dos tipos de ocorrencia?
  3. Quais a distribuicao do sentido das vias de ocorrencia?
  4. Quais anos/meses/dias do ano ocorrem mais ocorrencias?

Problemas de consistencia dos dados

Tabela Ocorrencia Acidente

Descritores

Tipos de Acidente

Variaveis parecem ser binarias (True or False)

Localizacao

Distancia entre pontos A, B, C ????

Pista

Sumario dos dados

Alguns pontos de dados

setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia_acidente <- read.csv("ocorrenciaacidente_1_Semestre_2007.csv", head = TRUE, sep = ";", fileEncoding = "latin1")
head(ocorrencia_acidente)
##   oacocoid oacttacodigo oactcacodigo oacdano oacdanoterc oacdanoamb          oaclatitude         oaclongitude oacdistab
## 1   173677            8            7       N           N          N                                              (null)
## 2   173681            7            7       N           N          N                                              (null)
## 3   173686           12            5       N           S          N                                              (null)
## 4   173676            1           15       N           N          N                                              (null)
## 5   173669            7            2       N           N          N                                              (null)
## 6   173618            3            7       N           N          N                                              (null)
##   oacdistac oacdistbc oacmodelopista      oacsentido1    oacsentido2 oacqtdfaixa1 oacqtdfaixa2 oacacostamento1
## 1    (null)    (null)              1    FLORIANOPOLIS      JOINVILLE            2            2               S
## 2    (null)    (null)              1           SANTOS RIO DE JANEIRO            1            1               S
## 3    (null)    (null)              1 ARACAJU - CENTRO  SÃO CRISTÓVÃO            2            2               S
## 4    (null)    (null)             11      JOÃO PESSOA CAMPINA GRANDE            1            1               N
## 5    (null)    (null)              1            NATAL    CEARÁ-MIRIM            1            1               S
## 6    (null)    (null)             12         CURITIBA         CAJATI            1            1               N
##   oacacostamento2 oaccanteiro oaclinhacentral oacorientpista oacgirafundo oacversaocroqui oacsitio
## 1               S      (null)          (null)         (null)       (null)               1   (null)
## 2               S      (null)          (null)         (null)       (null)               1   (null)
## 3               S      (null)          (null)         (null)       (null)               1   (null)
## 4               N      (null)          (null)         (null)       (null)               1   (null)
## 5               S      (null)          (null)         (null)       (null)               1   (null)
## 6               N      (null)          (null)         (null)       (null)               1   (null)

Correcao dos tipos de dados para visualizacao dos sumarios

ocorrencia_acidente$oacttacodigo = as.factor(ocorrencia_acidente$oacttacodigo)
ocorrencia_acidente$oactcacodigo = as.factor(ocorrencia_acidente$oactcacodigo)
ocorrencia_acidente$oacversaocroqui = as.factor(ocorrencia_acidente$oacversaocroqui)

summary(ocorrencia_acidente)
##     oacocoid       oacttacodigo    oactcacodigo   oacdano   oacdanoterc     oacdanoamb                  oaclatitude   
##  Min.   :     3   8      :15872   16     :21786    :    8         :    9         :    9                       :60460  
##  1st Qu.:191624   12     : 9498   7      :20313   N:58901   (null):    6   (null):    6   (null)              :  448  
##  Median :210128   7      : 9492   17     : 3789   o:    7   N     :59538   N     :60808   0                   :    2  
##  Mean   :210044   10     : 5620   1      : 2958   S: 2018   o     :    3   o     :    1   LOCAL DESFEITO      :    2  
##  3rd Qu.:228419   5      : 3893   5      : 2627             S     : 1378   S     :  110   - A ao corpo: 34,6  :    1  
##  Max.   :247368   3      : 3282   15     : 2020                                           300 METROS DE P     :    1  
##                   (Other):13277   (Other): 7441                                           (Other)             :   20  
##                oaclongitude     oacdistab       oacdistac       oacdistbc     oacmodelopista          oacsentido1   
##                      :60479   (null) :53401   (null) :53613   (null) :53802   1      :38722                 : 5752  
##  (null)              :  448   5.0    : 1681   4.0    :  278   5.0    :  311   11     : 4953   RIO DE JANEIRO: 1966  
##  - B ao corpo: 31,0  :    1   3.0    : 1270   5.0    :  249   4.0    :  153   22     : 2458   BELO HORIZONTE: 1700  
##  & readonly  onKeyPre:    1   2.0    :  774   3.0    :  222   3.0    :  136   12     : 1444   SAO PAULO     : 1159  
##  0                   :    1   4.0    :  697   6.0    :  146   6.0    :  136   8      : 1337   SALVADOR      :  843  
##  3 mts a Leste de A  :    1   10.0   :  516   8.0    :  127   10.0   :  124   9      : 1219   SP            :  674  
##  (Other)             :    3   (Other): 2595   (Other): 6299   (Other): 6272   (Other):10801   (Other)       :48840  
##          oacsentido2     oacqtdfaixa1    oacqtdfaixa2   oacacostamento1 oacacostamento2 oaccanteiro    oaclinhacentral
##                : 5645   1      :45691   1      :46120   (null):    4    (null):    3    (null):60933   (null):60933   
##  RIO DE JANEIRO: 2056   2      : 9399   2      : 9275   N     :34745    N     :34379    N     :    1   4     :    1   
##  BELO HORIZONTE: 1703   3      : 3039   3      : 3138   S     :26185    S     :26552                                  
##  SAO PAULO     :  971   0      : 1685   0      : 1256                                                                 
##  VITORIA       :  749   4      :  830   4      :  888                                                                 
##  CURITIBA      :  701   5      :  157   5      :  171                                                                 
##  (Other)       :49109   (Other):  133   (Other):   86                                                                 
##  oacorientpista oacgirafundo   oacversaocroqui   oacsitio    
##  (null):60933   (null):60933   1:60933         (null):60933  
##  N     :    1   N     :    1   2:    1         1     :    1  
##                                                              
##                                                              
##                                                              
##                                                              
## 

Perguntas de Analise

Problemas de consistencia dos dados

Tabela OcorrenciaPessoa

Descritores

Esta tabela nao consta no dicionario nas descricoes, apenas no diagrama.

Sumario dos dados:

Alguns pontos de dados

setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia_pessoa <- read.csv("ocorrenciaPessoa_1_Semestre_2007.csv", head = TRUE, sep = ";", fileEncoding = "latin1")
head(ocorrencia_pessoa)
##    opeid opeocoid opepesid opeportenumero opeportevalidade opettecodigo openaoident opeestrangeiro opeanexo
## 1 487414   174005   447288         (null)           (null)            2           N              N        N
## 2 487416   174005   447288         (null)           (null)           10           N              N        N
## 3 487248   173945   447138         (null)           (null)            2           N              N        S
## 4 487271   173945   447157         (null)           (null)            2           N              N        S
## 5 487279   173945   447165         (null)           (null)            8           N              N        S
## 6 487291   173945   447176         (null)           (null)            3           N              N        N
##   opecondalegadas
## 1               1
## 2          (null)
## 3               1
## 4               1
## 5          (null)
## 6          (null)

Correcao dos tipos de dados para visualizacao dos sumarios

ocorrencia_pessoa$opeocoid = as.factor(ocorrencia_pessoa$opeocoid)
ocorrencia_pessoa$opepesid = as.factor(ocorrencia_pessoa$opepesid)

summary(ocorrencia_pessoa)
##      opeid             opeocoid         opepesid      opeportenumero  opeportevalidade  opettecodigo    openaoident    
##  Min.   :3.21e+02   210692 :    59   517178 :     3   (null):199434   (null):199434    2      :101520         :     1  
##  1st Qu.:5.46e+05   200617 :    55   574671 :     3                                    10     : 68823   (null):    24  
##  Median :6.06e+05   176324 :    54   441    :     2                                    3      : 22854   N     :196252  
##  Mean   :7.55e+05   233326 :    54   387338 :     2                                    8      :  3382   o     :     2  
##  3rd Qu.:6.65e+05   216253 :    50   387340 :     2                                    4      :  2543   S     :  3155  
##  Max.   :2.01e+09   189639 :    47   387343 :     2                                    12     :   246                  
##                     (Other):199115   (Other):199420                                    (Other):    66                  
##  opeestrangeiro    opeanexo      opecondalegadas 
##  (null):    24   (null):     3   (null) :100377  
##  N     :199262   N     :158915   1      : 87615  
##  S     :   148   o     :     9   7      :  4744  
##                  S     : 40507   4      :  2009  
##                                  5      :  1802  
##                                  3      :  1192  
##                                  (Other):  1695

Perguntas de analise

Problemas de consistencia dos dados

Tabela OcorrenciaVeiculo

Descritores

Tabela de ligacao entre ocorrencias e veiculos

Sumario dos dados:

Alguns pontos de dados

setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia_veiculo <- read.csv("ocorrenciaveiculo.csv", head = TRUE, sep = "|", fileEncoding = "latin1")
head(ocorrencia_veiculo)
##   ocvid ocvocoid ocvveiid
## 1    99      123       NA
## 2   100      124       NA
## 3   100      125       NA
## 4    11        3       NA
## 5    12        4       NA
## 6    13        5       NA

Correcao dos tipos de dados para visualizacao dos sumarios

ocorrencia_veiculo$ocvid = as.factor(ocorrencia_veiculo$ocvid)
ocorrencia_veiculo$ocvocoid = as.factor(ocorrencia_veiculo$ocvocoid)
ocorrencia_veiculo$ocvveiid = as.factor(ocorrencia_veiculo$ocvveiid)
summary(ocorrencia_veiculo)
##      ocvid            ocvocoid       ocvveiid      
##  1039505:     20   59436  :      5   NA's:2303047  
##  289155 :     19   13325  :      4                 
##  786417 :     19   15903  :      4                 
##  1298249:     19   17224  :      4                 
##  798843 :     18   55813  :      4                 
##  942514 :     18   70547  :      4                 
##  (Other):2302934   (Other):2303022

Tabela Veiculo

Descritores

Porte do veiculo

Sumario dos dados:

Alguns pontos de dados

setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
veiculo <- read.csv("veiculo.csv", head = TRUE, sep = "|", row.names = NULL)  # entradas duplicadas
head(veiculo)
##   row.names veiid vei.veiano veitmvcodigo veiqtdocupantes veitevcodigo veitcvcodigo veitvvcodigo veidescricao
## 1         1  1974          0            2               1            1           13          \\         56634
## 2         1  1974          0            2               1            1           13          \\         56634
## 3         2                0            1               0            0            7          \\            NA
## 4         2                0            1               0            0            7          \\            NA
## 5         3  2009       9025            1               6            4            7          \\         35157
## 6         3  2009       9025            1               6            4            7          \\         35157
##   veimunicipio veitcecodigo veimunorigem veipaisorigem veimundestino veipaisdestino veitttcodigo veitipoproprietario
## 1            4        56634           22         57134            22              0            1             3517504
## 2            4        56634           22         57134            22              0            1             3517504
## 3            0           NA           22            NA            22              0            1              101738
## 4            0           NA           22            NA            22              0            1              101738
## 5            5        35157           22         35157            22              0            1             2705824
## 6            5        35157           22         35157            22              0            1             2705824
##   veiproprietario veioenid veisequencial veitipoplaca
## 1         1183807        2             N           NA
## 2         1183807        2             N           NA
## 3              NA        2                         NA
## 4              NA        2                         NA
## 5          997418        1             N           NA
## 6          997418        1             N           NA

Correcao dos tipos de dados para visualizacao dos sumarios

# ocorrencia_veiculo$opeocoid = as.factor(ocorrencia_veiculo$opeocoid) summary(data.frame(lapply(veiculo,as.factor)))
summary(veiculo)
##   row.names             veiid           vei.veiano       veitmvcodigo      veiqtdocupantes   veitevcodigo     
##  Length:2772657            : 218878   Min.   :      0   Min.   :0.00e+00   Min.   :     0   Min.   :0.00e+00  
##  Class :character   2008   : 212362   1st Qu.:   1691   1st Qu.:1.00e+00   1st Qu.:     4   1st Qu.:1.00e+00  
##  Mode  :character   2007   : 198530   Median :   7449   Median :2.00e+00   Median :     6   Median :4.00e+00  
##                     2006   : 169685   Mean   :   7397   Mean   :7.79e+02   Mean   :     5   Mean   :1.55e+03  
##                     2009   : 161222   3rd Qu.:  10694   3rd Qu.:3.00e+00   3rd Qu.:     6   3rd Qu.:4.00e+00  
##                     2005   : 159813   Max.   :1146201   Max.   :2.15e+09   Max.   :661138   Max.   :2.15e+09  
##                     (Other):1652167   NA's   :20254     NA's   :2032       NA's   :54217    NA's   :2416      
##   veitcvcodigo                 veitvvcodigo       veidescricao     veimunicipio      veitcecodigo    
##  Min.   :      0   \\                 :2069056   Min.   :    19   Min.   :      0   Min.   :    19   
##  1st Qu.:      7   BICICLETA          :   9536   1st Qu.: 39659   1st Qu.:      4   1st Qu.: 31178   
##  Median :      7   AUTOM<d3>VEL       :   9120   Median : 60216   Median :      5   Median : 57215   
##  Mean   :     15   AUTOMOVEL          :   8590   Mean   : 58118   Mean   :      9   Mean   : 54905   
##  3rd Qu.:     13   N<c3>O IDENTIFICADO:   7975   3rd Qu.: 81434   3rd Qu.:     11   3rd Qu.: 81051   
##  Max.   :7484439   MOTOCICLETA        :   6978   Max.   : 99970   Max.   :1525036   Max.   : 99970   
##  NA's   :11315     (Other)            : 661402   NA's   :500121   NA's   :19163     NA's   :1008674  
##   veimunorigem       veipaisorigem     veimundestino       veipaisdestino     veitttcodigo    veitipoproprietario
##  Min.   :-3.21e+08   Min.   :    19    Min.   :-2.04e+09   Min.   :      0   Min.   :1        Min.   :0.00e+00   
##  1st Qu.: 2.20e+01   1st Qu.: 31054    1st Qu.: 2.20e+01   1st Qu.:      0   1st Qu.:1        1st Qu.:5.83e+05   
##  Median : 2.20e+01   Median : 57053    Median : 2.20e+01   Median :      0   Median :1        Median :1.40e+06   
##  Mean   :-3.28e+02   Mean   : 54759    Mean   :-7.25e+02   Mean   :      7   Mean   :1        Mean   :2.45e+06   
##  3rd Qu.: 2.20e+01   3rd Qu.: 81051    3rd Qu.: 2.20e+01   3rd Qu.:      0   3rd Qu.:2        3rd Qu.:3.08e+06   
##  Max.   : 7.75e+06   Max.   : 99970    Max.   : 2.50e+06   Max.   :8322396   Max.   :2        Max.   :8.80e+08   
##  NA's   :54217       NA's   :1011692   NA's   :54217                         NA's   :133934   NA's   :133934     
##  veiproprietario      veioenid      veisequencial veitipoplaca  
##  Min.   :      4   Min.   :     0    : 219018     Mode:logical  
##  1st Qu.: 597200   1st Qu.:     1   E:   3211     NA's:2772657  
##  Median : 847440   Median :     1   G: 113989                   
##  Mean   : 791550   Mean   :     2   I:   7715                   
##  3rd Qu.:1099818   3rd Qu.:     2   N:2428724                   
##  Max.   :1351973   Max.   :524000                               
##  NA's   :2177906   NA's   :54217

Perguntas de analise

Tabela OcorrenciaPessoas

setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia_pessoas <- read.csv("ocorrenciaPessoa_1_Semestre_2007.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(ocorrencia_pessoas)
##    opeid opeocoid opepesid opeportenumero opeportevalidade opettecodigo openaoident opeestrangeiro opeanexo
## 1 487414   174005   447288         (null)           (null)            2           N              N        N
## 2 487416   174005   447288         (null)           (null)           10           N              N        N
## 3 487248   173945   447138         (null)           (null)            2           N              N        S
## 4 487271   173945   447157         (null)           (null)            2           N              N        S
## 5 487279   173945   447165         (null)           (null)            8           N              N        S
## 6 487291   173945   447176         (null)           (null)            3           N              N        N
##   opecondalegadas
## 1               1
## 2          (null)
## 3               1
## 4               1
## 5          (null)
## 6          (null)

Correcao dos tipos de dados para visualizacao dos sumarios

# ocorrencia_veiculo$opeocoid = as.factor(ocorrencia_veiculo$opeocoid)
summary(data.frame(lapply(ocorrencia_pessoas, as.factor)))
##      opeid           opeocoid         opepesid      opeportenumero  opeportevalidade  opettecodigo    openaoident    
##  321    :     1   210692 :    59   517178 :     3   (null):199434   (null):199434    2      :101520         :     1  
##  509    :     1   200617 :    55   574671 :     3                                    10     : 68823   (null):    24  
##  510    :     1   176324 :    54   441    :     2                                    3      : 22854   N     :196252  
##  511    :     1   233326 :    54   387338 :     2                                    8      :  3382   o     :     2  
##  512    :     1   216253 :    50   387340 :     2                                    4      :  2543   S     :  3155  
##  513    :     1   189639 :    47   387343 :     2                                    12     :   246                  
##  (Other):199428   (Other):199115   (Other):199420                                    (Other):    66                  
##  opeestrangeiro    opeanexo      opecondalegadas 
##  (null):    24   (null):     3   (null) :100377  
##  N     :199262   N     :158915   1      : 87615  
##  S     :   148   o     :     9   7      :  4744  
##                  S     : 40507   4      :  2009  
##                                  5      :  1802  
##                                  3      :  1192  
##                                  (Other):  1695

Tabela Pessoas

setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
pessoas <- read.csv("pessoa_1_Semestre_2007.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(pessoas)
##     pesid pesdatanascimento pesnaturalidade pesnacionalidade pessexo pesteccodigo pestgicodigo pesmunicipio
## 1 3056784        1970-02-09           54011               22       M            1            0        69531
## 2 4002639        1972-08-05              NA               22       M            1            4        41238
## 3 4154409        1972-08-05              NA               22       M            1            4        41238
## 4 1041615        1972-07-14           23817               22       M            2            4        23817
## 5 1041642            (null)              NA               22  (null)            0            0        23817
## 6  982037        1978-01-08              NA               22       M            1            3        53430
##   pestopcodigo pesmunicipioori pespaisori pesmunicipiodest pespaisdest pesveiid pesestadofisico pescinto pescapacete
## 1          557           69531         22            62073          22  2685160               1        S           A
## 2          557           43710         22            43710          22 18234237               2        A           S
## 3          557           43710         22            43710          22 18314110               2        A           S
## 4          557           25615         22            23817          22   654256               2        S           A
## 5            0                          0                            0   (null)               0   (null)      (null)
## 6          557                         22                           22   (null)               1        A           A
##   peshabilitado pessocorrido pesdormindo pesalcool peskmpercorre peshorapercorre pescategcnh pesufcnh pespaiscnh
## 1             S            N           N         N          -1.0            9999         22        SP          0
## 2             S            S           N         N           0.3            0015         21        MG          0
## 3             S            S           N         N           0.3            0015         21        MG          0
## 4             S            S           N         N          12.0            0007         24        PE          0
## 5        (null)            N           N    (null)        (null)          (null)      (null)   (null)          0
## 6                          N           N         N        (null)                                               0
##   pesdatahabil pesdatavalidade pesidade pesaltura pespeso pescicatriz pestatuagem pessinal peslesao pestcccodigo
## 1   1988-12-13      2011-12-26       41    (null)  (null)           N           N        N        N            0
## 2   1992-10-05      2016-09-08       40    (null)  (null)           N           N        N        N            0
## 3   1992-10-05      2016-09-08       40    (null)  (null)           N           N        N        N            0
## 4   1991-08-13      2011-12-07       35    (null)  (null)           N           N        N        N            0
## 5       (null)          (null)   (null)    (null)  (null)           N           N        N        N            0
## 6       (null)          (null)       30    (null)  (null)           N           N        N        N            0
##   pestctcodigo pestclcodigo pesoenid
## 1            0            0        0
## 2            0            0  1294088
## 3            0            0  1327471
## 4            0            0   582852
## 5            0            0        0
## 6            0            0        0

Correcao dos tipos de dados para visualizacao dos sumarios

# ocorrencia_veiculo$opeocoid = as.factor(ocorrencia_veiculo$opeocoid)
summary(data.frame(lapply(pessoas, as.factor)))
##      pesid        pesdatanascimento pesnaturalidade pesnacionalidade   pessexo       pesteccodigo   pestgicodigo
##  1239696:   76   (null)    :13589   60011  : 3293   (null): 1749           : 1051   1      :27600   0:18903     
##  753683 :   74   1982-03-21:  667   71072  : 1590   0     : 7249     (null):11019   0      :16353   2: 2124     
##  3604440:   74   1981-07-28:  282   41238  : 1544   116   :   15     F     : 2487   4      :10593   3:11875     
##  1672973:   70   1980-04-28:  278   81051  : 1246   22    :52153     I     :   54   7      : 3477   4:23891     
##  2152993:   70   1972-08-05:  259   88013  : 1061                    M     :46555   2      : 1925   5:  147     
##  1937130:   67   1979-12-05:  245   (Other):28243                                   3      :  921   6:    8     
##  (Other):60735   (Other)   :45846   NA's   :24189                                   (Other):  297   7: 4218     
##   pesmunicipio    pestopcodigo   pesmunicipioori  pespaisori    pesmunicipiodest pespaisdest       pesveiid    
##         :11557   557    :26117          :31164   (null): 1749          :31159    (null): 1749   (null) :15691  
##  75353  : 1993   0      :24428   75876  :  794   0     :12036   78859  :  718    0     :12037   2477032:  609  
##  41238  : 1404   13     : 3239   60011  :  639   22    :47381   75353  :  642    116   :   14   619506 :  119  
##  60011  : 1220   (null) : 1738   75353  :  575                  41238  :  531    22    :47366   284561 :  104  
##  83275  : 1159   519    : 1625   04154  :  482                  60011  :  515                   760065 :  102  
##  80470  :  896   16     :  462   93734  :  452                  04154  :  436                   597794 :   86  
##  (Other):42937   (Other): 3557   (Other):27060                  (Other):27165                   (Other):44455  
##  pesestadofisico   pescinto     pescapacete    peshabilitado  pessocorrido pesdormindo  pesalcool     peskmpercorre  
##  (null):  295          : 2956         : 5485         : 1367    : 1690       : 1749           : 2230   (null) :16368  
##  0     :12261    (null):11019   (null):11019   (null):18531   N:58009      N:59276     (null):11019   -1.0   :13549  
##  1     :40309    A     : 5686   A     :40199   I     :  159   S: 1467      S:  141     I     : 4426   0.0    : 7322  
##  2     : 6557    I     : 5410   I     :  855   N     :  388                            N     :43033   10.0   : 2069  
##  3     : 1417    N     : 1190   N     : 1579   S     :40721                            S     :  458   5.0    : 1539  
##  4     :  222    S     :34905   S     : 2029                                                          20.0   : 1496  
##  5     :  105                                                                                         (Other):18823  
##  peshorapercorre  pescategcnh       pesufcnh      pespaiscnh        pesdatahabil     pesdatavalidade     pesidade    
##  (null) :17788   (null) :19429   (null) :19429   (null):19706   (null)    :20141   (null)    :20067   (null) :13621  
##  9999   :13928   17     :16905   SC     : 6931   0     :41448   2000-04-28:  669   2014-05-06:  698   28     : 2386  
##  0010   : 3622   21     : 9229   MG     : 6242   22    :   12   1900-01-01:  440   1900-01-01:  426   36     : 2362  
##         : 2796   24     : 6069   RJ     : 4119                  1999-09-03:  265   2014-08-13:  270   30     : 2356  
##  0030   : 2598   22     : 2597   SP     : 3950                  2000-01-26:  245   2013-06-11:  220   31     : 2173  
##  0015   : 2343   19     : 2375   RS     : 3404                  1990-08-21:  195   2012-09-12:  197   38     : 2101  
##  (Other):18091   (Other): 4562   (Other):17091                  (Other)   :39211   (Other)   :39288   (Other):36167  
##    pesaltura        pespeso      pescicatriz    pestatuagem      pessinal       peslesao      pestcccodigo  
##  (null) :60585   (null) :60701   (null): 1749   (null): 1749   (null): 1749   (null): 1749   0      :58209  
##  1.70   :   61   80     :  105   N     :59415   N     :59333   N     :59406   N     :59397   (null) : 1749  
##  1.48   :   48   75     :   64   S     :    2   S     :   84   S     :   11   S     :   20   5      :  389  
##  1.75   :   45   76     :   40                                                               1      :  358  
##  1.71   :   43   73     :   36                                                               2      :  313  
##  1.78   :   35   70     :   35                                                               3      :   92  
##  (Other):  349   (Other):  185                                                               (Other):   56  
##  pestctcodigo   pestclcodigo      pesoenid    
##  (null): 1749   (null): 1749   (null) :33186  
##  0     :58277   0     :58400   0      :21466  
##  1     :   12   1     :   57   633640 :   76  
##  2     :  688   2     :  273   164135 :   74  
##  3     :   17   3     :  488   62458  :   55  
##  4     :   75   4     :  169   802731 :   55  
##  5     :  348   5     :   30   (Other): 6254

Tabela Unidade Operacional

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
unidade_operacional <- read.csv2("unidadeoperacional.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(unidade_operacional)
##   uniid uniunidade unilotacao        unisigla unittucodigo uniunidaderesponsavel
## 1     1     090000  0520      9ªSR/RS                    4                   111
## 2     2     091400  0565      9ªSR/RS                    1                     1
## 3     3     090100  0539      9ªSR/RS                    1                     1
## 4     4     090300  0543      9ªSR/RS                    1                     1
## 5     5     090200  0541      9ªSR/RS                    1                     1
## 6     6     090400  0545      9ªSR/RS                    1                     1
##                                               unidenominacao                             uniendereco unimunicipio
## 1 9ª SUPERINTENDÊNCIA REGIONAL DE POLÍCIA RODOVIÁRIA FEDERAL Av. A. J. Renner, 2701 - Parque Humaitá        88013
## 2                              DEL.14 - Delegacia de Sarandi                  Rodovia BR 386, Km 135        89036
## 3                         DEL.01 - Delegacia de Porto Alegre                Rodovia BR-116, KM 243,5        88773
## 4                               DEL.03 - Delegacia de Osório                 Rodovia BR-101, km 94,3        87734
## 5                      DEL.02 - Delegacia de Eldorado do Sul                          BR-290, Km 111        84239
## 6                              DEL.04 - Delegacia de Lajeado                  Rodovia BR 386, Km 340        87297
##     unicep    unitelefone             uniemail unilocal unilatitude unilongitude unihelicoptero
## 1 90250000 (51) 3375-9700   sup.rs@dprf.gov.br     6158  S 29G 58M    W 51G 10M               S
## 2 99560000  (54) 361-2100 del14.rs@dprf.gov.br     6620  -27.968028   -52.907778              N
## 3 93125340  (51) 568.2837 del01.rs@dprf.gov.br     6160  -29.736583   -51.150361              N
## 4 95520000  (51) 663-1035 del03.rs@dprf.gov.br     6162  -29.857528   -50.248083              N
## 5 92990000 (51) 3481 3286 del02.rs@dprf.gov.br     6163  -30.036361   -51.327972              N
## 6 95900000 (51) 3748-9605 del04.rs@dprf.gov.br     6162  -29.432222   -52.011611              N
##                                                                                                             unitexto
## 1                                                                    Há uma área disponível para pouso de aeronaves.
## 2                                                             Não há uma área apropriada para pouso de helicóptero. 
## 3                        Antiga quadra de esporte próxima a delegacia precisar de manunteção para pouso de aeronave.
## 4                                                                               Há uma área para pouso de aeronaves 
## 5 Não tem uma área apropriada para pouso de aeronave é utilizada uma área com escanpado aberto do lado da delegacia.
## 6                                                              Há uma área de pouso de aeronave mais sem sinalização

Tabela Local BR

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
local_br <- read.csv2("localbr.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(local_br)
##   lbrid lbruf lbrbr lbrkm lbrlatitude lbrlongitude lbrpnvid lbratualiza
## 1  6977    GO   153  5008      (null)       (null)        1           S
## 2  6978    GO   060  1650      (null)       (null)        1           S
## 3  6979    GO   060  1600      (null)       (null)        1           S
## 4  6980    GO   060  2200      (null)       (null)        1           S
## 5  6981    GO   153  4980      (null)       (null)        1           S
## 6  6982    GO   153  4975      (null)       (null)        1           S
summary(data.frame(lapply(local_br, as.factor)))
##      lbrid            lbruf            lbrbr            lbrkm                      lbrlatitude    
##  3      :     1   MG     : 64304   116    : 54642   0      :  1236   (null)              :249888  
##  5      :     1          : 49379   101    : 46583   10     :   467                       : 69664  
##  213    :     1   RS     : 41115   153    : 24839   40     :   419   -22.8715590495      :  3014  
##  6158   :     1   SC     : 31668   364    : 19009   20     :   416   -18.4178690489999   :  2647  
##  6159   :     1   PR     : 29969   381    : 16796   30     :   412   -21.8711707994999   :  2223  
##  6160   :     1   BA     : 27514   262    : 16069   (Other):448855   -17.5204243864999   :  2175  
##  (Other):451806   (Other):207863   (Other):273874   NA's   :     7   (Other)             :122201  
##                lbrlongitude       lbrpnvid      lbratualiza
##  (null)              :249888   1      :205937   N: 14773   
##                      : 69664   3671   :   711   S:437039   
##  -46.3591216409999   :  3014   2998   :   624              
##  -49.1944493939999   :  2647   4331   :   462              
##  -42.6684830604999   :  2223   3003   :   425              
##  -54.7398042344999   :  2175   2564   :   422              
##  (Other)             :122201   (Other):243231
# View(local_br[local_br$lbrlatitude != '(null)',])

Tabela Municipio

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
municipio <- read.csv2("municipio.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(municipio)
##   tmucodigo      tmudenominacao tmuuf
## 1     10502     ABADIA DE GOIAS    GO
## 2     40010 ABADIA DOS DOURADOS    MG
## 3     92010           ABADIANIA    GO
## 4     40037              ABAETE    MG
## 5      4014          ABAETETUBA    PA
## 6     13013             ABAIARA    CE
summary(data.frame(lapply(municipio, as.factor)))
##    tmucodigo         tmudenominacao     tmuuf     
##  19     :   1   BOM JESUS   :   5   MG     : 854  
##  27     :   1   BONITO      :   4   SP     : 646  
##  35     :   1   PLANALTO    :   4   RS     : 496  
##  43     :   1   SANTA HELENA:   4   BA     : 418  
##  51     :   1   SANTA INES  :   4   PR     : 399  
##  60     :   1   SANTA LUZIA :   4   SC     : 293  
##  (Other):5563   (Other)     :5544   (Other):2463

Tabela UF

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
uf <- read.csv2("uf.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(uf)
##   tufuf tufdenominacao
## 1    AC           Acre
## 2    AL        Alagoas
## 3    AM       Amazonas
## 4    AP          Amapá
## 5    BA          Bahia
## 6    CE          Ceará
summary(data.frame(lapply(uf, as.factor)))
##      tufuf     tufdenominacao
##  AC     : 1   Acre    : 1    
##  AL     : 1   Alagoas : 1    
##  AM     : 1   Amapá   : 1    
##  AP     : 1   Amazonas: 1    
##  BA     : 1   Bahia   : 1    
##  CE     : 1   Ceará   : 1    
##  (Other):21   (Other) :21

Tabela Tipo Unidade Operacional

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_unidade_operacional <- read.csv2("tipounidadeoperacional.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_unidade_operacional)
##   ttucodigo                                   ttudescricao ttuatualiza
## 1         1                                      Delegacia           N
## 2         2     Departamento de Polícia Rodoviária Federal           N
## 3         3         Distrito de Polícia Rodoviária Federal           N
## 4         4 Superintendência de Polícia Rodoviária Federal           N
## 5         5                                          Posto           N
## 6         6                                        Viatura           N
summary(data.frame(lapply(tipo_unidade_operacional, as.factor)))
##    ttucodigo                              ttudescricao ttuatualiza
##  1      :1   Central de Informações Operacionais:1     N:15       
##  2      :1   Coordenação                        :1                
##  3      :1   Coordenação-Geral                  :1                
##  4      :1   Corregedoria Regional              :1                
##  5      :1   Corregedoria-Geral                 :1                
##  6      :1   Delegacia                          :1                
##  (Other):9   (Other)                            :9

Tabela Tipo Ponto Medico

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_ponto_medico <- read.csv2("tipopontomedico.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_ponto_medico)
##   ttmcodigo   ttmdescricao ttmatualiza
## 1         1       Farmácia           N
## 2         2       Hospital           N
## 3         3         Médico           N
## 4         4       Parteira           N
## 5         5 Posto de saúde           N
## 6         6        Clínica           N
summary(data.frame(lapply(tipo_ponto_medico, as.factor)))
##  ttmcodigo         ttmdescricao ttmatualiza
##  1:1       Clínica       :1     N:7        
##  2:1       Farmácia      :1                
##  3:1       Hospital      :1                
##  4:1       Médico        :1                
##  5:1       Parteira      :1                
##  6:1       Posto de saúde:1                
##  7:1       Pronto-Socorro:1

Tabela Tipo Comunicacao

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_comunicacao <- read.csv2("tipocomunicacao.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_comunicacao)
##   tcocodigo          tcodescricao tcoatualiza
## 1         1              Acidente           N
## 2         6 Interdição de Rodovia           N
## 3        15                 Crime           N
## 4        20            Informação           N
summary(data.frame(lapply(tipo_comunicacao, as.factor)))
##  tcocodigo                tcodescricao tcoatualiza
##  1 :1      Acidente             :1     N:4        
##  6 :1      Crime                :1                
##  15:1      Informação           :1                
##  20:1      Interdição de Rodovia:1

Tabela Tipo Apreensao

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_apreensao <- read.csv2("tipoapreensao.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_apreensao)
##   ttpcodigo           ttpdescricao ttpatualiza
## 1         1 Contrabando/Descaminho           N
## 2         2          Meio ambiente           N
## 3         3              Documento           N
## 4         4             Mercadoria           N
## 5         5                  Armas           N
## 6         6                Munição           N
summary(data.frame(lapply(tipo_apreensao, as.factor)))
##  ttpcodigo                 ttpdescricao ttpatualiza
##  1:1       Armas                 :1     N:7        
##  2:1       Contrabando/Descaminho:1                
##  3:1       Documento             :1                
##  4:1       Drogas                :1                
##  5:1       Meio ambiente         :1                
##  6:1       Mercadoria            :1                
##  7:1       Munição               :1

Tabela Tipo Ponto Notavel

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_ponto_notavel <- read.csv2("tipopontonotavel.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_ponto_notavel)
##   ttncodigo                   ttndescricao ttnatualiza
## 1         1                         Escola           N
## 2        10 Ponto relevante - linha férrea           N
## 3        11        Ponto relevante - morro           N
## 4        12          Ponto relevante - rio           N
## 5        13        Ponto relevante - serra           N
## 6        14        Ponto relevante - trevo           N
summary(data.frame(lapply(tipo_ponto_notavel, as.factor)))
##    ttncodigo             ttndescricao ttnatualiza
##  1      : 1   Acampamentos     : 1    N:23       
##  2      : 1   Borracharia      : 1    S: 2       
##  3      : 1   Escola           : 1               
##  4      : 1   Fazenda e chácara: 1               
##  5      : 1   Hotel e pousada  : 1               
##  6      : 1   Indústria        : 1               
##  (Other):19   (Other)          :19

Tabela Tipo Obra

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_obra <- read.csv2("tipoobra.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_obra)
##   ttbcodigo ttbdescricao ttbatualiza
## 1         1    Passarela           N
## 2         2        Ponte           N
## 3         3      Pórtico           N
## 4         4        Túnel           N
## 5         5      Viaduto           N
summary(data.frame(lapply(tipo_obra, as.factor)))
##  ttbcodigo    ttbdescricao ttbatualiza
##  1:1       Passarela:1     N:5        
##  2:1       Ponte    :1                
##  3:1       Pórtico  :1                
##  4:1       Túnel    :1                
##  5:1       Viaduto  :1

Tabela Tipo Crime

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_crime <- read.csv2("tipocrime.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_crime)
##   ttccodigo                     ttcdescricao ttcatualiza
## 1         1        Contra a economia popular           N
## 2         2        Contra a ordem tributária           N
## 3         3                    Contra a vida           N
## 4         4       Contra as leis de trânsito           N
## 5         5           Contra o meio ambiente           N
## 6         6 Contra a criança e o adolescente           N
summary(data.frame(lapply(tipo_crime, as.factor)))
##    ttccodigo                           ttcdescricao ttcatualiza
##  1      :1   Contra a criança e o adolescente:1     N:11       
##  2      :1   Contra a economia popular       :1                
##  3      :1   Contra a ordem tributária       :1                
##  4      :1   Contra a vida                   :1                
##  5      :1   Contra as leis de trânsito      :1                
##  6      :1   Contra o meio ambiente          :1                
##  (Other):5   (Other)                         :5

Tabela Tipo Sinalizacao

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_sinalizacao <- read.csv2("tiposinalizacao.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_sinalizacao)
##   ttscodigo                ttsdescricao ttsatualiza
## 1         1    Horizontal em bom estado           N
## 2         2        Horizontal irregular           N
## 3         3 Horizontal em más condições           N
## 4         4      Vertical em bom estado           N
## 5         5          Vertical irregular           N
## 6         6   Vertical em más condições           N
summary(data.frame(lapply(tipo_sinalizacao, as.factor)))
##  ttscodigo                      ttsdescricao ttsatualiza
##  1:1       Horizontal em bom estado   :1     N:7        
##  2:1       Horizontal em más condições:1                
##  3:1       Horizontal irregular       :1                
##  4:1       Não há                     :1                
##  5:1       Vertical em bom estado     :1                
##  6:1       Vertical em más condições  :1                
##  7:1       Vertical irregular         :1

Tabela Tipo Detencao

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_detencao <- read.csv2("tipodetencao.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_detencao)
##   ttdcodigo                ttddescricao ttdatualiza ttdrelacidente
## 1         1            Assalto a ônibus           N         (null)
## 2         2         Encontro de cadáver           N         (null)
## 3         3                   Homicídio           N         (null)
## 4         4      Tentativa de Homicídio           N         (null)
## 5         5 Assalto a veículos de carga           N         (null)
## 6         6        Tentativa de assalto           N         (null)
summary(data.frame(lapply(tipo_detencao, as.factor)))
##    ttdcodigo                        ttddescricao ttdatualiza ttdrelacidente
##  1      :1   Tentativa de assalto         :2     N:15        (null):15     
##  2      :1   Assalto a ônibus             :1                               
##  3      :1   Assalto a veículos de carga  :1                               
##  4      :1   Contrabando                  :1                               
##  5      :1   Crimes contra o meio-ambiente:1                               
##  6      :1   Crimes contra o patrimônio   :1                               
##  (Other):9   (Other)                      :8

Tabela Tipo Localidade

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_localidade <- read.csv2("tipolocalidade.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_localidade)
##   ttlcodigo  ttldescricao ttlatualiza
## 1         1     Comercial           N
## 2         2       Escolar           N
## 3         3    Industrial           N
## 4         4 Não edificada           N
## 5         5   Residencial           N
## 6         6         Lazer           N
summary(data.frame(lapply(tipo_localidade, as.factor)))
##  ttlcodigo        ttldescricao ttlatualiza
##  1:1       Comercial    :1     N:6        
##  2:1       Escolar      :1                
##  3:1       Industrial   :1                
##  4:1       Lazer        :1                
##  5:1       Não edificada:1                
##  6:1       Residencial  :1

Tabela Tipo Receptor

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_receptor <- read.csv2("tiporeceptor.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_receptor)
##   ttrcodigo          ttrdescricao ttratualiza ttrdelegacia
## 1         1  Clínica psiquiátrica           N       (null)
## 2         2    Corpo de Bombeiros           N       (null)
## 3         3 Detentor do documento           N       (null)
## 4         4                Detran           N       (null)
## 5         5                 Funai           N       (null)
## 6         6              Hospital           N       (null)
summary(data.frame(lapply(tipo_receptor, as.factor)))
##    ttrcodigo                ttrdescricao ttratualiza ttrdelegacia
##  1      : 1   Bombeiro Voluntário : 1    N:19        (null):19   
##  2      : 1   Clínica psiquiátrica: 1    S: 8        N     : 8   
##  3      : 1   Condutor Habilitado : 1                            
##  4      : 1   Conselho Tutelar    : 1                            
##  5      : 1   Corpo de Bombeiros  : 1                            
##  6      : 1   Depósito Credenciado: 1                            
##  (Other):21   (Other)             :21

Tabela Tipo Documento

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_documento <- read.csv2("tipodocumento.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_documento)
##   ttocodigo               ttodescricao ttoatualiza ttorelapreensao ttorelrecuperacao
## 1         1 Cartão de crédito bancário           N          (null)            (null)
## 2         2          Carteira de saúde           N          (null)            (null)
## 3         3         Cédula falsificada           N          (null)            (null)
## 4         4      Certidão de casamento           N          (null)            (null)
## 5         5     Certidão de nascimento           N          (null)            (null)
## 6         6                        CNH           N          (null)            (null)
summary(data.frame(lapply(tipo_documento, as.factor)))
##    ttocodigo                            ttodescricao ttoatualiza ttorelapreensao ttorelrecuperacao
##  1      : 1   AET                             : 1    N:17        (null):17       (null):17        
##  2      : 1   Cartão de crédito bancário      : 1                                                 
##  3      : 1   Carteira de Motorista de Escolta: 1                                                 
##  4      : 1   Carteira de saúde               : 1                                                 
##  5      : 1   Carteira funcional              : 1                                                 
##  6      : 1   Cédula falsificada              : 1                                                 
##  (Other):11   (Other)                         :11

Tabela Tipo Acidente

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_acidente <- read.csv2("tipoacidente.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(tipo_acidente)
##   ttacodigo            ttadescricao ttaatualiza ttarelacidente ttaativo
## 1         1 Atropelamento de animal           N         (null)        S
## 2        12          Saída de Pista           N         (null)        S
## 3        11              Tombamento           N         (null)        S
## 4         2 Atropelamento de pessoa           N         (null)        S
## 5         3             Capotamento           N         (null)        S
## 6         4   Colisão com bicicleta           N         (null)        S
summary(data.frame(lapply(tipo_acidente, as.factor)))
##    ttacodigo                    ttadescricao ttaatualiza ttarelacidente ttaativo
##  1      : 1   Atropelamento de animal : 1    N:17        (null):17      N: 1    
##  2      : 1   Atropelamento de pessoa : 1                               S:16    
##  3      : 1   Capotamento             : 1                                       
##  4      : 1   Colisão com bicicleta   : 1                                       
##  5      : 1   Colisão com objeto fixo : 1                                       
##  6      : 1   Colisão com objeto móvel: 1                                       
##  (Other):11   (Other)                 :11

Estado Fisico

setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
estado_fisico <- read.csv2("estadofisico.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1")  # entradas duplicadas
head(estado_fisico)
##     esid  estadofisico
## 1 (null)          null
## 2      0  Desconhecido
## 3      1         Ileso
## 4      2  Lesoes Leves
## 5      3 Lesoes Graves
## 6      4         Morto
summary(data.frame(lapply(estado_fisico, as.factor)))
##      esid          estadofisico
##  (null):1   Desconhecido :1    
##  0     :1   Ignorado     :1    
##  1     :1   Ileso        :1    
##  2     :1   Lesoes Graves:1    
##  3     :1   Lesoes Leves :1    
##  4     :1   Morto        :1    
##  5     :1   null         :1