options(width = 120)
(id [ocoid])
Alguns pontos de dados
setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia <- read.csv("ocorrencia_1_Semestre_2007.csv", head = TRUE, sep = ";", fileEncoding = "latin1")
head(ocorrencia)
## ocoid ocolocal ocostatus ocomunicipio ocosentido ocodataocorrencia ocodataregistro ocotipo ococomid
## 1 173677 46057 S 81612 1 2006-12-27 10:40:00 2006-12-31 23:13:00 1 187007
## 2 173681 126898 S 72095 1 2006-12-30 20:30:00 2006-12-31 23:26:00 1 189137
## 3 173686 24468 S 31950 1 2006-12-31 19:50:00 2006-12-31 23:45:00 1 189522
## 4 173676 126893 S 19810 2 2006-12-31 20:10:00 2006-12-31 23:11:00 1 189548
## 5 173669 126885 S 17612 2 2006-12-31 19:00:00 2006-12-31 22:53:00 1 189507
## 6 173618 16474 S 62073 1 2006-12-31 10:42:00 2006-12-31 20:33:00 1 189504
## ocoidorigem ocodatafim
## 1 (null) 2007-01-01 00:03:00
## 2 (null) 2007-01-01 00:03:00
## 3 (null) 2007-01-01 00:03:00
## 4 (null) 2007-01-01 00:18:00
## 5 (null) 2007-01-01 00:34:00
## 6 (null) 2007-01-01 00:41:00
Correcao dos tipos de dados para visualizacao dos sumarios
ocorrencia$ocolocal = as.factor(ocorrencia$ocolocal)
ocorrencia$ocoid = as.factor(ocorrencia$ocoid)
ocorrencia$ocotipo = as.factor(ocorrencia$ocotipo)
ocorrencia$ocosentido = as.factor(ocorrencia$ocosentido)
ocorrencia$ococomid = as.factor(ocorrencia$ococomid)
summary(ocorrencia)
## ocoid ocolocal ocostatus ocomunicipio ocosentido ocodataocorrencia
## 3 : 1 36186 : 115 S:60934 64777 : 801 1:31394 2007-04-08 17:00:00: 28
## 209 : 1 12983 : 90 56251 : 721 2:29539 2007-04-08 16:00:00: 19
## 22124 : 1 43035 : 68 83275 : 683 3: 1 2007-04-08 18:00:00: 19
## 46688 : 1 13103 : 66 56995 : 665 2007-04-08 15:30:00: 18
## 82247 : 1 13278 : 64 75353 : 613 2007-04-08 17:30:00: 18
## 88984 : 1 14059 : 58 58335 : 584 2007-04-15 19:00:00: 18
## (Other):60928 (Other):60473 (Other):56867 (Other) :60814
## ocodataregistro ocotipo ococomid ocoidorigem ocodatafim
## 2007-01-11 15:11:00: 5 1:60934 165742 : 2 (null):60934 2007-01-02 23:34:00: 5
## 2007-03-05 12:43:00: 5 190525 : 2 2007-03-24 11:18:00: 5
## 2007-03-20 21:20:00: 5 199779 : 2 2007-04-09 11:05:00: 5
## 2007-04-09 20:16:00: 5 211876 : 2 2007-04-09 15:32:00: 5
## 2007-05-08 13:52:00: 5 215287 : 2 2007-05-07 18:29:00: 5
## 2007-06-15 14:47:00: 5 215529 : 2 2007-01-04 23:26:00: 4
## (Other) :60904 (Other):60922 (Other) :60905
Alguns pontos de dados
setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia_acidente <- read.csv("ocorrenciaacidente_1_Semestre_2007.csv", head = TRUE, sep = ";", fileEncoding = "latin1")
head(ocorrencia_acidente)
## oacocoid oacttacodigo oactcacodigo oacdano oacdanoterc oacdanoamb oaclatitude oaclongitude oacdistab
## 1 173677 8 7 N N N (null)
## 2 173681 7 7 N N N (null)
## 3 173686 12 5 N S N (null)
## 4 173676 1 15 N N N (null)
## 5 173669 7 2 N N N (null)
## 6 173618 3 7 N N N (null)
## oacdistac oacdistbc oacmodelopista oacsentido1 oacsentido2 oacqtdfaixa1 oacqtdfaixa2 oacacostamento1
## 1 (null) (null) 1 FLORIANOPOLIS JOINVILLE 2 2 S
## 2 (null) (null) 1 SANTOS RIO DE JANEIRO 1 1 S
## 3 (null) (null) 1 ARACAJU - CENTRO SÃO CRISTÓVÃO 2 2 S
## 4 (null) (null) 11 JOÃO PESSOA CAMPINA GRANDE 1 1 N
## 5 (null) (null) 1 NATAL CEARÁ-MIRIM 1 1 S
## 6 (null) (null) 12 CURITIBA CAJATI 1 1 N
## oacacostamento2 oaccanteiro oaclinhacentral oacorientpista oacgirafundo oacversaocroqui oacsitio
## 1 S (null) (null) (null) (null) 1 (null)
## 2 S (null) (null) (null) (null) 1 (null)
## 3 S (null) (null) (null) (null) 1 (null)
## 4 N (null) (null) (null) (null) 1 (null)
## 5 S (null) (null) (null) (null) 1 (null)
## 6 N (null) (null) (null) (null) 1 (null)
Correcao dos tipos de dados para visualizacao dos sumarios
ocorrencia_acidente$oacttacodigo = as.factor(ocorrencia_acidente$oacttacodigo)
ocorrencia_acidente$oactcacodigo = as.factor(ocorrencia_acidente$oactcacodigo)
ocorrencia_acidente$oacversaocroqui = as.factor(ocorrencia_acidente$oacversaocroqui)
summary(ocorrencia_acidente)
## oacocoid oacttacodigo oactcacodigo oacdano oacdanoterc oacdanoamb oaclatitude
## Min. : 3 8 :15872 16 :21786 : 8 : 9 : 9 :60460
## 1st Qu.:191624 12 : 9498 7 :20313 N:58901 (null): 6 (null): 6 (null) : 448
## Median :210128 7 : 9492 17 : 3789 o: 7 N :59538 N :60808 0 : 2
## Mean :210044 10 : 5620 1 : 2958 S: 2018 o : 3 o : 1 LOCAL DESFEITO : 2
## 3rd Qu.:228419 5 : 3893 5 : 2627 S : 1378 S : 110 - A ao corpo: 34,6 : 1
## Max. :247368 3 : 3282 15 : 2020 300 METROS DE P : 1
## (Other):13277 (Other): 7441 (Other) : 20
## oaclongitude oacdistab oacdistac oacdistbc oacmodelopista oacsentido1
## :60479 (null) :53401 (null) :53613 (null) :53802 1 :38722 : 5752
## (null) : 448 5.0 : 1681 4.0 : 278 5.0 : 311 11 : 4953 RIO DE JANEIRO: 1966
## - B ao corpo: 31,0 : 1 3.0 : 1270 5.0 : 249 4.0 : 153 22 : 2458 BELO HORIZONTE: 1700
## & readonly onKeyPre: 1 2.0 : 774 3.0 : 222 3.0 : 136 12 : 1444 SAO PAULO : 1159
## 0 : 1 4.0 : 697 6.0 : 146 6.0 : 136 8 : 1337 SALVADOR : 843
## 3 mts a Leste de A : 1 10.0 : 516 8.0 : 127 10.0 : 124 9 : 1219 SP : 674
## (Other) : 3 (Other): 2595 (Other): 6299 (Other): 6272 (Other):10801 (Other) :48840
## oacsentido2 oacqtdfaixa1 oacqtdfaixa2 oacacostamento1 oacacostamento2 oaccanteiro oaclinhacentral
## : 5645 1 :45691 1 :46120 (null): 4 (null): 3 (null):60933 (null):60933
## RIO DE JANEIRO: 2056 2 : 9399 2 : 9275 N :34745 N :34379 N : 1 4 : 1
## BELO HORIZONTE: 1703 3 : 3039 3 : 3138 S :26185 S :26552
## SAO PAULO : 971 0 : 1685 0 : 1256
## VITORIA : 749 4 : 830 4 : 888
## CURITIBA : 701 5 : 157 5 : 171
## (Other) :49109 (Other): 133 (Other): 86
## oacorientpista oacgirafundo oacversaocroqui oacsitio
## (null):60933 (null):60933 1:60933 (null):60933
## N : 1 N : 1 2: 1 1 : 1
##
##
##
##
##
Esta tabela nao consta no dicionario nas descricoes, apenas no diagrama.
Alguns pontos de dados
setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia_pessoa <- read.csv("ocorrenciaPessoa_1_Semestre_2007.csv", head = TRUE, sep = ";", fileEncoding = "latin1")
head(ocorrencia_pessoa)
## opeid opeocoid opepesid opeportenumero opeportevalidade opettecodigo openaoident opeestrangeiro opeanexo
## 1 487414 174005 447288 (null) (null) 2 N N N
## 2 487416 174005 447288 (null) (null) 10 N N N
## 3 487248 173945 447138 (null) (null) 2 N N S
## 4 487271 173945 447157 (null) (null) 2 N N S
## 5 487279 173945 447165 (null) (null) 8 N N S
## 6 487291 173945 447176 (null) (null) 3 N N N
## opecondalegadas
## 1 1
## 2 (null)
## 3 1
## 4 1
## 5 (null)
## 6 (null)
Correcao dos tipos de dados para visualizacao dos sumarios
ocorrencia_pessoa$opeocoid = as.factor(ocorrencia_pessoa$opeocoid)
ocorrencia_pessoa$opepesid = as.factor(ocorrencia_pessoa$opepesid)
summary(ocorrencia_pessoa)
## opeid opeocoid opepesid opeportenumero opeportevalidade opettecodigo openaoident
## Min. :3.21e+02 210692 : 59 517178 : 3 (null):199434 (null):199434 2 :101520 : 1
## 1st Qu.:5.46e+05 200617 : 55 574671 : 3 10 : 68823 (null): 24
## Median :6.06e+05 176324 : 54 441 : 2 3 : 22854 N :196252
## Mean :7.55e+05 233326 : 54 387338 : 2 8 : 3382 o : 2
## 3rd Qu.:6.65e+05 216253 : 50 387340 : 2 4 : 2543 S : 3155
## Max. :2.01e+09 189639 : 47 387343 : 2 12 : 246
## (Other):199115 (Other):199420 (Other): 66
## opeestrangeiro opeanexo opecondalegadas
## (null): 24 (null): 3 (null) :100377
## N :199262 N :158915 1 : 87615
## S : 148 o : 9 7 : 4744
## S : 40507 4 : 2009
## 5 : 1802
## 3 : 1192
## (Other): 1695
Tabela de ligacao entre ocorrencias e veiculos
Alguns pontos de dados
setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia_veiculo <- read.csv("ocorrenciaveiculo.csv", head = TRUE, sep = "|", fileEncoding = "latin1")
head(ocorrencia_veiculo)
## ocvid ocvocoid ocvveiid
## 1 99 123 NA
## 2 100 124 NA
## 3 100 125 NA
## 4 11 3 NA
## 5 12 4 NA
## 6 13 5 NA
Correcao dos tipos de dados para visualizacao dos sumarios
ocorrencia_veiculo$ocvid = as.factor(ocorrencia_veiculo$ocvid)
ocorrencia_veiculo$ocvocoid = as.factor(ocorrencia_veiculo$ocvocoid)
ocorrencia_veiculo$ocvveiid = as.factor(ocorrencia_veiculo$ocvveiid)
summary(ocorrencia_veiculo)
## ocvid ocvocoid ocvveiid
## 1039505: 20 59436 : 5 NA's:2303047
## 289155 : 19 13325 : 4
## 786417 : 19 15903 : 4
## 1298249: 19 17224 : 4
## 798843 : 18 55813 : 4
## 942514 : 18 70547 : 4
## (Other):2302934 (Other):2303022
Alguns pontos de dados
setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
veiculo <- read.csv("veiculo.csv", head = TRUE, sep = "|", row.names = NULL) # entradas duplicadas
head(veiculo)
## row.names veiid vei.veiano veitmvcodigo veiqtdocupantes veitevcodigo veitcvcodigo veitvvcodigo veidescricao
## 1 1 1974 0 2 1 1 13 \\ 56634
## 2 1 1974 0 2 1 1 13 \\ 56634
## 3 2 0 1 0 0 7 \\ NA
## 4 2 0 1 0 0 7 \\ NA
## 5 3 2009 9025 1 6 4 7 \\ 35157
## 6 3 2009 9025 1 6 4 7 \\ 35157
## veimunicipio veitcecodigo veimunorigem veipaisorigem veimundestino veipaisdestino veitttcodigo veitipoproprietario
## 1 4 56634 22 57134 22 0 1 3517504
## 2 4 56634 22 57134 22 0 1 3517504
## 3 0 NA 22 NA 22 0 1 101738
## 4 0 NA 22 NA 22 0 1 101738
## 5 5 35157 22 35157 22 0 1 2705824
## 6 5 35157 22 35157 22 0 1 2705824
## veiproprietario veioenid veisequencial veitipoplaca
## 1 1183807 2 N NA
## 2 1183807 2 N NA
## 3 NA 2 NA
## 4 NA 2 NA
## 5 997418 1 N NA
## 6 997418 1 N NA
Correcao dos tipos de dados para visualizacao dos sumarios
# ocorrencia_veiculo$opeocoid = as.factor(ocorrencia_veiculo$opeocoid) summary(data.frame(lapply(veiculo,as.factor)))
summary(veiculo)
## row.names veiid vei.veiano veitmvcodigo veiqtdocupantes veitevcodigo
## Length:2772657 : 218878 Min. : 0 Min. :0.00e+00 Min. : 0 Min. :0.00e+00
## Class :character 2008 : 212362 1st Qu.: 1691 1st Qu.:1.00e+00 1st Qu.: 4 1st Qu.:1.00e+00
## Mode :character 2007 : 198530 Median : 7449 Median :2.00e+00 Median : 6 Median :4.00e+00
## 2006 : 169685 Mean : 7397 Mean :7.79e+02 Mean : 5 Mean :1.55e+03
## 2009 : 161222 3rd Qu.: 10694 3rd Qu.:3.00e+00 3rd Qu.: 6 3rd Qu.:4.00e+00
## 2005 : 159813 Max. :1146201 Max. :2.15e+09 Max. :661138 Max. :2.15e+09
## (Other):1652167 NA's :20254 NA's :2032 NA's :54217 NA's :2416
## veitcvcodigo veitvvcodigo veidescricao veimunicipio veitcecodigo
## Min. : 0 \\ :2069056 Min. : 19 Min. : 0 Min. : 19
## 1st Qu.: 7 BICICLETA : 9536 1st Qu.: 39659 1st Qu.: 4 1st Qu.: 31178
## Median : 7 AUTOM<d3>VEL : 9120 Median : 60216 Median : 5 Median : 57215
## Mean : 15 AUTOMOVEL : 8590 Mean : 58118 Mean : 9 Mean : 54905
## 3rd Qu.: 13 N<c3>O IDENTIFICADO: 7975 3rd Qu.: 81434 3rd Qu.: 11 3rd Qu.: 81051
## Max. :7484439 MOTOCICLETA : 6978 Max. : 99970 Max. :1525036 Max. : 99970
## NA's :11315 (Other) : 661402 NA's :500121 NA's :19163 NA's :1008674
## veimunorigem veipaisorigem veimundestino veipaisdestino veitttcodigo veitipoproprietario
## Min. :-3.21e+08 Min. : 19 Min. :-2.04e+09 Min. : 0 Min. :1 Min. :0.00e+00
## 1st Qu.: 2.20e+01 1st Qu.: 31054 1st Qu.: 2.20e+01 1st Qu.: 0 1st Qu.:1 1st Qu.:5.83e+05
## Median : 2.20e+01 Median : 57053 Median : 2.20e+01 Median : 0 Median :1 Median :1.40e+06
## Mean :-3.28e+02 Mean : 54759 Mean :-7.25e+02 Mean : 7 Mean :1 Mean :2.45e+06
## 3rd Qu.: 2.20e+01 3rd Qu.: 81051 3rd Qu.: 2.20e+01 3rd Qu.: 0 3rd Qu.:2 3rd Qu.:3.08e+06
## Max. : 7.75e+06 Max. : 99970 Max. : 2.50e+06 Max. :8322396 Max. :2 Max. :8.80e+08
## NA's :54217 NA's :1011692 NA's :54217 NA's :133934 NA's :133934
## veiproprietario veioenid veisequencial veitipoplaca
## Min. : 4 Min. : 0 : 219018 Mode:logical
## 1st Qu.: 597200 1st Qu.: 1 E: 3211 NA's:2772657
## Median : 847440 Median : 1 G: 113989
## Mean : 791550 Mean : 2 I: 7715
## 3rd Qu.:1099818 3rd Qu.: 2 N:2428724
## Max. :1351973 Max. :524000
## NA's :2177906 NA's :54217
setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
ocorrencia_pessoas <- read.csv("ocorrenciaPessoa_1_Semestre_2007.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(ocorrencia_pessoas)
## opeid opeocoid opepesid opeportenumero opeportevalidade opettecodigo openaoident opeestrangeiro opeanexo
## 1 487414 174005 447288 (null) (null) 2 N N N
## 2 487416 174005 447288 (null) (null) 10 N N N
## 3 487248 173945 447138 (null) (null) 2 N N S
## 4 487271 173945 447157 (null) (null) 2 N N S
## 5 487279 173945 447165 (null) (null) 8 N N S
## 6 487291 173945 447176 (null) (null) 3 N N N
## opecondalegadas
## 1 1
## 2 (null)
## 3 1
## 4 1
## 5 (null)
## 6 (null)
Correcao dos tipos de dados para visualizacao dos sumarios
# ocorrencia_veiculo$opeocoid = as.factor(ocorrencia_veiculo$opeocoid)
summary(data.frame(lapply(ocorrencia_pessoas, as.factor)))
## opeid opeocoid opepesid opeportenumero opeportevalidade opettecodigo openaoident
## 321 : 1 210692 : 59 517178 : 3 (null):199434 (null):199434 2 :101520 : 1
## 509 : 1 200617 : 55 574671 : 3 10 : 68823 (null): 24
## 510 : 1 176324 : 54 441 : 2 3 : 22854 N :196252
## 511 : 1 233326 : 54 387338 : 2 8 : 3382 o : 2
## 512 : 1 216253 : 50 387340 : 2 4 : 2543 S : 3155
## 513 : 1 189639 : 47 387343 : 2 12 : 246
## (Other):199428 (Other):199115 (Other):199420 (Other): 66
## opeestrangeiro opeanexo opecondalegadas
## (null): 24 (null): 3 (null) :100377
## N :199262 N :158915 1 : 87615
## S : 148 o : 9 7 : 4744
## S : 40507 4 : 2009
## 5 : 1802
## 3 : 1192
## (Other): 1695
setwd("~/Dropbox/Academia/dados_mj/ocorencias/brbrasil_1_semestre_2007")
pessoas <- read.csv("pessoa_1_Semestre_2007.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(pessoas)
## pesid pesdatanascimento pesnaturalidade pesnacionalidade pessexo pesteccodigo pestgicodigo pesmunicipio
## 1 3056784 1970-02-09 54011 22 M 1 0 69531
## 2 4002639 1972-08-05 NA 22 M 1 4 41238
## 3 4154409 1972-08-05 NA 22 M 1 4 41238
## 4 1041615 1972-07-14 23817 22 M 2 4 23817
## 5 1041642 (null) NA 22 (null) 0 0 23817
## 6 982037 1978-01-08 NA 22 M 1 3 53430
## pestopcodigo pesmunicipioori pespaisori pesmunicipiodest pespaisdest pesveiid pesestadofisico pescinto pescapacete
## 1 557 69531 22 62073 22 2685160 1 S A
## 2 557 43710 22 43710 22 18234237 2 A S
## 3 557 43710 22 43710 22 18314110 2 A S
## 4 557 25615 22 23817 22 654256 2 S A
## 5 0 0 0 (null) 0 (null) (null)
## 6 557 22 22 (null) 1 A A
## peshabilitado pessocorrido pesdormindo pesalcool peskmpercorre peshorapercorre pescategcnh pesufcnh pespaiscnh
## 1 S N N N -1.0 9999 22 SP 0
## 2 S S N N 0.3 0015 21 MG 0
## 3 S S N N 0.3 0015 21 MG 0
## 4 S S N N 12.0 0007 24 PE 0
## 5 (null) N N (null) (null) (null) (null) (null) 0
## 6 N N N (null) 0
## pesdatahabil pesdatavalidade pesidade pesaltura pespeso pescicatriz pestatuagem pessinal peslesao pestcccodigo
## 1 1988-12-13 2011-12-26 41 (null) (null) N N N N 0
## 2 1992-10-05 2016-09-08 40 (null) (null) N N N N 0
## 3 1992-10-05 2016-09-08 40 (null) (null) N N N N 0
## 4 1991-08-13 2011-12-07 35 (null) (null) N N N N 0
## 5 (null) (null) (null) (null) (null) N N N N 0
## 6 (null) (null) 30 (null) (null) N N N N 0
## pestctcodigo pestclcodigo pesoenid
## 1 0 0 0
## 2 0 0 1294088
## 3 0 0 1327471
## 4 0 0 582852
## 5 0 0 0
## 6 0 0 0
Correcao dos tipos de dados para visualizacao dos sumarios
# ocorrencia_veiculo$opeocoid = as.factor(ocorrencia_veiculo$opeocoid)
summary(data.frame(lapply(pessoas, as.factor)))
## pesid pesdatanascimento pesnaturalidade pesnacionalidade pessexo pesteccodigo pestgicodigo
## 1239696: 76 (null) :13589 60011 : 3293 (null): 1749 : 1051 1 :27600 0:18903
## 753683 : 74 1982-03-21: 667 71072 : 1590 0 : 7249 (null):11019 0 :16353 2: 2124
## 3604440: 74 1981-07-28: 282 41238 : 1544 116 : 15 F : 2487 4 :10593 3:11875
## 1672973: 70 1980-04-28: 278 81051 : 1246 22 :52153 I : 54 7 : 3477 4:23891
## 2152993: 70 1972-08-05: 259 88013 : 1061 M :46555 2 : 1925 5: 147
## 1937130: 67 1979-12-05: 245 (Other):28243 3 : 921 6: 8
## (Other):60735 (Other) :45846 NA's :24189 (Other): 297 7: 4218
## pesmunicipio pestopcodigo pesmunicipioori pespaisori pesmunicipiodest pespaisdest pesveiid
## :11557 557 :26117 :31164 (null): 1749 :31159 (null): 1749 (null) :15691
## 75353 : 1993 0 :24428 75876 : 794 0 :12036 78859 : 718 0 :12037 2477032: 609
## 41238 : 1404 13 : 3239 60011 : 639 22 :47381 75353 : 642 116 : 14 619506 : 119
## 60011 : 1220 (null) : 1738 75353 : 575 41238 : 531 22 :47366 284561 : 104
## 83275 : 1159 519 : 1625 04154 : 482 60011 : 515 760065 : 102
## 80470 : 896 16 : 462 93734 : 452 04154 : 436 597794 : 86
## (Other):42937 (Other): 3557 (Other):27060 (Other):27165 (Other):44455
## pesestadofisico pescinto pescapacete peshabilitado pessocorrido pesdormindo pesalcool peskmpercorre
## (null): 295 : 2956 : 5485 : 1367 : 1690 : 1749 : 2230 (null) :16368
## 0 :12261 (null):11019 (null):11019 (null):18531 N:58009 N:59276 (null):11019 -1.0 :13549
## 1 :40309 A : 5686 A :40199 I : 159 S: 1467 S: 141 I : 4426 0.0 : 7322
## 2 : 6557 I : 5410 I : 855 N : 388 N :43033 10.0 : 2069
## 3 : 1417 N : 1190 N : 1579 S :40721 S : 458 5.0 : 1539
## 4 : 222 S :34905 S : 2029 20.0 : 1496
## 5 : 105 (Other):18823
## peshorapercorre pescategcnh pesufcnh pespaiscnh pesdatahabil pesdatavalidade pesidade
## (null) :17788 (null) :19429 (null) :19429 (null):19706 (null) :20141 (null) :20067 (null) :13621
## 9999 :13928 17 :16905 SC : 6931 0 :41448 2000-04-28: 669 2014-05-06: 698 28 : 2386
## 0010 : 3622 21 : 9229 MG : 6242 22 : 12 1900-01-01: 440 1900-01-01: 426 36 : 2362
## : 2796 24 : 6069 RJ : 4119 1999-09-03: 265 2014-08-13: 270 30 : 2356
## 0030 : 2598 22 : 2597 SP : 3950 2000-01-26: 245 2013-06-11: 220 31 : 2173
## 0015 : 2343 19 : 2375 RS : 3404 1990-08-21: 195 2012-09-12: 197 38 : 2101
## (Other):18091 (Other): 4562 (Other):17091 (Other) :39211 (Other) :39288 (Other):36167
## pesaltura pespeso pescicatriz pestatuagem pessinal peslesao pestcccodigo
## (null) :60585 (null) :60701 (null): 1749 (null): 1749 (null): 1749 (null): 1749 0 :58209
## 1.70 : 61 80 : 105 N :59415 N :59333 N :59406 N :59397 (null) : 1749
## 1.48 : 48 75 : 64 S : 2 S : 84 S : 11 S : 20 5 : 389
## 1.75 : 45 76 : 40 1 : 358
## 1.71 : 43 73 : 36 2 : 313
## 1.78 : 35 70 : 35 3 : 92
## (Other): 349 (Other): 185 (Other): 56
## pestctcodigo pestclcodigo pesoenid
## (null): 1749 (null): 1749 (null) :33186
## 0 :58277 0 :58400 0 :21466
## 1 : 12 1 : 57 633640 : 76
## 2 : 688 2 : 273 164135 : 74
## 3 : 17 3 : 488 62458 : 55
## 4 : 75 4 : 169 802731 : 55
## 5 : 348 5 : 30 (Other): 6254
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
unidade_operacional <- read.csv2("unidadeoperacional.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(unidade_operacional)
## uniid uniunidade unilotacao unisigla unittucodigo uniunidaderesponsavel
## 1 1 090000 0520 9ªSR/RS 4 111
## 2 2 091400 0565 9ªSR/RS 1 1
## 3 3 090100 0539 9ªSR/RS 1 1
## 4 4 090300 0543 9ªSR/RS 1 1
## 5 5 090200 0541 9ªSR/RS 1 1
## 6 6 090400 0545 9ªSR/RS 1 1
## unidenominacao uniendereco unimunicipio
## 1 9ª SUPERINTENDÊNCIA REGIONAL DE POLÍCIA RODOVIÁRIA FEDERAL Av. A. J. Renner, 2701 - Parque Humaitá 88013
## 2 DEL.14 - Delegacia de Sarandi Rodovia BR 386, Km 135 89036
## 3 DEL.01 - Delegacia de Porto Alegre Rodovia BR-116, KM 243,5 88773
## 4 DEL.03 - Delegacia de Osório Rodovia BR-101, km 94,3 87734
## 5 DEL.02 - Delegacia de Eldorado do Sul BR-290, Km 111 84239
## 6 DEL.04 - Delegacia de Lajeado Rodovia BR 386, Km 340 87297
## unicep unitelefone uniemail unilocal unilatitude unilongitude unihelicoptero
## 1 90250000 (51) 3375-9700 sup.rs@dprf.gov.br 6158 S 29G 58M W 51G 10M S
## 2 99560000 (54) 361-2100 del14.rs@dprf.gov.br 6620 -27.968028 -52.907778 N
## 3 93125340 (51) 568.2837 del01.rs@dprf.gov.br 6160 -29.736583 -51.150361 N
## 4 95520000 (51) 663-1035 del03.rs@dprf.gov.br 6162 -29.857528 -50.248083 N
## 5 92990000 (51) 3481 3286 del02.rs@dprf.gov.br 6163 -30.036361 -51.327972 N
## 6 95900000 (51) 3748-9605 del04.rs@dprf.gov.br 6162 -29.432222 -52.011611 N
## unitexto
## 1 Há uma área disponível para pouso de aeronaves.
## 2 Não há uma área apropriada para pouso de helicóptero.
## 3 Antiga quadra de esporte próxima a delegacia precisar de manunteção para pouso de aeronave.
## 4 Há uma área para pouso de aeronaves
## 5 Não tem uma área apropriada para pouso de aeronave é utilizada uma área com escanpado aberto do lado da delegacia.
## 6 Há uma área de pouso de aeronave mais sem sinalização
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
local_br <- read.csv2("localbr.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(local_br)
## lbrid lbruf lbrbr lbrkm lbrlatitude lbrlongitude lbrpnvid lbratualiza
## 1 6977 GO 153 5008 (null) (null) 1 S
## 2 6978 GO 060 1650 (null) (null) 1 S
## 3 6979 GO 060 1600 (null) (null) 1 S
## 4 6980 GO 060 2200 (null) (null) 1 S
## 5 6981 GO 153 4980 (null) (null) 1 S
## 6 6982 GO 153 4975 (null) (null) 1 S
summary(data.frame(lapply(local_br, as.factor)))
## lbrid lbruf lbrbr lbrkm lbrlatitude
## 3 : 1 MG : 64304 116 : 54642 0 : 1236 (null) :249888
## 5 : 1 : 49379 101 : 46583 10 : 467 : 69664
## 213 : 1 RS : 41115 153 : 24839 40 : 419 -22.8715590495 : 3014
## 6158 : 1 SC : 31668 364 : 19009 20 : 416 -18.4178690489999 : 2647
## 6159 : 1 PR : 29969 381 : 16796 30 : 412 -21.8711707994999 : 2223
## 6160 : 1 BA : 27514 262 : 16069 (Other):448855 -17.5204243864999 : 2175
## (Other):451806 (Other):207863 (Other):273874 NA's : 7 (Other) :122201
## lbrlongitude lbrpnvid lbratualiza
## (null) :249888 1 :205937 N: 14773
## : 69664 3671 : 711 S:437039
## -46.3591216409999 : 3014 2998 : 624
## -49.1944493939999 : 2647 4331 : 462
## -42.6684830604999 : 2223 3003 : 425
## -54.7398042344999 : 2175 2564 : 422
## (Other) :122201 (Other):243231
# View(local_br[local_br$lbrlatitude != '(null)',])
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
municipio <- read.csv2("municipio.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(municipio)
## tmucodigo tmudenominacao tmuuf
## 1 10502 ABADIA DE GOIAS GO
## 2 40010 ABADIA DOS DOURADOS MG
## 3 92010 ABADIANIA GO
## 4 40037 ABAETE MG
## 5 4014 ABAETETUBA PA
## 6 13013 ABAIARA CE
summary(data.frame(lapply(municipio, as.factor)))
## tmucodigo tmudenominacao tmuuf
## 19 : 1 BOM JESUS : 5 MG : 854
## 27 : 1 BONITO : 4 SP : 646
## 35 : 1 PLANALTO : 4 RS : 496
## 43 : 1 SANTA HELENA: 4 BA : 418
## 51 : 1 SANTA INES : 4 PR : 399
## 60 : 1 SANTA LUZIA : 4 SC : 293
## (Other):5563 (Other) :5544 (Other):2463
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
uf <- read.csv2("uf.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(uf)
## tufuf tufdenominacao
## 1 AC Acre
## 2 AL Alagoas
## 3 AM Amazonas
## 4 AP Amapá
## 5 BA Bahia
## 6 CE Ceará
summary(data.frame(lapply(uf, as.factor)))
## tufuf tufdenominacao
## AC : 1 Acre : 1
## AL : 1 Alagoas : 1
## AM : 1 Amapá : 1
## AP : 1 Amazonas: 1
## BA : 1 Bahia : 1
## CE : 1 Ceará : 1
## (Other):21 (Other) :21
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_unidade_operacional <- read.csv2("tipounidadeoperacional.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_unidade_operacional)
## ttucodigo ttudescricao ttuatualiza
## 1 1 Delegacia N
## 2 2 Departamento de Polícia Rodoviária Federal N
## 3 3 Distrito de Polícia Rodoviária Federal N
## 4 4 Superintendência de Polícia Rodoviária Federal N
## 5 5 Posto N
## 6 6 Viatura N
summary(data.frame(lapply(tipo_unidade_operacional, as.factor)))
## ttucodigo ttudescricao ttuatualiza
## 1 :1 Central de Informações Operacionais:1 N:15
## 2 :1 Coordenação :1
## 3 :1 Coordenação-Geral :1
## 4 :1 Corregedoria Regional :1
## 5 :1 Corregedoria-Geral :1
## 6 :1 Delegacia :1
## (Other):9 (Other) :9
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_ponto_medico <- read.csv2("tipopontomedico.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_ponto_medico)
## ttmcodigo ttmdescricao ttmatualiza
## 1 1 Farmácia N
## 2 2 Hospital N
## 3 3 Médico N
## 4 4 Parteira N
## 5 5 Posto de saúde N
## 6 6 Clínica N
summary(data.frame(lapply(tipo_ponto_medico, as.factor)))
## ttmcodigo ttmdescricao ttmatualiza
## 1:1 Clínica :1 N:7
## 2:1 Farmácia :1
## 3:1 Hospital :1
## 4:1 Médico :1
## 5:1 Parteira :1
## 6:1 Posto de saúde:1
## 7:1 Pronto-Socorro:1
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_comunicacao <- read.csv2("tipocomunicacao.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_comunicacao)
## tcocodigo tcodescricao tcoatualiza
## 1 1 Acidente N
## 2 6 Interdição de Rodovia N
## 3 15 Crime N
## 4 20 Informação N
summary(data.frame(lapply(tipo_comunicacao, as.factor)))
## tcocodigo tcodescricao tcoatualiza
## 1 :1 Acidente :1 N:4
## 6 :1 Crime :1
## 15:1 Informação :1
## 20:1 Interdição de Rodovia:1
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_apreensao <- read.csv2("tipoapreensao.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_apreensao)
## ttpcodigo ttpdescricao ttpatualiza
## 1 1 Contrabando/Descaminho N
## 2 2 Meio ambiente N
## 3 3 Documento N
## 4 4 Mercadoria N
## 5 5 Armas N
## 6 6 Munição N
summary(data.frame(lapply(tipo_apreensao, as.factor)))
## ttpcodigo ttpdescricao ttpatualiza
## 1:1 Armas :1 N:7
## 2:1 Contrabando/Descaminho:1
## 3:1 Documento :1
## 4:1 Drogas :1
## 5:1 Meio ambiente :1
## 6:1 Mercadoria :1
## 7:1 Munição :1
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_ponto_notavel <- read.csv2("tipopontonotavel.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_ponto_notavel)
## ttncodigo ttndescricao ttnatualiza
## 1 1 Escola N
## 2 10 Ponto relevante - linha férrea N
## 3 11 Ponto relevante - morro N
## 4 12 Ponto relevante - rio N
## 5 13 Ponto relevante - serra N
## 6 14 Ponto relevante - trevo N
summary(data.frame(lapply(tipo_ponto_notavel, as.factor)))
## ttncodigo ttndescricao ttnatualiza
## 1 : 1 Acampamentos : 1 N:23
## 2 : 1 Borracharia : 1 S: 2
## 3 : 1 Escola : 1
## 4 : 1 Fazenda e chácara: 1
## 5 : 1 Hotel e pousada : 1
## 6 : 1 Indústria : 1
## (Other):19 (Other) :19
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_obra <- read.csv2("tipoobra.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_obra)
## ttbcodigo ttbdescricao ttbatualiza
## 1 1 Passarela N
## 2 2 Ponte N
## 3 3 Pórtico N
## 4 4 Túnel N
## 5 5 Viaduto N
summary(data.frame(lapply(tipo_obra, as.factor)))
## ttbcodigo ttbdescricao ttbatualiza
## 1:1 Passarela:1 N:5
## 2:1 Ponte :1
## 3:1 Pórtico :1
## 4:1 Túnel :1
## 5:1 Viaduto :1
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_crime <- read.csv2("tipocrime.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_crime)
## ttccodigo ttcdescricao ttcatualiza
## 1 1 Contra a economia popular N
## 2 2 Contra a ordem tributária N
## 3 3 Contra a vida N
## 4 4 Contra as leis de trânsito N
## 5 5 Contra o meio ambiente N
## 6 6 Contra a criança e o adolescente N
summary(data.frame(lapply(tipo_crime, as.factor)))
## ttccodigo ttcdescricao ttcatualiza
## 1 :1 Contra a criança e o adolescente:1 N:11
## 2 :1 Contra a economia popular :1
## 3 :1 Contra a ordem tributária :1
## 4 :1 Contra a vida :1
## 5 :1 Contra as leis de trânsito :1
## 6 :1 Contra o meio ambiente :1
## (Other):5 (Other) :5
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_sinalizacao <- read.csv2("tiposinalizacao.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_sinalizacao)
## ttscodigo ttsdescricao ttsatualiza
## 1 1 Horizontal em bom estado N
## 2 2 Horizontal irregular N
## 3 3 Horizontal em más condições N
## 4 4 Vertical em bom estado N
## 5 5 Vertical irregular N
## 6 6 Vertical em más condições N
summary(data.frame(lapply(tipo_sinalizacao, as.factor)))
## ttscodigo ttsdescricao ttsatualiza
## 1:1 Horizontal em bom estado :1 N:7
## 2:1 Horizontal em más condições:1
## 3:1 Horizontal irregular :1
## 4:1 Não há :1
## 5:1 Vertical em bom estado :1
## 6:1 Vertical em más condições :1
## 7:1 Vertical irregular :1
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_detencao <- read.csv2("tipodetencao.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_detencao)
## ttdcodigo ttddescricao ttdatualiza ttdrelacidente
## 1 1 Assalto a ônibus N (null)
## 2 2 Encontro de cadáver N (null)
## 3 3 Homicídio N (null)
## 4 4 Tentativa de Homicídio N (null)
## 5 5 Assalto a veículos de carga N (null)
## 6 6 Tentativa de assalto N (null)
summary(data.frame(lapply(tipo_detencao, as.factor)))
## ttdcodigo ttddescricao ttdatualiza ttdrelacidente
## 1 :1 Tentativa de assalto :2 N:15 (null):15
## 2 :1 Assalto a ônibus :1
## 3 :1 Assalto a veículos de carga :1
## 4 :1 Contrabando :1
## 5 :1 Crimes contra o meio-ambiente:1
## 6 :1 Crimes contra o patrimônio :1
## (Other):9 (Other) :8
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_localidade <- read.csv2("tipolocalidade.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_localidade)
## ttlcodigo ttldescricao ttlatualiza
## 1 1 Comercial N
## 2 2 Escolar N
## 3 3 Industrial N
## 4 4 Não edificada N
## 5 5 Residencial N
## 6 6 Lazer N
summary(data.frame(lapply(tipo_localidade, as.factor)))
## ttlcodigo ttldescricao ttlatualiza
## 1:1 Comercial :1 N:6
## 2:1 Escolar :1
## 3:1 Industrial :1
## 4:1 Lazer :1
## 5:1 Não edificada:1
## 6:1 Residencial :1
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_receptor <- read.csv2("tiporeceptor.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_receptor)
## ttrcodigo ttrdescricao ttratualiza ttrdelegacia
## 1 1 Clínica psiquiátrica N (null)
## 2 2 Corpo de Bombeiros N (null)
## 3 3 Detentor do documento N (null)
## 4 4 Detran N (null)
## 5 5 Funai N (null)
## 6 6 Hospital N (null)
summary(data.frame(lapply(tipo_receptor, as.factor)))
## ttrcodigo ttrdescricao ttratualiza ttrdelegacia
## 1 : 1 Bombeiro Voluntário : 1 N:19 (null):19
## 2 : 1 Clínica psiquiátrica: 1 S: 8 N : 8
## 3 : 1 Condutor Habilitado : 1
## 4 : 1 Conselho Tutelar : 1
## 5 : 1 Corpo de Bombeiros : 1
## 6 : 1 Depósito Credenciado: 1
## (Other):21 (Other) :21
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_documento <- read.csv2("tipodocumento.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_documento)
## ttocodigo ttodescricao ttoatualiza ttorelapreensao ttorelrecuperacao
## 1 1 Cartão de crédito bancário N (null) (null)
## 2 2 Carteira de saúde N (null) (null)
## 3 3 Cédula falsificada N (null) (null)
## 4 4 Certidão de casamento N (null) (null)
## 5 5 Certidão de nascimento N (null) (null)
## 6 6 CNH N (null) (null)
summary(data.frame(lapply(tipo_documento, as.factor)))
## ttocodigo ttodescricao ttoatualiza ttorelapreensao ttorelrecuperacao
## 1 : 1 AET : 1 N:17 (null):17 (null):17
## 2 : 1 Cartão de crédito bancário : 1
## 3 : 1 Carteira de Motorista de Escolta: 1
## 4 : 1 Carteira de saúde : 1
## 5 : 1 Carteira funcional : 1
## 6 : 1 Cédula falsificada : 1
## (Other):11 (Other) :11
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
tipo_acidente <- read.csv2("tipoacidente.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(tipo_acidente)
## ttacodigo ttadescricao ttaatualiza ttarelacidente ttaativo
## 1 1 Atropelamento de animal N (null) S
## 2 12 Saída de Pista N (null) S
## 3 11 Tombamento N (null) S
## 4 2 Atropelamento de pessoa N (null) S
## 5 3 Capotamento N (null) S
## 6 4 Colisão com bicicleta N (null) S
summary(data.frame(lapply(tipo_acidente, as.factor)))
## ttacodigo ttadescricao ttaatualiza ttarelacidente ttaativo
## 1 : 1 Atropelamento de animal : 1 N:17 (null):17 N: 1
## 2 : 1 Atropelamento de pessoa : 1 S:16
## 3 : 1 Capotamento : 1
## 4 : 1 Colisão com bicicleta : 1
## 5 : 1 Colisão com objeto fixo : 1
## 6 : 1 Colisão com objeto móvel: 1
## (Other):11 (Other) :11
setwd("~/Dropbox/Academia/dados_mj/ocorencias/BRBRASIL/dominios")
estado_fisico <- read.csv2("estadofisico.csv", head = TRUE, sep = ";", row.names = NULL, fileEncoding = "latin1") # entradas duplicadas
head(estado_fisico)
## esid estadofisico
## 1 (null) null
## 2 0 Desconhecido
## 3 1 Ileso
## 4 2 Lesoes Leves
## 5 3 Lesoes Graves
## 6 4 Morto
summary(data.frame(lapply(estado_fisico, as.factor)))
## esid estadofisico
## (null):1 Desconhecido :1
## 0 :1 Ignorado :1
## 1 :1 Ileso :1
## 2 :1 Lesoes Graves:1
## 3 :1 Lesoes Leves :1
## 4 :1 Morto :1
## 5 :1 null :1