1 Introducción

Los datos que vamos a analizar provienen del VI Censo Nacional de Comisarías realizado en el año 2017 por el Instituto Nacional de Estadística e Informática. El objetivo primordial de dicho censo fue conocer mejor la infraestructura y equipamiento con el que cuentan los locales donde funcionan las Comisarías de la Policía Nacional del Perú. Entre las principales características a evaluar fueron:

  • Ámbito jurisdiccional de la comisaría
  • Número de policías asignados
  • Labor de cada policiía asignado
  • Accesorios de trabajo
  • Planes operativos y de emergencia

Pueden conocer más sobre el ánalisis final de este censo en la publicación oficial del INEI: PERÚ: VI CENSO NACIONAL DE COMISARÍAS 2017, Resultados Definitivos.

2 Análisis Descriptivo

En este análisis se explora la data sobre comisarias.

2.1 Lectura de Datos

El archivo con la información descargada del INEI se encuentra en la carpeta datos y tiene por nombre CensoComisarias.sav. El formato de este archivo corresponde a bases de datos registradas en el software SPSS, por lo que, se debe importar al R haciendo uso del paquete foreign.

# install.packages("foreign") 
library(foreign) 
datos <-  read.spss("https://pebiba-taller-rmd.netlify.app/datos/Cap_100_Infraestructura%202017.sav", to.data.frame=TRUE)

Veamos la data.

library(DT)
## Warning: package 'DT' was built under R version 4.0.5
datatable(datos)
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html
knitr::kable(cars)
speed dist
4 2
4 10
7 4
7 22
8 16
9 10
10 18
10 26
10 34
11 17
11 28
12 14
12 20
12 24
12 28
13 26
13 34
13 34
13 46
14 26
14 36
14 60
14 80
15 20
15 26
15 54
16 32
16 40
17 32
17 40
17 50
18 42
18 56
18 76
18 84
19 36
19 46
19 68
20 32
20 48
20 52
20 56
20 64
22 66
23 54
24 70
24 92
24 93
24 120
25 85

Veamos cuanta información tenemos,

dim(datos)
## [1] 1495  280

Existen 1495 registros y 280 variables.

Ahora, veamos un pequeño extracto de los datos.

datos[1:5, 4:6]
##                               NOMBREDI               INF109    INF109A
## 1 RUPA-RUPA                            De 40001 - 80000 Hab  Distrital
## 2 MARIANO DAMASO BERAUN                 De 5000 - 10000 Hab  Distrital
## 3 JOSE CRESPO Y CASTILLO               De 20001 - 40000 Hab  Distrital
## 4 TOCACHE                               De 5000 - 10000 Hab Provincial
## 5 NUEVO PROGRESO                        De 5000 - 10000 Hab  Distrital
knitr::kable(datos[1:5, 4:6])
NOMBREDI INF109 INF109A
RUPA-RUPA De 40001 - 80000 Hab Distrital
MARIANO DAMASO BERAUN De 5000 - 10000 Hab Distrital
JOSE CRESPO Y CASTILLO De 20001 - 40000 Hab Distrital
TOCACHE De 5000 - 10000 Hab Provincial
NUEVO PROGRESO De 5000 - 10000 Hab Distrital

2.2 Jurisdicción

2.2.1 Alcance de Jurisdicción

cuadro1 <- as.data.frame(table(datos$INF109))
cuadro2 <- as.data.frame(prop.table(table(datos$INF109)))
names(cuadro1) <- c("Categoría", "Frecuencia")
cuadro1$Porcentaje <- cuadro2$Freq
knitr::kable(cuadro1)
Categoría Frecuencia Porcentaje
Menos de 5000 Hab 288 0.1926421
De 5000 - 10000 Hab 329 0.2200669
De 10001 - 20000 Hab 290 0.1939799
De 20001 - 40000 Hab 248 0.1658863
De 40001 - 80000 Hab 196 0.1311037
De 80001 a más Hab 144 0.0963211
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.5
ggplot(datos, mapping = aes(x = INF109)) +
  geom_bar() +
  xlab("Habitantes") + ylab("Frecuencia") +
  theme(axis.text.x = element_text(angle = 12))
Alcance de Jurisdicción de las Comisarías

Alcance de Jurisdicción de las Comisarías

2.2.2 Tipo de Jurisdicción

knitr::kable(table(datos$INF109A), col.names = c("Categoría", "Frecuencia"))
Categoría Frecuencia
Nacional 2
Regional 29
Provincial 139
Distrital 1241
Otros 84
library(ggplot2)
ggplot(datos, mapping = aes(x = INF109A)) +
  geom_bar(color = "black", fill = "red", alpha = 0.6) +
  xlab("") + ylab("Frecuencia")
Tipo de Jurisdicción de las Comisarías

Tipo de Jurisdicción de las Comisarías

Estos gráficos fueron elaborados con el paquete ggplot2 desarrollado por @Wickham2009. Además, el reporte fue generado usando rmarkdown. Pueden aprender más en el libro de @Xie2018.

3 Conclusiones