Introducción

Los datos que vamos a analizar provienen del VI Censo Nacional de Comisarías realizado en el año 2017 por el Instituto Nacional de Estadística e Informática. El objetivo primordial de dicho censo fue conocer mejor la infraestructura y equipamiento con el que cuentan los locales donde funcionan las Comisarías de la Policía Nacional del Perú. Entre las principales características a evaluar fueron:

Pueden conocer más sobre el ánalisis final de este censo en la publicación oficial del INEI: PERÚ: VI CENSO NACIONAL DE COMISARÍAS 2017, Resultados Definitivos.

Análisis Descriptivo

Lectura de Datos

El archivo con la información descargada del INEI se encuentra en la carpeta datos y tiene por nombre CensoComisarias.sav. El formato de este archivo corresponde a bases de datos registradas en el software SPSS, por lo que, se debe importar al R haciendo uso del paquete foreign.

# install.packages("foreign") 
library(foreign) 
datos <-  read.spss("D:/UNI/Materiales_Compartido/datos/Cap_100_Infraestructura 2017.sav", to.data.frame=TRUE)
head(datos)

Veamos cuanta información tenemos,

dim(datos)
## [1] 1495  280

Existen 1495 registros y 280 variables.

Ahora, veamos un pequeño extracto de los datos.

datos[1:5, 4:6]
knitr::kable(datos[1:5, 4:6])
NOMBREDI INF109 INF109A
RUPA-RUPA De 40001 - 80000 Hab Distrital
MARIANO DAMASO BERAUN De 5000 - 10000 Hab Distrital
JOSE CRESPO Y CASTILLO De 20001 - 40000 Hab Distrital
TOCACHE De 5000 - 10000 Hab Provincial
NUEVO PROGRESO De 5000 - 10000 Hab Distrital

Jurisdicción

Alcance de Jurisdicción

cuadro1 <- as.data.frame(table(datos$INF109))
cuadro2 <- as.data.frame(prop.table(table(datos$INF109)))
names(cuadro1) <- c("Categoría", "Frecuencia")
cuadro1$Porcentaje <- cuadro2$Freq
knitr::kable(cuadro1)
Categoría Frecuencia Porcentaje
Menos de 5000 Hab 288 0.1926421
De 5000 - 10000 Hab 329 0.2200669
De 10001 - 20000 Hab 290 0.1939799
De 20001 - 40000 Hab 248 0.1658863
De 40001 - 80000 Hab 196 0.1311037
De 80001 a más Hab 144 0.0963211
library(ggplot2)

alc <- 
  ggplot(datos, mapping = aes(x = INF109)) +
  geom_bar() +
  xlab("Habitantes") + ylab("Frecuencia") +
  theme(axis.text.x = element_text(angle = 12));alc
Alcance de Jurisdicción de las Comisarías

Alcance de Jurisdicción de las Comisarías

Tipo de Jurisdicción

knitr::kable(table(datos$INF109A), col.names = c("Categoría", "Frecuencia"))
Categoría Frecuencia
Nacional 2
Regional 29
Provincial 139
Distrital 1241
Otros 84
library(ggplot2)
tip <- 
  ggplot(datos, mapping = aes(x = INF109A)) +
  geom_bar(color = "black", fill = "red", alpha = 0.6) +
  xlab("") + ylab("Frecuencia");tip
Tipo de Jurisdicción de las Comisarías

Tipo de Jurisdicción de las Comisarías

Tipo y alcance de jurisdicción

summarytools::ctable(x = datos$INF109, y = datos$INF109A,prop = "r")
## Cross-Tabulation, Row Proportions  
## INF109 * INF109A  
## Data Frame: datos  
## 
## ---------------------- --------- ---------- ----------- ------------- -------------- ------------ ---------------
##                          INF109A   Nacional    Regional    Provincial      Distrital        Otros           Total
##                 INF109                                                                                           
##      Menos de 5000 Hab             0 (0.0%)    5 (1.7%)     9 ( 3.1%)    245 (85.1%)   29 (10.1%)    288 (100.0%)
##    De 5000 - 10000 Hab             1 (0.3%)    3 (0.9%)    18 ( 5.5%)    283 (86.0%)   24 ( 7.3%)    329 (100.0%)
##   De 10001 - 20000 Hab             0 (0.0%)    5 (1.7%)    34 (11.7%)    231 (79.7%)   20 ( 6.9%)    290 (100.0%)
##   De 20001 - 40000 Hab             0 (0.0%)    3 (1.2%)    27 (10.9%)    212 (85.5%)    6 ( 2.4%)    248 (100.0%)
##   De 40001 - 80000 Hab             0 (0.0%)    3 (1.5%)    25 (12.8%)    166 (84.7%)    2 ( 1.0%)    196 (100.0%)
##     De 80001 a más Hab             1 (0.7%)   10 (6.9%)    26 (18.1%)    104 (72.2%)    3 ( 2.1%)    144 (100.0%)
##                  Total             2 (0.1%)   29 (1.9%)   139 ( 9.3%)   1241 (83.0%)   84 ( 5.6%)   1495 (100.0%)
## ---------------------- --------- ---------- ----------- ------------- -------------- ------------ ---------------

Estos gráficos fueron elaborados con el paquete ggplot2 desarrollado por @Wickham2009. Además, el reporte fue generado usando rmarkdown. Pueden aprender más en el libro de @Xie2018.