Los datos que vamos a analizar provienen del VI Censo Nacional de Comisarías realizado en el año 2017 por el Instituto Nacional de Estadística e Informática. El objetivo primordial de dicho censo fue conocer mejor la infraestructura y equipamiento con el que cuentan los locales donde funcionan las Comisarías de la Policía Nacional del Perú. Entre las principales características a evaluar fueron:
Pueden conocer más sobre el ánalisis final de este censo en la publicación oficial del INEI: PERÚ: VI CENSO NACIONAL DE COMISARÍAS 2017, Resultados Definitivos.
El archivo con la información descargada del INEI se encuentra en la carpeta datos y tiene por nombre CensoComisarias.sav. El formato de este archivo corresponde a bases de datos registradas en el software SPSS, por lo que, se debe importar al R haciendo uso del paquete foreign.
# install.packages("foreign")
library(foreign)
datos <- read.spss("D:/UNI/Materiales_Compartido/datos/Cap_100_Infraestructura 2017.sav", to.data.frame=TRUE)
head(datos)
Veamos cuanta información tenemos,
dim(datos)
## [1] 1495 280
Existen 1495 registros y 280 variables.
Ahora, veamos un pequeño extracto de los datos.
datos[1:5, 4:6]
knitr::kable(datos[1:5, 4:6])
| NOMBREDI | INF109 | INF109A |
|---|---|---|
| RUPA-RUPA | De 40001 - 80000 Hab | Distrital |
| MARIANO DAMASO BERAUN | De 5000 - 10000 Hab | Distrital |
| JOSE CRESPO Y CASTILLO | De 20001 - 40000 Hab | Distrital |
| TOCACHE | De 5000 - 10000 Hab | Provincial |
| NUEVO PROGRESO | De 5000 - 10000 Hab | Distrital |
cuadro1 <- as.data.frame(table(datos$INF109))
cuadro2 <- as.data.frame(prop.table(table(datos$INF109)))
names(cuadro1) <- c("Categoría", "Frecuencia")
cuadro1$Porcentaje <- cuadro2$Freq
knitr::kable(cuadro1)
| Categoría | Frecuencia | Porcentaje |
|---|---|---|
| Menos de 5000 Hab | 288 | 0.1926421 |
| De 5000 - 10000 Hab | 329 | 0.2200669 |
| De 10001 - 20000 Hab | 290 | 0.1939799 |
| De 20001 - 40000 Hab | 248 | 0.1658863 |
| De 40001 - 80000 Hab | 196 | 0.1311037 |
| De 80001 a más Hab | 144 | 0.0963211 |
library(ggplot2)
alc <-
ggplot(datos, mapping = aes(x = INF109)) +
geom_bar() +
xlab("Habitantes") + ylab("Frecuencia") +
theme(axis.text.x = element_text(angle = 12));alc
Alcance de Jurisdicción de las Comisarías
knitr::kable(table(datos$INF109A), col.names = c("Categoría", "Frecuencia"))
| Categoría | Frecuencia |
|---|---|
| Nacional | 2 |
| Regional | 29 |
| Provincial | 139 |
| Distrital | 1241 |
| Otros | 84 |
library(ggplot2)
tip <-
ggplot(datos, mapping = aes(x = INF109A)) +
geom_bar(color = "black", fill = "red", alpha = 0.6) +
xlab("") + ylab("Frecuencia");tip
Tipo de Jurisdicción de las Comisarías
summarytools::ctable(x = datos$INF109, y = datos$INF109A,prop = "r")
## Cross-Tabulation, Row Proportions
## INF109 * INF109A
## Data Frame: datos
##
## ---------------------- --------- ---------- ----------- ------------- -------------- ------------ ---------------
## INF109A Nacional Regional Provincial Distrital Otros Total
## INF109
## Menos de 5000 Hab 0 (0.0%) 5 (1.7%) 9 ( 3.1%) 245 (85.1%) 29 (10.1%) 288 (100.0%)
## De 5000 - 10000 Hab 1 (0.3%) 3 (0.9%) 18 ( 5.5%) 283 (86.0%) 24 ( 7.3%) 329 (100.0%)
## De 10001 - 20000 Hab 0 (0.0%) 5 (1.7%) 34 (11.7%) 231 (79.7%) 20 ( 6.9%) 290 (100.0%)
## De 20001 - 40000 Hab 0 (0.0%) 3 (1.2%) 27 (10.9%) 212 (85.5%) 6 ( 2.4%) 248 (100.0%)
## De 40001 - 80000 Hab 0 (0.0%) 3 (1.5%) 25 (12.8%) 166 (84.7%) 2 ( 1.0%) 196 (100.0%)
## De 80001 a más Hab 1 (0.7%) 10 (6.9%) 26 (18.1%) 104 (72.2%) 3 ( 2.1%) 144 (100.0%)
## Total 2 (0.1%) 29 (1.9%) 139 ( 9.3%) 1241 (83.0%) 84 ( 5.6%) 1495 (100.0%)
## ---------------------- --------- ---------- ----------- ------------- -------------- ------------ ---------------
Estos gráficos fueron elaborados con el paquete ggplot2 desarrollado por @Wickham2009. Además, el reporte fue generado usando rmarkdown. Pueden aprender más en el libro de @Xie2018.