library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ ggplot2 3.3.3 ✓ purrr 0.3.4
## ✓ tibble 3.1.1 ✓ dplyr 1.0.7
## ✓ tidyr 1.1.3 ✓ stringr 1.4.0
## ✓ readr 1.4.0 ✓ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
censo2017 <- read_csv("censo2017_cap200.csv.csv")
##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## .default = col_character(),
## area_terreno_m2 = col_double(),
## area_ocupada_m2 = col_double(),
## area_disponible_m2 = col_double(),
## area_techada_m2 = col_double(),
## antiguedad_anios = col_double()
## )
## ℹ Use `spec()` for the full column specifications.
censo2017
## # A tibble: 1,495 x 24
## id ubigeo region provincia distrito area_terreno_m2 area_ocupada_m2
## <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 0001 100601 HUÁNUCO LEONCIO P… RUPA-RUPA 1250 327
## 2 0002 100606 HUÁNUCO LEONCIO P… MARÍANO DÁM… 197 197
## 3 0003 100604 HUÁNUCO LEONCIO P… JOSÉ CRESPO… 1227 627
## 4 0004 221001 SAN MAR… TOCACHE TOCACHE 541 157
## 5 0005 221002 SAN MAR… TOCACHE NUEVO PROGR… 506 426
## 6 0006 221005 SAN MAR… TOCACHE UCHIZA 2608 270
## 7 0007 250301 UCAYALI PADRE ABAD PADRE ABAD 960 960
## 8 0008 250305 UCAYALI PADRE ABAD ALEXANDER V… 840 325
## 9 0009 250302 UCAYALI PADRE ABAD IRAZOLA 800 585
## 10 0010 200101 PIURA PIURA PIURA 2826 740
## # … with 1,485 more rows, and 17 more variables: area_disponible_m2 <dbl>,
## # area_techada_m2 <dbl>, antiguedad_anios <dbl>, tiene_planos <chr>,
## # planos_actualizados <chr>, material_predom_paredes <chr>,
## # estado_conserv_paredes <chr>, material_predom_pisos <chr>,
## # estado_conserv_pisos <chr>, material_predom_techo <chr>,
## # estado_conserv_techo <chr>, electricidad_7_dias <chr>,
## # electricidad_con <chr>, agua_procedencia <chr>, agua_potable <chr>,
## # agua_7_dias <chr>, banio_coneccion <chr>
Ejercicio 1: Lima Responder las siguientes preguntas:
¿Cuántas comisarías tiene Lima Metropolitana? ¿Cuáles son los distritos de Lima Metropolitana con mayor número de comisarías? Top 10 Pista: Usa filter(), summarise(), group_by() y arrange().
filter(censo2017, provincia == "LIMA")
## # A tibble: 126 x 24
## id ubigeo region provincia distrito area_terreno_m2 area_ocupada_m2
## <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 0405 150101 LIMA LIMA LIMA 1234 1234
## 2 0406 150101 LIMA LIMA LIMA 444 444
## 3 0407 150101 LIMA LIMA LIMA 719 719
## 4 0408 150101 LIMA LIMA LIMA 250 250
## 5 0409 150101 LIMA LIMA LIMA 706 706
## 6 0410 150101 LIMA LIMA LIMA 1410 1410
## 7 0411 150101 LIMA LIMA LIMA 846 846
## 8 0412 150101 LIMA LIMA LIMA 640 640
## 9 0413 150101 LIMA LIMA LIMA 3058 1600
## 10 0414 150101 LIMA LIMA LIMA 1343 681
## # … with 116 more rows, and 17 more variables: area_disponible_m2 <dbl>,
## # area_techada_m2 <dbl>, antiguedad_anios <dbl>, tiene_planos <chr>,
## # planos_actualizados <chr>, material_predom_paredes <chr>,
## # estado_conserv_paredes <chr>, material_predom_pisos <chr>,
## # estado_conserv_pisos <chr>, material_predom_techo <chr>,
## # estado_conserv_techo <chr>, electricidad_7_dias <chr>,
## # electricidad_con <chr>, agua_procedencia <chr>, agua_potable <chr>,
## # agua_7_dias <chr>, banio_coneccion <chr>
¿Cuántas comisarías tiene Lima Metropolitana? Hay 126 comisarías en Lima Metropolitana
Operdor pipe: control shift M
filter(censo2017, provincia == "LIMA") %>%
group_by(provincia, distrito) %>%
summarise(comisaria = n()) %>%
ungroup() %>%
arrange(desc(comisaria))
## `summarise()` has grouped output by 'provincia'. You can override using the `.groups` argument.
## # A tibble: 43 x 3
## provincia distrito comisaria
## <chr> <chr> <int>
## 1 LIMA LIMA 13
## 2 LIMA SAN JUAN DE LURIGANCHO 10
## 3 LIMA COMAS 6
## 4 LIMA EL AGUSTINO 6
## 5 LIMA RÍMAC 6
## 6 LIMA VILLA MARÍA DEL TRIUNFO 6
## 7 LIMA SAN JUAN DE MIRAFLORES 5
## 8 LIMA ATE 4
## 9 LIMA CHORRILLOS 4
## 10 LIMA INDEPENDENCIA 4
## # … with 33 more rows
Ejercicio 2: Costa Norte Consideremos que en la Costa Norte están las regiones de La Libertad, Lambayeque, Piura y Tumbes.
Responder las siguientes preguntas:
¿Cuántas comisarías tiene la Costa Norte? ¿Cuáles son los distritos de la Costa Norte con mayor número de comisarías? Top 10 Pista: Usa filter(), summarise(), group_by() y arrange().
filter(censo2017, region %in% c("LA LIBERTAD", "TUMBES", "PIURA", "LAMBAYEQUE"))
## # A tibble: 248 x 24
## id ubigeo region provincia distrito area_terreno_m2 area_ocupada_m2
## <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 0010 200101 PIURA PIURA PIURA 2826 740
## 2 0011 200115 PIURA PIURA VEINTISÉIS DE … 1600 700
## 3 0012 200104 PIURA PIURA CASTILLA 1238 1238
## 4 0013 200104 PIURA PIURA CASTILLA 1716 1716
## 5 0014 200104 PIURA PIURA CASTILLA 420 420
## 6 0015 200104 PIURA PIURA CASTILLA 24 24
## 7 0016 200101 PIURA PIURA PIURA 4011 650
## 8 0017 200105 PIURA PIURA CATACAOS 280 180
## 9 0018 200105 PIURA PIURA CATACAOS 2421 1421
## 10 0019 200107 PIURA PIURA CURA MORI 180 180
## # … with 238 more rows, and 17 more variables: area_disponible_m2 <dbl>,
## # area_techada_m2 <dbl>, antiguedad_anios <dbl>, tiene_planos <chr>,
## # planos_actualizados <chr>, material_predom_paredes <chr>,
## # estado_conserv_paredes <chr>, material_predom_pisos <chr>,
## # estado_conserv_pisos <chr>, material_predom_techo <chr>,
## # estado_conserv_techo <chr>, electricidad_7_dias <chr>,
## # electricidad_con <chr>, agua_procedencia <chr>, agua_potable <chr>,
## # agua_7_dias <chr>, banio_coneccion <chr>
¿Cuántas comisarías tiene la Costa Norte? 248 comisarías tiene la Costa Norte que incluye La Libertad, Tumbes, Piura y Lambayeque
¿Cuáles son los distritos de la Costa Norte con mayor número de comisarías? Top 10 Pista: Usa filter(), summarise(), group_by() y arrange().
censo2017 %>%
filter(region %in% c("LA LIBERTAD", "TUMBES", "PIURA", "LAMBAYEQUE")) %>%
group_by(provincia, distrito) %>%
summarise(comisaria = n()) %>%
ungroup() %>%
arrange(desc(comisaria))
## `summarise()` has grouped output by 'provincia'. You can override using the `.groups` argument.
## # A tibble: 164 x 3
## provincia distrito comisaria
## <chr> <chr> <int>
## 1 CHICLAYO CHICLAYO 7
## 2 TRUJILLO TRUJILLO 6
## 3 MORROPON CHULUCANAS 5
## 4 TUMBES TUMBES 5
## 5 PIURA CASTILLA 4
## 6 PIURA PIURA 4
## 7 ASCOPE CHICAMA 3
## 8 GRAN CHIMÚ CASCAS 3
## 9 LAMBAYEQUE MORROPE 3
## 10 PACASMAYO GUADALUPE 3
## # … with 154 more rows
Ejercicio 3: Toda la Costa
Consideremos que la costa peruana se divide así:
Norte: La Libertad, Lambayeque, Piura, Tumbes Centro: Ancash, Lima, Ica Sur: Arequipa, Moquegua, Tacna
Responder las siguientes preguntas:
¿Cuántas comisarías tiene cada sección de la costa peruana? ¿Cuáles son las provincias de la costa peruana con mayor número de comisarías? Top 10 Pista: Usa mutate(), filter(), summarise(), group_by(), y arrange().
censo2017 %>%
select(region) %>%
mutate(comi_recat = case_when(
region %in% c("LA LIBERTAD", "TUMBES", "PIURA", "LAMBAYEQUE") ~ "Norte",
region %in% c("ANCASH", "LIMA", "ICA") ~ "Centro",
region %in% c("AREQUIPA", "MOQUEGUA", "TACNA") ~ "Sur",
TRUE ~ "otro")) %>%
group_by(comi_recat) %>%
summarise(comisarias_regiones = n()) %>%
ungroup() %>%
arrange(desc(comisarias_regiones))
## # A tibble: 4 x 2
## comi_recat comisarias_regiones
## <chr> <int>
## 1 otro 851
## 2 Norte 248
## 3 Centro 224
## 4 Sur 172
¿Cuántas comisarías tiene cada sección de la costa peruana? Norte (851), Centro (224), Sur (172)
¿Cuáles son las provincias de la costa peruana con mayor número de comisarías? Top 10
censo2017 %>%
select(region, provincia) %>%
mutate(comi_recat = case_when(
region %in% c("LA LIBERTAD", "TUMBES", "PIURA", "LAMBAYEQUE") ~ "Norte",
region %in% c("ANCASH", "LIMA", "ICA") ~ "Centro",
region %in% c("AREQUIPA", "MOQUEGUA", "TACNA") ~ "Sur",
TRUE ~ "otro")) %>%
group_by(provincia, comi_recat) %>%
filter(comi_recat != "otro") %>%
summarise(comisarias_regiones = n()) %>%
ungroup() %>%
arrange(desc(comisarias_regiones))
## `summarise()` has grouped output by 'provincia'. You can override using the `.groups` argument.
## # A tibble: 56 x 3
## provincia comi_recat comisarias_regiones
## <chr> <chr> <int>
## 1 LIMA Centro 126
## 2 AREQUIPA Sur 58
## 3 CHICLAYO Norte 32
## 4 TRUJILLO Norte 22
## 5 PIURA Norte 21
## 6 TACNA Sur 18
## 7 CAÑETE Centro 17
## 8 ICA Centro 16
## 9 LAMBAYEQUE Norte 16
## 10 MORROPON Norte 16
## # … with 46 more rows
Ejercicio 4: Todo el Perú Responder las siguientes preguntas:
¿Cuáles son las regiones con mayor número de comisarías? Top 10 ¿Cuáles son las provincias con mayor número de comisarías? Top 10 ¿Cuáles son los distritos con mayor número de comisarías? Top 10
¿Cuáles son las regiones con mayor número de comisarías? Top 10 – Lima, Cajamarca, Arequipa y Cusco
censo2017 %>%
select(region) %>%
group_by(region) %>%
summarise(comisarias_regiones = n()) %>%
arrange(desc(comisarias_regiones))
## # A tibble: 25 x 2
## region comisarias_regiones
## <chr> <int>
## 1 LIMA 183
## 2 CAJAMARCA 128
## 3 AREQUIPA 115
## 4 CUSCO 101
## 5 PIURA 89
## 6 LA LIBERTAD 87
## 7 ÁNCASH 84
## 8 PUNO 68
## 9 AMAZONAS 54
## 10 APURÍMAC 54
## # … with 15 more rows
¿Cuáles son las provincias con mayor número de comisarías? Top 10
censo2017 %>%
select(provincia) %>%
group_by(provincia) %>%
summarise(comisarias_provincia = n()) %>%
arrange(desc(comisarias_provincia))
## # A tibble: 196 x 2
## provincia comisarias_provincia
## <chr> <int>
## 1 LIMA 126
## 2 AREQUIPA 58
## 3 CHICLAYO 32
## 4 CALLAO 23
## 5 TRUJILLO 22
## 6 LA CONVENCIÓN 21
## 7 PIURA 21
## 8 SANTA 21
## 9 MAYNAS 19
## 10 TACNA 18
## # … with 186 more rows
¿Cuáles son los distritos con mayor número de comisarías? Top 10 Callao, Lima, San Juan de Lurigancho
censo2017 %>%
group_by(distrito,region,provincia) %>%
summarise(comisarias_distrito= n()) %>%
ungroup() %>%
arrange(desc(comisarias_distrito))
## `summarise()` has grouped output by 'distrito', 'region'. You can override using the `.groups` argument.
## # A tibble: 1,056 x 4
## distrito region provincia comisarias_distrito
## <chr> <chr> <chr> <int>
## 1 CALLAO CALLAO CALLAO 13
## 2 LIMA LIMA LIMA 13
## 3 SAN JUAN DE LURIGANCHO LIMA LIMA 10
## 4 TACNA TACNA TACNA 9
## 5 CHIMBOTE ÁNCASH SANTA 8
## 6 CHICLAYO LAMBAYEQUE CHICLAYO 7
## 7 COMAS LIMA LIMA 6
## 8 EL AGUSTINO LIMA LIMA 6
## 9 PAUCARPATA AREQUIPA AREQUIPA 6
## 10 PUNO PUNO PUNO 6
## # … with 1,046 more rows
Ejercicio 5: Area ocupada en Madre de Dios ¿Cuál es el porcentaje de área ocupada por comisaría en Madre de Dios? Puedes calcular el porcentaje así:
%areaocupada=areaocupadaareaterreno×100 Pista: Usa filter() y mutate()
Ejercicio 6: Area ocupada en la costa ¿Cuál es el promedio del porcentaje de área ocupada por comisaría en la costa peruana? Divídelo en Norte, Centro y Sur Pista: Usa filter(), mutate(), group_by() y summarise()
Ejercicio 7: Area ocupada en todo el Perú ¿Cuáles son las regiones con menor promedio de porcentaje de área ocupada por comisaría en el país? ¿Cuáles son las provincias con menor promedio de porcentaje de área ocupada por comisaría en el país? ¿Cuáles son los distritos con menor promedio de porcentaje de área ocupada por comisaría en el país? Pista: Usa filter(), mutate(), group_by() y summarise()
Ejercicio 8: Area techada en todo el Perú ¿Cuáles son las regiones con mayor mediana de porcentaje de área techada por comisaría en el país? ¿Cuáles son las provincias con mayor mediana de porcentaje de área techada por comisaría en el país? ¿Cuáles son los distritos con mayor mediana de porcentaje de área techada por comisaría en el país?