library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ ggplot2 3.3.3     ✓ purrr   0.3.4
## ✓ tibble  3.1.1     ✓ dplyr   1.0.7
## ✓ tidyr   1.1.3     ✓ stringr 1.4.0
## ✓ readr   1.4.0     ✓ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Cargando data

censo2017 <- read_csv("censo2017_cap200.csv.csv")
## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   .default = col_character(),
##   area_terreno_m2 = col_double(),
##   area_ocupada_m2 = col_double(),
##   area_disponible_m2 = col_double(),
##   area_techada_m2 = col_double(),
##   antiguedad_anios = col_double()
## )
## ℹ Use `spec()` for the full column specifications.
censo2017
## # A tibble: 1,495 x 24
##    id    ubigeo region   provincia  distrito     area_terreno_m2 area_ocupada_m2
##    <chr> <chr>  <chr>    <chr>      <chr>                  <dbl>           <dbl>
##  1 0001  100601 HUÁNUCO  LEONCIO P… RUPA-RUPA               1250             327
##  2 0002  100606 HUÁNUCO  LEONCIO P… MARÍANO DÁM…             197             197
##  3 0003  100604 HUÁNUCO  LEONCIO P… JOSÉ CRESPO…            1227             627
##  4 0004  221001 SAN MAR… TOCACHE    TOCACHE                  541             157
##  5 0005  221002 SAN MAR… TOCACHE    NUEVO PROGR…             506             426
##  6 0006  221005 SAN MAR… TOCACHE    UCHIZA                  2608             270
##  7 0007  250301 UCAYALI  PADRE ABAD PADRE ABAD               960             960
##  8 0008  250305 UCAYALI  PADRE ABAD ALEXANDER V…             840             325
##  9 0009  250302 UCAYALI  PADRE ABAD IRAZOLA                  800             585
## 10 0010  200101 PIURA    PIURA      PIURA                   2826             740
## # … with 1,485 more rows, and 17 more variables: area_disponible_m2 <dbl>,
## #   area_techada_m2 <dbl>, antiguedad_anios <dbl>, tiene_planos <chr>,
## #   planos_actualizados <chr>, material_predom_paredes <chr>,
## #   estado_conserv_paredes <chr>, material_predom_pisos <chr>,
## #   estado_conserv_pisos <chr>, material_predom_techo <chr>,
## #   estado_conserv_techo <chr>, electricidad_7_dias <chr>,
## #   electricidad_con <chr>, agua_procedencia <chr>, agua_potable <chr>,
## #   agua_7_dias <chr>, banio_coneccion <chr>

Ejercicio 1: Lima Responder las siguientes preguntas:

¿Cuántas comisarías tiene Lima Metropolitana? ¿Cuáles son los distritos de Lima Metropolitana con mayor número de comisarías? Top 10 Pista: Usa filter(), summarise(), group_by() y arrange().

filter(censo2017, provincia == "LIMA")
## # A tibble: 126 x 24
##    id    ubigeo region provincia distrito area_terreno_m2 area_ocupada_m2
##    <chr> <chr>  <chr>  <chr>     <chr>              <dbl>           <dbl>
##  1 0405  150101 LIMA   LIMA      LIMA                1234            1234
##  2 0406  150101 LIMA   LIMA      LIMA                 444             444
##  3 0407  150101 LIMA   LIMA      LIMA                 719             719
##  4 0408  150101 LIMA   LIMA      LIMA                 250             250
##  5 0409  150101 LIMA   LIMA      LIMA                 706             706
##  6 0410  150101 LIMA   LIMA      LIMA                1410            1410
##  7 0411  150101 LIMA   LIMA      LIMA                 846             846
##  8 0412  150101 LIMA   LIMA      LIMA                 640             640
##  9 0413  150101 LIMA   LIMA      LIMA                3058            1600
## 10 0414  150101 LIMA   LIMA      LIMA                1343             681
## # … with 116 more rows, and 17 more variables: area_disponible_m2 <dbl>,
## #   area_techada_m2 <dbl>, antiguedad_anios <dbl>, tiene_planos <chr>,
## #   planos_actualizados <chr>, material_predom_paredes <chr>,
## #   estado_conserv_paredes <chr>, material_predom_pisos <chr>,
## #   estado_conserv_pisos <chr>, material_predom_techo <chr>,
## #   estado_conserv_techo <chr>, electricidad_7_dias <chr>,
## #   electricidad_con <chr>, agua_procedencia <chr>, agua_potable <chr>,
## #   agua_7_dias <chr>, banio_coneccion <chr>

¿Cuántas comisarías tiene Lima Metropolitana? Hay 126 comisarías en Lima Metropolitana

Operdor pipe: control shift M

filter(censo2017, provincia == "LIMA") %>% 
group_by(provincia, distrito)  %>% 
summarise(comisaria = n()) %>% 
ungroup() %>% 
arrange(desc(comisaria))
## `summarise()` has grouped output by 'provincia'. You can override using the `.groups` argument.
## # A tibble: 43 x 3
##    provincia distrito                comisaria
##    <chr>     <chr>                       <int>
##  1 LIMA      LIMA                           13
##  2 LIMA      SAN JUAN DE LURIGANCHO         10
##  3 LIMA      COMAS                           6
##  4 LIMA      EL AGUSTINO                     6
##  5 LIMA      RÍMAC                           6
##  6 LIMA      VILLA MARÍA DEL TRIUNFO         6
##  7 LIMA      SAN JUAN DE MIRAFLORES          5
##  8 LIMA      ATE                             4
##  9 LIMA      CHORRILLOS                      4
## 10 LIMA      INDEPENDENCIA                   4
## # … with 33 more rows

Ejercicio 2: Costa Norte Consideremos que en la Costa Norte están las regiones de La Libertad, Lambayeque, Piura y Tumbes.

Responder las siguientes preguntas:

¿Cuántas comisarías tiene la Costa Norte? ¿Cuáles son los distritos de la Costa Norte con mayor número de comisarías? Top 10 Pista: Usa filter(), summarise(), group_by() y arrange().

filter(censo2017, region %in% c("LA LIBERTAD", "TUMBES", "PIURA", "LAMBAYEQUE"))
## # A tibble: 248 x 24
##    id    ubigeo region provincia distrito        area_terreno_m2 area_ocupada_m2
##    <chr> <chr>  <chr>  <chr>     <chr>                     <dbl>           <dbl>
##  1 0010  200101 PIURA  PIURA     PIURA                      2826             740
##  2 0011  200115 PIURA  PIURA     VEINTISÉIS DE …            1600             700
##  3 0012  200104 PIURA  PIURA     CASTILLA                   1238            1238
##  4 0013  200104 PIURA  PIURA     CASTILLA                   1716            1716
##  5 0014  200104 PIURA  PIURA     CASTILLA                    420             420
##  6 0015  200104 PIURA  PIURA     CASTILLA                     24              24
##  7 0016  200101 PIURA  PIURA     PIURA                      4011             650
##  8 0017  200105 PIURA  PIURA     CATACAOS                    280             180
##  9 0018  200105 PIURA  PIURA     CATACAOS                   2421            1421
## 10 0019  200107 PIURA  PIURA     CURA MORI                   180             180
## # … with 238 more rows, and 17 more variables: area_disponible_m2 <dbl>,
## #   area_techada_m2 <dbl>, antiguedad_anios <dbl>, tiene_planos <chr>,
## #   planos_actualizados <chr>, material_predom_paredes <chr>,
## #   estado_conserv_paredes <chr>, material_predom_pisos <chr>,
## #   estado_conserv_pisos <chr>, material_predom_techo <chr>,
## #   estado_conserv_techo <chr>, electricidad_7_dias <chr>,
## #   electricidad_con <chr>, agua_procedencia <chr>, agua_potable <chr>,
## #   agua_7_dias <chr>, banio_coneccion <chr>

¿Cuántas comisarías tiene la Costa Norte? 248 comisarías tiene la Costa Norte que incluye La Libertad, Tumbes, Piura y Lambayeque

¿Cuáles son los distritos de la Costa Norte con mayor número de comisarías? Top 10 Pista: Usa filter(), summarise(), group_by() y arrange().

censo2017 %>% 
filter(region %in% c("LA LIBERTAD", "TUMBES", "PIURA", "LAMBAYEQUE")) %>% 
group_by(provincia, distrito)  %>% 
summarise(comisaria = n()) %>% 
ungroup() %>% 
arrange(desc(comisaria))
## `summarise()` has grouped output by 'provincia'. You can override using the `.groups` argument.
## # A tibble: 164 x 3
##    provincia  distrito   comisaria
##    <chr>      <chr>          <int>
##  1 CHICLAYO   CHICLAYO           7
##  2 TRUJILLO   TRUJILLO           6
##  3 MORROPON   CHULUCANAS         5
##  4 TUMBES     TUMBES             5
##  5 PIURA      CASTILLA           4
##  6 PIURA      PIURA              4
##  7 ASCOPE     CHICAMA            3
##  8 GRAN CHIMÚ CASCAS             3
##  9 LAMBAYEQUE MORROPE            3
## 10 PACASMAYO  GUADALUPE          3
## # … with 154 more rows

Ejercicio 3: Toda la Costa

Consideremos que la costa peruana se divide así:

Norte: La Libertad, Lambayeque, Piura, Tumbes Centro: Ancash, Lima, Ica Sur: Arequipa, Moquegua, Tacna

Responder las siguientes preguntas:

¿Cuántas comisarías tiene cada sección de la costa peruana? ¿Cuáles son las provincias de la costa peruana con mayor número de comisarías? Top 10 Pista: Usa mutate(), filter(), summarise(), group_by(), y arrange().

censo2017 %>%
select(region) %>%
mutate(comi_recat = case_when(
  region %in% c("LA LIBERTAD", "TUMBES", "PIURA", "LAMBAYEQUE") ~ "Norte",
  region %in% c("ANCASH", "LIMA", "ICA") ~ "Centro",
  region %in% c("AREQUIPA", "MOQUEGUA", "TACNA") ~ "Sur",
  TRUE ~ "otro")) %>%
  group_by(comi_recat)  %>% 
  summarise(comisarias_regiones = n()) %>% 
  ungroup() %>% 
  arrange(desc(comisarias_regiones))
## # A tibble: 4 x 2
##   comi_recat comisarias_regiones
##   <chr>                    <int>
## 1 otro                       851
## 2 Norte                      248
## 3 Centro                     224
## 4 Sur                        172

¿Cuántas comisarías tiene cada sección de la costa peruana? Norte (851), Centro (224), Sur (172)

¿Cuáles son las provincias de la costa peruana con mayor número de comisarías? Top 10

censo2017 %>%
select(region, provincia) %>%
mutate(comi_recat = case_when(
  region %in% c("LA LIBERTAD", "TUMBES", "PIURA", "LAMBAYEQUE") ~ "Norte",
  region %in% c("ANCASH", "LIMA", "ICA") ~ "Centro",
  region %in% c("AREQUIPA", "MOQUEGUA", "TACNA") ~ "Sur",
  TRUE ~ "otro")) %>%
  group_by(provincia, comi_recat) %>% 
  filter(comi_recat != "otro")  %>% 
  summarise(comisarias_regiones = n()) %>% 
  ungroup() %>% 
  arrange(desc(comisarias_regiones))
## `summarise()` has grouped output by 'provincia'. You can override using the `.groups` argument.
## # A tibble: 56 x 3
##    provincia  comi_recat comisarias_regiones
##    <chr>      <chr>                    <int>
##  1 LIMA       Centro                     126
##  2 AREQUIPA   Sur                         58
##  3 CHICLAYO   Norte                       32
##  4 TRUJILLO   Norte                       22
##  5 PIURA      Norte                       21
##  6 TACNA      Sur                         18
##  7 CAÑETE     Centro                      17
##  8 ICA        Centro                      16
##  9 LAMBAYEQUE Norte                       16
## 10 MORROPON   Norte                       16
## # … with 46 more rows

Ejercicio 4: Todo el Perú Responder las siguientes preguntas:

¿Cuáles son las regiones con mayor número de comisarías? Top 10 ¿Cuáles son las provincias con mayor número de comisarías? Top 10 ¿Cuáles son los distritos con mayor número de comisarías? Top 10

¿Cuáles son las regiones con mayor número de comisarías? Top 10 – Lima, Cajamarca, Arequipa y Cusco

censo2017 %>%
select(region) %>%
group_by(region) %>%
summarise(comisarias_regiones = n()) %>% 
arrange(desc(comisarias_regiones))
## # A tibble: 25 x 2
##    region      comisarias_regiones
##    <chr>                     <int>
##  1 LIMA                        183
##  2 CAJAMARCA                   128
##  3 AREQUIPA                    115
##  4 CUSCO                       101
##  5 PIURA                        89
##  6 LA LIBERTAD                  87
##  7 ÁNCASH                       84
##  8 PUNO                         68
##  9 AMAZONAS                     54
## 10 APURÍMAC                     54
## # … with 15 more rows

¿Cuáles son las provincias con mayor número de comisarías? Top 10

censo2017 %>%
select(provincia) %>%
group_by(provincia) %>%
summarise(comisarias_provincia = n()) %>% 
arrange(desc(comisarias_provincia))
## # A tibble: 196 x 2
##    provincia     comisarias_provincia
##    <chr>                        <int>
##  1 LIMA                           126
##  2 AREQUIPA                        58
##  3 CHICLAYO                        32
##  4 CALLAO                          23
##  5 TRUJILLO                        22
##  6 LA CONVENCIÓN                   21
##  7 PIURA                           21
##  8 SANTA                           21
##  9 MAYNAS                          19
## 10 TACNA                           18
## # … with 186 more rows

¿Cuáles son los distritos con mayor número de comisarías? Top 10 Callao, Lima, San Juan de Lurigancho

censo2017 %>%
group_by(distrito,region,provincia) %>%
summarise(comisarias_distrito= n()) %>% 
ungroup() %>% 
arrange(desc(comisarias_distrito))
## `summarise()` has grouped output by 'distrito', 'region'. You can override using the `.groups` argument.
## # A tibble: 1,056 x 4
##    distrito               region     provincia comisarias_distrito
##    <chr>                  <chr>      <chr>                   <int>
##  1 CALLAO                 CALLAO     CALLAO                     13
##  2 LIMA                   LIMA       LIMA                       13
##  3 SAN JUAN DE LURIGANCHO LIMA       LIMA                       10
##  4 TACNA                  TACNA      TACNA                       9
##  5 CHIMBOTE               ÁNCASH     SANTA                       8
##  6 CHICLAYO               LAMBAYEQUE CHICLAYO                    7
##  7 COMAS                  LIMA       LIMA                        6
##  8 EL AGUSTINO            LIMA       LIMA                        6
##  9 PAUCARPATA             AREQUIPA   AREQUIPA                    6
## 10 PUNO                   PUNO       PUNO                        6
## # … with 1,046 more rows

Ejercicio 5: Area ocupada en Madre de Dios ¿Cuál es el porcentaje de área ocupada por comisaría en Madre de Dios? Puedes calcular el porcentaje así:

%areaocupada=areaocupadaareaterreno×100 Pista: Usa filter() y mutate()

Ejercicio 6: Area ocupada en la costa ¿Cuál es el promedio del porcentaje de área ocupada por comisaría en la costa peruana? Divídelo en Norte, Centro y Sur Pista: Usa filter(), mutate(), group_by() y summarise()

Ejercicio 7: Area ocupada en todo el Perú ¿Cuáles son las regiones con menor promedio de porcentaje de área ocupada por comisaría en el país? ¿Cuáles son las provincias con menor promedio de porcentaje de área ocupada por comisaría en el país? ¿Cuáles son los distritos con menor promedio de porcentaje de área ocupada por comisaría en el país? Pista: Usa filter(), mutate(), group_by() y summarise()

Ejercicio 8: Area techada en todo el Perú ¿Cuáles son las regiones con mayor mediana de porcentaje de área techada por comisaría en el país? ¿Cuáles son las provincias con mayor mediana de porcentaje de área techada por comisaría en el país? ¿Cuáles son los distritos con mayor mediana de porcentaje de área techada por comisaría en el país?