#Cargar paquetes

library(readxl)

Data

licenciamiento_institucional_5 <- read_xls("Licenciamiento Institucional_5.xls")
licenciamiento_institucional_5
## # A tibble: 143 x 10
##    CODIGO_ENTIDAD NOMBRE        TIPO_GESTION ESTADO_LICENCIAM~ PERIODO_LICENCIA~
##    <chr>          <chr>         <chr>        <chr>                         <dbl>
##  1 091            UNIVERSIDAD ~ PRIVADO      LICENCIA DENEGADA                 0
##  2 016            UNIVERSIDAD ~ PÚBLICO      LICENCIA OTORGADA                 6
##  3 067            UNIVERSIDAD ~ PRIVADO      LICENCIA OTORGADA                 6
##  4 118            UNIVERSIDAD ~ PRIVADO      LICENCIA DENEGADA                 0
##  5 104            UNIVERSIDAD ~ PRIVADO      LICENCIA OTORGADA                 6
##  6 037            UNIVERSIDAD ~ PRIVADO      LICENCIA OTORGADA                 6
##  7 064            UNIVERSIDAD ~ PRIVADO      LICENCIA OTORGADA                 6
##  8 006            UNIVERSIDAD ~ PÚBLICO      LICENCIA OTORGADA                10
##  9 038            UNIVERSIDAD ~ PRIVADO      LICENCIA OTORGADA                 6
## 10 109            UNIVERSIDAD ~ PRIVADO      LICENCIA DENEGADA                 0
## # ... with 133 more rows, and 5 more variables: DEPARTAMENTO_LOCAL <chr>,
## #   PROVINCIA_LOCAL <chr>, DISTRITO_LOCAL <chr>, LATITUD_UBICACION <dbl>,
## #   LONGITUD_UBICACION <dbl>

No olvidar cargar los paquetes de library(dplyr) y también library(tidyverse)

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.1.2     v stringr 1.4.0
## v tidyr   1.1.3     v forcats 0.5.1
## v readr   1.4.0
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Recordar que:

Filter es para filas select es para elegir columnas

Repaso

1. ¿Cuántas universidades públicas y privadas existían en el país cuando se inició el proceso de licenciamiento institucional de universidades peruanas? 143

licenciamiento_institucional_5 %>% 
  summarise(TIPO_GESTION)
## # A tibble: 143 x 1
##    TIPO_GESTION
##    <chr>       
##  1 PRIVADO     
##  2 PÚBLICO     
##  3 PRIVADO     
##  4 PRIVADO     
##  5 PRIVADO     
##  6 PRIVADO     
##  7 PRIVADO     
##  8 PÚBLICO     
##  9 PRIVADO     
## 10 PRIVADO     
## # ... with 133 more rows

2. ¿Cuántas universidades públicas obtuvieron el licenciamiento?

licenciamiento_institucional_5 %>% 
  filter(TIPO_GESTION == "PÚBLICO", ESTADO_LICENCIAMIENTO == "LICENCIA OTORGADA") %>% 
  summarise(n_publicas_licenciadas = n())
## # A tibble: 1 x 1
##   n_publicas_licenciadas
##                    <int>
## 1                     46

¿Cuántas universidades privadas obtuvieron el licenciamiento?

licenciamiento_institucional_5 %>% 
  filter(TIPO_GESTION == "PRIVADO", ESTADO_LICENCIAMIENTO == "LICENCIA OTORGADA") %>% 
  summarise(n_publicas_licenciadas = n())
## # A tibble: 1 x 1
##   n_publicas_licenciadas
##                    <int>
## 1                     46

2 Y 3

licenciamiento_institucional_5 %>%
  filter(ESTADO_LICENCIAMIENTO == "LICENCIA OTORGADA") %>% 
    group_by(TIPO_GESTION) %>% 
    summarise(n_de_univ_licenciadas = n()) %>% 
    ungroup()
## # A tibble: 2 x 2
##   TIPO_GESTION n_de_univ_licenciadas
##   <chr>                        <int>
## 1 PRIVADO                         46
## 2 PÚBLICO                         46

1, 2 y 3:

licenciamiento_institucional_5 %>%
   summarise(n_univ_pre_licen = n(), n_publicas_licen = sum(TIPO_GESTION == "PÚBLICO" & ESTADO_LICENCIAMIENTO == "LICENCIA OTORGADA"), n_privadas_licen = sum(TIPO_GESTION == "PRIVADO" & ESTADO_LICENCIAMIENTO == "LICENCIA OTORGADA"))
## # A tibble: 1 x 3
##   n_univ_pre_licen n_publicas_licen n_privadas_licen
##              <int>            <int>            <int>
## 1              143               46               46

¿Cuáles son los 5 departamentos con mayor número de universidades licenciadas?

licenciamiento_institucional_5 %>%
  filter(ESTADO_LICENCIAMIENTO == "LICENCIA OTORGADA") %>% 
  group_by(DEPARTAMENTO_LOCAL) %>%
  summarise(n_licenciadas = n()) %>%
  ungroup() %>%
  arrange(desc(n_licenciadas)) %>% 
  filter(row_number() <= 5)
## # A tibble: 5 x 2
##   DEPARTAMENTO_LOCAL n_licenciadas
##   <chr>                      <int>
## 1 LIMA                          36
## 2 JUNÍN                          6
## 3 LA LIBERTAD                    5
## 4 AREQUIPA                       4
## 5 APURÍMAC                       3