Abriendo las librerías de los paquetes necesarios para llevar a cabo el ejercicio
library(htmltab)
library(rvest)
Creando un enlace mediante el cual se extrae la información sobre las personas que conforman el despacho presidencial del Perú
linkPage= "https://www.gob.pe/institucion/presidencia/funcionarios"
Directorio = read_html(linkPage)
Nombres de los funcionarios publicos
css_nombres="h3.h.is-6.link.link--read-more-inline.is-bold"
nombres_html <- html_nodes(Directorio,css_nombres)
nombres_texto <- html_text(nombres_html)
Acá visualizamos los primeros seis funcionarios públicos que conforman el despacho presidencial
head(nombres_texto)
## [1] "José Pedro Castillo Terrones" "Dina Ercilia Boluarte Zegarra"
## [3] "Arnulfo Bruno Pacheco Castillo" "Ysmael Rafael Mayuri Quispe"
## [5] "Auner Augusto Vásquez Cabrera" "Aida Giovanna Cecilia Céliz Kuóng"
Acá visualizamos los últimos seis funcionarios públicos que conforman el despacho presidencial
tail(nombres_texto)
## [1] "Pepe Hernando Díaz Bazán"
## [2] "Yazmín Ivonne Meléndez Fiestas de Galdo "
## [3] "Romelia Kethy Vásquez Aguirre"
## [4] "Pepe Hernando Díaz Bazán"
## [5] "José Luis Romero Chávez"
## [6] "Gregorio Martin Falconi Vallejos"
Cargos que ocupan los funcionarios públicos en cuestión
css_cargos="h3.font-light"
cargos_html <- html_nodes(Directorio,css_cargos)
cargos_texto <- html_text(cargos_html)
Acá visualizamos los cargos que ocupan los primeros seis funcionarios públicos que conforman el despacho presidencial
head(cargos_texto)
## [1] "Presidente de la República del Perú"
## [2] "Primera Vicepresidenta de la República del Perú"
## [3] "Secretario General"
## [4] "Subsecretario General"
## [5] "Jefe de Gabinete Técnico de la Presidencia de la República"
## [6] "Jefe del Órgano de Control Institucional (e)"
Acá visualizamos los cargos que ocupan los últimos seis funcionarios públicos que conforman el despacho presidencial
tail(cargos_texto)
## [1] "Director de la Oficina de Tecnologías de la Información"
## [2] "Directora de la Oficina de Recursos Humanos"
## [3] "Secretaria de Comunicación Estratégica y Prensa"
## [4] "Director de la Oficina de Telecomunicaciones (e)"
## [5] "Director de la Oficina de Contabilidad y Finanzas"
## [6] "Director de Prensa"
Con el siguiente código vamos a crear una pequeña base de datos, la cual va a contener las dos variables que nos interesan: el nombre de los funcionarios públicos y el cargo que ocupa cada uno
dataDirectorio <- data.frame(NOMBRES = nombres_texto, CARGOS = cargos_texto)
Aquí podemos ver la estructura de dicha base de datos
str(dataDirectorio)
## 'data.frame': 20 obs. of 2 variables:
## $ NOMBRES: chr "José Pedro Castillo Terrones" "Dina Ercilia Boluarte Zegarra" "Arnulfo Bruno Pacheco Castillo" "Ysmael Rafael Mayuri Quispe" ...
## $ CARGOS : chr "Presidente de la República del Perú" "Primera Vicepresidenta de la República del Perú" "Secretario General" "Subsecretario General" ...
Aquí podemos los seis primeros datos que conforman la base de datos
head(dataDirectorio)
## NOMBRES
## 1 José Pedro Castillo Terrones
## 2 Dina Ercilia Boluarte Zegarra
## 3 Arnulfo Bruno Pacheco Castillo
## 4 Ysmael Rafael Mayuri Quispe
## 5 Auner Augusto Vásquez Cabrera
## 6 Aida Giovanna Cecilia Céliz Kuóng
## CARGOS
## 1 Presidente de la República del Perú
## 2 Primera Vicepresidenta de la República del Perú
## 3 Secretario General
## 4 Subsecretario General
## 5 Jefe de Gabinete Técnico de la Presidencia de la República
## 6 Jefe del Órgano de Control Institucional (e)
Aquí podemos los seis últimos datos que conforman la base de datos
tail(dataDirectorio)
## NOMBRES
## 15 Pepe Hernando Díaz Bazán
## 16 Yazmín Ivonne Meléndez Fiestas de Galdo
## 17 Romelia Kethy Vásquez Aguirre
## 18 Pepe Hernando Díaz Bazán
## 19 José Luis Romero Chávez
## 20 Gregorio Martin Falconi Vallejos
## CARGOS
## 15 Director de la Oficina de Tecnologías de la Información
## 16 Directora de la Oficina de Recursos Humanos
## 17 Secretaria de Comunicación Estratégica y Prensa
## 18 Director de la Oficina de Telecomunicaciones (e)
## 19 Director de la Oficina de Contabilidad y Finanzas
## 20 Director de Prensa