PRÁCTICA CALIFICADA 5

library(htmltab)
link="https://es.wikipedia.org/wiki/Elecciones_parlamentarias_de_Per%C3%BA_de_2016"
path='//*/div/table[6]/tbody/tr/td/table'

Table=htmltab(doc = link,which = path)
str(Table)
## 'data.frame':    130 obs. of  6 variables:
##  $ Distrito Electoral  : chr  "Amazonas(al 100,00%)" "Amazonas(al 100,00%)" "Áncash(al 100,00%)" "Áncash(al 100,00%)" ...
##  $ Escaños             : chr  "2" "2" "5" "5" ...
##  $ Congresistas electos: chr  "2" "1" "2" "1" ...
##  $ Congresistas electos: chr  "Marita Herrera Arévalo" "Miguel Antonio Castro Grández" "Eloy Ricardo Narváez Soto" "María Elena Foronda Farro" ...
##  $ Partido             : chr  "Fuerza Popular" "Fuerza Popular" "Alianza para el Progreso" "Frente Amplio" ...
##  $ Votos               : chr  "15 312" "12 939" "20 941" "9 094" ...
names(Table)
## [1] "Distrito Electoral"   "Escaños"              "Congresistas electos"
## [4] "Congresistas electos" "Partido"              "Votos"

Eliminando espacios en blanco

Table[,]=lapply(Table[,],trimws,whitespace = "[\\h\\v]")

variable categórica nominal

Table$Partido=as.factor(Table$Partido)

variable númerica:

Table$Votos=as.numeric(Table$Votos)
## Warning: NAs introduced by coercion
Table$Escaños=as.numeric(Table$Escaños)
str(Table)
## 'data.frame':    130 obs. of  6 variables:
##  $ Distrito Electoral  : chr  "Amazonas(al 100,00%)" "Amazonas(al 100,00%)" "Áncash(al 100,00%)" "Áncash(al 100,00%)" ...
##  $ Escaños             : num  2 2 5 5 5 5 5 2 2 6 ...
##  $ Congresistas electos: chr  "2" "1" "2" "1" ...
##  $ Congresistas electos: chr  "Marita Herrera Arévalo" "Miguel Antonio Castro Grández" "Eloy Ricardo Narváez Soto" "María Elena Foronda Farro" ...
##  $ Partido             : Factor w/ 6 levels "Acción Popular",..: 5 5 2 4 5 5 5 4 5 1 ...
##  $ Votos               : num  NA NA NA NA NA NA NA NA NA NA ...