PRÁCTICA CALIFICADA 5
library(htmltab)
link="https://es.wikipedia.org/wiki/Elecciones_parlamentarias_de_Per%C3%BA_de_2016"
path='//*/div/table[6]/tbody/tr/td/table'
Table=htmltab(doc = link,which = path)
str(Table)
## 'data.frame': 130 obs. of 6 variables:
## $ Distrito Electoral : chr "Amazonas(al 100,00%)" "Amazonas(al 100,00%)" "Áncash(al 100,00%)" "Áncash(al 100,00%)" ...
## $ Escaños : chr "2" "2" "5" "5" ...
## $ Congresistas electos: chr "2" "1" "2" "1" ...
## $ Congresistas electos: chr "Marita Herrera Arévalo" "Miguel Antonio Castro Grández" "Eloy Ricardo Narváez Soto" "María Elena Foronda Farro" ...
## $ Partido : chr "Fuerza Popular" "Fuerza Popular" "Alianza para el Progreso" "Frente Amplio" ...
## $ Votos : chr "15 312" "12 939" "20 941" "9 094" ...
names(Table)
## [1] "Distrito Electoral" "Escaños" "Congresistas electos"
## [4] "Congresistas electos" "Partido" "Votos"
Eliminando espacios en blanco
Table[,]=lapply(Table[,],trimws,whitespace = "[\\h\\v]")
variable categórica nominal
Table$Partido=as.factor(Table$Partido)
variable númerica:
Table$Votos=as.numeric(Table$Votos)
## Warning: NAs introduced by coercion
Table$Escaños=as.numeric(Table$Escaños)
str(Table)
## 'data.frame': 130 obs. of 6 variables:
## $ Distrito Electoral : chr "Amazonas(al 100,00%)" "Amazonas(al 100,00%)" "Áncash(al 100,00%)" "Áncash(al 100,00%)" ...
## $ Escaños : num 2 2 5 5 5 5 5 2 2 6 ...
## $ Congresistas electos: chr "2" "1" "2" "1" ...
## $ Congresistas electos: chr "Marita Herrera Arévalo" "Miguel Antonio Castro Grández" "Eloy Ricardo Narváez Soto" "María Elena Foronda Farro" ...
## $ Partido : Factor w/ 6 levels "Acción Popular",..: 5 5 2 4 5 5 5 4 5 1 ...
## $ Votos : num NA NA NA NA NA NA NA NA NA NA ...