library(htmltab)
AA=htmltab(doc="https://es.wikipedia.org/wiki/Elecciones_parlamentarias_de_Per%C3%BA_de_2016",
which='//*[@id="mw-content-text"]/div/table[6]/tbody/tr/td/table')
quédese con las columnas “partido” y "votos
names(AA)
## [1] "Distrito Electoral" "Escaños" "Congresistas electos"
## [4] "Congresistas electos" "Partido" "Votos"
str(AA)
## 'data.frame': 130 obs. of 6 variables:
## $ Distrito Electoral : chr "Amazonas(al 100,00%)" "Amazonas(al 100,00%)" "Áncash(al 100,00%)" "Áncash(al 100,00%)" ...
## $ Escaños : chr "2" "2" "5" "5" ...
## $ Congresistas electos: chr "2" "1" "2" "1" ...
## $ Congresistas electos: chr "Marita Herrera Arévalo" "Miguel Antonio Castro Grández" "Eloy Ricardo Narváez Soto" "María Elena Foronda Farro" ...
## $ Partido : chr "Fuerza Popular" "Fuerza Popular" "Alianza para el Progreso" "Frente Amplio" ...
## $ Votos : chr "15 312" "12 939" "20 941" "9 094" ...
AA=AA[,c(5,6)]
str(AA)
## 'data.frame': 130 obs. of 2 variables:
## $ Partido: chr "Fuerza Popular" "Fuerza Popular" "Alianza para el Progreso" "Frente Amplio" ...
## $ Votos : chr "15 312" "12 939" "20 941" "9 094" ...
AA[,]=lapply(AA[,],trimws,whitespace="[\\h\\v]")
AA$Partido=as.factor(AA$Partido)
AA[,-c(1,2,3,4,5)]=lapply(AA[,-c(1,2,3,4,5)],as.numeric)
AA[!complete.cases(AA),]
## [1] Partido Votos
## <0 rows> (or 0-length row.names)
AA$rank=NULL
summary(AA)
## Partido Votos
## Acción Popular : 5 Length:130
## Alianza para el Progreso: 9 Class :character
## Alianza Popular : 5 Mode :character
## Frente Amplio :20
## Fuerza Popular :73
## Peruanos por el Kambio :18
VOTOS,PARTIDO
f1=formula(Votos~Partido)
aggregate(f1,AA,mean)
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Partido Votos
## 1 Acción Popular NA
## 2 Alianza para el Progreso NA
## 3 Alianza Popular NA
## 4 Frente Amplio NA
## 5 Fuerza Popular NA
## 6 Peruanos por el Kambio NA