Primera Pregunta ¿Hay algun condado cuya poblacion completa votarÔ por un solo candidato? si no lo hay, ¿que condado es el mÔs cercano a este 100%?
library (tidyr)
## Warning: package 'tidyr' was built under R version 3.3.2
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(readr)
## Warning: package 'readr' was built under R version 3.3.2
election <- read_csv("anes_pilot_2016.csv")
## Parsed with column specification:
## cols(
## demcand = col_integer(),
## repcand = col_integer(),
## africanam10_1 = col_integer(),
## white10_1 = col_integer(),
## hispanic10_1 = col_integer(),
## asianam10_1 = col_integer(),
## nativeam10_1 = col_integer(),
## other10_1 = col_integer(),
## other10_open = col_character(),
## gender = col_integer(),
## race = col_integer(),
## educ = col_integer(),
## speakspanish = col_integer(),
## employ = col_integer(),
## state = col_integer(),
## religpew = col_integer()
## )
election
## # A tibble: 1,200 x 16
## demcand repcand africanam10_1 white10_1 hispanic10_1 asianam10_1
## <int> <int> <int> <int> <int> <int>
## 1 1 6 0 10 0 0
## 2 1 1 0 10 0 0
## 3 5 9 0 10 0 0
## 4 1 11 0 10 0 0
## 5 5 4 0 0 0 0
## 6 2 7 0 5 0 0
## 7 3 7 0 7 0 0
## 8 2 9 0 10 0 0
## 9 5 4 0 7 0 0
## 10 3 6 2 2 2 2
## # ... with 1,190 more rows, and 10 more variables: nativeam10_1 <int>,
## # other10_1 <int>, other10_open <chr>, gender <int>, race <int>,
## # educ <int>, speakspanish <int>, employ <int>, state <int>,
## # religpew <int>
#Hay algun estado donde todos voten por un solo candidato?
### seleccioné las columnas state y demcand, luego las agrupe por state y conté las frecuencias de demcand. creé la columna porcentaje con el siguiente código.
resp1Dem <- election%>%
select(state, demcand)%>%
group_by(state)%>%
count(demcand)%>%
mutate(porcentaje = n*100/1200)%>%
arrange(desc(porcentaje))
resp1Rep <- election%>%
select(state, repcand)%>%
group_by(state)%>%
count(repcand)%>%
mutate(porcentaje1 = n*100/1200)%>%
arrange(desc(porcentaje1))
#El condado mĆ”s alto en cuanto a los democrĆĀ”ticos es en el estado #6 por el candidato democratico #1 con un 3.16% en comparacion a las 1,200 encuestas
#el condado mĆĀ”s alto en cuanto a los republicanos es en el estado #6 por el candidato republicano #11 con un 2.75% en comparacion a las 1,200 encuestas
#En estas dos: lo que hice fue seleccionar primero la columna solamente de demcand y luego de repcand para ver cual fue el mĆĀ”s votado, tanto demcand como repcand en que estados para luego ver la incidencia mĆĀ”s alta y crear otra variable donde filtre por el estado donde mayor votaciones hubieron por un canditato tanto demcand como repcand.
stateDemMayorCandidato<- election%>%
select(state, demcand)%>%
group_by(state)%>%
count(demcand)%>%
arrange(desc(n))
stateRepMayorCandidato<- election%>%
select(state, repcand)%>%
group_by(state)%>%
count(repcand)%>%
arrange(desc(n))
State6Dem <- election%>%
select(state, demcand)%>%
filter(state == 6)%>%
count(demcand)%>%
arrange(desc(n))%>%
mutate(porcentaje = n*100/sum(n))
#en el estado 6 para el partido democratico el candidato mĆĀ”s votado fue el candidato 1 y el 3, los dos con un 32.758621% sobre las 116 personas encuestadas.
State6Rep <- election%>%
select(state, repcand)%>%
filter(state == 6)%>%
count(repcand)%>%
arrange(desc(n))%>%
mutate(porcentaje = n*100/sum(n))
#en el estado 6 para el partido republicano el candidato mĆĀ”s votado fue el candidato 11 con un 28.448276% sobre las 116 personas encuestadas