Preguntas proyecto DS Elecciones. / Gustavo Behrens.

Primera Pregunta ¿Hay algun condado cuya poblacion completa votarÔ por un solo candidato? si no lo hay, ¿que condado es el mÔs cercano a este 100%?

library (tidyr)
## Warning: package 'tidyr' was built under R version 3.3.2
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readr)
## Warning: package 'readr' was built under R version 3.3.2
election <- read_csv("anes_pilot_2016.csv")
## Parsed with column specification:
## cols(
##   demcand = col_integer(),
##   repcand = col_integer(),
##   africanam10_1 = col_integer(),
##   white10_1 = col_integer(),
##   hispanic10_1 = col_integer(),
##   asianam10_1 = col_integer(),
##   nativeam10_1 = col_integer(),
##   other10_1 = col_integer(),
##   other10_open = col_character(),
##   gender = col_integer(),
##   race = col_integer(),
##   educ = col_integer(),
##   speakspanish = col_integer(),
##   employ = col_integer(),
##   state = col_integer(),
##   religpew = col_integer()
## )
election
## # A tibble: 1,200 x 16
##    demcand repcand africanam10_1 white10_1 hispanic10_1 asianam10_1
##      <int>   <int>         <int>     <int>        <int>       <int>
## 1        1       6             0        10            0           0
## 2        1       1             0        10            0           0
## 3        5       9             0        10            0           0
## 4        1      11             0        10            0           0
## 5        5       4             0         0            0           0
## 6        2       7             0         5            0           0
## 7        3       7             0         7            0           0
## 8        2       9             0        10            0           0
## 9        5       4             0         7            0           0
## 10       3       6             2         2            2           2
## # ... with 1,190 more rows, and 10 more variables: nativeam10_1 <int>,
## #   other10_1 <int>, other10_open <chr>, gender <int>, race <int>,
## #   educ <int>, speakspanish <int>, employ <int>, state <int>,
## #   religpew <int>
#Hay algun estado donde todos voten por un solo candidato?
### seleccioné las columnas state y demcand, luego las agrupe por state y conté las frecuencias de demcand. creé la columna porcentaje con el siguiente código.
resp1Dem <- election%>%
    select(state, demcand)%>%
    group_by(state)%>%
    count(demcand)%>%
    mutate(porcentaje = n*100/1200)%>%
    arrange(desc(porcentaje))
resp1Rep <- election%>%
    select(state, repcand)%>%
    group_by(state)%>%
    count(repcand)%>%
    mutate(porcentaje1 = n*100/1200)%>%
    arrange(desc(porcentaje1))
#El condado mÔs alto en cuanto a los democrÔticos es en el estado #6 por el candidato democratico #1 con un 3.16% en comparacion a las 1,200 encuestas
#el condado mÔs alto en cuanto a los republicanos es en el estado #6 por el candidato republicano #11 con un 2.75% en comparacion a las 1,200 encuestas

#En estas dos: lo que hice fue seleccionar primero la columna solamente de demcand y luego de repcand para ver cual fue el mÔs votado, tanto demcand como repcand en que estados para luego ver la incidencia mÔs alta y crear otra variable donde filtre por el estado donde mayor votaciones hubieron por un canditato tanto demcand como repcand.
stateDemMayorCandidato<- election%>%
    select(state, demcand)%>%
    group_by(state)%>%
    count(demcand)%>%
    arrange(desc(n))
stateRepMayorCandidato<- election%>%
    select(state, repcand)%>%
    group_by(state)%>%
    count(repcand)%>%
    arrange(desc(n))

State6Dem <- election%>%
    select(state, demcand)%>%
    filter(state == 6)%>%
    count(demcand)%>%
    arrange(desc(n))%>%
    mutate(porcentaje = n*100/sum(n))
#en el estado 6 para el partido democratico el candidato mÔs votado fue el candidato 1 y el 3, los dos con un 32.758621% sobre las 116 personas encuestadas.
    
State6Rep <- election%>%
    select(state, repcand)%>%
    filter(state == 6)%>%
    count(repcand)%>%
    arrange(desc(n))%>%
    mutate(porcentaje = n*100/sum(n))
#en el estado 6 para el partido republicano el candidato mÔs votado fue el candidato 11 con un 28.448276% sobre las 116 personas encuestadas

RESPUESTA DE LA PRIMERA PREGUNTA.

El estado mƔs alto en cuanto a los democrƔticos es en el estado #6 por el candidato democratico #1 con un 3.16% en comparacion a las 1,200 encuestas.

El estado mƔs alto en cuanto a los republicanos es en el estado #6 por el candidato republicano #11 con un 2.75% en comparacion a las 1,200 encuestas.

En el estado 6 para el partido democratico el candidato mƔs votado fue el candidato 1 y el 3, los dos con un 32.758621% sobre las 116 personas encuestadas.

En el estado 6 para el partido republicano el candidato mƔs votado fue el candidato 11 con un 28.448276% sobre las 116 personas encuestadas.

Segunda Pregunta

¿De toda la gente que completó la encuesta que tiene empleo, que porcentaje de los votos van para qué candidato?

#info: FullTime=1, Part-Time=2, Temp_Off=3, Unemployed=4, Retired=5 Disabled=6, Homemake=7, Student=8, Other=9.
#se define que tienen empleos: 1 y 2.
empleadosDem <-election%>%
    select(demcand, employ)%>%
    filter(employ <= 2)%>%
    count(demcand)%>%
    arrange(desc(n))%>%
    mutate(total = sum(n))%>%
    mutate(porcentaje = n*100/sum(n))

empleadosRep <-election%>%
    select(repcand, employ)%>%
    filter(employ <= 2)%>%
    count(repcand)%>%
    arrange(desc(n))%>%
    mutate(total = sum(n))%>%
    mutate(porcentaje = n*100/sum(n))

respuesta grƔfica de la segunda pregunta

Distribución de votos de personas empleadas para el partido republicano.

Distribución de votos de personas empleadas para el partido republicano_