library(viridis)
library(dplyr)
library(ggplot2)
data_set <- read.csv('primary_results.csv')
#View(data_set)
1. ¿Cuantos candidatos estaban en las primarias?
cand_list<- data_set %>%
select(candidate) %>%
filter(trimws(candidate)!= "No Preference" , trimws(candidate) != "Uncommitted")%>%
group_by(candidate) %>%
summarise()
print(cand_list)
De la información mostrada anteriormente es claro que la cantidad de cantidatos en las primarias eran 14.
2. ¿Cuantos candidatos estaban en las primarias?
party_cand<-data_set %>%
select(candidate, party) %>%
filter(trimws(candidate)!= "No Preference" , trimws(candidate) != "Uncommitted" ,
party == "Republican") %>%
group_by(candidate) %>%
summarise()
party_cand
De la información anterior es claro que 11 cantidatos eran Republicanos.
3. ¿Que partido obtuvo la mayor cantidad de votos en Florida?
votes_florida<- data_set %>%
filter(trimws(candidate)!= "No Preference" , trimws(candidate)!= "Uncommitted")%>%
filter(state == "Florida") %>%
select(candidate, votes, party) %>%
group_by(party) %>%
summarise(Total=sum(votes))
votes_florida
Graficando tenemos:
votes_florida %>% ggplot(aes(x=party, y=Total))+
geom_bar(stat = "identity", fill=c("blue", "red"))

4. ¿Que condado de Florida es el que tiene la mayor cantidad de votantes?
total_florida<- data_set %>%
filter(trimws(candidate)!= "No Preference" , trimws(candidate)!= "Uncommitted")%>%
filter(state == "Florida") %>%
select(county, votes) %>%
group_by(county) %>%
summarise(Total=sum(votes)) %>%
mutate(index=c(1: nrow(total_florida)))
total_florida
florida_plot <- total_florida %>%
ggplot(aes(x=index, y=Total, fill=index)) +
geom_bar(stat = "identity", width = 1) + #GeometrÃÂa de la grafica
theme_minimal() + #Colores
scale_x_continuous(breaks=seq(1,nrow(total_florida),by=4))#Cambio de escala eje x
florida_plot

5. En el condado de florida, que tuvo la mayor cantidad de votantes, ¿Que candidato tuvo la mayor cantidad de votos y de que partido era?
florida_summary <- data_set %>%
filter(!(trimws(candidate)) %in% c( "No Preference", "Uncommitted")) %>%
filter(state == "Florida") %>%
select(candidate, votes) %>%
group_by(candidate) %>%
summarise(Total_Votes = sum(votes))
florida_summary
Graficando tenemos:
florida_summary_plot <- florida_summary %>%
ggplot(aes(x=candidate, y=Total_Votes)) +
geom_bar(stat = "identity",
fill=c("red", "blue", "green", "orange", "yellow", "brown"))
florida_summary_plot

6- ¿Cuantas personas Votaron por Hillary Clinton y cuantas por Donald Trump en estados unidos?
Clin_Trump<- data_set %>%
filter(!(trimws(candidate)) %in% c("No Preference", "Uncommitted"))%>%
filter(candidate == "Donald Trump" | candidate == "Hillary Clinton") %>%
select(candidate, votes) %>%
group_by(candidate) %>%
summarise(Votes=sum(votes))
Clin_Trump
7. ¿Cual es la probabilidad de que si alguien sea republicano en florida haya votado por Jeb Bush?
florida_republic <- data_set %>%
filter(!(trimws(candidate)) %in% c("No Preference", "Uncommitted"))%>%
filter(party == "Republican", state == "Florida") %>%
select(votes) %>%
summarise(Total=sum(votes))
florida_republic
La cardinalida del evento votante que voto por Jeb Bush, republicano y de florida es de 0
Por lo tanto la probabilidad sera de 0
8. Dado que una persona voto por Ted Cruz, ¿Cual es la probabilidad que sea de California?
Primero calcularemos la probabilidad de que un votante haya votado por Ted Cruz.
Votantes por Ted Cruz
ted_vots<- data_set %>%
filter(candidate == "Ted Cruz")%>%
select(votes) %>%
summarise(Total=sum(votes))
#ted_vots
Total de Votantes
total_vots <- data_set %>%
select(votes) %>%
summarise(Total=sum(votes))
#total_vots
Probabilidad de Voto por Ted Cruz
prob1<-ted_vots/total_vots
colnames(prob1)<-c("Probabilidad 1")
prob1
Ahora calcularemos la probabilidad de que un votante sea de California:
Votantes de California
vote_calif<-data_set %>%
filter(state == "California") %>%
select(votes) %>%
summarise(Total_California=sum(votes))
#vote_calif
Probabilidad de Voto en California:
prob2<-vote_calif/total_vots
colnames(prob2)<-c("Probabilidad 2")
prob2
Ahora calcularemos la probabilidad de la intersección ya que los dos eventos anteriores son independiente .
cruz_california <- data_set %>%
filter(state=="California", candidate=="Ted Cruz") %>%
select(votes) %>%
summarise(Cruz_Cal = sum(votes))
#Calculo de Probabilidad
prob3<- cruz_california/total_vots
colnames(prob3)<-c("Probabilidad 3")
prob3
Finalmente calcularemos la probabilidad de que un votante sea de California, dado que voto por Ted Cruz
prob4<-prob3/prob2
colnames(prob4)<-c("Probabilidad 4")
prob4
9. Dado que un persona es de Texas, ¿Cual es la probabilidad que vote por Donald Trump?
Calcularemos la probabilidad de que un votante sea de Texas
Votantes de Texas
texas_votes<-data_set %>%
filter(state == "Texas") %>%
select(votes) %>%
summarise(Texas_Votes=sum(votes))
#texas_votes
Probabilidad de Voto en Texas
prob5<- texas_votes/total_vots
colnames(prob5)<-c("Probabilidad 5")
prob5
Votantes por Donald Trump
trump_votes <- data_set %>%
filter(candidate == "Donald Trump") %>%
select(votes) %>%
summarise(Trump_Votes = sum(votes))
#trump_votes
Probabilidad de Voto por Trump
prob6<-trump_votes/total_vots
colnames(prob6)<-c("Probabilidad 5")
prob6
Ahora calcularemos la probabilidad de la intersección ya que los dos eventos anteriores son independiente .
trump_texas <- data_set %>%
filter(candidate=="Donald Trump", state=="Texas") %>%
select(votes) %>%
summarise(Total=sum(votes))
#Calculo de probabilidad
prob7<- trump_texas/total_vots
colnames(prob7)<-c("Probabilidad 7")
prob7
Finalmente calcularemos la probabilidad de que un votante vote por Dondal Trump, dado que es de Texas:
prob8<- prob7/prob5
colnames(prob8)<-c("Probabilidad 8")
prob8
10. ¿Que condado de los Estados Unidos es el que tuvo la mayor cantidad de votantes?
vote_condado<- data_set %>%
filter(!(trimws(candidate)) %in% c("No Preference", "Uncommitted"))%>%
select(county, votes)%>%
group_by(county) %>%
summarise(Votes = sum(votes))
vote_condado
max_votes<-which.max(vote_condado$Votes) #Obtenemos el Maximo.
condados<-vote_condado$county
(condados[max_votes][1])
[1] Los Angeles
2633 Levels: Abbeville Abbot Abington Acadia Accomack Acton Acushnet ... Ziebach
