Data Mining and Big Data
Librerias
library(dplyr)
library(ggplot2)
library(usmap)
Data Set
data_set<-read.csv("primary_results.csv")
data_set
1-2. ¿Cuantos candidatos estaban en las primarias?
unique(data_set$candidate)
[1] Bernie Sanders Hillary Clinton Ben Carson Donald Trump John Kasich Marco Rubio
[7] Ted Cruz Uncommitted Martin O'Malley Carly Fiorina Chris Christie Jeb Bush
[13] Mike Huckabee Rand Paul Rick Santorum No Preference
16 Levels: No Preference Uncommitted Ben Carson Bernie Sanders Carly Fiorina ... Ted Cruz
R1<-length(unique(data_set$candidate))
R1
[1] 16
R/ En total eran 16 candidatos
3. ¿Que partido obtuvo la mayor cantidad de votos en Florida?
R3 <- data_set %>%
filter (state == "Florida") %>%
group_by(party) %>%
summarise(votos = sum(votes)) %>%
filter(votos == max(votos))
R3
R/Los republicanos son el partido que mas votos obtuvieron en florida
4. ¿Realice una gráfica sobre el top 10 de los condados de Colorado que tiene más votantes?
R4 <-data_set %>%
filter(data_set$state == "Colorado")%>%
group_by(county) %>%
summarise(votantes=sum(votes)) %>%
top_n(10) %>%
arrange(-votantes)
Selecting by votantes
R4
barplot(R4$votantes,
main="Top 10 Votantes de Colorado",
xlab="county",
ylab="votantes",
col= rainbow(10),
lwd=2)

5. ¿En el estado de California, que condado tuvo la mayor cantidad de votantes?
R5 <- data_set%>%
filter(data_set$state == "California")%>%
group_by(county)%>%
select(county, votes)%>%
summarise(votantes = sum(votes))%>%
top_n(1)
Selecting by votantes
R5
R/ Los Angeles con 1,268,622 votos
6. Realice una gráfica de barras la cual muestre cuantas personas votaron por Hillary Clinton y cuantas por Donald Trump
Trump <- sum(data_set[data_set$candidate == "Donald Trump","votes"])
Hillary <- sum(data_set[data_set$candidate == "Hillary Clinton", "votes" ])
Grafica<- c(trump, hillary)
barplot(Grafica,
main= "Hillary vs Trump",
xlab = "Votos",
ylab = "Candidatos",
col = rainbow(3))

7. ¿Cúal es la probabilidad de que si un votante es republicano en Florida haya votado por Jeb Bush?
R7_Votos <- data_set%>%
summarise(Votos=sum(votes))
R7_Probabilidad=data_set%>%
filter(candidate == "Jeb Bush" & party == "Republican")%>%
summarise(Probabilidad_Voto = sum(votes))%>%
arrange(desc(Probabilidad_Voto))
Probabilidad_JebBush=(R7_Probabilidad/R7_Votos)*100
Probabilidad_JebBush
NA
R/7 La probabilidad de que un votante sea republicano al votar por Jeb Bush es de 0.17
8. Dado que una persona voto por Ted Cruz, ¿Cúal es la probabilidad que sea de California?
R8_Probabilidad=data_set%>%
filter(candidate == "Ted Cruz" & state == "California")%>%
summarise(Total_votos = sum(votes))%>%
arrange(desc(Total_votos))
Probabilidad_JebBush=(R8_Probabilidad/R7_Votos)*100
Probabilidad_JebBush
R/ La probabilidad de que sea de california es del 0.25
9. Realice una gráfica sobre el top 10 de condados de los Estados Unidos con la mayor cantidad de votantes.
R9 <- data_set %>%
filter(!is.na(county)) %>%
group_by(county) %>%
summarise(votantes=sum(votes)) %>%
arrange(-votantes)%>%
top_n(10)
Selecting by votantes
R9
barplot(R9$votantes,
main="Top 10 Condados con más votos",
xlab="county",
ylab="votantes",
col= rainbow(10),
lwd=2)

10. Genere una gráfica del mapa Estados Unidos donde se muestre la cantidad de votantes por estado por medio de un color.
plot_usmap(regions = "state", data = data_set, values = "votes", color = "yellow")

LS0tDQp0aXRsZTogIkxhYm9yYXRvcmlvIDEiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KIyMjIE1hcnZpbiBMw7NwZXoNCiMjIyBEYXRhIE1pbmluZyBhbmQgQmlnIERhdGENCg0KIyMjIyBMaWJyZXJpYXMNCmBgYHtyfQ0KbGlicmFyeShkcGx5cikNCmxpYnJhcnkoZ2dwbG90MikNCmxpYnJhcnkodXNtYXApDQpgYGANCiMjIyMgRGF0YSBTZXQNCmBgYHtyfQ0KZGF0YV9zZXQ8LXJlYWQuY3N2KCJwcmltYXJ5X3Jlc3VsdHMuY3N2IikNCmRhdGFfc2V0DQpgYGANCg0KIyMjIyAxLTIuIMK/Q3VhbnRvcyBjYW5kaWRhdG9zIGVzdGFiYW4gZW4gbGFzIHByaW1hcmlhcz8NCmBgYHtyfQ0KdW5pcXVlKGRhdGFfc2V0JGNhbmRpZGF0ZSkNCmBgYA0KYGBge3J9DQpSMTwtbGVuZ3RoKHVuaXF1ZShkYXRhX3NldCRjYW5kaWRhdGUpKQ0KUjENCmBgYA0KUi8gRW4gdG90YWwgZXJhbiAxNiBjYW5kaWRhdG9zDQoNCiMjIyMgMy4gwr9RdWUgcGFydGlkbyBvYnR1dm8gbGEgbWF5b3IgY2FudGlkYWQgZGUgdm90b3MgZW4gRmxvcmlkYT8NCg0KYGBge3J9DQpSMyA8LSBkYXRhX3NldCAlPiUgDQogIGZpbHRlciAoc3RhdGUgPT0gIkZsb3JpZGEiKSAlPiUNCiAgZ3JvdXBfYnkocGFydHkpICU+JQ0KICBzdW1tYXJpc2Uodm90b3MgPSBzdW0odm90ZXMpKSAlPiUgDQogIGZpbHRlcih2b3RvcyA9PSBtYXgodm90b3MpKQ0KUjMNCmBgYA0KDQpSL0xvcyByZXB1YmxpY2Fub3Mgc29uIGVsIHBhcnRpZG8gcXVlIG1hcyB2b3RvcyBvYnR1dmllcm9uIGVuIGZsb3JpZGENCg0KIyMjIyA0LiDCv1JlYWxpY2UgdW5hIGdyw6FmaWNhIHNvYnJlIGVsIHRvcCAxMCBkZSBsb3MgY29uZGFkb3MgZGUgQ29sb3JhZG8gcXVlIHRpZW5lIG3DoXMgdm90YW50ZXM/DQoNCmBgYHtyfQ0KUjQgPC1kYXRhX3NldCAlPiUNCiAgZmlsdGVyKGRhdGFfc2V0JHN0YXRlID09ICJDb2xvcmFkbyIpJT4lDQogIGdyb3VwX2J5KGNvdW50eSkgJT4lDQogIHN1bW1hcmlzZSh2b3RhbnRlcz1zdW0odm90ZXMpKSAlPiUNCiAgdG9wX24oMTApICU+JQ0KICBhcnJhbmdlKC12b3RhbnRlcykNClI0DQoNCmJhcnBsb3QoUjQkdm90YW50ZXMsIA0KICAgICBtYWluPSJUb3AgMTAgVm90YW50ZXMgZGUgQ29sb3JhZG8iLCANCiAgICAgeGxhYj0iY291bnR5IiwgDQogICAgIHlsYWI9InZvdGFudGVzIiwgDQogICAgIGNvbD0gcmFpbmJvdygxMCksIA0KICAgICBsd2Q9MikNCg0KYGBgDQoNCiMjIyMgNS4gwr9FbiBlbCBlc3RhZG8gZGUgQ2FsaWZvcm5pYSwgcXVlIGNvbmRhZG8gdHV2byBsYSBtYXlvciBjYW50aWRhZCBkZSB2b3RhbnRlcz8NCg0KYGBge3J9DQpSNSA8LSBkYXRhX3NldCU+JQ0KICBmaWx0ZXIoZGF0YV9zZXQkc3RhdGUgPT0gIkNhbGlmb3JuaWEiKSU+JQ0KICBncm91cF9ieShjb3VudHkpJT4lDQogIHNlbGVjdChjb3VudHksIHZvdGVzKSU+JQ0KICBzdW1tYXJpc2Uodm90YW50ZXMgPSBzdW0odm90ZXMpKSU+JQ0KICB0b3BfbigxKQ0KUjUNCmBgYA0KDQpSLyBMb3MgQW5nZWxlcyBjb24gMSwyNjgsNjIyIHZvdG9zDQoNCiMjIyMgNi4gUmVhbGljZSB1bmEgZ3LDoWZpY2EgZGUgYmFycmFzIGxhIGN1YWwgbXVlc3RyZSBjdWFudGFzIHBlcnNvbmFzIHZvdGFyb24gcG9yIEhpbGxhcnkgQ2xpbnRvbiB5IGN1YW50YXMgcG9yIERvbmFsZCBUcnVtcA0KDQpgYGB7cn0NClRydW1wIDwtIHN1bShkYXRhX3NldFtkYXRhX3NldCRjYW5kaWRhdGUgPT0gIkRvbmFsZCBUcnVtcCIsInZvdGVzIl0pDQpIaWxsYXJ5IDwtIHN1bShkYXRhX3NldFtkYXRhX3NldCRjYW5kaWRhdGUgPT0gIkhpbGxhcnkgQ2xpbnRvbiIsICJ2b3RlcyIgXSkNCkdyYWZpY2E8LSBjKHRydW1wLCBoaWxsYXJ5KQ0KYmFycGxvdChHcmFmaWNhLCANCiAgICAgICAgbWFpbj0gIkhpbGxhcnkgdnMgVHJ1bXAiLCANCiAgICAgICAgeGxhYiA9ICJWb3RvcyIsIA0KICAgICAgICB5bGFiID0gIkNhbmRpZGF0b3MiLA0KICAgICAgICBjb2wgPSByYWluYm93KDMpKQ0KDQpgYGANCg0KIyMjIyA3LiDCv0PDumFsIGVzIGxhIHByb2JhYmlsaWRhZCBkZSBxdWUgc2kgdW4gdm90YW50ZSBlcyByZXB1YmxpY2FubyBlbiBGbG9yaWRhIGhheWEgdm90YWRvIHBvciBKZWIgQnVzaD8NCg0KYGBge3J9DQpSN19Wb3RvcyA8LSBkYXRhX3NldCU+JQ0KICBzdW1tYXJpc2UoVm90b3M9c3VtKHZvdGVzKSkNCiAgDQpSN19Qcm9iYWJpbGlkYWQ9ZGF0YV9zZXQlPiUNCiAgZmlsdGVyKGNhbmRpZGF0ZSA9PSAiSmViIEJ1c2giICYgcGFydHkgPT0gIlJlcHVibGljYW4iKSU+JQ0KICBzdW1tYXJpc2UoUHJvYmFiaWxpZGFkX1ZvdG8gPSBzdW0odm90ZXMpKSU+JQ0KICBhcnJhbmdlKGRlc2MoUHJvYmFiaWxpZGFkX1ZvdG8pKQ0KUHJvYmFiaWxpZGFkX0plYkJ1c2g9KFI3X1Byb2JhYmlsaWRhZC9SN19Wb3RvcykqMTAwDQpQcm9iYWJpbGlkYWRfSmViQnVzaA0KDQpgYGANCg0KUi83IExhIHByb2JhYmlsaWRhZCBkZSBxdWUgdW4gdm90YW50ZSBzZWEgcmVwdWJsaWNhbm8gYWwgdm90YXIgcG9yIEplYiBCdXNoIGVzIGRlIDAuMTcNCg0KDQojIyMjIDguIERhZG8gcXVlIHVuYSBwZXJzb25hIHZvdG8gcG9yIFRlZCBDcnV6LCDCv0PDumFsIGVzIGxhIHByb2JhYmlsaWRhZCBxdWUgc2VhIGRlIENhbGlmb3JuaWE/DQoNCmBgYHtyfQ0KUjhfUHJvYmFiaWxpZGFkPWRhdGFfc2V0JT4lDQogIGZpbHRlcihjYW5kaWRhdGUgPT0gIlRlZCBDcnV6IiAmIHN0YXRlID09ICJDYWxpZm9ybmlhIiklPiUNCiAgc3VtbWFyaXNlKFRvdGFsX3ZvdG9zID0gc3VtKHZvdGVzKSklPiUNCiAgYXJyYW5nZShkZXNjKFRvdGFsX3ZvdG9zKSkNClByb2JhYmlsaWRhZF9KZWJCdXNoPShSOF9Qcm9iYWJpbGlkYWQvUjdfVm90b3MpKjEwMA0KUHJvYmFiaWxpZGFkX0plYkJ1c2gNCmBgYA0KDQpSLyBMYSBwcm9iYWJpbGlkYWQgZGUgcXVlIHNlYSBkZSBjYWxpZm9ybmlhIGVzIGRlbCAwLjI1DQoNCg0KIyMjIyA5LiBSZWFsaWNlIHVuYSBncsOhZmljYSBzb2JyZSBlbCB0b3AgMTAgZGUgY29uZGFkb3MgZGUgbG9zIEVzdGFkb3MgVW5pZG9zIGNvbiBsYSBtYXlvciBjYW50aWRhZCBkZSB2b3RhbnRlcy4NCg0KYGBge3J9DQpSOSA8LSBkYXRhX3NldCAlPiUNCiAgZmlsdGVyKCFpcy5uYShjb3VudHkpKSAlPiUNCiAgZ3JvdXBfYnkoY291bnR5KSAlPiUNCiAgc3VtbWFyaXNlKHZvdGFudGVzPXN1bSh2b3RlcykpICU+JQ0KICBhcnJhbmdlKC12b3RhbnRlcyklPiUNCiAgdG9wX24oMTApDQoNClI5DQoNCmJhcnBsb3QoUjkkdm90YW50ZXMsIA0KICAgICBtYWluPSJUb3AgMTAgQ29uZGFkb3MgY29uIG3DoXMgdm90b3MiLCANCiAgICAgeGxhYj0iY291bnR5IiwgDQogICAgIHlsYWI9InZvdGFudGVzIiwgDQogICAgIGNvbD0gcmFpbmJvdygxMCksIA0KICAgICBsd2Q9MikNCmBgYA0KDQojIyMjIDEwLiBHZW5lcmUgdW5hIGdyw6FmaWNhIGRlbCBtYXBhIEVzdGFkb3MgVW5pZG9zIGRvbmRlIHNlIG11ZXN0cmUgbGEgY2FudGlkYWQgZGUgdm90YW50ZXMgcG9yIGVzdGFkbyBwb3IgbWVkaW8gZGUgdW4gY29sb3IuDQoNCg0KYGBge3J9DQpwbG90X3VzbWFwKHJlZ2lvbnMgPSAic3RhdGUiLCBkYXRhID0gZGF0YV9zZXQsIHZhbHVlcyA9ICJ2b3RlcyIsIGNvbG9yID0gInllbGxvdyIpDQpgYGANCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQo=