Marvin López

Data Mining and Big Data

Librerias

library(dplyr)
library(ggplot2)
library(usmap)

Data Set

data_set<-read.csv("primary_results.csv")
data_set

1-2. ¿Cuantos candidatos estaban en las primarias?

unique(data_set$candidate)
 [1] Bernie Sanders  Hillary Clinton Ben Carson      Donald Trump    John Kasich     Marco Rubio    
 [7] Ted Cruz         Uncommitted    Martin O'Malley Carly Fiorina   Chris Christie  Jeb Bush       
[13] Mike Huckabee   Rand Paul       Rick Santorum    No Preference 
16 Levels:  No Preference  Uncommitted Ben Carson Bernie Sanders Carly Fiorina ... Ted Cruz
R1<-length(unique(data_set$candidate))
R1
[1] 16

R/ En total eran 16 candidatos

3. ¿Que partido obtuvo la mayor cantidad de votos en Florida?

R3 <- data_set %>% 
  filter (state == "Florida") %>%
  group_by(party) %>%
  summarise(votos = sum(votes)) %>% 
  filter(votos == max(votos))
R3

R/Los republicanos son el partido que mas votos obtuvieron en florida

4. ¿Realice una gráfica sobre el top 10 de los condados de Colorado que tiene más votantes?

R4 <-data_set %>%
  filter(data_set$state == "Colorado")%>%
  group_by(county) %>%
  summarise(votantes=sum(votes)) %>%
  top_n(10) %>%
  arrange(-votantes)
Selecting by votantes
R4

barplot(R4$votantes, 
     main="Top 10 Votantes de Colorado", 
     xlab="county", 
     ylab="votantes", 
     col= rainbow(10), 
     lwd=2)

5. ¿En el estado de California, que condado tuvo la mayor cantidad de votantes?

R5 <- data_set%>%
  filter(data_set$state == "California")%>%
  group_by(county)%>%
  select(county, votes)%>%
  summarise(votantes = sum(votes))%>%
  top_n(1)
Selecting by votantes
R5

R/ Los Angeles con 1,268,622 votos

6. Realice una gráfica de barras la cual muestre cuantas personas votaron por Hillary Clinton y cuantas por Donald Trump

Trump <- sum(data_set[data_set$candidate == "Donald Trump","votes"])
Hillary <- sum(data_set[data_set$candidate == "Hillary Clinton", "votes" ])
Grafica<- c(trump, hillary)
barplot(Grafica, 
        main= "Hillary vs Trump", 
        xlab = "Votos", 
        ylab = "Candidatos",
        col = rainbow(3))

7. ¿Cúal es la probabilidad de que si un votante es republicano en Florida haya votado por Jeb Bush?

R7_Votos <- data_set%>%
  summarise(Votos=sum(votes))
  
R7_Probabilidad=data_set%>%
  filter(candidate == "Jeb Bush" & party == "Republican")%>%
  summarise(Probabilidad_Voto = sum(votes))%>%
  arrange(desc(Probabilidad_Voto))
Probabilidad_JebBush=(R7_Probabilidad/R7_Votos)*100
Probabilidad_JebBush
NA

R/7 La probabilidad de que un votante sea republicano al votar por Jeb Bush es de 0.17

8. Dado que una persona voto por Ted Cruz, ¿Cúal es la probabilidad que sea de California?

R8_Probabilidad=data_set%>%
  filter(candidate == "Ted Cruz" & state == "California")%>%
  summarise(Total_votos = sum(votes))%>%
  arrange(desc(Total_votos))
Probabilidad_JebBush=(R8_Probabilidad/R7_Votos)*100
Probabilidad_JebBush

R/ La probabilidad de que sea de california es del 0.25

9. Realice una gráfica sobre el top 10 de condados de los Estados Unidos con la mayor cantidad de votantes.

R9 <- data_set %>%
  filter(!is.na(county)) %>%
  group_by(county) %>%
  summarise(votantes=sum(votes)) %>%
  arrange(-votantes)%>%
  top_n(10)
Selecting by votantes
R9

barplot(R9$votantes, 
     main="Top 10 Condados con más votos", 
     xlab="county", 
     ylab="votantes", 
     col= rainbow(10), 
     lwd=2)

10. Genere una gráfica del mapa Estados Unidos donde se muestre la cantidad de votantes por estado por medio de un color.

plot_usmap(regions = "state", data = data_set, values = "votes", color = "yellow")

LS0tDQp0aXRsZTogIkxhYm9yYXRvcmlvIDEiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KIyMjIE1hcnZpbiBMw7NwZXoNCiMjIyBEYXRhIE1pbmluZyBhbmQgQmlnIERhdGENCg0KIyMjIyBMaWJyZXJpYXMNCmBgYHtyfQ0KbGlicmFyeShkcGx5cikNCmxpYnJhcnkoZ2dwbG90MikNCmxpYnJhcnkodXNtYXApDQpgYGANCiMjIyMgRGF0YSBTZXQNCmBgYHtyfQ0KZGF0YV9zZXQ8LXJlYWQuY3N2KCJwcmltYXJ5X3Jlc3VsdHMuY3N2IikNCmRhdGFfc2V0DQpgYGANCg0KIyMjIyAxLTIuIMK/Q3VhbnRvcyBjYW5kaWRhdG9zIGVzdGFiYW4gZW4gbGFzIHByaW1hcmlhcz8NCmBgYHtyfQ0KdW5pcXVlKGRhdGFfc2V0JGNhbmRpZGF0ZSkNCmBgYA0KYGBge3J9DQpSMTwtbGVuZ3RoKHVuaXF1ZShkYXRhX3NldCRjYW5kaWRhdGUpKQ0KUjENCmBgYA0KUi8gRW4gdG90YWwgZXJhbiAxNiBjYW5kaWRhdG9zDQoNCiMjIyMgMy4gwr9RdWUgcGFydGlkbyBvYnR1dm8gbGEgbWF5b3IgY2FudGlkYWQgZGUgdm90b3MgZW4gRmxvcmlkYT8NCg0KYGBge3J9DQpSMyA8LSBkYXRhX3NldCAlPiUgDQogIGZpbHRlciAoc3RhdGUgPT0gIkZsb3JpZGEiKSAlPiUNCiAgZ3JvdXBfYnkocGFydHkpICU+JQ0KICBzdW1tYXJpc2Uodm90b3MgPSBzdW0odm90ZXMpKSAlPiUgDQogIGZpbHRlcih2b3RvcyA9PSBtYXgodm90b3MpKQ0KUjMNCmBgYA0KDQpSL0xvcyByZXB1YmxpY2Fub3Mgc29uIGVsIHBhcnRpZG8gcXVlIG1hcyB2b3RvcyBvYnR1dmllcm9uIGVuIGZsb3JpZGENCg0KIyMjIyA0LiDCv1JlYWxpY2UgdW5hIGdyw6FmaWNhIHNvYnJlIGVsIHRvcCAxMCBkZSBsb3MgY29uZGFkb3MgZGUgQ29sb3JhZG8gcXVlIHRpZW5lIG3DoXMgdm90YW50ZXM/DQoNCmBgYHtyfQ0KUjQgPC1kYXRhX3NldCAlPiUNCiAgZmlsdGVyKGRhdGFfc2V0JHN0YXRlID09ICJDb2xvcmFkbyIpJT4lDQogIGdyb3VwX2J5KGNvdW50eSkgJT4lDQogIHN1bW1hcmlzZSh2b3RhbnRlcz1zdW0odm90ZXMpKSAlPiUNCiAgdG9wX24oMTApICU+JQ0KICBhcnJhbmdlKC12b3RhbnRlcykNClI0DQoNCmJhcnBsb3QoUjQkdm90YW50ZXMsIA0KICAgICBtYWluPSJUb3AgMTAgVm90YW50ZXMgZGUgQ29sb3JhZG8iLCANCiAgICAgeGxhYj0iY291bnR5IiwgDQogICAgIHlsYWI9InZvdGFudGVzIiwgDQogICAgIGNvbD0gcmFpbmJvdygxMCksIA0KICAgICBsd2Q9MikNCg0KYGBgDQoNCiMjIyMgNS4gwr9FbiBlbCBlc3RhZG8gZGUgQ2FsaWZvcm5pYSwgcXVlIGNvbmRhZG8gdHV2byBsYSBtYXlvciBjYW50aWRhZCBkZSB2b3RhbnRlcz8NCg0KYGBge3J9DQpSNSA8LSBkYXRhX3NldCU+JQ0KICBmaWx0ZXIoZGF0YV9zZXQkc3RhdGUgPT0gIkNhbGlmb3JuaWEiKSU+JQ0KICBncm91cF9ieShjb3VudHkpJT4lDQogIHNlbGVjdChjb3VudHksIHZvdGVzKSU+JQ0KICBzdW1tYXJpc2Uodm90YW50ZXMgPSBzdW0odm90ZXMpKSU+JQ0KICB0b3BfbigxKQ0KUjUNCmBgYA0KDQpSLyBMb3MgQW5nZWxlcyBjb24gMSwyNjgsNjIyIHZvdG9zDQoNCiMjIyMgNi4gUmVhbGljZSB1bmEgZ3LDoWZpY2EgZGUgYmFycmFzIGxhIGN1YWwgbXVlc3RyZSBjdWFudGFzIHBlcnNvbmFzIHZvdGFyb24gcG9yIEhpbGxhcnkgQ2xpbnRvbiB5IGN1YW50YXMgcG9yIERvbmFsZCBUcnVtcA0KDQpgYGB7cn0NClRydW1wIDwtIHN1bShkYXRhX3NldFtkYXRhX3NldCRjYW5kaWRhdGUgPT0gIkRvbmFsZCBUcnVtcCIsInZvdGVzIl0pDQpIaWxsYXJ5IDwtIHN1bShkYXRhX3NldFtkYXRhX3NldCRjYW5kaWRhdGUgPT0gIkhpbGxhcnkgQ2xpbnRvbiIsICJ2b3RlcyIgXSkNCkdyYWZpY2E8LSBjKHRydW1wLCBoaWxsYXJ5KQ0KYmFycGxvdChHcmFmaWNhLCANCiAgICAgICAgbWFpbj0gIkhpbGxhcnkgdnMgVHJ1bXAiLCANCiAgICAgICAgeGxhYiA9ICJWb3RvcyIsIA0KICAgICAgICB5bGFiID0gIkNhbmRpZGF0b3MiLA0KICAgICAgICBjb2wgPSByYWluYm93KDMpKQ0KDQpgYGANCg0KIyMjIyA3LiDCv0PDumFsIGVzIGxhIHByb2JhYmlsaWRhZCBkZSBxdWUgc2kgdW4gdm90YW50ZSBlcyByZXB1YmxpY2FubyBlbiBGbG9yaWRhIGhheWEgdm90YWRvIHBvciBKZWIgQnVzaD8NCg0KYGBge3J9DQpSN19Wb3RvcyA8LSBkYXRhX3NldCU+JQ0KICBzdW1tYXJpc2UoVm90b3M9c3VtKHZvdGVzKSkNCiAgDQpSN19Qcm9iYWJpbGlkYWQ9ZGF0YV9zZXQlPiUNCiAgZmlsdGVyKGNhbmRpZGF0ZSA9PSAiSmViIEJ1c2giICYgcGFydHkgPT0gIlJlcHVibGljYW4iKSU+JQ0KICBzdW1tYXJpc2UoUHJvYmFiaWxpZGFkX1ZvdG8gPSBzdW0odm90ZXMpKSU+JQ0KICBhcnJhbmdlKGRlc2MoUHJvYmFiaWxpZGFkX1ZvdG8pKQ0KUHJvYmFiaWxpZGFkX0plYkJ1c2g9KFI3X1Byb2JhYmlsaWRhZC9SN19Wb3RvcykqMTAwDQpQcm9iYWJpbGlkYWRfSmViQnVzaA0KDQpgYGANCg0KUi83IExhIHByb2JhYmlsaWRhZCBkZSBxdWUgdW4gdm90YW50ZSBzZWEgcmVwdWJsaWNhbm8gYWwgdm90YXIgcG9yIEplYiBCdXNoIGVzIGRlIDAuMTcNCg0KDQojIyMjIDguIERhZG8gcXVlIHVuYSBwZXJzb25hIHZvdG8gcG9yIFRlZCBDcnV6LCDCv0PDumFsIGVzIGxhIHByb2JhYmlsaWRhZCBxdWUgc2VhIGRlIENhbGlmb3JuaWE/DQoNCmBgYHtyfQ0KUjhfUHJvYmFiaWxpZGFkPWRhdGFfc2V0JT4lDQogIGZpbHRlcihjYW5kaWRhdGUgPT0gIlRlZCBDcnV6IiAmIHN0YXRlID09ICJDYWxpZm9ybmlhIiklPiUNCiAgc3VtbWFyaXNlKFRvdGFsX3ZvdG9zID0gc3VtKHZvdGVzKSklPiUNCiAgYXJyYW5nZShkZXNjKFRvdGFsX3ZvdG9zKSkNClByb2JhYmlsaWRhZF9KZWJCdXNoPShSOF9Qcm9iYWJpbGlkYWQvUjdfVm90b3MpKjEwMA0KUHJvYmFiaWxpZGFkX0plYkJ1c2gNCmBgYA0KDQpSLyBMYSBwcm9iYWJpbGlkYWQgZGUgcXVlIHNlYSBkZSBjYWxpZm9ybmlhIGVzIGRlbCAwLjI1DQoNCg0KIyMjIyA5LiBSZWFsaWNlIHVuYSBncsOhZmljYSBzb2JyZSBlbCB0b3AgMTAgZGUgY29uZGFkb3MgZGUgbG9zIEVzdGFkb3MgVW5pZG9zIGNvbiBsYSBtYXlvciBjYW50aWRhZCBkZSB2b3RhbnRlcy4NCg0KYGBge3J9DQpSOSA8LSBkYXRhX3NldCAlPiUNCiAgZmlsdGVyKCFpcy5uYShjb3VudHkpKSAlPiUNCiAgZ3JvdXBfYnkoY291bnR5KSAlPiUNCiAgc3VtbWFyaXNlKHZvdGFudGVzPXN1bSh2b3RlcykpICU+JQ0KICBhcnJhbmdlKC12b3RhbnRlcyklPiUNCiAgdG9wX24oMTApDQoNClI5DQoNCmJhcnBsb3QoUjkkdm90YW50ZXMsIA0KICAgICBtYWluPSJUb3AgMTAgQ29uZGFkb3MgY29uIG3DoXMgdm90b3MiLCANCiAgICAgeGxhYj0iY291bnR5IiwgDQogICAgIHlsYWI9InZvdGFudGVzIiwgDQogICAgIGNvbD0gcmFpbmJvdygxMCksIA0KICAgICBsd2Q9MikNCmBgYA0KDQojIyMjIDEwLiBHZW5lcmUgdW5hIGdyw6FmaWNhIGRlbCBtYXBhIEVzdGFkb3MgVW5pZG9zIGRvbmRlIHNlIG11ZXN0cmUgbGEgY2FudGlkYWQgZGUgdm90YW50ZXMgcG9yIGVzdGFkbyBwb3IgbWVkaW8gZGUgdW4gY29sb3IuDQoNCg0KYGBge3J9DQpwbG90X3VzbWFwKHJlZ2lvbnMgPSAic3RhdGUiLCBkYXRhID0gZGF0YV9zZXQsIHZhbHVlcyA9ICJ2b3RlcyIsIGNvbG9yID0gInllbGxvdyIpDQpgYGANCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQo=