El objetivo del siguiente laboratorio es analizar data haciendo uso de la librería “dplyr”
library(dplyr)
setwd("~/R/VotesEEUU")
votes_data <- read.csv(file = "primary_results.csv")
str(votes_data)
'data.frame': 24611 obs. of 8 variables:
$ state : Factor w/ 49 levels "Alabama","Alaska",..: 1 1 1 1 1 1 1 1 1 1 ...
$ state_abbreviation: Factor w/ 49 levels "AK","AL","AR",..: 2 2 2 2 2 2 2 2 2 2 ...
$ county : Factor w/ 2633 levels "Abbeville","Abbot",..: 104 104 115 115 128 128 198 198 216 216 ...
$ fips : num 1001 1001 1003 1003 1005 ...
$ party : Factor w/ 2 levels "Democrat","Republican": 1 1 1 1 1 1 1 1 1 1 ...
$ candidate : Factor w/ 16 levels " No Preference",..: 4 8 4 8 4 8 4 8 4 8 ...
$ votes : int 544 2387 2694 5290 222 2567 246 942 395 564 ...
$ fraction_votes : num 0.182 0.8 0.329 0.647 0.078 0.906 0.197 0.755 0.386 0.551 ...
head(votes_data)
- ¿Cuántos candidatos estaban en las primarias?
candidate <- length(levels(votes_data$candidate))
candidate
[1] 16
R: Habían 16 candidatos
- ¿Cuántos de los candidatos eran republicanos?
republicans<- filter(votes_data,party=="Republican")%>%
group_by(candidate)%>%
summarise()%>%
nrow()
republicans
[1] 11
R: De esos 16 candidatos, 11 eran republicanos
- ¿Qué partido obtuvo la mayor cantidad de votos en Florida?
Florida<- (filter(votes_data,state=="Florida")%>%
group_by(party)%>%
summarise(total = sum(votes))%>%
arrange(desc(total)))[1,]
Florida
R: Los republicanos tuvieron más votos, siendo estos 2,276,926 votos
- ¿Qué condado de Florida es el que tiene la mayor cantidad de votantes?
florida_country <- (filter(votes_data,state=="Florida")%>%
group_by(county)%>%
summarise(total = sum(votes))%>%
arrange(desc(total)))[1,]
florida_country
R: Miami-Dade es el condado de Florida con mayor candidad de votantes
- En el condado de Florida que tuvo la mayor cantidad de votantes ¿Qué candidato tuvo la mayor cantidad de votos y de qué partido era?
Miami_Dade <- (filter(votes_data,state=="Florida",county=="Miami-Dade")%>%
group_by(candidate,party)%>%
summarise(votes = sum(votes))%>%
arrange(desc(votes)))[1,]
Miami_Dade
R: En Florida Hillary Clinton, del partido demócrata tuvo mayor cantidad de votos, siendo estos 129,467 votos
- ¿Cuántas personas Votaron por Hillary Clinton y cuántas por Donald Trump en Estados Unidos?
Hillary_Trump <- filter(votes_data,candidate=="Hillary Clinton"| candidate=="Donald Trump")%>%
group_by(candidate)%>%
summarise(votes = sum(votes))
Hillary_Trump
R: Hillary Clinton obtuvo 15,692,452 votos y Donald Trump 13,302,541 votos en todos los Estados Unidos
- ¿Cuál es la probabilidad de que si alguien sea republicano en Florida haya votado por Jeb Bush?
Jeb_Bush_Fl <- filter(votes_data, party=="Republican", state=="Florida",candidate=="Jeb Bush")%>%
summarise(prob = sum(votes))
all_Florida <- filter(votes_data, party=="Republican", state=="Florida")%>%
summarise(prob = sum(votes))
Prob_JBush_FL <- Jeb_Bush_Fl/all_Florida
Prob_JBush_FL
R: La probabilidad de que alguien republicano de Florida haya votado por Jeb Bush es de 0
- Dado que una persona votó por Ted Cruz, ¿Cuál es la probabilidad que sea de California?
Ted_Cruz <- filter(votes_data,candidate=="Ted Cruz")%>%
summarise(prob = sum(votes))
Ted_Cruz_Cal <- filter(votes_data,candidate=="Ted Cruz",state =="California")%>%
summarise(prob = sum(votes))
Prob_TedC_Cal <- Ted_Cruz_Cal/Ted_Cruz
Prob_TedC_Cal
R: La probabilidad de que una persona de California haya votado por Ted Cruz es de 0.0189
- Dado que una persona es de texas, ¿Cuál es la probabilidad que vote por Donald Trump?
all_Texas <- filter(votes_data,state=="Texas")%>%
summarise(prob = sum(votes))
Trump_Texas <- filter(votes_data,state=="Texas",candidate=="Donald Trump")%>%
summarise(prob = sum(votes))
Prob_TrumpTex <- Trump_Texas/all_Texas
Prob_TrumpTex
La probabilidad de que una persona de Texas haya votado por Donald Trump es de 0.1826
- ¿Qué condado de los Estados Unidos es el que tuvo la mayor cantidad de votantes?
total_county <- (group_by(votes_data,county)%>%
summarise(total = sum(votes))%>%
arrange(desc(total)))[1,]
total_county
R: Los Ángeles es el estado con mayor cantidad de votantes, siendo estos 1,268,622
- ¿Quién ganó en Los Ángeles para los demócratas?
LA_dem <- (filter(votes_data,county=="Los Angeles",party=="Democrat")%>%
group_by(candidate)%>%
summarise(total = sum(votes))%>%
arrange(desc(total)))[1,]
LA_dem
¿Para los republicanos?
LA_rep <- (filter(votes_data,county=="Los Angeles",party=="Republican")%>%
group_by(candidate)%>%
summarise(total = sum(votes))%>%
arrange(desc(total)))[1,]
LA_rep
R: Para los demóctratas en Los Ángeles ganó Hillary Clinton con 590,502 votos y para los republicanos ganó Donald Trump con 179,130 votos.
- ¿Cuántas personas votaron por los republicanos y cuantas por los demócratas en todo Estados Unidos?
all_USA <- group_by(votes_data,party)%>%
summarise(total = sum(votes))
all_USA
R: En todos los Estados Unidos, 27,660,501 de personas votaron por el partido demócrata y 29,098,686 por el partido republicano.
LS0tDQp0aXRsZTogIkVsZWNjaW9uZXMgLUxhYm9yYXRvcmlvIDItIg0Kc3VidGl0bGU6ICJBbGVqYW5kcmEgQ2VybWXxby8xMjAwMjI5NCINCm91dHB1dDogaHRtbF9ub3RlYm9vaw0KLS0tDQoNCkVsIG9iamV0aXZvIGRlbCBzaWd1aWVudGUgbGFib3JhdG9yaW8gZXMgYW5hbGl6YXIgZGF0YSBoYWNpZW5kbyB1c28gZGUgbGEgbGlicmVy7WEgImRwbHlyIiANCg0KYGBge3IsZWNobz1UUlVFLGV2YWw9VFJVRX0NCmxpYnJhcnkoZHBseXIpDQpzZXR3ZCgifi9SL1ZvdGVzRUVVVSIpDQp2b3Rlc19kYXRhIDwtIHJlYWQuY3N2KGZpbGUgPSAicHJpbWFyeV9yZXN1bHRzLmNzdiIpDQpzdHIodm90ZXNfZGF0YSkNCmhlYWQodm90ZXNfZGF0YSkNCmBgYA0KDQoNCjEuIL9DdeFudG9zIGNhbmRpZGF0b3MgZXN0YWJhbiBlbiBsYXMgcHJpbWFyaWFzPw0KYGBge3J9DQpjYW5kaWRhdGUgPC0gbGVuZ3RoKGxldmVscyh2b3Rlc19kYXRhJGNhbmRpZGF0ZSkpDQpjYW5kaWRhdGUNCmBgYA0KDQpSOiBIYWLtYW4gMTYgY2FuZGlkYXRvcw0KDQoNCjIuIL9DdeFudG9zIGRlIGxvcyBjYW5kaWRhdG9zIGVyYW4gcmVwdWJsaWNhbm9zPw0KYGBge3J9DQpyZXB1YmxpY2FuczwtIGZpbHRlcih2b3Rlc19kYXRhLHBhcnR5PT0iUmVwdWJsaWNhbiIpJT4lDQogICAgIGdyb3VwX2J5KGNhbmRpZGF0ZSklPiUNCiAgICAgc3VtbWFyaXNlKCklPiUNCiAgICAgbnJvdygpDQpyZXB1YmxpY2Fucw0KYGBgDQoNClI6IERlIGVzb3MgMTYgY2FuZGlkYXRvcywgMTEgZXJhbiByZXB1YmxpY2Fub3MNCg0KDQozLiC/UXXpIHBhcnRpZG8gb2J0dXZvIGxhIG1heW9yIGNhbnRpZGFkIGRlIHZvdG9zIGVuIEZsb3JpZGE/DQoNCmBgYHtyfQ0KRmxvcmlkYTwtIChmaWx0ZXIodm90ZXNfZGF0YSxzdGF0ZT09IkZsb3JpZGEiKSU+JQ0KICAgIGdyb3VwX2J5KHBhcnR5KSU+JQ0KICAgIHN1bW1hcmlzZSh0b3RhbCA9IHN1bSh2b3RlcykpJT4lDQogICAgYXJyYW5nZShkZXNjKHRvdGFsKSkpWzEsXQ0KRmxvcmlkYQ0KYGBgDQoNClI6IExvcyByZXB1YmxpY2Fub3MgdHV2aWVyb24gbeFzIHZvdG9zLCBzaWVuZG8gZXN0b3MgMiwyNzYsOTI2IHZvdG9zDQoNCg0KNC4gv1F16SBjb25kYWRvIGRlIEZsb3JpZGEgZXMgZWwgcXVlIHRpZW5lIGxhIG1heW9yIGNhbnRpZGFkIGRlIHZvdGFudGVzPw0KYGBge3J9DQpmbG9yaWRhX2NvdW50cnkgPC0gKGZpbHRlcih2b3Rlc19kYXRhLHN0YXRlPT0iRmxvcmlkYSIpJT4lDQogIGdyb3VwX2J5KGNvdW50eSklPiUNCiAgc3VtbWFyaXNlKHRvdGFsID0gc3VtKHZvdGVzKSklPiUNCiAgYXJyYW5nZShkZXNjKHRvdGFsKSkpWzEsXQ0KZmxvcmlkYV9jb3VudHJ5DQoNCmBgYA0KDQpSOiBNaWFtaS1EYWRlIGVzIGVsIGNvbmRhZG8gZGUgRmxvcmlkYSBjb24gbWF5b3IgY2FuZGlkYWQgZGUgdm90YW50ZXMNCg0KDQo1LiBFbiBlbCBjb25kYWRvIGRlIEZsb3JpZGEgcXVlIHR1dm8gbGEgbWF5b3IgY2FudGlkYWQgZGUgdm90YW50ZXMgv1F16SBjYW5kaWRhdG8gdHV2byBsYSBtYXlvciBjYW50aWRhZCBkZSB2b3RvcyB5IGRlIHF16SBwYXJ0aWRvIGVyYT8NCmBgYHtyfQ0KTWlhbWlfRGFkZSA8LSAoZmlsdGVyKHZvdGVzX2RhdGEsc3RhdGU9PSJGbG9yaWRhIixjb3VudHk9PSJNaWFtaS1EYWRlIiklPiUNCiAgZ3JvdXBfYnkoY2FuZGlkYXRlLHBhcnR5KSU+JQ0KICBzdW1tYXJpc2Uodm90ZXMgPSBzdW0odm90ZXMpKSU+JQ0KICBhcnJhbmdlKGRlc2Modm90ZXMpKSlbMSxdDQogIA0KTWlhbWlfRGFkZQ0KYGBgDQoNClI6IEVuIEZsb3JpZGEgSGlsbGFyeSBDbGludG9uLCBkZWwgcGFydGlkbyBkZW3zY3JhdGEgdHV2byBtYXlvciBjYW50aWRhZCBkZSB2b3Rvcywgc2llbmRvIGVzdG9zIDEyOSw0Njcgdm90b3MNCg0KDQo2LiC/Q3XhbnRhcyBwZXJzb25hcyBWb3Rhcm9uIHBvciBIaWxsYXJ5IENsaW50b24geSBjdeFudGFzIHBvciBEb25hbGQgVHJ1bXAgZW4gRXN0YWRvcyBVbmlkb3M/DQoNCmBgYHtyfQ0KSGlsbGFyeV9UcnVtcCA8LSBmaWx0ZXIodm90ZXNfZGF0YSxjYW5kaWRhdGU9PSJIaWxsYXJ5IENsaW50b24ifCBjYW5kaWRhdGU9PSJEb25hbGQgVHJ1bXAiKSU+JQ0KICAgIGdyb3VwX2J5KGNhbmRpZGF0ZSklPiUNCiAgICBzdW1tYXJpc2Uodm90ZXMgPSBzdW0odm90ZXMpKQ0KSGlsbGFyeV9UcnVtcA0KYGBgDQoNClI6IEhpbGxhcnkgQ2xpbnRvbiBvYnR1dm8gMTUsNjkyLDQ1MiB2b3RvcyB5IERvbmFsZCBUcnVtcCAxMywzMDIsNTQxIHZvdG9zIGVuIHRvZG9zIGxvcyBFc3RhZG9zIFVuaWRvcw0KDQogDQo3LiC/Q3XhbCBlcyBsYSBwcm9iYWJpbGlkYWQgZGUgcXVlIHNpIGFsZ3VpZW4gc2VhIHJlcHVibGljYW5vIGVuIEZsb3JpZGEgaGF5YSB2b3RhZG8gcG9yIEplYiBCdXNoPw0KDQpgYGB7cn0NCkplYl9CdXNoX0ZsIDwtIGZpbHRlcih2b3Rlc19kYXRhLCBwYXJ0eT09IlJlcHVibGljYW4iLCBzdGF0ZT09IkZsb3JpZGEiLGNhbmRpZGF0ZT09IkplYiBCdXNoIiklPiUNCiAgICBzdW1tYXJpc2UocHJvYiA9IHN1bSh2b3RlcykpIA0KYWxsX0Zsb3JpZGEgPC0gZmlsdGVyKHZvdGVzX2RhdGEsIHBhcnR5PT0iUmVwdWJsaWNhbiIsIHN0YXRlPT0iRmxvcmlkYSIpJT4lDQogICAgc3VtbWFyaXNlKHByb2IgPSBzdW0odm90ZXMpKQ0KUHJvYl9KQnVzaF9GTCA8LSBKZWJfQnVzaF9GbC9hbGxfRmxvcmlkYQ0KUHJvYl9KQnVzaF9GTA0KYGBgDQoNClI6IExhIHByb2JhYmlsaWRhZCBkZSBxdWUgYWxndWllbiByZXB1YmxpY2FubyBkZSBGbG9yaWRhIGhheWEgdm90YWRvIHBvciBKZWIgQnVzaCBlcyBkZSAwDQoNCg0KOC4gRGFkbyBxdWUgdW5hIHBlcnNvbmEgdm908yBwb3IgVGVkIENydXosIL9DdeFsIGVzIGxhIHByb2JhYmlsaWRhZCBxdWUgc2VhIGRlIENhbGlmb3JuaWE/DQoNCmBgYHtyfQ0KVGVkX0NydXogPC0gZmlsdGVyKHZvdGVzX2RhdGEsY2FuZGlkYXRlPT0iVGVkIENydXoiKSU+JQ0KICAgIHN1bW1hcmlzZShwcm9iID0gc3VtKHZvdGVzKSkNClRlZF9DcnV6X0NhbCA8LSBmaWx0ZXIodm90ZXNfZGF0YSxjYW5kaWRhdGU9PSJUZWQgQ3J1eiIsc3RhdGUgPT0iQ2FsaWZvcm5pYSIpJT4lDQogICAgc3VtbWFyaXNlKHByb2IgPSBzdW0odm90ZXMpKQ0KUHJvYl9UZWRDX0NhbCA8LSBUZWRfQ3J1el9DYWwvVGVkX0NydXoNClByb2JfVGVkQ19DYWwNCmBgYA0KDQpSOiBMYSBwcm9iYWJpbGlkYWQgZGUgcXVlIHVuYSBwZXJzb25hIGRlIENhbGlmb3JuaWEgaGF5YSB2b3RhZG8gcG9yIFRlZCBDcnV6IGVzIGRlIDAuMDE4OQ0KDQoNCjkuIERhZG8gcXVlIHVuYSBwZXJzb25hIGVzIGRlIHRleGFzLCC/Q3XhbCBlcyBsYSBwcm9iYWJpbGlkYWQgcXVlIHZvdGUgcG9yIERvbmFsZCBUcnVtcD8NCmBgYHtyfQ0KYWxsX1RleGFzIDwtIGZpbHRlcih2b3Rlc19kYXRhLHN0YXRlPT0iVGV4YXMiKSU+JQ0KICAgIHN1bW1hcmlzZShwcm9iID0gc3VtKHZvdGVzKSkNClRydW1wX1RleGFzIDwtIGZpbHRlcih2b3Rlc19kYXRhLHN0YXRlPT0iVGV4YXMiLGNhbmRpZGF0ZT09IkRvbmFsZCBUcnVtcCIpJT4lDQogICAgc3VtbWFyaXNlKHByb2IgPSBzdW0odm90ZXMpKQ0KUHJvYl9UcnVtcFRleCA8LSBUcnVtcF9UZXhhcy9hbGxfVGV4YXMNClByb2JfVHJ1bXBUZXgNCmBgYA0KDQpMYSBwcm9iYWJpbGlkYWQgZGUgcXVlIHVuYSBwZXJzb25hIGRlIFRleGFzIGhheWEgdm90YWRvIHBvciBEb25hbGQgVHJ1bXAgZXMgZGUgMC4xODI2DQoNCg0KMTAuIL9RdekgY29uZGFkbyBkZSBsb3MgRXN0YWRvcyBVbmlkb3MgZXMgZWwgcXVlIHR1dm8gbGEgbWF5b3IgY2FudGlkYWQgZGUgdm90YW50ZXM/DQpgYGB7cn0NCnRvdGFsX2NvdW50eSA8LSAoZ3JvdXBfYnkodm90ZXNfZGF0YSxjb3VudHkpJT4lDQogICAgc3VtbWFyaXNlKHRvdGFsID0gc3VtKHZvdGVzKSklPiUNCiAgICAgIGFycmFuZ2UoZGVzYyh0b3RhbCkpKVsxLF0NCnRvdGFsX2NvdW50eQ0KYGBgDQoNClI6IExvcyDBbmdlbGVzIGVzIGVsIGVzdGFkbyBjb24gbWF5b3IgY2FudGlkYWQgZGUgdm90YW50ZXMsIHNpZW5kbyBlc3RvcyAxLDI2OCw2MjIgDQoNCg0KMTEuIL9RdWnpbiBnYW7zIGVuIExvcyDBbmdlbGVzIHBhcmEgbG9zIGRlbfNjcmF0YXM/IA0KYGBge3J9DQpMQV9kZW0gPC0gKGZpbHRlcih2b3Rlc19kYXRhLGNvdW50eT09IkxvcyBBbmdlbGVzIixwYXJ0eT09IkRlbW9jcmF0IiklPiUNCiAgICBncm91cF9ieShjYW5kaWRhdGUpJT4lDQogICAgc3VtbWFyaXNlKHRvdGFsID0gc3VtKHZvdGVzKSklPiUNCiAgICBhcnJhbmdlKGRlc2ModG90YWwpKSlbMSxdDQpMQV9kZW0NCg0KYGBgDQogIA0KICC/UGFyYSBsb3MgcmVwdWJsaWNhbm9zPw0KYGBge3J9DQpMQV9yZXAgPC0gKGZpbHRlcih2b3Rlc19kYXRhLGNvdW50eT09IkxvcyBBbmdlbGVzIixwYXJ0eT09IlJlcHVibGljYW4iKSU+JQ0KICAgIGdyb3VwX2J5KGNhbmRpZGF0ZSklPiUNCiAgICBzdW1tYXJpc2UodG90YWwgPSBzdW0odm90ZXMpKSU+JQ0KICAgIGFycmFuZ2UoZGVzYyh0b3RhbCkpKVsxLF0NCkxBX3JlcA0KYGBgDQoNClI6IFBhcmEgbG9zIGRlbfNjdHJhdGFzIGVuIExvcyDBbmdlbGVzIGdhbvMgSGlsbGFyeSBDbGludG9uIGNvbiA1OTAsNTAyIHZvdG9zIHkgcGFyYSBsb3MgcmVwdWJsaWNhbm9zIGdhbvMgRG9uYWxkIFRydW1wIGNvbiAxNzksMTMwIHZvdG9zLg0KDQoNCjEyLiC/Q3XhbnRhcyBwZXJzb25hcyB2b3Rhcm9uIHBvciBsb3MgcmVwdWJsaWNhbm9zIHkgY3VhbnRhcyBwb3IgbG9zIGRlbfNjcmF0YXMgZW4gdG9kbyBFc3RhZG9zIFVuaWRvcz8NCg0KYGBge3J9DQphbGxfVVNBIDwtIGdyb3VwX2J5KHZvdGVzX2RhdGEscGFydHkpJT4lDQogICAgc3VtbWFyaXNlKHRvdGFsID0gc3VtKHZvdGVzKSkNCmFsbF9VU0ENCmBgYA0KDQpSOiBFbiB0b2RvcyBsb3MgRXN0YWRvcyBVbmlkb3MsIDI3LDY2MCw1MDEgZGUgcGVyc29uYXMgdm90YXJvbiBwb3IgZWwgcGFydGlkbyBkZW3zY3JhdGEgeSAyOSwwOTgsNjg2IHBvciBlbCBwYXJ0aWRvIHJlcHVibGljYW5vLiANCg0K