# posa eval = T per visualitzar la imatge
# assegura't que la imatge i aquest document es troben a la mateixa carpeta
knitr::include_graphics("aadd_unit2.png")PAC2
Activitat 1
Quantes observacions i variables té?
Quina és la unitat d’observació?
Quin tipus de variables té?
Quin és el nivell d’anàlisi?
Proposa una pregunta que es pugui contestar amb aquest marc de dades.
Posa un exemple de problema de fal·làcia ecològica amb aquestes dades.
Activitat 2
En aquesta activitat utilitzarem el marc de dades eu_ideology_scores.xlsx. Per això l’importarem amb la funció readxl() i li donarem el nom de euis.
#Recorda que tots els chunks estan en eval = F, per activar-los has de canviar a eval = T
library(readxl)
euis <- read_xlsx("eu_ideology_scores.xlsx")- En primer lloc, fes una exploració general les dades amb les funcions que ja coneixes, identificant el nombre d’observacions, variables, unitat d’observació, etc.
euis- Amb
unique(), examina quants països diferents hi ha.
euis- Escriu el codi que et permeti observar quina observació / observacions és “Euskal Herria Bildu”?
euis- Canvia “Social Democratic and Labour Party” per “Social Democratic & Labour Party”
euis- La variable
election_year_regionalcomputa l’any que es van produir eleccions regionals. No obstant, el que volem crear és una nova variable que tingui per nomdifi que calculi la diferència d’anys amb l’actualitzat, de manera que si unes eleccions es van produir el 1995 i estem a 2024, el resultat sigui 29 (2024 - 1995).
euis- Redueix les dades, de manera que conservis les observacions de Catalunya que van tenir eleccions regionals més tard del 2010.
euis- Finalment, crea una nova variable
decadea partir dels valors de la variableelection_year_national_previous, de manera que observis els seus valors per dècades. És a dir, enlloc de 1971 s’hauria de veure el valor “1970s”, enlloc de 1981 el valor “1980s”, etc.
euisThe War Of The Five Kings
En aquesta secció utilitzarem el sistema pipe (%>% o |>) i les funcions del paquet dplyr (filter, select, mutate, arrange). I ho aplicarem a la base de dades The War Of The Five Kings, inspirada en la popular sèrie Game of Thrones.
got <- tibble(read.csv("https://github.com/chrisalbon/war_of_the_five_kings_dataset/raw/master/5kings_battles_v1.csv"))- En primer lloc anem a reduir les dades, de manera que només conservarem les dades que ens interessen. Primer hauràs de visualitzar les dades per fer-te una idea del seu contingut (recomanem amb
glimpse()). A continuació, crea un nou objectegotron conservem les següents columnes: el nom de la batalla, l’any, el rei atacant i defensor, la mida de l’atacant i el defensor, el resultat i el tipus de la batalla, la localització, la regió i si era estiu.
gotr- Filtra les dades de
gotrper tal que es vegin només les batalles on Stannis Baratheon era el rei atacant.
gotr- Filtra les dades per tal que es vegin només les batalles on Stannis Baratheon era el rei atacant i la batalla va ser a l’hivern.
gotr - Copia el codi anterior i crea una nova pipe, on posis les dades de mida de l’atacant i mida del defensor en milers.
gotr - Copia el codi anterior i crea una nova pipe, on ordenis les dades per mida de l’exèrcit defensor.
gotr - Entre les batalles que eren una embuscada, quins eren els exèrcits defensors amb més tropes? Respon a la pregunta utilitzant, per aquest ordre,
filter(),select()iarrange(). El marc de dades resultant t’hauria de mostrar clarament la resposta.
gotr