PAC2

Miquel Àngel Arévalo Juárez

Estudiant

Última modificació

30 d’octubre de 2024

Activitat 1

  1. Quantes observacions i variables té?

  2. Quina és la unitat d’observació?

  3. Quin tipus de variables té?

  4. Quin és el nivell d’anàlisi?

  5. Proposa una pregunta que es pugui contestar amb aquest marc de dades.

  6. Posa un exemple de problema de fal·làcia ecològica amb aquestes dades.

# posa eval = T per visualitzar la imatge
# assegura't que la imatge i aquest document es troben a la mateixa carpeta
knitr::include_graphics("aadd_unit2.png")

Activitat 2

En aquesta activitat utilitzarem el marc de dades eu_ideology_scores.xlsx. Per això l’importarem amb la funció readxl() i li donarem el nom de euis.

#Recorda que tots els chunks estan en eval = F, per activar-los has de canviar a eval = T
library(readxl)
euis <- read_xlsx("eu_ideology_scores.xlsx")
  1. En primer lloc, fes una exploració general les dades amb les funcions que ja coneixes, identificant el nombre d’observacions, variables, unitat d’observació, etc.
euis
  1. Amb unique(), examina quants països diferents hi ha.
euis
  1. Escriu el codi que et permeti observar quina observació / observacions és “Euskal Herria Bildu”?
euis
  1. Canvia “Social Democratic and Labour Party” per “Social Democratic & Labour Party”
euis
  1. La variable election_year_regional computa l’any que es van produir eleccions regionals. No obstant, el que volem crear és una nova variable que tingui per nom dif i que calculi la diferència d’anys amb l’actualitzat, de manera que si unes eleccions es van produir el 1995 i estem a 2024, el resultat sigui 29 (2024 - 1995).
euis
  1. Redueix les dades, de manera que conservis les observacions de Catalunya que van tenir eleccions regionals més tard del 2010.
euis
  1. Finalment, crea una nova variable decade a partir dels valors de la variable election_year_national_previous, de manera que observis els seus valors per dècades. És a dir, enlloc de 1971 s’hauria de veure el valor “1970s”, enlloc de 1981 el valor “1980s”, etc.
euis

The War Of The Five Kings

En aquesta secció utilitzarem el sistema pipe (%>% o |>) i les funcions del paquet dplyr (filter, select, mutate, arrange). I ho aplicarem a la base de dades The War Of The Five Kings, inspirada en la popular sèrie Game of Thrones.

got <- tibble(read.csv("https://github.com/chrisalbon/war_of_the_five_kings_dataset/raw/master/5kings_battles_v1.csv"))
  1. En primer lloc anem a reduir les dades, de manera que només conservarem les dades que ens interessen. Primer hauràs de visualitzar les dades per fer-te una idea del seu contingut (recomanem amb glimpse()). A continuació, crea un nou objecte gotr on conservem les següents columnes: el nom de la batalla, l’any, el rei atacant i defensor, la mida de l’atacant i el defensor, el resultat i el tipus de la batalla, la localització, la regió i si era estiu.
gotr
  1. Filtra les dades de gotr per tal que es vegin només les batalles on Stannis Baratheon era el rei atacant.
gotr
  1. Filtra les dades per tal que es vegin només les batalles on Stannis Baratheon era el rei atacant i la batalla va ser a l’hivern.
gotr 
  1. Copia el codi anterior i crea una nova pipe, on posis les dades de mida de l’atacant i mida del defensor en milers.
gotr 
  1. Copia el codi anterior i crea una nova pipe, on ordenis les dades per mida de l’exèrcit defensor.
gotr 
  1. Entre les batalles que eren una embuscada, quins eren els exèrcits defensors amb més tropes? Respon a la pregunta utilitzant, per aquest ordre, filter() , select() i arrange(). El marc de dades resultant t’hauria de mostrar clarament la resposta.
gotr