dades = load("ConjuntEquipsFutbol.RData")
Expliqueu breument:
D’on prové el conjunt de dades. L’hem creat nosaltres a partir de les dades de pàgines web com ara TransferMrkt, OneFootball, i altres llocs web.
Quin és l’objectiu del projecte. Aprendre a gestionar amb R en Rstudio les dades del conjunt que hem escollit. En el procés aconseguir respondre la pregunta o preguntes inicials que haguem plantejat.
Quina pregunta voleu respondre. ¿Quina relació hi ha entre que l’entrenador d’un equip sigui estranger amb el percentatge d’estrangers de la plantilla?
Per què aquestes dades són adequades per aquesta pregunta. Creiem que el conjunt resumeix correctament els atributs més importants dels equips de les 5 grans lligues, i això ens serà essencial per respondre bé la pregunta. # 2. Importació de les dades
Explicació:
El format original el vem crear desde 0 amb XLSX (googleSheets) perquè fos més ràpid i visual de modificar entre tots i una vegada acabat el vam exportar a CSV.
Incloeu: - Nombre de files = {r} nrow(equips)
Nombre de columnes= {r} ncol(equips)
Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…): equips de futbol de 1a divisio de les 5 grans lligues
Descriviu cada variable del dataset.
| Variable | Tipus | Descripció | Valors possibles / rang |
|---|---|---|---|
| exemple_var | numèrica | Significat de la variable | 0–100 |
tibble(
variable = names(dades),
tipus = sapply(dades, class)
)
## # A tibble: 1 × 1
## tipus
## <chr>
## 1 character
# summary(dades)
Comenteu: - Si hi ha valors perduts. - Si alguna variable s’hauria de transformar. - Outliers o valors estranys.
Incloeu una o dues gràfiques exploratòries.
# Exemple:
# ggplot(dades, aes(x = variable)) + geom_histogram()
Expliqueu: - Si necessitareu dades externes per completar l’anàlisi. - On les podríeu trobar. - Si falten variables per respondre la pregunta inicial.
Incloeu qualsevol altre detall rellevant del procés de preparació de dades.