Expliqueu breument: - D’on prové el conjunt de dades. De la recolecta d’informacio en pagines web relacionada amb personatges de shonen - Quin és l’objectiu del projecte. Aprendre a treballar un cojunt de dades amb R relacionan amb un tema que ens agrada que seria el Anime - Quina pregunta voleu respondre. Quina relació hi ha entre edat i nivell de poder - Per què aquestes dades són adequades per aquesta pregunta. Perque recull diferents personatges amb la seva edat corresponent i el seus nivells de poder
Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.
load("Personatges_Shonen_v2.RData")
dades = personatges
Expliqueu: - Quin era el format original (CSV, XLSX, txt…) - Si heu fet cap modificació prèvia (neteja, reanomenar columnes, selecció de variables…)
dim(dades)
## [1] 105 8
glimpse(dades)
## Rows: 105
## Columns: 8
## $ Nom <chr> "Naruto Uzumaki", "Sasuke Uchiha", "Sakura Haruno", "Kaka…
## $ Edat <int> 17, 17, 17, 27, 21, 16, 17, 17, 19, 18, 19, 28, 24, 20, 1…
## $ Alçada_cm <int> 166, 168, 165, 181, 178, 160, 166, 174, 181, 169, 180, 18…
## $ Poder_nivell <int> 95, 94, 82, 90, 93, 76, 88, 96, 92, 68, 88, 78, 90, 89, 9…
## $ Sexe <chr> "Masculí", "Masculí", "Femení", "Masculí", "Masculí", "Fe…
## $ Anime_origen <chr> "Naruto", "Naruto", "Naruto", "Naruto", "Naruto", "Naruto…
## $ Tipus_poder <chr> "Energia_Interna", "Energia_Interna", "Energia_Interna", …
## $ Rol <chr> "Protagonista", "Antagonista", "Suport", "Suport", "Antag…
Incloeu: - Nombre de files. - Nombre de columnes. - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…)
Descriviu cada variable del dataset.
| Variable | Tipus | Descripció | Valors possibles / rang |
|---|---|---|---|
| exemple_var | numèrica | Significat de la variable | 0–100 |
# tibble(
# variable = names(dades),
# tipus = sapply(dades, class)
# )
# summary(dades)
Comenteu: - Si hi ha valors perduts. - Si alguna variable s’hauria de transformar. - Outliers o valors estranys.
Incloeu una o dues gràfiques exploratòries.
# Exemple:
# ggplot(dades, aes(x = variable)) + geom_histogram()
Expliqueu: - Si necessitareu dades externes per completar l’anàlisi. - On les podríeu trobar. - Si falten variables per respondre la pregunta inicial.
Incloeu qualsevol altre detall rellevant del procés de preparació de dades.