El conjunt de dades prové de internet, més concretament de Kaggle. L’objectiu del projecta, és estudiar els graus de autonomia segons la complexitat de la tasca i depenent de la IA.
Pimer vam descarregar el fitxer en CSV, deprès el vam iportar a R studio i el vam combertir a .Rdata. El nom del fitxer és Dataset_AI.
load("Dataset_AI (1).RData")
El format original del fitxer era CSV, i no hi em realitzat cap modificació.
# dim(dades)
# glimpse(dades)
Incloeu: - Nombre de files. - Nombre de columnes. - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…)
Descriviu cada variable del dataset.
| Variable | Tipus | Descripció | Valors possibles / rang |
|---|---|---|---|
| exemple_var | numèrica | Significat de la variable | 0–100 |
# tibble(
# variable = names(dades),
# tipus = sapply(dades, class)
# )
# summary(dades)
Comenteu: - Si hi ha valors perduts. - Si alguna variable s’hauria de transformar. - Outliers o valors estranys.
Incloeu una o dues gràfiques exploratòries.
# Exemple:
# ggplot(dades, aes(x = variable)) + geom_histogram()
Expliqueu: - Si necessitareu dades externes per completar l’anàlisi. - On les podríeu trobar. - Si falten variables per respondre la pregunta inicial.
Incloeu qualsevol altre detall rellevant del procés de preparació de dades.