1. Introducció

El conjunt de dades prové de internet, més concretament de Kaggle. L’objectiu del projecta, és estudiar els graus de autonomia segons la complexitat de la tasca i depenent de la IA.

2. Importació de les dades

Pimer vam descarregar el fitxer en CSV, deprès el vam iportar a R studio i el vam combertir a .Rdata. El nom del fitxer és Dataset_AI.

load("Dataset_AI (1).RData")

El format original del fitxer era CSV, i no hi em realitzat cap modificació.

3. Dimensions del dataset

# dim(dades)
# glimpse(dades)

Incloeu: - Nombre de files. - Nombre de columnes. - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…)

4. Diccionari de variables

Descriviu cada variable del dataset.

Variable Tipus Descripció Valors possibles / rang
exemple_var numèrica Significat de la variable 0–100
# tibble(
#   variable = names(dades),
#   tipus = sapply(dades, class)
# )

5. Estadístiques descriptives

# summary(dades)

Comenteu: - Si hi ha valors perduts. - Si alguna variable s’hauria de transformar. - Outliers o valors estranys.

6. Visualització inicial

Incloeu una o dues gràfiques exploratòries.

# Exemple:
# ggplot(dades, aes(x = variable)) + geom_histogram()

7. Variables externes i dades addicionals

Expliqueu: - Si necessitareu dades externes per completar l’anàlisi. - On les podríeu trobar. - Si falten variables per respondre la pregunta inicial.

8. Altres comentaris

Incloeu qualsevol altre detall rellevant del procés de preparació de dades.