1. Introducció

Expliqueu breument:

2. Importació de les dades

Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.

# Exemple d'importació (modifiqueu segons calgui)
dades <- read_csv("Vols_ElPrat.csv")
## Rows: 56480 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (3): Data_Referencia, Nom_Companyia, Nom_Zona
## dbl (3): Codi_Companyia, Codi_Zona, Nombre_Vols
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Expliqueu: - Quin era el format original (CSV, XLSX, txt…) - Si heu fet cap modificació prèvia (neteja, reanomenar columnes, selecció de variables…)

3. Dimensions del dataset

summary(dades)
##  Data_Referencia    Codi_Companyia   Nom_Companyia        Codi_Zona    
##  Length:56480       Min.   :   1.0   Length:56480       Min.   :1.000  
##  Class :character   1st Qu.:   3.0   Class :character   1st Qu.:2.000  
##  Mode  :character   Median :   9.0   Mode  :character   Median :2.000  
##                     Mean   : 182.7                      Mean   :2.269  
##                     3rd Qu.:  18.0                      3rd Qu.:2.000  
##                     Max.   :9999.0                      Max.   :5.000  
##                     NA's   :1                           NA's   :1      
##    Nom_Zona          Nombre_Vols   
##  Length:56480       Min.   :  1.0  
##  Class :character   1st Qu.:  4.0  
##  Mode  :character   Median :  8.0  
##                     Mean   : 19.7  
##                     3rd Qu.: 16.0  
##                     Max.   :245.0  
##                     NA's   :1
# dim(dades)
# glimpse(dades)

Incloeu: - Nombre de files. - Nombre de columnes. - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…)

4. Diccionari de variables

Descriviu cada variable del dataset.

Variable Tipus Descripció Valors possibles / rang
exemple_var numèrica Significat de la variable 0–100
# tibble(
#   variable = names(dades),
#   tipus = sapply(dades, class)
# )

5. Estadístiques descriptives

# summary(dades)

Comenteu: - Si hi ha valors perduts. - Si alguna variable s’hauria de transformar. - Outliers o valors estranys.

6. Visualització inicial

Incloeu una o dues gràfiques exploratòries.

# Exemple:
# ggplot(dades, aes(x = variable)) + geom_histogram()

7. Variables externes i dades addicionals

Expliqueu: - Si necessitareu dades externes per completar l’anàlisi. - On les podríeu trobar. - Si falten variables per respondre la pregunta inicial.

8. Altres comentaris

Incloeu qualsevol altre detall rellevant del procés de preparació de dades.