Expliqueu breument:
D’on prové el conjunt de dades.
El conjunt de dades prové de la web oficial de l’ajuntament de Barcelona on pengen tots els estudis de dades
Quin és l’objectiu del projecte.
L’objectiu del projecte és estudiar la diferència de vols que va haver durant un període de temps específic (2019-2025) degut a una pandèmia mundial.
Quina pregunta voleu respondre.
L’any 2020 va haver una pandèmia mundial que va afectar a tota la població, empreses, companyies… Això inclou els vols d’avions. Des del 2019 fins a la actualitat genera una gràfica que mostri com ha canviat el nombre de vols a l’espai aeri espanyol durant aquest període de temps.
Per què aquestes dades són adequades per aquesta pregunta.
Són adeqüades perquè l’aeroport de barcelona arrastra una gran quantitat de turisme, llavors podem obtenir moltes dades durant el període de temps que volem estudiar i observar la diferència.
Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.
# Exemple d'importació (modifiqueu segons calgui)
dades <- read_csv("Vols_ElPrat.csv")
## Rows: 56480 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (3): Data_Referencia, Nom_Companyia, Nom_Zona
## dbl (3): Codi_Companyia, Codi_Zona, Nombre_Vols
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Expliqueu: - Quin era el format original (CSV, XLSX, txt…) - Si heu fet cap modificació prèvia (neteja, reanomenar columnes, selecció de variables…)
summary(dades)
## Data_Referencia Codi_Companyia Nom_Companyia Codi_Zona
## Length:56480 Min. : 1.0 Length:56480 Min. :1.000
## Class :character 1st Qu.: 3.0 Class :character 1st Qu.:2.000
## Mode :character Median : 9.0 Mode :character Median :2.000
## Mean : 182.7 Mean :2.269
## 3rd Qu.: 18.0 3rd Qu.:2.000
## Max. :9999.0 Max. :5.000
## NA's :1 NA's :1
## Nom_Zona Nombre_Vols
## Length:56480 Min. : 1.0
## Class :character 1st Qu.: 4.0
## Mode :character Median : 8.0
## Mean : 19.7
## 3rd Qu.: 16.0
## Max. :245.0
## NA's :1
# dim(dades)
# glimpse(dades)
Incloeu: - Nombre de files. - Nombre de columnes. - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…)
Descriviu cada variable del dataset.
| Variable | Tipus | Descripció | Valors possibles / rang |
|---|---|---|---|
| exemple_var | numèrica | Significat de la variable | 0–100 |
# tibble(
# variable = names(dades),
# tipus = sapply(dades, class)
# )
# summary(dades)
Comenteu: - Si hi ha valors perduts. - Si alguna variable s’hauria de transformar. - Outliers o valors estranys.
Incloeu una o dues gràfiques exploratòries.
# Exemple:
# ggplot(dades, aes(x = variable)) + geom_histogram()
Expliqueu: - Si necessitareu dades externes per completar l’anàlisi. - On les podríeu trobar. - Si falten variables per respondre la pregunta inicial.
Incloeu qualsevol altre detall rellevant del procés de preparació de dades.