Expliqueu breument: - D’on prové el conjunt de dades? L’hem creat nosaltres amb dades d’internet fent un llarg estudi de les característiques dels vehicles. Són els 70 vehicles elèctrics més venguts d’Espanya durant el 2025.
Quin és l’objectiu del projecte? Estudiar les diferències que hi ha entre els cotxes d’un pais amb la resta.
Quina pregunta voleu respondre? Els cotxes de china tenen més autonomia que la resta?
Per què aquestes dades són adequades per aquesta pregunta? Perquè sabem l’autonomia del cotxe i el pais de fabricació.
Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.
# Exemple d'importació (modifiqueu segons calgui)
load("cotxes_electrics.RData")
Expliqueu: - Quin era el format original (CSV, XLSX, txt…) XLSX
dim(dades)
## [1] 70 12
glimpse(dades)
## Rows: 70
## Columns: 12
## $ id_cotxe <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, …
## $ marca <chr> "Tesla", "Tesla", "KIA", "Renault", "BYD", "Toyota"…
## $ model <chr> "Model 3", "Model Y", "EV3", "Renault 5 E-Tech Eléc…
## $ tipus <chr> "Sedan", "SUV", "SUV", "Hatchback", "Hatchback", "S…
## $ bateria_kWh <int> 60, 82, 81, 52, 43, 71, 44, 49, 77, 46, 82, 27, 64,…
## $ autonomia_km <int> 660, 534, 600, 412, 310, 567, 320, 420, 480, 345, 5…
## $ temps_de_carrega_h <dbl> 8.0, 9.3, 8.5, 5.7, 4.7, 7.0, 4.5, 6.4, 6.0, 5.0, 9…
## $ cavalls <int> 360, 460, 204, 150, 156, 201, 83, 204, 217, 163, 31…
## $ preu <int> 35000, 52760, 41390, 32900, 30990, 39500, 16950, 43…
## $ pes <int> 1824, 1997, 1750, 1504, 1465, 2024, 1420, 1780, 183…
## $ pais_produccio <chr> "EUA", "EUA", "Corea del Sud", "França", "Xina", "J…
## $ vendes.2025 <dbl> 7.722, 4.924, 4.793, 3.703, 2.796, 2.585, 2.352, 2.…
Incloeu: - Nombre de files. 70 - Nombre de columnes. 12 - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…) Cotxe
Descriviu cada variable del dataset.
| Variable | Tipus | Descripció | Valors possibles / rang |
|---|---|---|---|
| exemple_var | numèrica | Significat de la variable | 0–100 |
tibble(
variable = names(dades),
tipus = sapply(dades, class)
)
## # A tibble: 12 × 2
## variable tipus
## <chr> <chr>
## 1 id_cotxe integer
## 2 marca character
## 3 model character
## 4 tipus character
## 5 bateria_kWh integer
## 6 autonomia_km integer
## 7 temps_de_carrega_h numeric
## 8 cavalls integer
## 9 preu integer
## 10 pes integer
## 11 pais_produccio character
## 12 vendes.2025 numeric
summary(dades)
## id_cotxe marca model tipus
## Min. : 1.00 Length:70 Length:70 Length:70
## 1st Qu.:18.25 Class :character Class :character Class :character
## Median :35.50 Mode :character Mode :character Mode :character
## Mean :35.50
## 3rd Qu.:52.75
## Max. :70.00
## bateria_kWh autonomia_km temps_de_carrega_h cavalls
## Min. : 27.00 Min. :200.0 Min. : 2.500 Min. : 45.0
## 1st Qu.: 52.50 1st Qu.:406.2 1st Qu.: 6.000 1st Qu.:184.0
## Median : 66.00 Median :452.5 Median : 7.000 Median :215.5
## Mean : 65.83 Mean :453.9 Mean : 6.963 Mean :248.3
## 3rd Qu.: 77.00 3rd Qu.:521.5 3rd Qu.: 8.000 3rd Qu.:299.0
## Max. :102.00 Max. :660.0 Max. :10.000 Max. :680.0
## preu pes pais_produccio vendes.2025
## Min. : 16950 Min. : 970 Length:70 Min. : 1.009
## 1st Qu.: 35000 1st Qu.:1632 Class :character 1st Qu.: 1.951
## Median : 44900 Median :1835 Mode :character Median :261.000
## Mean : 47009 Mean :1864 Mean :288.460
## 3rd Qu.: 55872 3rd Qu.:2135 3rd Qu.:507.000
## Max. :130000 Max. :2800 Max. :864.000
Comenteu: - Si hi ha valors perduts. No - Si alguna variable s’hauria de transformar. - Outliers o valors estranys.
Incloeu una o dues gràfiques exploratòries.
# Exemple:
ggplot(dades, aes(x = id_cotxe)) + geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
Expliqueu: - Si necessitareu dades externes per completar l’anàlisi? No perquè vam fer el conjunt de dades molt bé. - On les podríeu trobar. – - Si falten variables per respondre la pregunta inicial. No;