D’on prové el conjunt de dades? L’hem creat nosaltres amb dades d’internet fent un llarg estudi de les característiques dels vehicles. Són els 70 vehicles elèctrics més venguts d’Espanya durant el 2025.
Quin és l’objectiu del projecte? Estudiar les diferències que hi ha entre els cotxes d’un pais (Xina) amb la resta.
Quina pregunta voleu respondre? Els cotxes de Xina tenen més autonomia que la resta?
Per què aquestes dades són adequades per aquesta pregunta? Perquè sabem l’autonomia del cotxe i el pais de fabricació.
El conjunt de dades l’hem creat nosaltres. Hem agafat les dades de internet mirant totes les dades per cada cotxe. Hem posat com a variables: id: hem utilitzat un id diferent per a cada vehicle (de 1 a 70) model (el model del cotxe) marca (la marca del cotxe) pais_prod (el país on s’ha fabricat el cotxe) bateria kwh (la capacitat de la bateria en kwh) autonomia_km (autonomia en km que pot fer el cotxe temps_de_càrrega (quan tarda a carregar el cotxe) Aquestes dades corresponen als 70 cotxes elèctrics més venuts a Espanya durant el 2025
# Exemple d'importació (modifiqueu segons calgui)
load("cotxes_electrics.RData")
stats_pais <- dades %>%
group_by(pais_produccio) %>%
summarise(
n = n(),
mitjana = mean(autonomia_km, na.rm = TRUE),
mediana = median(autonomia_km, na.rm = TRUE),
desviacio = sd(autonomia_km, na.rm = TRUE)
) %>%
arrange(desc(mitjana))
print(stats_pais)
## # A tibble: 13 × 5
## pais_produccio n mitjana mediana desviacio
## <chr> <int> <dbl> <dbl> <dbl>
## 1 Bèlgica 2 595 595 77.8
## 2 República Txeca 2 524 524 5.66
## 3 Corea del Sud 6 502. 486 50.7
## 4 Alemanya 14 502. 504 69.4
## 5 EUA 6 478 445 104.
## 6 Xina 17 456. 440 93.3
## 7 Espanya 5 444. 490 102.
## 8 Suècia 2 427 427 9.90
## 9 Japó 2 424. 424. 203.
## 10 França 9 368. 362 79.8
## 11 Regne Unit 3 365. 410 115.
## 12 Itàlia 1 320 320 NA
## 13 Romania 1 230 230 NA
ggplot(stats_pais, aes(x = reorder(pais_produccio, mitjana), y = mitjana)) +
geom_col() +
coord_flip() +
labs(title = "Autonomia mitjana per país",
x = "País",
y = "Autonomia mitjana (km)") +
theme_minimal()
Incloeu una o dues gràfiques exploratòries.
# 1r gràfic:
dades <- dades %>%
mutate(grup = ifelse(pais_produccio == "Xina", "Xina", "Altres"))
ggplot(dades, aes(x = grup, y = autonomia_km, fill = grup)) +
geom_boxplot(alpha = 0.7) +
labs(
title = "Autonomia: Xina vs Resta del món",
x = "",
y = "Autonomia (km)"
) +
theme_minimal()
#2n gràfic
ggplot(dades, aes(x = autonomia_km, fill = grup)) +
geom_histogram(alpha = 0.6, position = "identity", bins = 20) +
labs(title = "Distribució d'autonomia (Xina vs Resta del món)",
x = "Autonomia (km)",
y = "Freqüència") +
theme_minimal()
La mitjana d’autonomia de la Xina és lleugerament superior a la mitjana global, això ens pot portar a pensar que la mitjana de la xina és superior a la de la resta de països, però no ens assegura res.
Podem veure que les empreses Xineses eviten fer cotxes d’autonomia molt baixa, ja que la seva autonomia mínima és considerablement superior a la global. Si ens fixem en el rang, podem afirmar que els cotxes de xina són més consistents en quant a la seva autonomia. Aquests resultats apunten a que les empreses xineses es centren en donar una autonomia fiable en tots els seus models, evitant autonomies molt baixes, però sacrificant el fet de tenir autonomies molt altes.
A causa del volum petit de dades observat, no podem treure grans conclusions, pero en podem extreure els següents punts: Respecte la pregunta inicial que ens feiem, no podem afirmar que els cotxes produits a Xina tinguin mes autonomia que la resta, ja que hi ha altres països on l’autonomia mitjana dels vehicles és superior. També podem veure que l’autonomia no depèn del país de producció o continent, ja que aquesta varia entre models i països de forma que no mantenen cap relació. L’autonomia varia molt entre models d’un mateix país, (a Xina, l’autonomia mínima és de 200 km i la màxima de 600 km), fet que indica que el país de producció no és tan influent.
Per a millorar aquest estudi, podriem afegir més models al conjunt de dades, diferenciar entre el tipus de cada model (SUV, Hatchback, Crossover, … ) i hauríem d’haver tingut en compte altres variables com per exemple la capacitat de la bateria.
–