1. Introducció

2. Descripció del conjunt de dades

El conjunt de dades l’hem creat nosaltres. Hem agafat les dades de internet mirant totes les dades per cada cotxe. Hem posat com a variables: id: hem utilitzat un id diferent per a cada vehicle (de 1 a 70) model (el model del cotxe) marca (la marca del cotxe) pais_prod (el país on s’ha fabricat el cotxe) bateria kwh (la capacitat de la bateria en kwh) autonomia_km (autonomia en km que pot fer el cotxe temps_de_càrrega (quan tarda a carregar el cotxe) Aquestes dades corresponen als 70 cotxes elèctrics més venuts a Espanya durant el 2025

# Exemple d'importació (modifiqueu segons calgui)
load("cotxes_electrics.RData")

3. Exploració inicial de les dades.

stats_pais <- dades %>%
  group_by(pais_produccio) %>%
  summarise(
    n = n(),
    mitjana = mean(autonomia_km, na.rm = TRUE),
    mediana = median(autonomia_km, na.rm = TRUE),
    desviacio = sd(autonomia_km, na.rm = TRUE)
  ) %>%
  arrange(desc(mitjana))

print(stats_pais)
## # A tibble: 13 × 5
##    pais_produccio      n mitjana mediana desviacio
##    <chr>           <int>   <dbl>   <dbl>     <dbl>
##  1 Bèlgica             2    595     595      77.8 
##  2 República Txeca     2    524     524       5.66
##  3 Corea del Sud       6    502.    486      50.7 
##  4 Alemanya           14    502.    504      69.4 
##  5 EUA                 6    478     445     104.  
##  6 Xina               17    456.    440      93.3 
##  7 Espanya             5    444.    490     102.  
##  8 Suècia              2    427     427       9.90
##  9 Japó                2    424.    424.    203.  
## 10 França              9    368.    362      79.8 
## 11 Regne Unit          3    365.    410     115.  
## 12 Itàlia              1    320     320      NA   
## 13 Romania             1    230     230      NA
ggplot(stats_pais, aes(x = reorder(pais_produccio, mitjana), y = mitjana)) +
  geom_col() +
  coord_flip() +
  labs(title = "Autonomia mitjana per país",
       x = "País",
       y = "Autonomia mitjana (km)") +
  theme_minimal()

4. Gràfics per analitzar la pregunta feta

Incloeu una o dues gràfiques exploratòries.

# 1r gràfic:
dades <- dades %>%
  mutate(grup = ifelse(pais_produccio == "Xina", "Xina", "Altres"))

ggplot(dades, aes(x = grup, y = autonomia_km, fill = grup)) +
  geom_boxplot(alpha = 0.7) +
  labs(
    title = "Autonomia: Xina vs Resta del món",
    x = "",
    y = "Autonomia (km)"
  ) +
  theme_minimal()

#2n gràfic
ggplot(dades, aes(x = autonomia_km, fill = grup)) +
  geom_histogram(alpha = 0.6, position = "identity", bins = 20) +
  labs(title = "Distribució d'autonomia (Xina vs Resta del món)",
       x = "Autonomia (km)",
       y = "Freqüència") +
  theme_minimal()

4.1. Anàlisis descriptiva

La mitjana d’autonomia de la Xina és lleugerament superior a la mitjana global, això ens pot portar a pensar que la mitjana de la xina és superior a la de la resta de països, però no ens assegura res.

Podem veure que les empreses Xineses eviten fer cotxes d’autonomia molt baixa, ja que la seva autonomia mínima és considerablement superior a la global. Si ens fixem en el rang, podem afirmar que els cotxes de xina són més consistents en quant a la seva autonomia. Aquests resultats apunten a que les empreses xineses es centren en donar una autonomia fiable en tots els seus models, evitant autonomies molt baixes, però sacrificant el fet de tenir autonomies molt altes.

5. Conclusions

A causa del volum petit de dades observat, no podem treure grans conclusions, pero en podem extreure els següents punts: Respecte la pregunta inicial que ens feiem, no podem afirmar que els cotxes produits a Xina tinguin mes autonomia que la resta, ja que hi ha altres països on l’autonomia mitjana dels vehicles és superior. També podem veure que l’autonomia no depèn del país de producció o continent, ja que aquesta varia entre models i països de forma que no mantenen cap relació. L’autonomia varia molt entre models d’un mateix país, (a Xina, l’autonomia mínima és de 200 km i la màxima de 600 km), fet que indica que el país de producció no és tan influent.

Per a millorar aquest estudi, podriem afegir més models al conjunt de dades, diferenciar entre el tipus de cada model (SUV, Hatchback, Crossover, … ) i hauríem d’haver tingut en compte altres variables com per exemple la capacitat de la bateria.