Trasnformação dos dados

summary(CARROS$Tipodecombustivel)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.4375  1.0000  1.0000
CARROS$Tipodecombustivel <- ifelse(CARROS$Tipodecombustivel==0,"Gas","Alc")
summary(CARROS$TipodeMarcha)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.4062  1.0000  1.0000
CARROS$TipodeMarcha <- ifelse(CARROS$TipodeMarcha==0,"Auto","Manual")

O desvio-padrão

names(CARROS)
##  [1] "Kmporlitro"              "Cilindros"              
##  [3] "Preco"                   "HP"                     
##  [5] "Amperagem_circ_eletrico" "Peso"                   
##  [7] "RPM"                     "Tipodecombustivel"      
##  [9] "TipodeMarcha"            "NumdeMarchas"           
## [11] "NumdeValvulas"
var(CARROS$Kmporlitro)
## [1] 36.3241
sd(CARROS$Kmporlitro)
## [1] 6.026948
var(CARROS$Preco)
## [1] 15360.8
sd(CARROS$Preco)
## [1] 123.9387
var(CARROS$HP)
## [1] 4700.867
sd(CARROS$HP)
## [1] 68.56287
mean(CARROS$HP)
## [1] 146.6875

Tabelas Quali Vs Quanti

Cruzamento de variáveis quantitativas por variáveis qualitativas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
library(reactable)

CARROS %>% select(Preco,Tipodecombustivel) %>%
  group_by(Tipodecombustivel) %>% 
  summarise(Média=mean(Preco)) %>% flextable()
CARROS %>% select(Preco,Tipodecombustivel) %>%
  group_by(Tipodecombustivel) %>% 
  summarise(Média=round(mean(Preco),2),
            Desvio_Padrao=round(sd(Preco),2),
            Mediana=median(Preco)) %>% reactable()
CARROS %>% select(Kmporlitro,TipodeMarcha) %>% 
  group_by(TipodeMarcha) %>%
  summarise(Média=round(mean(Kmporlitro),2),
            Desvio_Padrão=round(sd(Kmporlitro),2)) %>%
  flextable() %>% theme_tron()
CARROS %>% select(HP,TipodeMarcha) %>% 
  group_by(TipodeMarcha) %>%
  summarise(Média=round(mean(HP),2),
            Desvio_Padrão=round(sd(HP),2)) %>%
  flextable() %>% theme_tron()
CARROS %>% select(Kmporlitro,TipodeMarcha) %>%
  group_by(TipodeMarcha) %>%
  summarise(minimo=min(Kmporlitro),
            primeiro_quartil=quantile(Kmporlitro,probs=0.25),
            mediana=median(Kmporlitro),
            terceiro_quartil=quantile(Kmporlitro,probs=0.75),
            maximo=max(Kmporlitro)) %>%
  flextable() %>% theme_tron()

#Gerar uma vizualização dessa tabela #(min, 1 quartil, mediana, 3 quartil e maximo)

boxplot

boxplot(Kmporlitro~TipodeMarcha, data=CARROS)

boxplot(Kmporlitro~TipodeMarcha, data=CARROS,
        col=c("red","royalblue"),
        horizontal =T,
        main="Gráfico 1 - Boxplot do km/l por tipo de marcha")

boxplot(Preco~Tipodecombustivel, data=CARROS,
        col=c("red","royalblue"),
        horizontal =F,main="Gráfico 2 - Boxplot do preço por tipo de combustivel")