Transformação dos dados

load("C:/Users/Hearthz Gaming/Desktop/Base_de_dados-master/CARROS.RData")
summary(CARROS$Tipodecombustivel)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.4375  1.0000  1.0000
CARROS$Tipodecombustivel<-ifelse(CARROS$Tipodecombustivel==0,"Gás","Alcool")
summary(CARROS$Tipodecombustivel)
##    Length     Class      Mode 
##        32 character character
CARROS$TipodeMarcha<-ifelse(CARROS$TipodeMarcha==0,"Auto","Manual")

O desvio Padrão

var(CARROS$Kmporlitro)
## [1] 36.3241
sd(CARROS$Kmporlitro)
## [1] 6.026948
var(CARROS$Preco)
## [1] 15360.8
sd(CARROS$Preco)
## [1] 123.9387
var(CARROS$HP)
## [1] 4700.867
sd(CARROS$HP)
## [1] 68.56287

Tabelas qualitativa vs quantitativa

cruzamento de variaveis qualitativas por quantitativas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
library(reactable)

#Preço(quantitativa) por tipo de combustivel(qualitativa)


CARROS %>% select(Preco,Tipodecombustivel) %>%
  group_by(Tipodecombustivel) %>% summarise(MEDIA=round(mean(Preco),2),desvio_padrão=round(sd(Preco),2)) %>% flextable()
#carro a gasolina é mais carro do que carro a alcool nessa base de dados
#interpretação da tabela: o carro a alcool é mais baroto em media do que o a gasolina, 
#sendo uma diferença bem alta, e que o carro a alcool é bem mais concentrado 
#em torno da media com em torno de 56 de desvio padrão, enquento o do carro a gsolina
#é praticamente o dobro


#km/l ( quantititiva) por tipo de marcha(qualitativa)

CARROS %>% select(Kmporlitro,TipodeMarcha) %>%
  group_by(TipodeMarcha) %>% 
  summarise(MEDIA=round(mean(Kmporlitro),2),DESVIO_PADRAO=round(sd(Kmporlitro),2)) %>%
  flextable() %>% theme_tron()
#interpretação: O carro manual em media faz mais km/l do que o carro automatico, sendo que o automaatioc
#é bem mais concentrado que o carro manual tem uma diferenca de quase 4 km/l

CARROS %>% select(HP,TipodeMarcha) %>%
  group_by(TipodeMarcha) %>% 
  summarise(MEDIA=round(mean(HP),2),DESVIO_PADRAO=round(sd(HP),2)) %>%
  flextable() %>% theme_tron()
#-----------------------------------------------

CARROS %>% select(Kmporlitro,TipodeMarcha) %>%
  group_by(TipodeMarcha) %>%
  summarise(minimo=min(Kmporlitro),
            primeiro_quartil=quantile(Kmporlitro,probs=0.25),
            mediana=median(Kmporlitro),
            terceiro_quartil=quantile(Kmporlitro,probs=0.75),
            maximo=max(Kmporlitro)) %>%
  flextable() %>% theme_tron() 

#Gerar uma visualização dessa tabela

#(min, 1 quartil, mediana,3 quartil e maximo)

boxplot(Kmporlitro~TipodeMarcha, data = CARROS,
        col=c("purple","blue"),
        horizontal = T,
        main= "gráfico 1 - Km/l por Tipo de Marcha")

boxplot(Preco~Tipodecombustivel,data = CARROS,
        col=c("yellow","orange"),
        main= "Grafico 2 - Preço por Tipo de Combustivel")

# interpretação 2 grafico boxplot 
# podemos ver que a mediana ,os quartis, o minimo é o maximo do carros a alcool são menores que o do carro a gasolina, o que nos leva a crer que os carros 
# alcool sao mais baratos que os carros a gasolina
#o carro a gasolina é mais simentrico mantendo os os valores da mediana ate os extremos bem parecidos diferente dos carros a alcool
#que sao assimetricos
# podemos ver tambem nos carros a gasolina dois outliers nos carros a gasolina , com precos muito abaixo do resto dos carros a gasolina