Análise de Variável Quanatitativa

Author

Larissa Ramos

#Introdução

Nesta aula vamos ver os conceitos de média, mediana, variância, desvio padrão e outlier.

Vamos ver também o gráfico chamado de histograma, bem como a sua diferença para o gráfico de barras.

#Carregar a base de dados

Aqui vou carregar o arquivo CARROS.RData

load("~/BASE DE DADOS UNIRIO/CARROS.RData")

#Transformar as variáveis

Aqui vou transformar as variáveis TipodeMarcha e TipodeCombustível.

CARROS$TipodeMarcha=ifelse(CARROS$TipodeMarcha==0,"Auto","Manual")
CARROS$Tipodecombustivel=ifelse(CARROS$Tipodecombustivel==0,"Gas","Alc")

#Média, mediana, desvio padrão e outlier

rua_vermelha=c(40,95,55,80,65)
rua_azul=c(70,65,55,70,75)

mean(rua_azul)
[1] 67
var(rua_azul)
[1] 57.5
sd(rua_azul)
[1] 7.582875
mean(rua_vermelha)
[1] 67
var(rua_vermelha)
[1] 457.5
sd(rua_vermelha)
[1] 21.38925

#Histograma

O histograma é um gráfico para variáveis quantitativas.

hist(CARROS$Kmporlitro,col =c("pink","pink","pink","violet","violet"),
     main = "Gráfico 1 - Histograma do KM/L")

O KM/L é assimétrico e bimodal.

##Preço do carro

hist(CARROS$Preco,col=c("tomato","tomato","tomato","tomato","blue","blue","blue","blue","blue"),
           main="Gráfico 2 - Histograma Preço")

Assimétrico e bimodal. Parece ter ferraris e fuscas nessa base de dados.

#Qual a diferença entre um Gráfico de Barras e um Histograma?