Análise de Variável Quantitativa

Author

João Pedro Martins

Introdução

Nesta aula vamos ver os conceitos de média, mediana, variância, desvio-padrão e outlier.

Vamos ver também o gráfico chamada de histograma, bem como a sua diferença para o gráfico de barras.

Carregar a base de dados

Aqui vou carregar o arquivo CARROS.RData.

load("C:/Users/Helena/Base_de_dados-master/CARROS.RData")

Transformar as variáveis

Aqui vou transformar as variáveis TipodeMarcha e TipodeCombustível.

CARROS$Tipodecombustivel = ifelse(CARROS$Tipodecombustivel==0,
                                  "Gasolina","Álcool")

# OBS: "=" é condição e "==" é igualdade

CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0,
                             "Automático","Manual")

Média, mediana, desvio-padrão e outlier

# Criação do vetor "rua"

rua_vermelha = c(40,95,55,80,65)
rua_azul = c(70,65,55,70,75)

mean(rua_azul)
[1] 67
var(rua_azul)
[1] 57.5
sd(rua_azul)
[1] 7.582875
mean(rua_vermelha)
[1] 67
var(rua_vermelha)
[1] 457.5
sd(rua_vermelha)
[1] 21.38925

Histograma

O histograma é um gráfico para variáveis quantitativas.

hist(CARROS$Kmporlitro,
     col = c("#B02C3B","#B02C3B","#B02C3B","purple","purple"),
     main="Gráfico 1 - Histograma do Km/l",
     xlab = "Km por litro",ylab = "Quantidade")

O Km/l é assimétrico e bimodal.

Preço do carro

hist(CARROS$Preco,
     col = c("#D1CED9","#D1CED9","#D1CED9","#373482","#015343","#015343","#015343","#373482","#373482"),
     main="Gráfico 2 - Histograma do Preço",
     xlab = "Preço do Carro",ylab = "Quantidade")

Assimétrico e bimodal.Parece ter ferraris e fuscas nessa base de dados.

Qual a diferença entre um gráfico de barras e um histograma

par(mfrow=c(1,2))
hist(CARROS$Preco,
     col = c("#D1CED9","#D1CED9","#D1CED9","#373482","#015343","#015343","#015343","#373482","#373482"),
     main="Gráfico 2 - Histograma do Preço",
     xlab = "Preço do Carro",ylab = "Quantidade")

barplot(table(CARROS$Tipodecombustivel),
        col = c("blue","red"),
        main="Gráfico 3 - Gráfico de Barra do tipo de Combustível")

barplot(table(CARROS$TipodeMarcha),
        col = c("green","yellow"),
        main="Gráfico 4 - Gráfico de Barra do tipo de Marcha")

Conclusão

** O R é demais!**