Introdução

Nesta aula vamos ver os conceitos de média, mediana, variância, desvio-padrão, e outlier.

Vamos ver também o gráfico chamado de histograma, bem como a sua diferença para o gráfico de barras.

Carregar a base de dados

Aqui vou carregar o arquivo CARROS.RData.

load("~/Base_de_dados-master/CARROS.RData")

Transformar as variáveis

Aqui vou transformar as variáveis TipodeMarcha e TipodeCombustivel.

CARROS$Tipodecombustivel = ifelse(CARROS$Tipodecombustivel==0,
                                  "Gas","Alc")


CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0,
                                  "Auto","Manual")

Média, mediana, desvio-padrão e outlier

# Criação do vetor 'rua'
rua_vermelha = c(40,95,55,80,65)
rua_azul = c(70,65,55,70,75)

mean(rua_azul)
## [1] 67
sd(rua_azul)
## [1] 7.582875
mean(rua_vermelha)
## [1] 67
sd(rua_vermelha)
## [1] 21.38925

Histograma

O histograma é um gráfico para variáveis quantitativas.

hist(CARROS$Kmporlitro, 
     col = c("tomato3","tomato3","tomato3",'skyblue','skyblue'),
     main="Gráfico 1 - Histograma do Km/l")

O Km/l é assimétrico e bimodal.

Preço do carro

hist(CARROS$Preco, 
     col = c('skyblue','skyblue','skyblue','skyblue','red','red','red','red','red','red'),
     main="Gráfico 2 - Histograma do Preço",
     xlab = "Preço do carro",ylab = "Frequência")

Assimétrico e bimodal. Parece ter ferraris e fuscas nessa base de dados.

Qual a diferença entre um gráfico de barras e um histograma?

par(mfrow=c(1,2))
hist(CARROS$Preco, 
     col = c('skyblue','skyblue','skyblue','skyblue','red','red','red','red','red','red'),
     main="Gráfico 2 - Histograma do Preço",
     xlab = "Preço do carro",ylab = "Frequência")

barplot(table(CARROS$Tipodecombustivel),col = c("blue","red"))

Conclusão

O R é demais.