Nesta aula vamos ver os conceitos de média, mediana, variância, desvio-padrão, e outlier.
Vamos ver também o gráfico chamado de histograma, bem como a sua diferença para o gráfico de barras.
Aqui vou carregar o arquivo CARROS.RData.
load("~/Base_de_dados-master/CARROS.RData")
Aqui vou transformar as variáveis TipodeMarcha e TipodeCombustivel.
CARROS$Tipodecombustivel = ifelse(CARROS$Tipodecombustivel==0,
"Gas","Alc")
CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0,
"Auto","Manual")
# Criação do vetor 'rua'
rua_vermelha = c(40,95,55,80,65)
rua_azul = c(70,65,55,70,75)
mean(rua_azul)
## [1] 67
sd(rua_azul)
## [1] 7.582875
mean(rua_vermelha)
## [1] 67
sd(rua_vermelha)
## [1] 21.38925
O histograma é um gráfico para variáveis quantitativas.
hist(CARROS$Kmporlitro,
col = c("tomato3","tomato3","tomato3",'skyblue','skyblue'),
main="Gráfico 1 - Histograma do Km/l")
O Km/l é assimétrico e bimodal.
hist(CARROS$Preco,
col = c('skyblue','skyblue','skyblue','skyblue','red','red','red','red','red','red'),
main="Gráfico 2 - Histograma do Preço",
xlab = "Preço do carro",ylab = "Frequência")
Assimétrico e bimodal. Parece ter ferraris e fuscas nessa base de dados.
par(mfrow=c(1,2))
hist(CARROS$Preco,
col = c('skyblue','skyblue','skyblue','skyblue','red','red','red','red','red','red'),
main="Gráfico 2 - Histograma do Preço",
xlab = "Preço do carro",ylab = "Frequência")
barplot(table(CARROS$Tipodecombustivel),col = c("blue","red"))
O R é demais.