#introdução
na aula de hoje estudaremos a média,mediana,amplitude e desvio padrão
A media e a mediana são medidadas de posição ( usadas para encotrar o meio de um conjunto de dados) A amplitude e o desvio padrão sao medidas de dispersão (para encontrar a variedade de dados)
#exemplos de conjuntos de dados
dados1= c(1,2,3,4,5)
mean(dados1)
## [1] 3
median(dados1)
## [1] 3
dados2=c(1,2,3,4,50000)
mean(dados2)
## [1] 10002
median(dados2)
## [1] 3
o histograma é usado em variaveis quantitativas continuas
load("c:/Users/12389905412/Desktop/Base_de_dados-master/CARROS.RData")
#Histograma
hist(CARROS$Kmporlitro)
hist(CARROS$Kmporlitro,col = 'red',main= 'meu primeiro histograma',xlab='km/l',ylab='frequencia')
hist(CARROS$Preco,col="royalblue",main="histograma do preço",xlab='preço',ylab = "frequencia")
hist(CARROS$Peso,col="#e3beeb",main = "histograma do preço",xlab = "peso em toneladas")
hist(CARROS$RPM,col = "tomato3", main = "histograma do rpm",xlab = "rpm")
pode ser usado o ‘DOTCHART’
load("c:/Users/12389905412/Desktop/Base_de_dados-master/CARROS.RData")
stripchart(CARROS$NumdeValvulas,method = "stack",at=.15,pch=19,main="numero de vauvulas",xlab = "numero de vauvulas")
o numero 50000 é um outlier na presença de um outlier a mediana é melhor que a media o desvio padrão é sempre melhor que a amplitude para medir a variação histograma se aplica em variaveis quantitaivas continuas e graficos de barras para variaveis qualitativas dotchart se aplica melhor em quantitativas discretas