#introdução

na aula de hoje estudaremos a média,mediana,amplitude e desvio padrão

A media e a mediana são medidadas de posição ( usadas para encotrar o meio de um conjunto de dados) A amplitude e o desvio padrão sao medidas de dispersão (para encontrar a variedade de dados)

#exemplos de conjuntos de dados

dados1= c(1,2,3,4,5)
mean(dados1)
## [1] 3
median(dados1)
## [1] 3
dados2=c(1,2,3,4,50000)
mean(dados2)
## [1] 10002
median(dados2)
## [1] 3

graficos

histograma

o histograma é usado em variaveis quantitativas continuas

load("c:/Users/12389905412/Desktop/Base_de_dados-master/CARROS.RData")

#Histograma
hist(CARROS$Kmporlitro)

hist(CARROS$Kmporlitro,col = 'red',main= 'meu primeiro histograma',xlab='km/l',ylab='frequencia')

hist(CARROS$Preco,col="royalblue",main="histograma do preço",xlab='preço',ylab = "frequencia")

hist(CARROS$Peso,col="#e3beeb",main = "histograma do preço",xlab = "peso em toneladas")

hist(CARROS$RPM,col = "tomato3", main = "histograma do rpm",xlab = "rpm")

qual grafico usamos para variaveis quantitativas discretas?

pode ser usado o ‘DOTCHART’

dotchart

load("c:/Users/12389905412/Desktop/Base_de_dados-master/CARROS.RData")

stripchart(CARROS$NumdeValvulas,method = "stack",at=.15,pch=19,main="numero de vauvulas",xlab = "numero de vauvulas")

conclusão

o numero 50000 é um outlier na presença de um outlier a mediana é melhor que a media o desvio padrão é sempre melhor que a amplitude para medir a variação histograma se aplica em variaveis quantitaivas continuas e graficos de barras para variaveis qualitativas dotchart se aplica melhor em quantitativas discretas