no encontro de hoje, vamos estudar média, a mediana, a amplitude e o desvio padrão,
media e mediana são medidas de posição(encontrar o meio de um conjunto de dados).
##exemplos
load("C:/Users/14086606798/Desktop/Base_de_dados-master/CARROS.RData")
View(CARROS)
summary(CARROS)
## Kmporlitro Cilindros Preco HP
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## Amperagem_circ_eletrico Peso RPM Tipodecombustivel
## Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
## Median :3.695 Median :3.325 Median :17.71 Median :0.0000
## Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
## Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
## TipodeMarcha NumdeMarchas NumdeValvulas
## Min. :0.0000 Min. :3.000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
## Median :0.0000 Median :4.000 Median :2.000
## Mean :0.4062 Mean :3.688 Mean :2.812
## 3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :1.0000 Max. :5.000 Max. :8.000
mean(CARROS$Kmporlitro)
## [1] 20.09062
#os carros dessa base de dados fazem em media 20 km/l
#desvio padrão
sd(CARROS$Kmporlitro)
## [1] 6.026948
#fazem em media 20 km/l com desvio padrão de 6 km/l
mean(CARROS$Preco)
## [1] 230.7219
# tem em media o praço de 230 mil.
sd(CARROS$Preco)
## [1] 123.9387
max(CARROS$Preco) - min(CARROS$Preco)
## [1] 400.9
#por que usamos os devio padrão e não a amplitude
#por causa dos outliers
dados1 = c(1,2,3,4)
mean(dados1)
## [1] 2.5
dados2 = c(1,2,3,4,50000)
mean(dados2)
## [1] 10002
#50000 é um outlier
median(dados2)
## [1] 3
median(dados1)
## [1] 2.5
#na presença de outliers,a mediana é melhor que a média
# o desvio padrão é sempre melhor que a amplitude.
O número 50000 é considerado um outlier
na presença do outliers, a mediana é melhor que a média. para todos os outros casos, a média é mais utilizada que a mediana .
o desvio padrão é sempre melhor que a amplitude. para mensurar.