#chamar o arquivo que será utilizado
load("C:/Users/14086606798/Desktop/Base_de_dados-master/CARROS.RData")
load("C:/Users/14086606798/Desktop/Base_de_dados-master/CARROS.RData")
View(CARROS)
summary(CARROS)
## Kmporlitro Cilindros Preco HP
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## Amperagem_circ_eletrico Peso RPM Tipodecombustivel
## Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
## Median :3.695 Median :3.325 Median :17.71 Median :0.0000
## Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
## Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
## TipodeMarcha NumdeMarchas NumdeValvulas
## Min. :0.0000 Min. :3.000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
## Median :0.0000 Median :4.000 Median :2.000
## Mean :0.4062 Mean :3.688 Mean :2.812
## 3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :1.0000 Max. :5.000 Max. :8.000
mean(CARROS$Kmporlitro)
## [1] 20.09062
mean(CARROS$Preco)
## [1] 230.7219
os carros dessa base de dados fazem em media 20 km/l. os carros tem em media o preço de 230 mil.
#desvio padrão
sd(CARROS$Kmporlitro)
## [1] 6.026948
sd(CARROS$Preco)
## [1] 123.9387
max(CARROS$Preco) - min(CARROS$Preco)
## [1] 400.9
fazem em media 20 km/l com desvio padrão de 6 km/l
_ por que usamos os devio padrão e não a amplitude? - por causa dos outliers.
dados1 = c(1,2,3,4)
mean(dados1)
## [1] 2.5
dados2 = c(1,2,3,4,50000)
mean(dados2)
## [1] 10002
median(dados2)
## [1] 3
median(dados1)
## [1] 2.5
50000 é um outlier.
Na presença de outliers,a mediana é melhor que a média
O desvio padrão é sempre melhor que a amplitude.
# criação de histograma
hist(CARROS$Kmporlitro)
hist((CARROS$Kmporlitro), col = "tan", main = "histograma",
xlab = "km/l", ylab = "frequencia")
hist((CARROS$Preco), col = "salmon", main = "histograma 2 ",
xlab = "km/l", ylab = "frequencia")
hist((CARROS$Peso), col = "pink", main = "histograma 3 ",
xlab = "km/l", ylab = "frequencia")
hist((CARROS$RPM), col = "brown", main = "histograma 4 ",
xlab = "km/l", ylab = "frequencia")
conclusão 1 : Ele é assimetrico a direita.
conclusão 2 : Ele é assimetrico a direito com 2 modas.
conclusão 3 : Ele é outliers e assimetrico
conclusão 4 : Ele é outliers e assimetrico.
o histograma é para variaveis quantitativas.
o gráfico de barras é para variaveis qualitativas.
o histograma pode mostrar a presença de outliers
o histograma pode ser unimodal ou bimodal.
# dot chart para numero de valvulas
dotchart(CARROS$NumdeValvulas, labels = row.names(mtcars),
cex = 0.9, xlab = "valvulas")