#chamar o arquivo que será utilizado

load("C:/Users/14086606798/Desktop/Base_de_dados-master/CARROS.RData")
load("C:/Users/14086606798/Desktop/Base_de_dados-master/CARROS.RData")

View(CARROS)
summary(CARROS)
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Min.   :0.0000   
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000   
##  Median :3.695           Median :3.325   Median :17.71   Median :0.0000   
##  Mean   :3.597           Mean   :3.217   Mean   :17.85   Mean   :0.4375   
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000   
##  Max.   :4.930           Max.   :5.424   Max.   :22.90   Max.   :1.0000   
##   TipodeMarcha     NumdeMarchas   NumdeValvulas  
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000

media

mean(CARROS$Kmporlitro)
## [1] 20.09062
mean(CARROS$Preco)
## [1] 230.7219

os carros dessa base de dados fazem em media 20 km/l. os carros tem em media o preço de 230 mil.

desvio padrão

#desvio padrão

sd(CARROS$Kmporlitro)
## [1] 6.026948
sd(CARROS$Preco)
## [1] 123.9387
max(CARROS$Preco) - min(CARROS$Preco)
## [1] 400.9

fazem em media 20 km/l com desvio padrão de 6 km/l

_ por que usamos os devio padrão e não a amplitude? - por causa dos outliers.

OUTLIERS

dados1 = c(1,2,3,4)
mean(dados1)
## [1] 2.5
dados2 = c(1,2,3,4,50000)
mean(dados2)
## [1] 10002
median(dados2)
## [1] 3
median(dados1)
## [1] 2.5

50000 é um outlier.

Na presença de outliers,a mediana é melhor que a média
O desvio padrão é sempre melhor que a amplitude.

criação de um histograma

# criação de histograma

hist(CARROS$Kmporlitro)

hist((CARROS$Kmporlitro), col = "tan", main = "histograma",
     xlab = "km/l", ylab = "frequencia")

hist((CARROS$Preco), col = "salmon", main = "histograma 2 ",
     xlab = "km/l", ylab = "frequencia")

hist((CARROS$Peso), col = "pink", main = "histograma 3 ",
     xlab = "km/l", ylab = "frequencia")

hist((CARROS$RPM), col = "brown", main = "histograma 4 ",
     xlab = "km/l", ylab = "frequencia")

conclusão 1 : Ele é assimetrico a direita.

conclusão 2 : Ele é assimetrico a direito com 2 modas.

conclusão 3 : Ele é outliers e assimetrico

conclusão 4 : Ele é outliers e assimetrico.

sobre o histograma e o grafico de barras.

  1. o histograma é para variaveis quantitativas.

  2. o gráfico de barras é para variaveis qualitativas.

  3. o histograma pode mostrar a presença de outliers

  4. o histograma pode ser unimodal ou bimodal.

Criação de um dotchart

# dot chart para numero de valvulas
dotchart(CARROS$NumdeValvulas, labels = row.names(mtcars),
         cex = 0.9, xlab = "valvulas")