introdução

Aqui vamos olhar a base de dados.

load("/Users/carol/Desktop/Materia de estatistica/Base_de_dados-master/CARROS.RData")
str(CARROS)
## 'data.frame':    32 obs. of  11 variables:
##  $ Kmporlitro             : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
##  $ Cilindros              : num  6 6 4 6 8 6 8 4 4 6 ...
##  $ Preco                  : num  160 160 108 258 360 ...
##  $ HP                     : num  110 110 93 110 175 105 245 62 95 123 ...
##  $ Amperagem_circ_eletrico: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
##  $ Peso                   : num  2.62 2.88 2.32 3.21 3.44 ...
##  $ RPM                    : num  16.5 17 18.6 19.4 17 ...
##  $ Tipodecombustivel      : num  0 0 1 1 0 1 0 1 1 1 ...
##  $ TipodeMarcha           : num  1 1 1 0 0 0 0 0 0 0 ...
##  $ NumdeMarchas           : num  4 4 4 3 3 3 3 4 4 4 ...
##  $ NumdeValvulas          : num  4 4 1 1 2 1 4 2 2 4 ...
##  - attr(*, "variable.labels")= chr [1:11] "Km por litro" "Número de Cilindros" "Preço" "HP = Horse Power (potência do motor)" ...

Aqui vou colocar um resumo do dados.

summary(CARROS)
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Min.   :0.0000   
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000   
##  Median :3.695           Median :3.325   Median :17.71   Median :0.0000   
##  Mean   :3.597           Mean   :3.217   Mean   :17.85   Mean   :0.4375   
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000   
##  Max.   :4.930           Max.   :5.424   Max.   :22.90   Max.   :1.0000   
##   TipodeMarcha     NumdeMarchas   NumdeValvulas  
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000

Transformação de dados

Aqui vou transformar as variáveis comb e marcha.

CARROS$Tipodecombustivel2 <- ifelse(CARROS$Tipodecombustivel==0,'Gas','Alc')

Gráfico de barras

Meu primeiro gráfico de barras

barplot(table(CARROS$Tipodecombustivel2),col = c('purple','red'),
        main='Distribuição dos carros por tipo de comb',
        ylim =c(0,20))

Estudo de variáveis quantitativas

km/l

summary(CARROS$Kmporlitro)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.40   15.43   19.20   20.09   22.80   33.90
hist(CARROS$Kmporlitro, col='skyblue', 
     main='Meu histograma',
     xlab='km/l',
     ylab='Frequencia')

preço do carro

summary(CARROS$Preco)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    71.1   120.8   196.3   230.7   326.0   472.0
hist(CARROS$Preco, col='navy',
     main= 'Histograma do preço',
     xlab='preço do carro')

estudo outliers

numeros<-c(1,2,3,4,5)
numeros
## [1] 1 2 3 4 5
mean(numeros)
## [1] 3
median(numeros)
## [1] 3
numeros2<-c(1,2,3,4,50000)
numeros2
## [1]     1     2     3     4 50000
mean(numeros2)
## [1] 10002
median(numeros2)
## [1] 3

o boxplot

boxplot(CARROS$Kmporlitro, col='green',
        main='Meu boxplot',
        ylim=c(0,40))

boxplot(CARROS$Preco, col='blue',
        main='Meu boxplot 2',
        ylim=c(0,500))

Termino da aula de grafico de barras, histograma, outliers e boxplot