Vamos fazer a média e o desvio-padrão da rua vermelha e da rua azul

A rua vermelha e a rua azul

rua_vermelha = c(40, 95, 55, 80, 65)
rua_vermelha
## [1] 40 95 55 80 65
rua_azul = c(70, 65, 55, 70, 75)
rua_azul
## [1] 70 65 55 70 75
#Calculando a média
mean(rua_vermelha)
## [1] 67
mean(rua_azul)
## [1] 67
#Calculando o desvio padrão 
sd(rua_vermelha)
## [1] 21.38925
sd(rua_azul)
## [1] 7.582875

Apesar de ter a mesma média, a rua vermelha tem uma dispersao maior.

A rua azul é mais concentrada em torno da média.

A base de dados CARROS

vamos fazer a média e o desvio-padrão das variáveis preço e km/l.

Carregar a base de dados

A base de dados está no formato RData.

load("c:/Users/eduar/Base_de_dados-master/CARROS.RData")

A variável preço do carro

Qual o preço médio do carro nessa base de dados

mean(CARROS$Preco)
## [1] 230.7219
sd(CARROS$Preco)
## [1] 123.9387

O preco médio do carro é 230 mil com desvio padrao de 123,9 mil

A variável km/l

mean(CARROS$Kmporlitro)
## [1] 20.09062
sd(CARROS$Kmporlitro)
## [1] 6.026948

Comparando a média e a mediana

#Novo vetor
conjunto1 = c(7, 8, 9, 10, 11, 12)
mean(conjunto1)
## [1] 9.5
median(conjunto1)
## [1] 9.5
conjunto2 = c(7, 8, 9, 10, 11, 120000)
mean(conjunto2)
## [1] 20007.5
median(conjunto2) 
## [1] 9.5

No conjunto 1 a média é igual a mediana

No conjunto 2 a média é muito maior que a mediana. No conjunto 2 temos um outlier

Análise dos quartis

summary(CARROS)
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Min.   :0.0000   
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000   
##  Median :3.695           Median :3.325   Median :17.71   Median :0.0000   
##  Mean   :3.597           Mean   :3.217   Mean   :17.85   Mean   :0.4375   
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000   
##  Max.   :4.930           Max.   :5.424   Max.   :22.90   Max.   :1.0000   
##   TipodeMarcha     NumdeMarchas   NumdeValvulas  
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000

O Boxplot

Vamos fazer o boxplot do preço do carro e do Km/l.

boxplot(CARROS$Preco, col = "tomato2",
        main= "meu primeiro boxplot", 
        horizontal = TRUE)

boxplot(CARROS$Kmporlitro, col = "blue",
        main= "Gráfico 1 - Boxplot do Km/l", 
        horizontal = TRUE)

O Histograma

Vamos fazer o histograma do preço do carro, km/l, hp e peso

hist(CARROS$Preco, col = "red",
     main = "meu primeiro histograma",
     ylab = "Frequência",
     xlab = "Preço")

hist(CARROS$Kmporlitro, col = "royalblue",
     main = "Gráfico 2 - Histograma do Km/l",
     ylab = "Frequência",
     xlab = "Km/l")

hist(CARROS$HP, col = c("pink", "pink", "blue", "blue", "yellow", "yellow"),
     main = "Gráfico 3 - Histograma do HP",
     ylab = "Frequência",
     xlab = "HP")

hist(CARROS$Peso, col = c("yellow", "yellow", "yellow", "green", "green", "blue"),
     main = "Gráfico 4 - Histograma do Peso",
     ylab = "Frequência",
     xlab = "Peso")