R Markdown
rua_vermelha = c(40,95,55,80,65)
rua_vermelha
## [1] 40 95 55 80 65
rua_azul = c(70,65,55,70,75)
rua_azul
## [1] 70 65 55 70 75
sd(rua_vermelha)
## [1] 21.38925
sd(rua_azul)
## [1] 7.582875
Apesar de ter a mesma média, a rua vermelha tem uma dispersão maior A rua azul é mais concentrada em torno da média
Qual o preço médio do carro nessa base de dados?
load("C:/Users/17175994788/Desktop/Base_de_dados-master/CARROS.RData")
```r
mean(CARROS$Preco)
## [1] 230.7219
sd(CARROS$Preco)
## [1] 123.9387
O preço médio do carro é 230 mil com um desvio padrão de 123,9 mil
mean(CARROS$Kmporlitro)
## [1] 20.09062
sd(CARROS$Kmporlitro)
## [1] 6.026948
o km/l médio é de 20 km/l com um desvio padrão de 6 km/l
vamos fazer a média e o desvio padrão das variáveis preço e km/l.
A base de dados está no formato RData
Qual o preço médio do carro nessa base de dados?
mean(CARROS$Preco)
## [1] 230.7219
sd(CARROS$Preco)
## [1] 123.9387
O preço médio do carro é 230 mil com um desvio padrão de 123,9 mil
mean(CARROS$Kmporlitro)
## [1] 20.09062
sd(CARROS$Kmporlitro)
## [1] 6.026948
conjunto1 = c(7,8,9,10,11,12)
mean(conjunto1)
## [1] 9.5
median(conjunto1)
## [1] 9.5
conjunto2 = c(7,8,9,10,11,120000)
mean(conjunto2)
## [1] 20007.5
median(conjunto2)
## [1] 9.5
No conjunto1 a média é igual a mediana. No conjunto 2 a média é muito maior que a mediana. No conjunto 2 temos um outlier
summary(CARROS)
## Kmporlitro Cilindros Preco HP
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## Amperagem_circ_eletrico Peso RPM Tipodecombustivel
## Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
## Median :3.695 Median :3.325 Median :17.71 Median :0.0000
## Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
## Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
## TipodeMarcha NumdeMarchas NumdeValvulas
## Min. :0.0000 Min. :3.000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
## Median :0.0000 Median :4.000 Median :2.000
## Mean :0.4062 Mean :3.688 Mean :2.812
## 3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :1.0000 Max. :5.000 Max. :8.000
Vamos fazer o boxplot do preço do carro e do km/l.
boxplot(CARROS$Preco, col = "tomato2",
main="meu primeiro boxplot",
horizontal = TRUE)
boxplot(CARROS$Kmporlitro, col = "royalblue",
main="Gráfico 1 - Boxplot do km/l",
horizontal = TRUE)
# Histograma
hist(CARROS$Preco, col = "red", main = "meu primeiro histograma")
hist(CARROS$Kmporlitro, col = "royalblue", main = "Gráfico 2 - Histograma do km/l", ylab = "Frequência", xlab = "km/l")
hist(CARROS$Peso, col = "red", main = "Gráfico 3 - Peso", ylab = "Frequência", xlab = "Toneladas")
hist(CARROS$HP, col = "purple", main = "Gráfico 4 - HP", ylab = "Frequência", xlab = "Horse power")