usando média e mediana
c1= c(1,2,3,4,5)
c1
## [1] 1 2 3 4 5
c2= c(1,2,3,4,50000)
c2
## [1] 1 2 3 4 50000
median(c1)
## [1] 3
median(c2)
## [1] 3
mean(c1)
## [1] 3
mean(c2)
## [1] 10002
#usar mean e median nos relatórios
c3= c(1,2,3,4,50000)
c3
## [1] 1 2 3 4 50000
mean(c3)
## [1] 10002
median(c3)
## [1] 3
#existe outlier no conjunto de dados #outlier= valor atipico
#Carregar base de dados
load(file.path("C:", "Users", "Letícia Colla", "Desktop", "Base_de_dados-master", "CARROS.RData"))
mean(CARROS$Kmporlitro)
## [1] 20.09062
median(CARROS$Kmporlitro)
## [1] 19.2
mean(CARROS$Preco)
## [1] 230.7219
median(CARROS$Preco)
## [1] 196.3
summary(CARROS)
## Kmporlitro Cilindros Preco HP
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## Amperagem_circ_eletrico Peso RPM Tipodecombustivel
## Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
## Median :3.695 Median :3.325 Median :17.71 Median :0.0000
## Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
## Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
## TipodeMarcha NumdeMarchas NumdeValvulas
## Min. :0.0000 Min. :3.000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
## Median :0.0000 Median :4.000 Median :2.000
## Mean :0.4062 Mean :3.688 Mean :2.812
## 3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :1.0000 Max. :5.000 Max. :8.000
CARROS$Tipodecombustivel = ifelse(CARROS$Tipodecombustivel==0,
"GAS", "ALCOOL")
CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0,
"AUTOMATICO", "MANUAL")
#obs: executar correção uma vez só
#Criação do vetor ‘rua’
rua_vermelha = c(40,95,55,80,65)
rua_azul = c(70,65,55,70,75)
mean(rua_azul)
## [1] 67
var(rua_azul)
## [1] 57.5
sd(rua_azul)
## [1] 7.582875
mean(rua_vermelha)
## [1] 67
var(rua_vermelha)
## [1] 457.5
sd(rua_vermelha)
## [1] 21.38925
#KM por litro
hist(
CARROS$Kmporlitro,
col = c("steelblue", "steelblue", "steelblue", "violet", "violet"),
main = "Gráfico 1 - Histograma do KM/L",
xlab = "KM por Litro",
ylab = "Frequência",
)
hist(
CARROS$Preco,
col = c("yellow", "yellow", "yellow", "tomato", "yellow", "yellow", "yellow", "tomato", "tomato"),
main = "Gráfico 2 - Histograma do Preço",
xlab = "Preço",
ylab = "Frequência",
breaks = 9 # Ajuste o número de intervalos conforme necessário
)
barplot(
table(CARROS$Tipodecombustivel),
col = c("purple", "pink"),
main = "Gráfico 3 - Histograma do tipo de combustível",
xlab = "Tipo de Combustível",
ylab = "Frequência"
)
#Juntando
hist(
CARROS$Kmporlitro,
col = c("steelblue", "steelblue", "steelblue", "violet", "violet"),
main = "Gráfico 1 - Histograma do KM/L",
xlab = "KM por Litro",
ylab = "Frequência",
breaks = 5 # Ajuste o número de intervalos conforme necessário
)
hist(
CARROS$Preco,
col = c("yellow", "yellow", "yellow", "tomato", "yellow", "yellow", "yellow", "tomato", "tomato"),
main = "Gráfico 2 - Histograma do Preço",
xlab = "Preço",
ylab = "Frequência",
breaks = 9 # Ajuste o número de intervalos conforme necessário
)
barplot(
table(CARROS$Tipodecombustivel),
col = c("purple", "pink"),
main = "Gráfico 3 - Histograma do tipo de combustível",
xlab = "Tipo de Combustível",
ylab = "Frequência"
)
par(mfrow=c(3,3))
#OBS: histograma para variaveis continuas(quantitativa) e barras para variavel categorica