INTRODUÇÃO:

usando média e mediana

c1= c(1,2,3,4,5)
c1
## [1] 1 2 3 4 5
c2= c(1,2,3,4,50000)
c2
## [1]     1     2     3     4 50000
median(c1)
## [1] 3
median(c2)
## [1] 3
mean(c1)
## [1] 3
mean(c2)
## [1] 10002

#usar mean e median nos relatórios

c3= c(1,2,3,4,50000)
c3
## [1]     1     2     3     4 50000
mean(c3)
## [1] 10002
median(c3)
## [1] 3

#existe outlier no conjunto de dados #outlier= valor atipico

#Carregar base de dados

load(file.path("C:", "Users", "Letícia Colla", "Desktop", "Base_de_dados-master", "CARROS.RData"))

Utilizando funções

mean(CARROS$Kmporlitro)
## [1] 20.09062
median(CARROS$Kmporlitro)
## [1] 19.2
mean(CARROS$Preco)
## [1] 230.7219
median(CARROS$Preco)
## [1] 196.3
summary(CARROS)
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Min.   :0.0000   
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000   
##  Median :3.695           Median :3.325   Median :17.71   Median :0.0000   
##  Mean   :3.597           Mean   :3.217   Mean   :17.85   Mean   :0.4375   
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000   
##  Max.   :4.930           Max.   :5.424   Max.   :22.90   Max.   :1.0000   
##   TipodeMarcha     NumdeMarchas   NumdeValvulas  
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000

Corrigir a base de dados

CARROS$Tipodecombustivel = ifelse(CARROS$Tipodecombustivel==0,
                                  "GAS", "ALCOOL")

CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0,
                             "AUTOMATICO", "MANUAL")

#obs: executar correção uma vez só

#Criação do vetor ‘rua’

rua_vermelha = c(40,95,55,80,65)
rua_azul = c(70,65,55,70,75)

mean(rua_azul)
## [1] 67
var(rua_azul)
## [1] 57.5
sd(rua_azul)
## [1] 7.582875
mean(rua_vermelha)
## [1] 67
var(rua_vermelha)
## [1] 457.5
sd(rua_vermelha)
## [1] 21.38925

Histogramas

#KM por litro

hist(
  CARROS$Kmporlitro,
  col = c("steelblue", "steelblue", "steelblue", "violet", "violet"),
  main = "Gráfico 1 - Histograma do KM/L",
  xlab = "KM por Litro",
  ylab = "Frequência",
)

Preços

hist(
  CARROS$Preco,
  col = c("yellow", "yellow", "yellow", "tomato", "yellow", "yellow", "yellow", "tomato", "tomato"),
  main = "Gráfico 2 - Histograma do Preço",
  xlab = "Preço",
  ylab = "Frequência",
  breaks = 9  # Ajuste o número de intervalos conforme necessário
)

Tipos

barplot(
  table(CARROS$Tipodecombustivel),
  col = c("purple", "pink"),
  main = "Gráfico 3 - Histograma do tipo de combustível",
  xlab = "Tipo de Combustível",
  ylab = "Frequência"
)

#Juntando

hist(
  CARROS$Kmporlitro,
  col = c("steelblue", "steelblue", "steelblue", "violet", "violet"),
  main = "Gráfico 1 - Histograma do KM/L",
  xlab = "KM por Litro",
  ylab = "Frequência",
  breaks = 5  # Ajuste o número de intervalos conforme necessário
)

hist(
  CARROS$Preco,
  col = c("yellow", "yellow", "yellow", "tomato", "yellow", "yellow", "yellow", "tomato", "tomato"),
  main = "Gráfico 2 - Histograma do Preço",
  xlab = "Preço",
  ylab = "Frequência",
  breaks = 9  # Ajuste o número de intervalos conforme necessário
)

barplot(
  table(CARROS$Tipodecombustivel),
  col = c("purple", "pink"),
  main = "Gráfico 3 - Histograma do tipo de combustível",
  xlab = "Tipo de Combustível",
  ylab = "Frequência"
)

par(mfrow=c(3,3))

#OBS: histograma para variaveis continuas(quantitativa) e barras para variavel categorica