Carregando o banco de dados Titanic e Carros

load("C:/Users/Marco Aurelio/Desktop/Base_de_dados-master/CARROS.RData")

load("C:/Users/Marco Aurelio/Desktop/Base_de_dados-master/Titanic.RData")

comando barplot na da base de dados Titanic e variável sexo

barplot(table(Titanic$Sexo))

###Para verificar o eixo x com fonte maior

par(cex= 1.9)

Colocando a tabela na horizontal

barplot(table(Titanic$Sexo), horiz = TRUE)

###modificando o parâmetro gráfico

barplot(table(Titanic$Sexo), horiz=TRUE, cex.axis = par(0.97), col="red")

###tentando verificar a variavel carros foi constatado que o R identificou com variável quantitativa, para mudar usamos ifelse

CARROS$Tipodecombustivel<-ifelse(CARROS$Tipodecombustivel==0, "gas","alc")
class(CARROS$Tipodecombustivel)
## [1] "character"
CARROS$TipodeMarcha<-ifelse(CARROS$TipodeMarcha==0,"auto","manual")
class(CARROS$TipodeMarcha)
## [1] "character"
CARROS$TipodeMarcha<-ifelse(CARROS$TipodeMarcha==0,"auto","manual")
class(CARROS$TipodeMarcha)
## [1] "character"

agora ele entende como caracteres

estatística para a variável quantitativa(resumão do banco de dados)

vai me dar media, a mediana o mínimo e o Maximo

summary(CARROS)
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel 
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Length:32         
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   Class :character  
##  Median :3.695           Median :3.325   Median :17.71   Mode  :character  
##  Mean   :3.597           Mean   :3.217   Mean   :17.85                     
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90                     
##  Max.   :4.930           Max.   :5.424   Max.   :22.90                     
##  TipodeMarcha        NumdeMarchas   NumdeValvulas  
##  Length:32          Min.   :3.000   Min.   :1.000  
##  Class :character   1st Qu.:3.000   1st Qu.:2.000  
##  Mode  :character   Median :4.000   Median :2.000  
##                     Mean   :3.688   Mean   :2.812  
##                     3rd Qu.:4.000   3rd Qu.:4.000  
##                     Max.   :5.000   Max.   :8.000

qual representa melhor media ou mediana no exemplos abaixo?

Ex. 11, 2, 3, 4, 5

Media 3

Mediane 3

nesse caso pode ser usada as duas mais sempre a mediana é melhor

Ex. 2

1, 2, 3, 4, 5000

Mediana 3

Media 1002

neste caso a melhor a ser usada é a mediana pois ha uma descrepancia de valores

media só pode ser usadas em situações simétricas

Fazendo um gráfico no boxplot para essas variáveis

Boxplot para a base de dados carros e variável preço

boxplot(CARROS$Preco)

###Trocando a cor e título

boxplot(CARROS$Preco, col = "SKYBLUE", main= "preço dos carros")

###colocando na horizontal

boxplot(CARROS$Preco, col = "SKYBLUE", main= "preço dos carros", horizontal=TRUE)

###colocando dentro dos limites (entre 0 e 500)

boxplot(CARROS$Preco, col = "SKYBLUE", main= "preço dos carros",
        horizontal=TRUE, ylim=c(0,500))

###colocando legenda do eixo x

boxplot(CARROS$Preco, col = "SKYBLUE", main= "preço dos carros",
        horizontal=TRUE, ylim=c(0,500), xlab= "preço do carro")

###fazendo o mesmo para kilometro por litro

boxplot(CARROS$Kmporlitro, col = "red", 
        main= "kilometro por litro", horizontal=TRUE,
        ylim=c(0,35), xlab= "kilometro por litro")

###colocando dois gráficos lado a lado

par(mfrow=c(1,2))
boxplot(CARROS$Preco, col = "SKYBLUE", 
        main= "boxplot preço dos carros", horizontal=TRUE, ylim=c(0,500),
        xlab= "preço do carro")

boxplot(CARROS$Kmporlitro, col = "red", main= "boxplot kilometro por litro", horizontal=TRUE, ylim=c(0,35),
        xlab= "kilometro por litro")

###para colocar um embaixo do outro é só trocar a ordem de linha e colonas no comando par

par(mfrow=c(2,1))
boxplot(CARROS$Preco, col = "SKYBLUE", main= "boxplot preço dos carros", horizontal=TRUE, ylim=c(0,500),
        xlab= "preço do carro")

boxplot(CARROS$Kmporlitro, col = "red", main= "boxplot kilometro por litro", horizontal=TRUE, ylim=c(0,35),
        xlab= "kilometro por litro")

###voltando pra formatação original

par(mfrow=c(1,1))

histograma - só pode ser utilizado em quantitativa continua

colocar histagrama em quantitativa preço do carro colocando legenda no eixo x e no eixo y

hist(CARROS$Preco, col="red", main = "HISTOGRAMA")

hist(CARROS$Preco, col="red", main = "HISTOGRAMA", xlab = "preço",
     ylab = "frequencia")

###histograma - só pode ser utilizado em quantitativa continua ###colocar histagrama em quantitativa kilometro por litro colocando legenda no eixo x e no eixo y

hist(CARROS$Kmporlitro, col="red", main = "HISTOGRAMA", xlab = "Kilometro",
     ylab = "frequencia")

###fazendo comparação lado a lado entre os gráficos boxplot e histograma

boxplot(CARROS$Kmporlitro, col = "red", main= "boxplot kilometro por litro", horizontal=FALSE, ylim=c(0,35),
        xlab= "kilometro por litro")

hist(CARROS$Kmporlitro, col="red", main = "HISTOGRAMA", xlab = "Kilometro",
     ylab = "frequencia")
par(mfrow=c(1,2))

hist(CARROS$Kmporlitro, col="red", main = "HISTOGRAMA", xlab = "Kilometro",
     ylab = "frequencia")
barplot(table(CARROS$Tipodecombustivel), col = "red", main= "Grafico de barras", horiz=FALSE)

par(mfrow=c(1,2))