carregar a base de dados

Aqui vamos carregar as duas bases de hoje.

#-----------------------------------------
#carregar a base de dados 
#-----------------------------------------
load("C:/Users/Aline/Desktop/Base_de_dados-master/Titanic.RData")
load("C:/Users/Aline/Desktop/Base_de_dados-master/CARROS.RData")

Transformar

Identificando e corrigindo o erro

#-----------------------------------------
#transformacao de variaveis 
#-----------------------------------------
class(CARROS$Tipodecombustivel)
## [1] "numeric"
class(CARROS$TipodeMarcha)
## [1] "numeric"
CARROS$Tipodecombustivel<-ifelse(CARROS$Tipodecombustivel==0,"Gasolina","Alcool")

class(CARROS$Tipodecombustivel)
## [1] "character"
CARROS$TipodeMarcha<-ifelse(CARROS$TipodeMarcha==0,"Auto","Manal")

class(CARROS$TipodeMarcha)
## [1] "character"

Estatística para variável quantitativa

Resumo numérico

#-----------------------------------------
# estatística para variável quantitativa 
#-----------------------------------------

summary(CARROS)
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel 
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Length:32         
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   Class :character  
##  Median :3.695           Median :3.325   Median :17.71   Mode  :character  
##  Mean   :3.597           Mean   :3.217   Mean   :17.85                     
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90                     
##  Max.   :4.930           Max.   :5.424   Max.   :22.90                     
##  TipodeMarcha        NumdeMarchas   NumdeValvulas  
##  Length:32          Min.   :3.000   Min.   :1.000  
##  Class :character   1st Qu.:3.000   1st Qu.:2.000  
##  Mode  :character   Median :4.000   Median :2.000  
##                     Mean   :3.688   Mean   :2.812  
##                     3rd Qu.:4.000   3rd Qu.:4.000  
##                     Max.   :5.000   Max.   :8.000

Boxplot

Aqui vamos fazer dois boxplots.

#-----------------------------------------
# Boxplot
#-----------------------------------------

par(mfrow=c(1,2))

boxplot(CARROS$Preco,col="skyblue",main="Boxplot do preço do carro",horizontal = TRUE,ylim=c(0,500),xlab="Preço do carro")

boxplot(CARROS$Kmporlitro,col="orange",main="Boxplot de Km/L do carro",horizontal = TRUE,ylim=c(0,35),xlab="Km/L")

par(mfrow=c(1,1))

Histograma

Aqui vamos fazer dois histogramas.

#-----------------------------------------
# Histograma
#-----------------------------------------

hist(CARROS$Preco, col="red",main="Histograma", xlab ="Preço", ylab = "Frequência")

hist(CARROS$Kmporlitro, col="blue",main="Histograma", xlab ="Km/L", ylab = "Frequência")

Comparação do Histograma x Boxplot

par(mfrow=c(1,2))

hist(CARROS$Kmporlitro, col="blue",main="Histograma", xlab ="Km/L", ylab = "Frequência")

boxplot(CARROS$Kmporlitro,col="orange",main="Boxplot de Km/L do carro",horizontal = TRUE,ylim=c(0,35),xlab="Km/L")

par(mfrow=c(1,1))

Histograma e gráfico de barras

Histograma não é gráfico de barras.

par(mfrow=c(1,2))
hist(CARROS$Kmporlitro, col="skyblue",
     main = "histograma",
     xlab = " km/l",
     ylab = "frequência")

barplot(table(CARROS$Tipodecombustivel),
        main="Gráfico de barras",horiz = FALSE,col = "red")

par(mfrow=c(1,1))

Conclusão

A análise de hoje foi em cima de variáveis quantitativas, resumos numéricos, Histogramas, Boxplot, diferença entre média e mediana, simetria e assimetria, outliers, quartis, manipulação de variáveis.