Aqui vamos carregar as duas bases de hoje.
#-----------------------------------------
#carregar a base de dados
#-----------------------------------------
load("C:/Users/Aline/Desktop/Base_de_dados-master/Titanic.RData")
load("C:/Users/Aline/Desktop/Base_de_dados-master/CARROS.RData")
#-----------------------------------------
#transformacao de variaveis
#-----------------------------------------
class(CARROS$Tipodecombustivel)
## [1] "numeric"
class(CARROS$TipodeMarcha)
## [1] "numeric"
CARROS$Tipodecombustivel<-ifelse(CARROS$Tipodecombustivel==0,"Gasolina","Alcool")
class(CARROS$Tipodecombustivel)
## [1] "character"
CARROS$TipodeMarcha<-ifelse(CARROS$TipodeMarcha==0,"Auto","Manal")
class(CARROS$TipodeMarcha)
## [1] "character"
#-----------------------------------------
# estatística para variável quantitativa
#-----------------------------------------
summary(CARROS)
## Kmporlitro Cilindros Preco HP
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## Amperagem_circ_eletrico Peso RPM Tipodecombustivel
## Min. :2.760 Min. :1.513 Min. :14.50 Length:32
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 Class :character
## Median :3.695 Median :3.325 Median :17.71 Mode :character
## Mean :3.597 Mean :3.217 Mean :17.85
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90
## Max. :4.930 Max. :5.424 Max. :22.90
## TipodeMarcha NumdeMarchas NumdeValvulas
## Length:32 Min. :3.000 Min. :1.000
## Class :character 1st Qu.:3.000 1st Qu.:2.000
## Mode :character Median :4.000 Median :2.000
## Mean :3.688 Mean :2.812
## 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :5.000 Max. :8.000
Aqui vamos fazer dois boxplots.
#-----------------------------------------
# Boxplot
#-----------------------------------------
par(mfrow=c(1,2))
boxplot(CARROS$Preco,col="skyblue",main="Boxplot do preço do carro",horizontal = TRUE,ylim=c(0,500),xlab="Preço do carro")
boxplot(CARROS$Kmporlitro,col="orange",main="Boxplot de Km/L do carro",horizontal = TRUE,ylim=c(0,35),xlab="Km/L")
par(mfrow=c(1,1))
Aqui vamos fazer dois histogramas.
#-----------------------------------------
# Histograma
#-----------------------------------------
hist(CARROS$Preco, col="red",main="Histograma", xlab ="Preço", ylab = "Frequência")
hist(CARROS$Kmporlitro, col="blue",main="Histograma", xlab ="Km/L", ylab = "Frequência")
par(mfrow=c(1,2))
hist(CARROS$Kmporlitro, col="blue",main="Histograma", xlab ="Km/L", ylab = "Frequência")
boxplot(CARROS$Kmporlitro,col="orange",main="Boxplot de Km/L do carro",horizontal = TRUE,ylim=c(0,35),xlab="Km/L")
par(mfrow=c(1,1))
Histograma não é gráfico de barras.
par(mfrow=c(1,2))
hist(CARROS$Kmporlitro, col="skyblue",
main = "histograma",
xlab = " km/l",
ylab = "frequência")
barplot(table(CARROS$Tipodecombustivel),
main="Gráfico de barras",horiz = FALSE,col = "red")
par(mfrow=c(1,1))
A análise de hoje foi em cima de variáveis quantitativas, resumos numéricos, Histogramas, Boxplot, diferença entre média e mediana, simetria e assimetria, outliers, quartis, manipulação de variáveis.