Carregar Bases de dados

load("D:/Desktop/Base_de_dados-master/CARROS.RData")
load("D:/Desktop/Base_de_dados-master/Titanic.RData")

Modificação o parâmetro Gráfico e ajustando tamanho do nome da variável

barplot(table(Titanic$Sexo),horiz = TRUE, cex.axis = 0.7, col = "red")

par(cex=1.4)

Transformando variáveis e Corrigindo erros

CARROS$Tipodecombustivel <- ifelse(CARROS$Tipodecombustivel==0, "Gas", "Alc")
CARROS$TipodeMarcha <- ifelse(CARROS$Tipodecombustivel==0, "automático", "manual")
class(CARROS$Tipodecombustivel)
[1] "character"
class(CARROS$TipodeMarcha)
[1] "character"

Estatística para variáveis quantitativas

summary(CARROS)
   Kmporlitro      Cilindros         Preco             HP       
 Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
 1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
 Median :19.20   Median :6.000   Median :196.3   Median :123.0  
 Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
 3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
 Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
 Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel 
 Min.   :2.760           Min.   :1.513   Min.   :14.50   Length:32         
 1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   Class :character  
 Median :3.695           Median :3.325   Median :17.71   Mode  :character  
 Mean   :3.597           Mean   :3.217   Mean   :17.85                     
 3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90                     
 Max.   :4.930           Max.   :5.424   Max.   :22.90                     
 TipodeMarcha        NumdeMarchas   NumdeValvulas  
 Length:32          Min.   :3.000   Min.   :1.000  
 Class :character   1st Qu.:3.000   1st Qu.:2.000  
 Mode  :character   Median :4.000   Median :2.000  
                    Mean   :3.688   Mean   :2.812  
                    3rd Qu.:4.000   3rd Qu.:4.000  
                    Max.   :5.000   Max.   :8.000  

Boxplot e Histograma

par(mfrow=c(1,2))

boxplot(CARROS$Preco, col = "skyblue", main = "Boxplot do Preço dos Carros", 
        horizontal = TRUE, ylim = c(0,500), xlab =  "Preço do Carro")
?boxplot
boxplot(CARROS$Kmporlitro, col = "red", main = "Boxplot do Km/L", 
        horizontal = TRUE, ylim = c(0,35), xlab =  "Km/L")

hist(CARROS$Preco, col = "skyblue", main = "Histograma", 
     xlab = "preço", ylab = "frequência" )
hist(CARROS$Kmporlitro, col = "red", main = "Histograma", 
     xlab = "preço", ylab = "frequência" )

Histograma e Gráfico de Barras

par(mfrow=c(1,2))
hist(CARROS$Kmporlitro, col="skyblue",
     main = "histograma",
     xlab = " km/l",
     ylab = "frequência")
barplot(table(CARROS$Tipodecombustivel),
        main="Gráfico de barras",horiz = FALSE,col = "red")

Conclusão

A análise de hoje foi em cima de variáveis quantitativas. Resumos numéricos, Histogramas, Boxplot, diferenças entre média e mediana, simetria, assimetria, outliers, quartis, manipulação de variáveis

Na semana que vem veremos o cruzamento de variáveis (quali x quali, quali x quanti, quanti x quanti)