Carregar dados

load("/cloud/project/Titanic.RData")

load("/cloud/project/CARROS.RData")

Gráfico para variável categórica: waffle

library(waffle)

#atribuiu os valores da prop table
partes <- c("não sobreviveu"=68,"sobreviveu"=32)

waffle(partes)

Gráfico para duas variáveis categóricas: mosaic

mosaicplot(~Sexo +Sobreviveu, data = Titanic, color=c("red","blue"))

# Gráfico para duas variáveis categóricas: Barras

##barplots
tabela <- table(Titanic$Sexo, Titanic$Sobreviveu)
barplot(tabela, beside = TRUE, legend = levels(unique(Titanic$Sobreviveu)), main="sobrevivência por sexo", col=c("red", "blue"))

Tabelas com duas variáveis categóricas

tabela1<-table(Titanic$Sexo, Titanic$Sobreviveu)


prop.table(tabela1)*100
           
            Não sobreviveu Sobreviveu
  Feminino             5.7       15.6
  Masculino           62.0       16.6
prop.table(tabela1,1)*100
           
            Não sobreviveu Sobreviveu
  Feminino              27         73
  Masculino             79         21
prop.table(tabela1,2)*100
           
            Não sobreviveu Sobreviveu
  Feminino             8.5       48.5
  Masculino           91.5       51.5

Em resumo, existe uma relação entre as variáveis SEXO e SOBREVIVEU.

variáveis quantitativas

Diagrama de Dispersão

plot(CARROS$Kmporlitro,CARROS$HP, pch=19, col="red")

abline(lm(HP~Kmporlitro, data=CARROS), col="blue", lty=4)

plot(CARROS$HP,CARROS$Preco, pch=19, col="blue")
abline(lm(Preco~HP, data=CARROS), col="red", lty=4)

plot(CARROS$Peso,CARROS$Preco, pch=19, col="green", main = "Diagrama de dispersão entre peso e preço")
abline(lm(Preco~Peso, data=CARROS), col="black", lty=4)

  • Correlação linear, forte e negativa entre HP e Km por litro
  • Correlação linear, forte e positiva entre HP e Preço
  • Correlação linear, forte e positiva entre Peso e Preço

Matriz de correlação

cor(CARROS$HP, CARROS$Preco)
[1] 0.79
cor(CARROS$Peso, CARROS$Preco)
[1] 0.89
cor(CARROS$HP, CARROS$Kmporlitro)
[1] -0.78
library(corrplot)
MC <-cor(CARROS[,c("HP","Preco","Peso","Kmporlitro","Amperagem_circ_eletrico","RPM")])
corrplot(MC, method="number")

MC
                           HP Preco  Peso Kmporlitro Amperagem_circ_eletrico
HP                       1.00  0.79  0.66      -0.78                  -0.449
Preco                    0.79  1.00  0.89      -0.85                  -0.710
Peso                     0.66  0.89  1.00      -0.87                  -0.712
Kmporlitro              -0.78 -0.85 -0.87       1.00                   0.681
Amperagem_circ_eletrico -0.45 -0.71 -0.71       0.68                   1.000
RPM                     -0.71 -0.43 -0.17       0.42                   0.091
                           RPM
HP                      -0.708
Preco                   -0.434
Peso                    -0.175
Kmporlitro               0.419
Amperagem_circ_eletrico  0.091
RPM                      1.000
corrplot.mixed(MC)

corrplot(MC,addCoef.col=TRUE,number.cex=0.7)

Pouca correlação entre RPM e Peso.

Conclusão

Gráficos e estatísticas para duas variáveis categóricas e duas variáveis quantitativas