Aula 04 - Estatística

passo 1 - Carregando banco de dados

library(readxl)
Familias <- read_excel("C:/Users/julia/Base_de_dados-master/Familias.xls", 
                       sheet = "Dados da pesquisa")

load("C:/Users/julia/Base_de_dados-master/CARROS.RData")

passo 2: especionar a base de dados

str(CARROS)
## 'data.frame':    32 obs. of  11 variables:
##  $ Kmporlitro             : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
##  $ Cilindros              : num  6 6 4 6 8 6 8 4 4 6 ...
##  $ Preco                  : num  160 160 108 258 360 ...
##  $ HP                     : num  110 110 93 110 175 105 245 62 95 123 ...
##  $ Amperagem_circ_eletrico: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
##  $ Peso                   : num  2.62 2.88 2.32 3.21 3.44 ...
##  $ RPM                    : num  16.5 17 18.6 19.4 17 ...
##  $ Tipodecombustivel      : num  0 0 1 1 0 1 0 1 1 1 ...
##  $ TipodeMarcha           : num  1 1 1 0 0 0 0 0 0 0 ...
##  $ NumdeMarchas           : num  4 4 4 3 3 3 3 4 4 4 ...
##  $ NumdeValvulas          : num  4 4 1 1 2 1 4 2 2 4 ...
##  - attr(*, "variable.labels")= chr [1:11] "Km por litro" "Número de Cilindros" "Preço" "HP = Horse Power (potência do motor)" ...
str(Familias)
## tibble [120 x 6] (S3: tbl_df/tbl/data.frame)
##  $ familia: num [1:120] 1 2 3 4 5 6 7 8 9 10 ...
##  $ local  : chr [1:120] "Monte Verde" "Monte Verde" "Monte Verde" "Monte Verde" ...
##  $ p.a.p  : chr [1:120] "Não usa" "Não usa" "Usa" "Não usa" ...
##  $ instr  : chr [1:120] "Ensino médio" "Ensino médio" "Ensino fundamental" "Ensino fundamental" ...
##  $ tam    : num [1:120] 4 4 4 5 4 1 2 3 6 4 ...
##  $ renda  : num [1:120] 10.3 15.4 9.6 5.5 9 2.4 4.1 8.4 10.3 4.6 ...

passo 3: correção de dados

CARROS$Tipodecombustivel <- ifelse(CARROS$Tipodecombustivel==0, "Gas", "Alc")
CARROS$TipodeMarcha <- ifelse(CARROS$TipodeMarcha==0, "Automático", "Manual")

passo 4 - analise de variavel qualitativa

tabela_comb <- table(CARROS$Tipodecombustivel)
prop.table(tabela_comb)*100
## 
##   Alc   Gas 
## 43.75 56.25
pie(tabela_comb)

GRÁFICOS

passo 5 - grafico de barras

barplot(tabela_comb, col= c("navyblue", "pink"), 
        main = "Gráfico 1 - Tipo de combustível", horiz=T,
legend.text = rownames(tabela_comb),
args.legend = list(x = "bottomright"),
xlim =c(0,20))

passo 6 - criando grafico de barras com rótulo

grafico <- barplot(table(CARROS$Tipodecombustivel),col = "black")
percentual <- prop.table(table(CARROS$Tipodecombustivel))*100
percentual
## 
##   Alc   Gas 
## 43.75 56.25
 rotulo <- paste0(percentual,"%")
 rotulo
## [1] "43.75%" "56.25%"
 text(grafico, 0, rotulo,cex=1,pos=3,col = "white")

HISTOGRAMAS

Preço do carro

hist(CARROS$Preco, col= "skyblue", main = "Gráfico 2 - Histograma do preço do carro",
xlab = "Preço do carro", ylab = "Frequência")

KM POR LITRO

hist(CARROS$Kmporlitro, col = "lightgreen", main = "Histograma",
     xlab = "Km/l do carro", ylab = "Frequência")

HP do carro

hist(CARROS$HP, col = "tomato", border ="yellow", main = "Histograma",
     xlab = "HP do carro", labels = TRUE, ylab = "Frequência")

Conclusão

  • Para as variáveis qualitativas é usado o gráfico de barras, e conforme as informações apresentadas nos gráficos anteriores, 43.75% são álcool e 56.25% são gasolina.
  • Para as variáveis quantitativas é usado o histograma, mostrando os dados contínuos.