R Markdown

Introdução

Vou importar os dados para o R.

# Passo 1 - IMPORTAR
library(readr)
anorexia <- read_csv("C:/Users/BISPO - ADV/Documents/bases_curso_estatistica/bases_curso_estatistica/bases_curso_estatistica/Base_de_dados-master/anorexia.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   subj = col_double(),
##   therapy = col_character(),
##   before = col_double(),
##   after = col_double()
## )
View(anorexia)

load("C:/Users/BISPO - ADV/Documents/bases_curso_estatistica/bases_curso_estatistica/bases_curso_estatistica/Base_de_dados-master/CARROS.RData")

###Aqui vou fazer um gráfico de pizza

# Passo 2 - GRÁFICO DE PIZZA
table(anorexia$therapy)
## 
##  b  c  f 
## 29 26 17
pie(table(anorexia$therapy))

###Aqui vou fazer um gráfico de barras

# Passo 3 - GRÁFICO DE BARRAS
barplot(table(anorexia$therapy),col = c("royalblue","darkblue","skyblue"),main = "meu gráfico de barras")

###Aqui vai um resumo do conjunto de dados

# Passo 4 - RESUMO
summary(CARROS)
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Min.   :0.0000   
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000   
##  Median :3.695           Median :3.325   Median :17.71   Median :0.0000   
##  Mean   :3.597           Mean   :3.217   Mean   :17.85   Mean   :0.4375   
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000   
##  Max.   :4.930           Max.   :5.424   Max.   :22.90   Max.   :1.0000   
##   TipodeMarcha     NumdeMarchas   NumdeValvulas  
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000

Aqui percebi um problema na base de dados que precisa ser corrigido.

# Passo 5 - TRANSFORMAÇÃO DE VARIÁVEIS
CARROS$Tipodecombustivel <- ifelse(CARROS$Tipodecombustivel==0,"Gas","Alc")
CARROS$TipodeMarcha <- ifelse(CARROS$TipodeMarcha==0,"Auto","Manual")

summary(CARROS) table(CARROS\(TipodeMarcha) table(CARROS\)Tipodecombustivel)

#—————————————————————-

summary(CARROS$Kmporlitro)

hist(CARROS$Kmporlitro,col = "purple",main = "Gráfico 1 - Histograma do Km/l",
     xlab = "Km/l",ylab = "Frequencia")

hist(CARROS$Preco,col = "royalblue",main = "Gráfico 2 - Histograma do preço",
     xlab = "Preço",ylab = "Frequencia")

Tanto o preço do carro quanto o km/l são assimétricos. Parece ter dois tipos de carro (popular e luxo).

É raro ber carro econômico nessa base de dados.

Conclusão

Abordamos dois tópicos:

  1. Transformação da variável
  2. Gráfico para variável quantitativa