Vou importar os dados para o R.
# Passo 1 - IMPORTAR
library(readr)
anorexia <- read_csv("C:/Users/BISPO - ADV/Documents/bases_curso_estatistica/bases_curso_estatistica/bases_curso_estatistica/Base_de_dados-master/anorexia.csv")
##
## -- Column specification --------------------------------------------------------
## cols(
## subj = col_double(),
## therapy = col_character(),
## before = col_double(),
## after = col_double()
## )
View(anorexia)
load("C:/Users/BISPO - ADV/Documents/bases_curso_estatistica/bases_curso_estatistica/bases_curso_estatistica/Base_de_dados-master/CARROS.RData")
###Aqui vou fazer um gráfico de pizza
# Passo 2 - GRÁFICO DE PIZZA
table(anorexia$therapy)
##
## b c f
## 29 26 17
pie(table(anorexia$therapy))
###Aqui vou fazer um gráfico de barras
# Passo 3 - GRÁFICO DE BARRAS
barplot(table(anorexia$therapy),col = c("royalblue","darkblue","skyblue"),main = "meu gráfico de barras")
###Aqui vai um resumo do conjunto de dados
# Passo 4 - RESUMO
summary(CARROS)
## Kmporlitro Cilindros Preco HP
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## Amperagem_circ_eletrico Peso RPM Tipodecombustivel
## Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
## Median :3.695 Median :3.325 Median :17.71 Median :0.0000
## Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
## Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
## TipodeMarcha NumdeMarchas NumdeValvulas
## Min. :0.0000 Min. :3.000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
## Median :0.0000 Median :4.000 Median :2.000
## Mean :0.4062 Mean :3.688 Mean :2.812
## 3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :1.0000 Max. :5.000 Max. :8.000
Aqui percebi um problema na base de dados que precisa ser corrigido.
# Passo 5 - TRANSFORMAÇÃO DE VARIÁVEIS
CARROS$Tipodecombustivel <- ifelse(CARROS$Tipodecombustivel==0,"Gas","Alc")
CARROS$TipodeMarcha <- ifelse(CARROS$TipodeMarcha==0,"Auto","Manual")
summary(CARROS) table(CARROS\(TipodeMarcha) table(CARROS\)Tipodecombustivel)
#—————————————————————-
summary(CARROS$Kmporlitro)
hist(CARROS$Kmporlitro,col = "purple",main = "Gráfico 1 - Histograma do Km/l",
xlab = "Km/l",ylab = "Frequencia")
hist(CARROS$Preco,col = "royalblue",main = "Gráfico 2 - Histograma do preço",
xlab = "Preço",ylab = "Frequencia")
Tanto o preço do carro quanto o km/l são assimétricos. Parece ter dois tipos de carro (popular e luxo).
É raro ber carro econômico nessa base de dados.
Abordamos dois tópicos: