Na segunda aula de R aprendemos a utilizar os seguintes códigos e as seguintes importações
Hoje vamos ver como importar a base de dados, como TRANSFORMAR VARIAVEIS E COMO FAZ UM GRÁFICO DE PIZZA.
Nessa parte irei importar as bases de dados utilizadas do formato RData, XLSX e CSV
Para carregar uma base do RData, podemos fazer o seguinte código.
# Carregando a base de dados CARROS.RData- dados do RData
load("C:/Users/06179351732/Desktop/Base_de_dados-master/CARROS.RData")
Para carregar uma base do Exel, pode,os fazer o seguinte
# Carregando um arquivo do EXEL no R
library(readxl)
base_IDH <- read_excel("C:/Users/06179351732/Desktop/Base_de_dados-master/IDH_por_regiao.XLS",
sheet = "Dados")
View(base_IDH)
Para carregar uma base de dados do CSV, podemos fazer o seguinte
# carregando arquivo modelo CSV (Comma-separated values/ separado por virgulas) no R
library(readr)
Familias <- read_delim("C:/Users/06179351732/Desktop/Base_de_dados-master/Familias2.csv",
delim = ";", escape_double = FALSE, locale = locale(encoding = "WINDOWS-1252"),
trim_ws = TRUE)
## Rows: 120 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (4): local, p.a.p, instr, renda
## dbl (2): familia, tam
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(Familias)
aqui vamos aprender a mexer nas variáveis Renada da base familia, tipo de marcha da base de carros e tipo de combustivel tambem da base de carros.
# transformação do tipo de marcha
class(CARROS$TipodeMarcha)
## [1] "numeric"
class(CARROS$Tipodecombustivel)
## [1] "numeric"
CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0,"Automatico","Manual")
#CARROS$TipodeCombustivel = ifelse(CARROS$TipodeCombustivel==0,"Gas","Alcool")
CARROS$Tipodecombustivel = ifelse(CARROS$Tipodecombustivel==0,'Gas','Alc')
class(CARROS$TipodeCombustivel)
## [1] "NULL"
summary(CARROS)
## Kmporlitro Cilindros Preco HP
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## Amperagem_circ_eletrico Peso RPM Tipodecombustivel
## Min. :2.760 Min. :1.513 Min. :14.50 Length:32
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 Class :character
## Median :3.695 Median :3.325 Median :17.71 Mode :character
## Mean :3.597 Mean :3.217 Mean :17.85
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90
## Max. :4.930 Max. :5.424 Max. :22.90
## TipodeMarcha NumdeMarchas NumdeValvulas
## Length:32 Min. :3.000 Min. :1.000
## Class :character 1st Qu.:3.000 1st Qu.:2.000
## Mode :character Median :4.000 Median :2.000
## Mean :3.688 Mean :2.812
## 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :5.000 Max. :8.000
#Familias$renda_REAL =Familias$renda*1320
Familias$renda = gsub(',','.',Familias$renda)
class(Familias$renda)
## [1] "character"
Familias$renda= as.numeric(Familias$renda)
class(Familias$renda)
## [1] "numeric"
Familias$renda_real =Familias$renda*1320
Aqui aprendemos a criar tabelas, utilizamos o gráfico de pizza!!
Aprendemos que no R tem 600 e pouca cores e caso queira mudar elas devemos utilizar o Google e digitar #ffffff para conseguir ter acesso a mais cores
tabela_pap = table(Familias$p.a.p)
tabela_pap
##
## Não usa Usa
## 42 78
# proporção
prop.table(tabela_pap)
##
## Não usa Usa
## 0.35 0.65
prop.table(tabela_pap)*100
##
## Não usa Usa
## 35 65
# proporção de quem mora no Parque da Figueira
tabela_local = table(Familias$local)
tabela_local
##
## Encosta do Morro Monte Verde Parque da Figueira
## 37 40 43
prop.table(tabela_local)
##
## Encosta do Morro Monte Verde Parque da Figueira
## 0.3083333 0.3333333 0.3583333
pie(tabela_pap)
pie(tabela_pap,col=c("black","red"))
pie(tabela_local,col=c("#ff05c5","#5e207d","#c0a7c9"))
Esses são para variaveis ordinárias. Gráficos de pizza são muito limitados. Não servem para variáveis ordináriasnem em situaçõesque tem muita categoria. Pois alem de ficar visivelmente feio, não é de fácil entendimento
Familias$educa = gsub('Sem Instrução', '1.Sem Instrução',Familias$instr)
Familias$educa = gsub('Ensino Fundamental', '2.Ensino Fundamental',Familias$educa)
Familias$educa = gsub('Ensino Medio', '3.Ensino Medio',Familias$educa)
tabela_educa = table(Familias$educa)
barplot(tabela_educa,col="#f20ac0")
barplot(tabela_educa,col=c("#f20ac0","#f20ac0", "purple"))
Meu primeiro gráfico waffle.
library(waffle)
## Carregando pacotes exigidos: ggplot2
parts <- c(NÃO=35, SIM=65)
waffle(parts, colors = c("#f20ac0","purple"))